本科畢業論文寫的是風力發電,作為一種安全清潔的可再生能源,雖然并網會給電網帶來較大壓力,但隨著智能電網的普及,風力發電前景喜人。與風力資源類似,數據也是可再生的,而且與對風力資源的利用暫時只局限在發電領域不同,數據可以被稱作是可再生的可再生資源。兩個可再生并非筆誤,而是源自其價值的多樣化,對數據利用方式的創新,帶來的,是源源不斷的數據價值。
數據冰山,更需要仔細勘探,太遠,會看不清,太近,會迷失方向,如果不小心撞上,那恐怕只能在數據之海里沉沒了。所幸,在大數據思維的指引下,在數據的首要價值被挖掘后,潛在價值也持續不斷被釋放。
三種創新讓我們得以初探冰山全貌。
數據創新1:數據的再利用
數據再利用的前提是收集或控制數據集尤其是大型數據集。有些機構如谷歌、如亞馬遜,早早地開啟了他們的數據再利用之旅,谷歌基于關鍵詞搜索整理了一個版本的搜索詞分析,并公開供人們查詢,如實時經濟指標以及旅游部門的業務預報服務;而亞馬遜則一直致力于讓數據的價值再大一點,通過早期為AOL電子商務網站提供后臺技術服務的合作,讓亞馬遜掌握了用戶的數據,包括他們在看什么、買什么,進一步幫助亞馬遜提高推薦引擎性能。
與這些線上企業對數據利用的敏感度不同,一些線下運作的傳統企業,也許還在信息噴泉上安睡。有些數據被收集、被保存,但也把數據帶入了墳墓,暫不能見天日。但當他們嗅到了數據所帶來的機會后,如一家知名的物流企業,針對其掌握的全球出貨信息,成立專門部門,以商業和經濟預測的形式出售匯總數據,創造了谷歌搜索查詢業務的一個線下版本。
數據創新2:重組數據
還記得那個將某個地區的交通事故發生情況與犯罪發生情況映射到一張地圖上的例子么,這就是數據重組,很多時候,1+1>2的效果一次又一次地在證明其強大魔力。其實,兩個或者更多個大數據的相加,是更大的大數據,關鍵在于怎么相加。丹麥癌癥協會曾就手機是否增加致癌率這個命題進行研究,通過將1990年至2007年間擁有手機用戶的信息和該國所有癌癥患者的信息這兩個數據集結合后,得出了沒有發現使用移動電話和癌癥風險增加之間存在任何關系的結論。這就是一個數據與數據相加的實例,雖然未能形成轟動的效果,但至少也能讓人們更加放心的使用移動電話了,也為我們提示了大數據運用的更多可能性。
數據創新3:可擴展數據
一個數據集并不會只有一種用途,就如美的發現需要一雙發現美的眼睛一樣,數據的用途也需要一雙發現數據用途的眼睛。零售商店內的監控攝像頭,不僅可以用來認出商店扒手,還能跟蹤在商店里購物的客戶流和他們停留的位置,利用這些信息,零售商可以設計店面的最佳布局并判斷營銷活動的有效性,正如那句話所說,無心插柳柳成蔭。
數據利用的其他可能,還有數據的折舊值、數據廢氣、開放數據等。其中,開放數據最吸引人眼球,這也是各國政府現在正在努力推進的,其主旨是通過多元主體的參與,喚醒沉睡的數據,雖然真正實施起來,并不是那么容易,但這,必然是大勢所趨,方向已經確定,路途的曲折蜿蜒,不過是為了更好地前進。