世界的本質是什么?道說:是人間;佛說:是六道之一;上帝說,是天堂和地域之間的戰場;哲學說:是無窮的辯證迷霧;物理說:是基本粒子堆砌起來的聚合體;人文說;是時間的積累。現在,又有了新的答案:是數據。站在不同的角度看待,往往會有不同的解答,因為世界是一個龐大的復雜體,橫看成嶺側成峰。維克多·邁爾-舍恩伯格教授的《大數據時代》,就向我們證明了世界的又一種形態——數據。
我們生活在一個充滿數據的時代,而計算機和網絡的發展讓數據的存儲、傳輸以及處理得到了巨大的飛躍。面對海量的數據,你能看到什么?數字?信息?還是一片混沌?在此之前,我只知道互聯網會深刻的改變和影響我們的生活,而不知道互聯網的價值是通過數據的交互來體現。現在。在海量的數據中,是源源不斷的價值,是對未來神秘精確的預言,是世界的一種形式。
我們已經進入大數據時代,以前所未有的方式,通過對海量數據進行分析獲得具有巨大價值的產品和服務,或深刻的洞見。大數據告誡我們“是什么”而不是“為什么”,在大數據時代,我們不必知道現象背后的原因,我們只要讓數據自己發聲。作者指出了大數據時代處理數據理念上的三大轉變:1.要全體不要抽樣? 2.要效率不要絕對精確? 3.要相關不要因果。抽樣不是一種必要的方法,而是受限于技術的妥協,但隨著網絡和計算機的發展,“樣本=全體”已經成為可能,這樣龐大的數據樣本更加豐富也更能還原事物的本質。另外,以前對于數據處理執迷于精確性,是信息缺乏時代和模擬時代的產物。只有5%的數據是結構化且能適用于傳統數據庫的。如果不接受混亂,剩下95%的非結構化數據都無法被利用,只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。然而錯誤并不是大數據固有的特性,而是一個需要我們去處理的現實問題,并且可能長期存在。對于大數據看中相關關系而不是因果關系,作者給了詳細的說明。相比較于因果關系,相關關系分析更加準確、更快,而且不受偏見的影響,因為信息量的變化會導致信息形態的變化——量變引發了質變。比如通過監聽微博,可以預測一部電影的成敗;銷售商利用信息可以設計店面的最佳布局并判斷營銷活動的有效性;通過大數據,語言可以得到翻譯,汽車可以在預測的基礎上自行駕駛,亞馬遜可以推薦你喜歡的書或者網易音樂推薦你喜歡的歌,這些推薦都往往能打動我們。我們只知道是什么就行,不需要明了為什么。作者認為,如果凡事都有因果的話,那我們就沒有決定任何事物的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果,而這個結果又是其他原因導致的,以此循環往復,那么就不存在認得自由意志這一說了。
大數據是一場思維革命,更是一場商業革命。如今,數據已經成為一種商業資本,一項重要的經濟投入,可以創造新的經濟利益。事實上,一旦思維轉變過來,數據就能巧妙地用來激發新產品和新興服務。大數據不但是我們獲得認知,創造新的價值的源泉,大數據還是改變市場、組織機構,以及政府與公民關系的方法。
數據的價值體現在哪?它能通過一定的數學算法,為人們揭示真相,獲得方法解決的途徑以及預測未來。數據的真實價值就像漂浮在海洋上的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。現如今,數據成為衡量一個公司實力的重要條件,擁有數據以及有對數據處理的能力和運用數據價值的思維是許多公司立于不敗之地的法寶。想象如果谷歌、微軟、亞馬遜、百度等等網絡巨頭公司如果沒有了所擁有的巨大的數據,那這些公司不知還能不能生存。根據所提供價值的不同來源,分別出現了三種大數據公司。這三種來源是指:1.數據本身 2.技能? 3.思維。往往巨頭公司都占有兩種或者三種來源。
然而,大數據時代的來臨,也將面臨著許多的問題,就像一開始互聯網到來時出現問題一樣。作者冷靜描繪了大數據帝國前夜的脆弱和不安,包括產業生態環境、數據安全隱私、信息公正公開等問題。大數據需要人們重新討論決策、命運和正義的性質,我們的世界觀正受到相關性優勢的挑戰。為此,作者提出了許多可行的措施,比如責任從民眾轉移到數據使用者。三大原則:公開原則,必須進行預測分析的算法系統。公正原則,具備有第三方專家公正的可靠有效的算法系統。可反駁原則,明確提出個人可以對其預測進行反駁的具體方式。最重要的是,確保個人動因能防范“數據獨裁”的危害。
《大數據時代》向我們表明,擁有知識曾意味著掌握過去,現在更意味著預測未來。
2015/05/06 19:51