在精讀丨讀完這本書,你將成為控制未來2%(一)中對吳軍博士的《人工智能》進行了部分內容的解讀,對數據和大數據人工智能進行了解讀。在此我們回顧一下:
數據:把不確定性世界化作確定性的重要方法。采用數據獲取、分析、建模、預測的模式完成對世界的認識和應用。
大數據:對某件事情所產生所能搜集到的全部且相關的數據進行采集,因此具備數據量大、多樣性甚至具備及時性三大特征。
人工智能:具備基本功能語音識別、機器翻譯、自動寫作、與人下棋、自動回答人類的問題。其實這些過程都是將人日常行為不斷細化后,使用大數據將這些問題變為數據的搜索、抽取、組合、編碼輸出過程。
對于世界的認識,我自己建立了一個認知模型,將世界分為,我、出我之外的客觀世界。那么看待世界的方式則變成了,看待我自己、分析除我之外的世界,以及如何與我之外的世界進行更好的聯系。
前文關于大數據和人工智能知識從我們自己的角度去看待這個問題。那么接下來,我將從大數據人工智能自身的角度和我們與大數據人工智能如何進行聯系繼續精讀《智能時代》。
3/6:思維的革命
在繼續精讀前,說兩個人類常見、常用的推導方法:演繹法和歸納法。
在《智能時代》中,吳軍博士提到,在2000多年前的希臘,眾多學著依據邏輯推理,構建了現在科學的基礎體系,同時將人類帶入了機械思維時代。
所謂的機械思維是一種確定性的思維,它人為世界的變化是確定的、有規律的,而這些規律可以描述或使用公式,同時這些規律能夠廣泛應用。它的核心就是把世界確定為一切都有因果關系,但凡有因必然有果。而機械思維的弊端也顯而易見,他否認了不確定性和不可知,一旦確定性被打破那么所有立即崩潰。就像《三體》中,三體人向地球發射了一個額外的中子、質子什么的,就讓人類幾千年來建立的科學體系全部停止前進,因為無法將那個多余的中子、質子什么的不確定性變為確定。
隨著時間發展,第一次工業革命,和第二次科技革命,機械思維發展到了巔峰,但是隨著第三次科技革命的開始,人類對世界的觀察和認知逐漸加深,機械思維開始力不從心。
為什么到現在科技在進步反而不確定性比一百多年前更多呢?這恰恰就是科技進步的結果,如果說科技進步和不確定性有因果關系,他們就像一個復利的過程。科技進步帶來對世界更深的觀察,發現更多不確定性,同時繼續發展科技來消除不確定性。這仿佛一個死循環。其實這個死循環很好理解,不確定性的增加表現在影響事情因素變多,這些影響變量之間的作用以及產生的效果具有不確定性;事情因為收到諸多因素的影響,事情發展到最后與模型計算的精度具有不確定性。
機械思維之所以無法適應,就是現在很多事情無法用簡單的公式來描述,而且事情因素之間因果關系難以確定,甚至互為因果。就像《三體》中三體星人的三個天體的運動,充滿了不確定性,因此三體星迫切需要占領地球。
第三次科技革命讓人類進入了信息化時代,信息量和信息傳播的速度呈幾何速度爆炸式增長。這也給我們消除不確定性帶來了契機。
因此在機械思維之上,進行了進化,形成了信息論。即不確定性的存在是由于信息的缺失或者不對稱,只要輸入獲取大量相關信息就能消除不對稱。
《智能時代》中提到了信息熵,可能只有少部分理工科的人接觸過這個“熵”的概念。對于書中信息上的概念,我自己將其簡化為,我們現在的狀態所含有的信息量與我們要確定一個不確定未知事物所要獲取的信息量之差就是信息熵。比如買一個蘋果要10塊錢(所屬權不確定性),我只有2塊錢(確定性),所以必須再湊齊八塊錢(信息熵)才能把蘋果變成我的(所屬權確定性)。而不確定性的系統大小決定了信息熵即我們所要獲取信息的大小。同時我們獲取信息量的大小能夠將決定系統的完備性。
對于信息的獲取,美國數學家、信息論的創始人克勞德·艾爾伍德·香農提出了香農三大定理,形成了信息論的基礎。得益于三大定律在20世紀人類的第三輪科技革命在電子信息方面突飛猛進。我們能夠利用電子信息技術獲取大量信息來消除不確定性,同時繼續使用機械思維,找尋各種現象的因果關系同時生產一系列復雜的公式。
無論是機械思維還是信息論,拋開對待不確定性的處理形式不說,他們的思維模式的共同點是要找到因果關系,確定規律的確定性。然而帶來的電子信息技術卻引起的思維的第三次革命,這就是大數據思維。
大數據思維的基礎其是信息論,但是與信息論不同的時,大數據思維并不糾結在找到事情之間的因果聯系。而是直接使用統計將所謂因輸入,得出結果,只要是在統計之內能夠滿足要求就按照此法執行。這里我嘗試對大數據思維進行假設:
? ? ? ? ?①事物影響因素太多,但不論影響再多同樣的事情會不斷重復發生;
? ? ? ? ?②信息技術發展能夠采集到全面事情發展的數據;
基于這兩個假設,那么在對數據進行統計分析后能夠必然的發現數據之間有一種冥冥之中的相關性,可能無法描述。而其中的統計就是為了建立系統的完備性,他的思路參照了窮舉法,在數據收集之間不經意的完成了各種的類型的分類和統計。用一句老話來說“林子大了什么鳥都有”。現在大數據就是把林子里面全部的鳥都爪走了,無論這個林子里面再出什么鳥,只要看一眼就只是是什么鳥,吃什么食要怎么處理等等。
舉個我自己在工作中應用的例子:
一般碳氫化合物燃燒過程單位質量與氧氣的體積比在,1:2.5之間。我工作的單位以前沒有這種計量系統,操作全憑人工經驗。在增加了有計算機和計量器具的燃燒閥組后,我讓操作人員1個月內,憑照他們20多年經驗調控燃燒強度,不要管計量器具,當然他調控的過程全部會記錄下來(大數據采集)。而我自己早以計算和理論上各種的碳氫化合物燃燒最佳比例2.2~2.4(機械思維確定因果關系)。1個月后,我對計算機中的數據進行統計分析,得出來的數據是2.3~2.4幾乎與我的計算相當。
這個例子如果用大數據思維就是,操作人員憑20多年經驗操作,計算機統計分析后得出一個比例值,操作人員完全可以以后按照這個值來操作。完全能夠不去找原因為什么要按照這個比例來控制,當然從工作角度我需要找到這個原因。
4/6:大數據與產業變革
大數據其實已經開始充斥在我們的生活中,可能你已經感覺到了。舉幾個例子:手機APP第一頭條,在你看過某個新聞后,會推送另外一條與此相關或類似的新聞。淘寶首頁的商品推送會與你近期瀏覽或購買的商品有關。豆瓣FM私人頻道會根據你喜歡的音樂推送一些風格類似的音樂。這些例子舉不勝舉。
在商業上,大數據的應用趨勢就是收集用于信息提供定制化服務,即收集你的信息,提供你想要的,看起來多美好,也很恐怖,因為感覺上像你在被操控。
那么在企業的產業上,依舊遵循著新技術+原有產業=新產業的模式,從蒸汽機、電能、電子信息技術包括大數據和人工智能都將遵循這個等式。發展的必然結果就是生產力的大幅度提升,產品稀缺將成為過去式,同質化產品不具備競爭力,只有提供個性化、定制化、差異化的服務才是企業的出路。用戶信息將成為爭奪的主戰場,相信各位能夠經常從新聞中看到現在社會上不少不法分子在交易個人信息。
當然違犯法律侵害廣大人民群眾切身安全和利益的行為必然受到法律的嚴厲制裁。正規渠道又如何獲取信息呢?
我既不是程序員也不是專業電子信息專業的出身,但是我還是大膽的猜測一下。我們用手機、PC端通過互聯網聯系起來,我們自己在互聯網上,就是以手機號、IP等信息作為識別代碼。我們每一個操作、點擊、地理位置的移動都通過APP、GPS、網絡傳輸到服務器中,形成了一個個數據。這就促使了各種智能穿戴設備的研發和上市,就連一個插座和煮飯的壓力鍋都要搞個WIFI,難道是真的想廣告所說的一樣,在外面能夠控制?其實是為了收集用戶數據。不過說真的普通人能夠做到數據采集還真的很少。
但是有的時候思路可以轉變一下,我們可以大膽的推測大數據產業的商業模式,猴子(數據挖掘公司)收集羊(用戶)身上的雞毛(相關數據)賣給牛(數據需求方)。我們沒有要做猴子從數據開始做,可以直接做牛,直接買數據(正規取道)用來改善自己的商業模式利用這些大數據消除自身商業模式的不確定性。因此未來的公司可以不參與到大數據和人工智能的開發中,但是一定要有大數據專家參與。
未完待續······
接下來,我將繼續為您精讀《智能時代》。
在《精讀丨讀完這本書,你將成為控制未來2%(三)》中將解讀大數據對我們個人生活的影響、我們將如何應對大數據對我們生活的影響,同時我講分享我對完《智能時代》后的感悟,以及在現實生活中的一點大數據小應用思路和案例。
敬請期待!!
END
文/四季道
如果覺得今天的文字希望能夠對你有用,就親關注我或擊下方愛心,如果可以請轉發讓更多的朋友能夠看到。
你的回復、喜歡、轉發是我堅持、進步的源泉。