關于本書作者:
吳軍,得到訂閱號《硅谷來信》的作者。計算機科學家,谷歌智能搜索算法的發明人,也是一位投資人,還是一位高產的作家,一共寫了6本書。
關于本書:
這本書給我們詳細的解釋了大數據的特點、人工智能的發展和我們面對人工智能要做什么改變。
一.大數據的特點和人工智能的發展
讓機器擁有智能的鑰匙其實是大數據。大數據不是一堆數字,網上的所有東西都可以算作數據,有了數據之后,再經過系統性的整理,就變成了信息,信息再經過更簡潔抽象的加工,就變成了知識。
案例:
通過測量星球之間的相對位置和時間,就得到了數據,通過數據能得到星球的運動軌跡,就是信息,通過信息總結出開普勒三定律,就是知識。
大數據有3個特征:體量大、多維度和完備性。
案例:
1.谷歌拍攝街景的汽車來說,一輛汽車每天生產的數據就是1TB, 1tb就是1024G,一部電影按500M算,也就是說一輛汽車每天能生產出2000部電影那么大的數據量。
2.手機號能調出你的搜索習慣,你的通訊信息,然后你的性別,年齡,位置,文化背景這些一連串的信息都會被調出來,然后根據大樣本統計,你平時關注什么東西,你的生活習慣都會清清楚楚的展現出來。
3.用智能手機手機全球人的面孔;谷歌的無人駕駛汽車,提前把道路上所有可能遇見的情況全部預先輸進電腦里,然后根據掃描情況快速匹配識別,做出各種各樣的反應。
智能問題實際上就轉變成了如何處理數據的問題。機器的智能水平也會隨著數據量的增長而增長,所以智能革命的趨勢是不會變的。
二.我們面對人工智能需要做出哪些改變?
首先要進行思維上的轉變,從單純的機械思維轉變到大數據思維。機械思維的本質就是確定性和因果關系。在兩個世紀以前具有機械思維人,那這個人就是頂級的精英。機械思維能被普遍接受的一個大前提是,它默認這個世界的所有事物都是有規律的,而且這些規律是確定的。
案例:
1.牛頓用幾個簡單的公式,像力學三定律和萬有引力定律,就把所有宏觀物體的運動規律描述清楚了,焦耳用一個公式就說清楚了能量守恒的原理,麥克斯韋用幾個公式就描述清楚了電磁的原理。
2.現代醫藥學的核心也是因果關系。如果要治療一種疾病,得先找到病原體,然后根據病原體生產克制它的藥,醫生首先要通過各種手段檢測你生病的原因,然后才能對癥下藥。
如今機械思維方式大多數時候不太管用了。因為這個世界具有不確定性。
案例:
1.在一個桌子上擲色子,如果不作弊,在色子站穩之前通常是沒辦法知道他是幾點的。可是假如我們想通過公式計算出這個色子的運動規律,那需要知道哪些數值呢?我們得知道色子的形狀和密度分布,出手時的力量和旋轉的角速度,我們還得知道桌面的彈性系數和空氣的流動速度,這里面還有很多我們忽略的細節,如果把所有的細節考慮清楚,那理論上應該是能測出色子的運動規律的,但是在實際操作中這里面的很多細節是沒法把握的。
2.測不準原理,像電子這樣的基本粒子,你要測它的位置總是有誤差的,因為你測量它這個動作本身就會對它的位置產生影響。
依靠因果關系這種方式認識世界的效率其實非常低。大數據思維給機械思維做了完美的補充。
首先,大數據解決了不確定性的問題。“信息熵”這個概念指出,信息量和不確定性有關。
案例:
你看一本心理學的書,如果你本來就對心理學這個領域很了解,那你可能很快就能看完這本書,就是說這本書只要給你提供很少的信息量你就消除了對這本書的不確定性。相反,如果你看一本編程的書,恰巧你又是這個領域的小白,那你可能就需要從頭到尾一字不拉的看完才能理解,你需要大量的信息才能消除對這本書的不確定性。想要消除不確定性,最好的辦法就是引入信息。
其次,大數據的強關聯性可以替代因果關系。
案例:
1.如果按照因果關系,研制一種新藥就得花費很長的時間和巨高的成本,有了大數據就不一樣了,它可以對每一種藥和每一種疾病進行配對,比如現在的病大概有5000種,藥有1萬種,我們對它們進行匹配就會發現,一種治療心臟病的藥對治療胃病特別有效,雖然不知道為啥,但是結果顯示就是有效。這樣先知道結果,然后再倒推原因,通常只需要花3年時間驗證就可以了,花的錢也只要原來的十分之一就夠了。
2.在美國各州的檢察官要告煙草公司,因為吸煙有害人們的健康。有一份報告就顯示,吸煙男性肺癌的發病率是不吸煙的23倍,女性則是相應的13倍,但證據不足夠對煙草公司判罪。直接的有因果關系的證據非常的難找,所以檢察官只能找煙草公司所說的那種,在其他因素都排除的情況下,吸煙者的發病率依然比不吸煙者高的證據。最后雖然還是沒有找到香煙和肺癌有直接因果關系的證據,但是依然收集了大量的樣本來間接說明吸煙的危害,因為樣本夠多也很權威,最終檢察官勝利。
那這場智能革命會讓傳統的產業加上大數據就會變成新產業。
案例:
1.弱勢籃球隊的崛起,通常是一個大老板喜歡這個球隊,先花錢買下球隊,然后砸錢買球星和請大牌教練,再做各種廣告招攬球迷。硅谷有一個球隊就很特殊,他的管理層是由風險投資人和數據分析師組成,他們不買大牌的球星,反而把隊里特別有名的球員都賣掉,然后圍繞一個沒有名氣的球員制定球隊的戰術,就是主要依靠三分球投籃得分。這個球隊就靠這個打法逆襲成功,成為那個賽季的總冠軍。
2.大數據在醫學上的運用,美國的一位高中生,他設計了一種確定乳腺癌癌細胞位置的算法,輸入了760萬個病例,對癌細胞位置預測的準確率就高達96%,基本上沒有失誤,比一個資深的老大夫要強上很多,相信不久后醫生這個職業也很快就會被機器替代。
大數據也會給我們帶來很多麻煩,首先就是我們會徹底沒有隱私。
案例:
1.奸商的精準營銷,會通過你的反饋記錄看出你是個好惹的人還是不好惹的人,要是你特別在乎自己的權宜,一買到假貨就給自己維權,商家就覺的你這個人不好惹,還是給你推送真貨比較省心,要是你對這個很不敏感,買到假貨也懶退,也不說,那商家就總是給你推送假貨。
2.美國很多航空公司就在利用個人隱私發財,當航空公司發現某個人最近必須出行時,而這個人以前的記錄又都顯示他對票價不敏感,那航空公司給他的報價就比其他人高的多,尤其再加上最近只有它們這一個航班的時候,那它們就會坐地起價。
大數據思維和機械思維不是相互對立的,而是互相補充,它就是新時代的方法論。
我們的工作被人工智能絞殺之后,那我們要怎么辦呢?
作者的答案就是人工智能只會把貧富差距越拉越大。唯一能做的是爭當百分之2的人,不要去做那百分之98的人。擁抱智能時代的任何新技術新工具,努力跟上時代的步伐,才能成為受益的少數者。
總結:
這本書給我們詳細的解釋了大數據的特點和人工智能的發展歷史,指出了大數據的三個特點,體量大,多維度和完備性,這三個特點讓人工智能技術得到了飛速的發展,人工智能實際上就是如何處理數據的問題,他帶來的智能革命要求我們從機械思維切換到大數據思維,用不確定性的眼光看世界,再用大數據的強相關性替代因果關系,掌握這些我們就能以正確的姿勢迎接這次智能革命了。
人工智能替代了人們重復性的工作是一件好事,總的生活品質還是會不斷的往上走,有創造力的人會不斷的提升社會的整體福利水平。清閑的生活也會釋放大量的創造力,人工智能的學習對象永遠是人,只要我們能不斷進步,人工智能就是我們的最好的工具。
金句:
1,如果我們把資本和機械動能做為大航海時代全球近代化的推動力的話,那么數據將成為下一次技術革命和社會變革的核心動力.
2,在無法確定因果關系時,數據為我們提供了解決問題的新方法,數據中所包含的信息可以幫助我們消除不確定性,而數據之間的相關性在某種程度上可以取代原來的因果關系,幫助我們得到想要知道的答案,這便是大數據思維的核心.
3,在未來我們可以看到,大數據和機器智能的工具就如同水和電這樣的資源一樣,由專門的公司提供給全社會使用.
撰稿:張凱講述:曾捷