2018-12-31

數據能力是人類文明最底層的作用力之一,人類對數據的記錄和處理能力將直接影響文明的形態。

乍一聽,你可能會覺得奇怪,數據不就是人類發展的一個結果嗎,它是對現實的記錄,又怎么能影響世界,甚至改變文明的形態呢?要想理解這個結論,我們就要建立更宏大的觀察視角。提到文明的進步,我們能想到很多作用力,比如制度、經濟、技術等等,但是作者認為,假如我們用一個更宏大的視角觀察文明的進展,就會發現這些作用力之下有一個更底層的力量,它支撐起人類文明的整個生命線,這就是數據的力量。說得更具體一點,是人類記錄和處理信息的能力。

作者認為,原始社會之所以發展緩慢,就是因為缺乏有效的記錄手段。因為無法精確記錄,所以成果不能積累,但文字誕生之后,信息就被精確地記錄下來,這就讓人類的智慧突破了原本的時空局限,可以被精確地傳播、積累、不斷疊加,文明的腳步也因此越來越快。你看,幾乎所有的重大進步都發生在文字出現之后,比如造紙術、印刷術、蒸汽機等等。

所以,什么叫文明?按照通常的理解,文明就是人類所有成果的總和,包括財富、技術、文化等等,但作者認為,文明還有另一種解讀方式,就是把文和明兩個字分開看:文是文字,它指代的是人類記錄世界的能力;明,是光明,它指的是由記錄帶來的真實世界的清晰度。比如過去,我們只知道中國是個國土遼闊的多民族國家,但現在,由于數據能力的進步,我們可以更加精確地統計出,國家有多少人口,他們的姓名、生日、籍貫等等。人類文明的演進,本質上就是不斷發現、思考、記錄真實世界,讓它呈現出更高清晰度的過程。

說到這,你一定已經發現,今天我們正處在一個重大的節點上。互聯網、算法技術、人工智能的興起,讓人類的數據能力產生了爆炸式的躍遷,世界以一種前所未有的清晰度呈現在我們面前。這種強大的數據能力,將如何改變文明的走向?它會對社會和人性帶來哪些永久性的改變?這已經不再是數據領域的專業問題,而是一個關乎人類未來的重大議題。

本書的作者是著名的信息專家、曾經擔任過阿里巴巴副總裁的涂子沛老師。中國第一本聚焦于大數據領域的暢銷書就是他的作品,書名就叫《大數據》。這回,涂子沛老師在《數文明》里,用人類文明的大視角重新審視數據的作用。書名“數文明”,其實是一語雙關,它既揭示了一種邏輯,也就是數據能力和文明之間的作用關系,同時它也指代一種狀態,就是以數據技術為基礎的人類文明的新階段。

接下來,我將分為兩部分為你解讀這本書。第一部分,我們將回答,數文明的基礎是什么?人類是怎么走上數文明的軌道的?第二部分,強大的數據能力,將對人類文明產生哪些重大影響?

第一部分

首先,第一部分,要想理解數文明的特點,我們得先明確一件事:為什么說數文明時代的到來,是一種不可逆的趨勢?換句話說,滋養數文明的土壤是什么?

人類邁入數文明時代,一共跨過了三個重大門檻,經歷了三次重要的技術突破。這三種技術你一定都不陌生,有的還會讓你感覺稀松平常,但是它們卻是數文明時代的原力,也就是原始動力,從最底層改寫了人類的記錄邏輯。

咱們先說數文明的第一個原力。提起數據技術,我們往往首先想到計算機和互聯網。你看,我們在網上的社交、娛樂等等一系列行為都被精確記錄,你有哪些好友、給誰點過贊、瀏覽過哪些網站,都被記錄得一清二楚。但是,你想過一件事沒有,計算機為什么能如此精確地記錄我們的行為?要知道,它察覺的可不只是那些有效操作,比如點贊、買東西、看視頻,這些在后臺都有明確的數據,它還能記錄那些無效操作,比如你在網頁的空白區上漫無目的地亂點,或者在一個頁面上隨意滾動,又或者鼠標在電腦上隨便滑來滑去。這些不會導致任何結果的無效操作,為什么也會被記錄下來呢?其實,答案就在我們每天都在用的、一個不起眼的小東西上,這就是鼠標。它也是數文明的第一個原力。

要想了解鼠標的作用為什么這么大,我們得先知道鼠標到底是什么。上世紀60年代,美國斯坦福研究院的一名教授,發明了世界上第一個鼠標。當時它并不叫鼠標,而是用了另一個名字,叫 X-Y 屏幕方位指示器。也就是,把屏幕像地圖上經緯度一樣,分成橫向的 X 軸和縱向的 Y 軸。你的鼠標停留在屏幕上的任何一點,計算機都可以把它的位置,轉化成一組由橫縱坐標值構成的數據記錄下來。不管你是否點擊,只要電腦開機,它的位置就會被記錄。顯然,無論是更原始的鍵盤操作,還是更先進的聲控技術,都無法達到這個效果。你看,鍵盤需要敲擊,每輸入一個指令都帶著操作者的清晰動機,這就意味著它只能記錄下那些有效的操作,而聲音控制也一樣,它們都沒法像鼠標一樣,始終黏在屏幕上。正所謂“凡走過必留下痕跡”,鼠標就是實現這種全方位記錄的基礎。

但是,你可別以為鼠標的作用僅限于此。除了功能本身,它還揭示了一種當今人類記錄數據的邏輯。以往,記錄是一種刻意行為,我們是有選擇地記錄。比如你出去旅游拍照片,你只會拍下那些你認為美好的場景,這種記錄是隨機的,而且記錄的信息不連貫。但現在,記錄已經變成了一種不需要刻意啟動的附加行為。就像一臺始終處在錄制狀態的攝影機,它不做任何判斷,只是客觀記錄,所有信息都是連貫的,只要開機,它就會不停記錄。

說到這,你可能會說,不對啊,我們在云端留下的只是網絡上的行蹤,要知道,很多人在網上的表現和現實中是大相徑庭的,比如我們常說的鍵盤俠,不就是一個典型嗎?那么,我們又該怎么讓網絡和現實連接在一起呢?這就要說到數據技術的第二個原力了。它和鼠標一樣,還是一個不起眼的小東西,這就是攝像頭。

你可能會覺得,攝像頭無非是記錄影像,怎么會成為人類步入數文明時代的一個關鍵突破呢?這就需要引入另一個因素,數量。截至到目前,全世界已經生產出了140億個攝像頭,平均每人2個;到2020年,這個數字將翻倍,達到280億,平均每人4個攝像頭。人類歷史上,還沒有任何一種小型機械能達到如此巨大的規模。要知道,這還不包括照相機、攝影機和手機上的攝像頭。換句話說,我們已經進入一個全民記錄時代,每個人都可以隨時隨地參與記錄。

你可能會覺得,這些照片不是一直都存在嗎?在古代,人們就開始畫肖像,攝像頭和照相機也有很多年的歷史。那么,今天的影像記錄,除了數量,在本質上和過去的影響有什么不同呢?答案是,今天所有的記錄都多了一層技術加持,這就是算法。它進步到什么程度了呢?舉個例子,2017年,騰訊總裁馬化騰就在全球財富論壇上說過,騰訊每天能收到超過10億張用戶照片,而且很多用戶都是從幾年前就開始上傳。平臺不光掌握了這些人的長相,還能根據他們過去的相貌變化,預測出未來的長相。換句話說,攝像頭不光能記錄你,還能認出你。你看,在算法和人臉識別技術出現之前,所有的聲音影像數據都隨意地散落在各處,但是現在,每一組數據都能跟它們的主人一一對應起來。這就等于是把人類在真實世界中的活動記錄,投影在了云端。

但是,更值得我們注意的并不是攝像頭本身,而是它所反映出的數據的一個重要特性,那就是超強的寄生能力。換句話說,攝像頭是一個重要的記錄手段。但是現在,即便拋開攝像頭不提,記錄手段依然有很多。照片可以成為個人數據,同樣,任何事物都可以成為數據的宿主。比如火車票,在實行實名制之前,它只是通行證,但實名之后,它也成了一條出行數據。再比如去餐館吃飯,以前用現金支付,吃完留不下任何痕跡,但現在通過網絡支付,你的飲食經歷也被一并記錄。

過去,哲學家說,萬物有靈,但現在應該說,萬物有數據。數據已經成為人類社會的一套共生系統,它緊緊地嵌入人類社會,我們的每一個行為都在不斷地生成數據。只要人類存在,它就會伴隨人類的行為,不斷地成長壯大。但是,你可別以為這個共生系統只會跟在人類身后,依附于人類,它還有可能超過人類,這就要說到數文明的第三個原力,深度學習技術。

深度學習,也就是讓人工智能學習人類的經驗,然后自己把這些經驗轉化成技能。比如下圍棋,你可以不用教會人工智能每一步該怎么走,只需要給它輸入大量的棋譜,它就會自己推導出一套章法。當年擊敗人類冠軍棋手的 AlphaGo,就是這么培養出來的。當然,我們今天要說的,并不是 AlphaGo 為什么會擊敗人類,而是深度學習技術所揭示出的一種新的技術演進邏輯。以往,是人類先掌握一門技術,然后把它復制到機器上,比如人類先有手工的活字印刷,然后把這門技術交給自動化的印刷機。換句話說,人是機器的老師,但現在,人類更像是家長。假如把人工智能比作嬰兒,那么數據就是奶粉,隨著我們生成的數據越來越多,這些奶粉變得越來越有營養,這些嬰兒就有可能快速生長,并且超過人類。

你看,我們一直認為人類是智慧的源泉,但現在,人工智能有可能繞過人類,直接獲得更強大的能力。AlphaGo 的勝利不就是一個例子嗎?所以,深度學習技術,讓數據具備了哺育人工智能的新用途,當人工智能進步之后,它又會給數據賦能,讓數據變得更有價值。

以上是第一部分內容。我們追根溯源,找到了激發數文明誕生的三個重要技術,分別是鼠標、攝像頭和深度學習技術。其實你應該已經發現,這三個發明本身并不能代表人類的全部數據能力,我們真正要揭示的,是當今這個時代數據能力的演化所遵循的一套邏輯。鼠標代表了數據記錄的連續性,以往的隨機記錄,變成了連貫、持續的常態。以往我們選擇記錄什么,但現在,我們只需要選擇不記錄什么。同樣,我們分析攝像頭的目的,也不是在強調攝像頭本身的重要性,而是想通過對攝像頭這個數據入口的分析,來感受人類挖掘數據的能力。除了攝像頭之外,我們身邊還有很多數據的記錄載體。任何事物都有數據的一面,隨著技術的進步,這些數據都可以被人類開發利用。而深度學習技術,揭示的是由數據增長引發的一種新的技術演化方式,那就是技術有可能繞過人類直接獲得更強的能力。這三重邏輯疊加在一起,讓人類的數據能力越來越強大,這是一個不可逆的趨勢。

第二部分

那么,這些改變將對文明產生哪些影響呢?第二部分我們就來回答這個問題。作者認為,最重要的影響有兩個:構建高清晰社會、打造高能個體。

先說第一個,構建高清晰社會。也就是通過精確的記錄,讓社會以一種越來越精確的面目呈現出來。你可能會說,這不是數據積累的自然結果嗎?它無非是對社會形態的一種精確描述,對社會本身和人類的心智會產生影響嗎?要想明白高清晰社會的意義,我們得建立更大的觀測視角。回顧歷史你會發現,幾乎所有的國家,都在通過各種手段不斷努力提高社會的清晰度。

姓氏的出現,就是一個典型的例子。比如日本,國家的人口不算多,但國民的姓氏卻多達11萬個,這是為什么呢?跟明治維新有關。150年前,絕大多數日本人是沒有姓的,19世紀時日本政府發現,國民沒有姓對于戶籍管理、征稅征兵非常不方便,于是下令全體國民都要在規定時間之內取一個姓。日本人情急之下只能自由發揮,看到什么就用什么作姓氏,住在大橋邊的就姓“大橋”,門口長了一棵松樹的就叫“松下”,村前有一座山的就姓“山口”。國家為什么這么熱衷于創造姓氏?因為人口是一個社會最基礎的數據,戶籍、納稅、征兵、治安、福利、財產等其他社會制度都建立在它的基礎之上,掌握清晰的人口數據是國家治理的前提。所以,姓氏是人類社會從模糊邁向清晰化的一種重要的制度設計。

后來,進入工業社會,社會大分工、人口大范圍流動,僅憑一個名字顯然無法實現精確管理,所以在第一次世界大戰期間,西方各國政府都開始強制公民提交照片,辦理各種證件都需要附上照片。你看,這又是社會清晰度的一次提升。換句話說,一個現代化社會必定需要現代化的管理,而現代化管理的前提就是構建高清晰社會。今天,社會的清晰度已經達到了空前的程度,你的身份、社交關系、行為記錄都可以被察覺到。我們就像一條長著尾巴的蝌蚪,無論去到哪、無論干什么,都會留下一串數據。

這會帶來什么呢?除了信息的增長和社會治安的提升,還有一個更重要的影響:高清晰社會正在重新塑造人類的天性,乃至整個人類文明的精神面貌。怎么講?回顧歷史你會發現,一個人不管有多大的權力,他的行為方式都受到一件事的影響,那就是他的一舉一動是不是會被記錄下來,被他人感知到。換句話說,一個人在社會上的清晰度,會影響他的行為方式。比如,過去的皇帝有著至高無上的權力,但他唯獨害怕一個東西,叫起居注,也就是身邊的史官寫的那個記錄皇帝言行舉止的小冊子,它一旦寫成,就不能更改。當年,宋太祖趙匡胤沉迷玩樂,但是又很少有人敢勸他,都怕惹皇帝不高興,萬一被降罪就麻煩了。直到其中一個大臣提醒他,別忘了世界上還有起居注這個東西,趙匡胤一聽,馬上痛改前非。因為即使當時沒人批評他,但起居注會把他當天的一言一行全部如實記錄并且傳播給后人,至于后人怎么說,他又怎么控制得了呢?

說到這,你應該已經發現,數據記錄對于人性的作用到底是什么:它正在一點一點地逼出人性中的僥幸心理。過去,人們會有僥幸心理,覺得自己做了壞事,也不一定會被發現,今天,數據會記錄下一切。比如說,在高速公路上一邊開車一邊玩手機非常危險,但是很多人覺得無傷大雅,反正也不會被交警抓到,但現在不行,比如2017年6月1日,浙江省在高速路上裝了一套設備,攝像頭自動抓拍、識別開車玩手機的行為,短短5天內就抓到4000多起。當年,愛迪生改造白熾燈,照亮了紐約的黑夜,犯罪率因此大幅度下降。今天的數據也有同樣的功效,它就像一束光照向人性的幽暗處,一點點清除人類的僥幸心理。

剛才咱們說了數據對人類社會的影響,構建高清晰社會,這不僅提高了社會的治理效率,也改變了人性,逼出了人們內心的僥幸心理。那么,數文明時代對于我們個人來說又意味著什么呢?數據技術會給個人帶來什么樣的機遇?這就是咱們接下來要說的,數據對于人類文明的第二個影響:打造高能個體。

高能個體,指的就是擁有強大能力的個人。你可能會說,數據既不是真金白銀,也不是實打實的權力,它是怎么打造高能個體的呢?要想明白這個觀點,我們得先弄明白一件事:獲取財富和權力最有效的方式是什么?你可能會說,靠機遇,巨大的機會意味著巨大的收益。但是,到底什么是機遇?答案是,認知差。也就是說,當一個新資源出現時,你比其他人更早地意識到了它的價值。比如,16世紀初,西班牙人來到墨西哥開掘黃金,當地人就很納悶,黃金既不能吃,打造成武器又不夠硬,這些人要黃金做什么?他們完全不知道,在另外一個世界里,黃金就是貨幣。此后的300年間,西班牙一共從南美洲拿走了250萬噸黃金,依靠這些財富,西班牙成了當時世界上最強大的帝國。

今天,人們看待數據的方式,就像當年人們看待黃金,并不是所有人都意識到了它的價值。比如,當年特朗普競選美國總統,你可能大概聽說過,他使用了大數據技術來輔助競選。但是當我們仔細分析整個過程,還是不免吃驚于數據的威力。

當年,特朗普雇用了一家大數據公司,叫劍橋公司。這家公司搜集了將近9000萬人的網絡社交數據,把它們和商業市場上的消費數據匹配分析,得出選民的性格、偏好政治立場。然后,對義憤填膺的愛國者,就給他們推送“雞血”,告訴他們特朗普能讓美國重新偉大;對知識精英,就推送包裝得比較理性、顯得高深的分析;對民主黨的支持者,推送一些和希拉里家族有關的負面信息,讓他們對希拉里失望。當然,我們不能斷言,特朗普當選完全是數據技術的功勞,但至少可以確定,數據發揮了一定的助推作用。在一場勢均力敵的競爭中,這些助推幾乎能決定成敗。

那么,這些幫助特朗普取勝的數據成本是多少呢?非常低。主要支出的,是數據的獲取和分析等技術成本。至于數據本身,是由每一個普通選民免費提供的。他們的每一次留言、點贊、消費,都在提供免費的數據。人們都沒有想到,那些看起來無所謂的個人數據到了別人手里,居然可以變成總統競選中的利器。你看,這不就是典型的認知差嗎?在數文明時代,最先意識到數據價值的人,就更有可能成為高能個體。當然,這本書里,作者也號召要尊重個人數據的價值和所有權,數據的提供者應該有權利共享數據帶來的收益。有關數據所有權的問題,我在另外一本書《算法的陷阱》里做了集中解讀,有興趣的話,你可以找來聽聽。

以上是第二部分內容。數文明時代的到來,會對人類文明產生哪些影響?對于社會來說,數據能力的提升,將打造出一個高清晰社會,而社會清晰度的提高,又會對人性產生深遠的影響,它將逼出人性中的僥幸心理。對于個人來說,數據是新的金礦,利用人們對數據的認知差,少部分人可以用極少的成本掌握數據的力量,從而成為高能個體。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容