關(guān)于作者
本書的作者艾伯特-拉斯洛·巴拉巴西是科學界的一位巨星,全球復雜網(wǎng)絡(luò)研究第一人,無尺度網(wǎng)絡(luò)模型的創(chuàng)立者。他的論文被引用次數(shù)達到10萬次,是諾貝爾物理學獎獲獎呼聲最高的一位候選者。
關(guān)于本書
在《鏈接》這本書里,作者揭示了復雜網(wǎng)絡(luò)的起源——從隨機網(wǎng)絡(luò)到無尺度網(wǎng)絡(luò)。復雜性蘊含于萬物之間的鏈接,我們看到在網(wǎng)絡(luò)中,表面的無序和深層的有序共存。網(wǎng)絡(luò)普遍具有先發(fā)優(yōu)勢、適者生存、健壯和脆弱并存的特點,樞紐節(jié)點和層級結(jié)構(gòu)在各種網(wǎng)絡(luò)中廣泛存在。這些復雜網(wǎng)絡(luò)的規(guī)律,成了我們今天高效利用大數(shù)據(jù),進而發(fā)展人工智能的一把鑰匙。
核心內(nèi)容
本書的思想核心是:鏈接是無處不在的,復雜網(wǎng)絡(luò)的本質(zhì)是無尺度網(wǎng)絡(luò)。充分理解網(wǎng)絡(luò)無尺度的特點,對于我們理解和分析各種復雜事物大有裨益。抓住復雜網(wǎng)絡(luò)中的樞紐節(jié)點,是我們處理復雜數(shù)據(jù)的基本原則,也是人工智能背后的深度神經(jīng)網(wǎng)絡(luò)的重要基礎(chǔ)。
一、關(guān)于復雜網(wǎng)絡(luò)的起源
在過去,人們認為網(wǎng)絡(luò)都是隨機形成的,把這些網(wǎng)絡(luò)都叫作隨機網(wǎng)絡(luò)。一場酒會上人們從互不相識到彼此認識,就是一個隨機網(wǎng)絡(luò)形成的過程。每個人都不知道自己會認識誰,會認識幾個人,所有節(jié)點之間的鏈接都是不確定的。作者指出,這種隨機網(wǎng)絡(luò)的形成速度非常快,門檻也非常低。只要每個人認識至少一個人,這100個人就能全部鏈接起來。
在現(xiàn)實生活中,每個人都認識很多人,所以鏈接更加緊密。由此產(chǎn)生了一個非常著名的理論,叫作六度分隔。你和這世界上任何一個人之間,最多通過6個人就能搭上關(guān)系。用隨機網(wǎng)絡(luò)來解釋,每個人認識100個人,那么通過6個中間人,能搭上關(guān)系的人理論上有1萬億人,是地球人口的140倍。這就是隨機網(wǎng)絡(luò)的力量。鏈接無處不在。擁有海量信息的互聯(lián)網(wǎng)也能做到從任何一個網(wǎng)頁出發(fā),平均只需要19次點擊,就能跳轉(zhuǎn)到另外任何一個網(wǎng)頁。在自然界的食物鏈網(wǎng)絡(luò)中,任何兩個物種之間的平均間隔只有兩個物種。六度分隔和類似的現(xiàn)象在生活中非常常見。
在隨機網(wǎng)絡(luò)的基礎(chǔ)上,作者提出了“樞紐節(jié)點”這一概念和無尺度網(wǎng)絡(luò)模型。樞紐節(jié)點指的是在一個網(wǎng)絡(luò)中比其他節(jié)點擁有更多鏈接的節(jié)點。在人類社會中,樞紐節(jié)點就是那些社交面非常廣、朋友非常多的人。網(wǎng)絡(luò)的真實結(jié)構(gòu)不是隨機網(wǎng)絡(luò)那樣均勻分布的,現(xiàn)實生活中有些善于交際的人微信好友有幾千人,有些爺爺奶奶的微信好友只有家里的幾口人。一個網(wǎng)絡(luò)的結(jié)構(gòu),主要是樞紐節(jié)點在支配、在起作用,而不是所有節(jié)點。我們?nèi)祟惿鐣軌虮3志o密鏈接,靠的就是樞紐節(jié)點聯(lián)系起不同的社交圈子。“社交圈”指的是一群人關(guān)系非常緊密,在整個社交網(wǎng)絡(luò)中就是一個“小世界”,每個小世界里都有樞紐節(jié)點,他們除了圈子里的人,還認識很多圈外的人。這樣就劃分出了強關(guān)系和弱關(guān)系。同一個圈子里的人,他們的關(guān)系非常緊密,這是強關(guān)系。而從樞紐節(jié)點向其他圈子伸出去的橄欖枝,就是弱關(guān)系。在這樣一個網(wǎng)絡(luò)里,節(jié)點之間的重要性差別巨大,服從二八定律。二八定律說的是20%的成員占據(jù)了80%的資源,少數(shù)成員占有非常重要的位置。無尺度網(wǎng)絡(luò)指的是:所有節(jié)點的重要性都服從于二八定律,有少量的樞紐節(jié)點非常重要,大量的節(jié)點沒有那么重要,這樣的網(wǎng)絡(luò),我們就叫它無尺度網(wǎng)絡(luò),因為無法用同樣的尺度去衡量每一個節(jié)點。
無尺度網(wǎng)絡(luò)的提出,顛覆了人們長期以來對復雜網(wǎng)絡(luò)的認識。所有網(wǎng)絡(luò)中都必然存在這種兩極分化,而均勻的、完全隨機的節(jié)點分布是不存在的。從隨機網(wǎng)絡(luò),到無尺度網(wǎng)絡(luò),人們對復雜網(wǎng)絡(luò)的認識加深了一步:隨機網(wǎng)絡(luò)是無序的、是雜亂無章的,而無尺度網(wǎng)絡(luò)就是無序和有序并存的,一旦抓住樞紐節(jié)點,整個網(wǎng)絡(luò)的結(jié)構(gòu)就變得清晰,無序之中浮現(xiàn)出有序。
二、關(guān)于復雜網(wǎng)絡(luò)的共有特點
復雜網(wǎng)絡(luò)的共有特點主要有以下三個:先發(fā)優(yōu)勢、適者生存和健壯性與脆弱性并存。
1.先發(fā)優(yōu)勢
先發(fā)優(yōu)勢指的是:網(wǎng)絡(luò)中越早產(chǎn)生的節(jié)點越容易成為樞紐節(jié)點。因為一個網(wǎng)絡(luò)在開始時,節(jié)點數(shù)量不多,后來產(chǎn)生的節(jié)點,總是傾向于鏈接網(wǎng)絡(luò)中已有的節(jié)點,最早的一批節(jié)點能獲取到最多的鏈接。在微信公眾號這樣一個復雜網(wǎng)絡(luò)中,節(jié)點的數(shù)量已經(jīng)超過了2000萬個,很多人羨慕做得早的公眾號,它們中很多都成為了10萬+的大號。后來進入這個網(wǎng)絡(luò)的人,不管是后進場的公眾號,還是后來關(guān)注公眾號的用戶,都愿意靠近已經(jīng)存在于網(wǎng)絡(luò)中的重要節(jié)點,這就是先發(fā)優(yōu)勢。
2.適者生存
適者生存指的是:競爭力更強,適應(yīng)度更高的節(jié)點,能獲取到的鏈接會更多。舉個例子,公眾號咪蒙起步很晚,2016年年初才開始更新,短短一年的時間里,粉絲數(shù)從0漲到了800萬。它在公眾號這樣一個無尺度網(wǎng)絡(luò)中成為了新的樞紐節(jié)點。因為它競爭力強,適應(yīng)度高,它獲取到的鏈接就會更多。一個公眾號如果文章寫得多寫得好,能夠引起更多人的共鳴和分享欲,即便一開始粉絲很少,但是在朋友圈得到的分享就會特別多,就能迅速成為無尺度網(wǎng)絡(luò)中的樞紐節(jié)點。這就是所有復雜網(wǎng)絡(luò)中共有的第二個特點:適者生存,優(yōu)勝劣汰。
3.健壯性與脆弱性并存
健壯性和脆弱性分別指什么?健壯,是非樞紐節(jié)點被破壞后不影響復雜網(wǎng)絡(luò)的結(jié)構(gòu),所以網(wǎng)絡(luò)體現(xiàn)出健壯性的特點。因為除了樞紐節(jié)點以外的其他節(jié)點對整個網(wǎng)絡(luò)來說都是次要的,砍掉這種節(jié)點,不會影響整個網(wǎng)絡(luò)的連通。就像砍掉壁虎的尾巴,并不會要了它的命,甚至過一陣子還會再生一條尾巴出來。而脆弱性指的是:一旦樞紐節(jié)點被破壞,整個系統(tǒng)就會迅速崩塌,網(wǎng)絡(luò)的結(jié)構(gòu)發(fā)生了重大變化。就像戳中了壁虎的心臟,壁虎很快就會死亡。因為心臟是它的樞紐節(jié)點,即便身體的其他部分都完好無損,也無濟于事。復雜網(wǎng)絡(luò)因此具有健壯性和脆弱性并存的特點。
三、關(guān)于復雜網(wǎng)絡(luò)與人工智能和大數(shù)據(jù)的關(guān)系
復雜網(wǎng)絡(luò)是樹根,大數(shù)據(jù)是樹干,人工智能是枝葉。分析大數(shù)據(jù)的方法,以及人工智能背后的深度神經(jīng)網(wǎng)絡(luò),都和無尺度網(wǎng)絡(luò)有著非常緊密的關(guān)系。雖然網(wǎng)絡(luò)科學的發(fā)展日新月異,但是最前沿的科技中同樣滲透著無尺度網(wǎng)絡(luò),這個網(wǎng)絡(luò)模型已經(jīng)成為科學家搭建復雜網(wǎng)絡(luò)、分析復雜網(wǎng)絡(luò)的基礎(chǔ)設(shè)施。復雜網(wǎng)絡(luò)縱有千姿百態(tài),無尺度都是它不變的內(nèi)核。對無尺度網(wǎng)絡(luò)的深刻洞察和廣泛應(yīng)用,加上海量的大數(shù)據(jù)對網(wǎng)絡(luò)節(jié)點進行不斷的訓練和調(diào)整,才有深度神經(jīng)網(wǎng)絡(luò)和人工智能的存在。
傳統(tǒng)的人工智能依賴科學家給它輸入各種規(guī)則模型,只能解決一些規(guī)則清楚的問題。但是今天的人工智能已經(jīng)能自己解決一些模糊的、規(guī)則不明確的問題,因為支撐它的是能夠進行深度學習的神經(jīng)網(wǎng)絡(luò)。這種網(wǎng)絡(luò)的特點是,具有多層結(jié)構(gòu),每一層神經(jīng)網(wǎng)絡(luò)都有很多個關(guān)鍵的節(jié)點,它們接收上一層處理完的數(shù)據(jù)結(jié)果,共同解決一個問題,把自己這一層的輸出結(jié)果傳遞到下一層去做進一步的處理。現(xiàn)在最流行的深度神經(jīng)網(wǎng)絡(luò)分為兩種:一種是處理空間分布數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò),另一種是處理時間分布數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡(luò)。它們的結(jié)構(gòu)特點,都與無尺度網(wǎng)絡(luò)有著密不可分的關(guān)系。
1.卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)可以用來做圖片識別,它對圖片的分析方法和我們分析無尺度網(wǎng)絡(luò)一樣,要抓住樞紐節(jié)點。比如在一個分辨貓和狗的識圖軟件中,每一層神經(jīng)網(wǎng)絡(luò)都需要處理一種能把它們明顯分開的特征,比如對臉部的分析,再把處理任務(wù)進一步細化,交給下一層去處理,比如瞳孔的粗細,直到最后一層處理單個像素。整個神經(jīng)網(wǎng)絡(luò)就是把區(qū)別貓和狗的任務(wù)拆解成許多任務(wù),一層一層處理,抓住樞紐節(jié)點,刻畫重要特征。
2.循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)可以用來做文字翻譯,最新的應(yīng)用就是“神經(jīng)網(wǎng)絡(luò)翻譯”。過去的機器翻譯,是把一句話里的字詞做切分以后逐個翻譯,再拼湊起來,經(jīng)常出錯。但是神經(jīng)網(wǎng)絡(luò)翻譯會把一整句話看成表達完整意思的網(wǎng)絡(luò),進行整體分析。每一個字詞作為樞紐節(jié)點的同時會尋找前后文中常見搭配的關(guān)鍵字詞,尋找鄰近的樞紐節(jié)點,從而區(qū)分出整句話中文字的重要性差異,把握住語句的基本結(jié)構(gòu)和修飾性成分,從而實現(xiàn)更準確的翻譯。神經(jīng)網(wǎng)絡(luò)翻譯的錯誤率,比原來的機器翻譯降低了55%到85%。
金句
1.復雜網(wǎng)絡(luò)縱有千姿百態(tài),無尺度都是它不變的內(nèi)核。
2.如果說隨機網(wǎng)絡(luò)是無序的、是雜亂無章的,那么無尺度網(wǎng)絡(luò)就是無序和有序并存的。表面上,每個節(jié)點都散亂地鏈接著其他節(jié)點,但是一旦抓住樞紐節(jié)點,整個網(wǎng)絡(luò)的結(jié)構(gòu)就變得清晰起來,無序之中就浮現(xiàn)出了有序。
3.對無尺度網(wǎng)絡(luò)的深刻洞察和廣泛應(yīng)用,再加上海量的大數(shù)據(jù)對網(wǎng)絡(luò)節(jié)點進行不斷的訓練和調(diào)整,才有深度神經(jīng)網(wǎng)絡(luò)和人工智能的存在。
4.復雜網(wǎng)絡(luò)是樹根,大數(shù)據(jù)是樹干,人工智能是樹枝樹葉。我們既要看到繁茂的枝葉和粗壯的樹干,也要看到樹根奠定了它們賴以生長的基礎(chǔ)。
撰稿:劉家琦
腦圖:摩西
轉(zhuǎn)述:成亞