復雜系統的科普——《復雜》讀書筆記

注:此文有大量原文引用,但并無牟利目的,如涉及版權問題,請通知本人下架。另禁止轉載。


[格式]

原文摘錄

我的批注


作者:梅拉妮·米歇爾

前言


1、還原論

(1)介紹

從 17 世紀以來,還原論就一直在科學中占據著主導地位。

還原論最早的倡議者之一笛卡兒這樣描述他的科學方法:“將面臨的所有問題盡可能地細分, 2 細至能用最佳的方式將其解決為止”,并且“以特定的順序引導我的思維,從最簡單和最容易理解的對象開始,一步一步逐漸上升,直至最復雜的知識”。

(2)局限性

還原論的計劃在許多現象面前都止步不前:天氣和氣候似乎無法還原的不可預測性;生物以及威脅它們的疾病的復雜性和適應性;社會的經濟、政治和文化行為;現代技術與通訊網絡的發展和影響;智能的本質以及用計算機實現智能的可能前景。

2、新的學說

對復雜行為如何從簡單個體的大規模組合中出現進行解釋時,混沌、系統生物學、進化經濟學和網絡理論等新學科勝過了還原論,反還原論者的口號——“整體大于部分之和”—也隨之變得越來越有影響力。

20世紀中葉,一些人開始嘗試建立新的基礎,這其中包括控制論、協同學、系統科學,以及最近才出現的——復雜系統科學

第一部分 背景和歷史


第1章 復雜系統


1、例子

自然界中的各種復雜系統——比如昆蟲群落、免疫系統、大腦和經濟.

2、共性

復雜系統存在很多共性:

  • 擁有復雜的集體行為。
  • 遵循規則,但卻不存在中央控制或領導者。
  • 信號和信息處理:所有這些系統都利用來自內部和外部環境中的信息和信號,同時也產生信息和信號。
  • 適應性:所有這些系統都通過學習和進化過程進行適應,即改變自身的行為以增加生存或成功的機會。

3、介紹

定義1:

復雜系統是由大量組分組成的網絡,不存在中央控制,通過簡單運作規則產生出復雜的集體行為和復雜的信息處理,并通過學習和進化產生適應性。

定義2:

如果系統有組織的行為不存在內部和外部的控制者或領導者,則也稱之為自組織(self-organizing)。由于簡單規則以難以預測的方式產生出復雜行為,這種系統的宏觀行為有時也稱為涌現(emergent)。這樣就有了復雜系統的另一個定義:具有涌現和自組織行為的系統。

一門新的科學形成的過程,就是不斷嘗試對其中心概念進行定義的過程

第2章 動力學、混沌和預測


1、動力學

(1)介紹

動力系統理論(動力學, dynamics)關注的是對系統的描述和預測,其所關注的系統通過許多相互作用的組分的集體行為涌現出宏觀層面的復雜變化。

動力一詞意味著變化。而動力系統則是以某種方式隨時間變化的系統。

近年來,動力系統理論很受大眾關注,這是因為它的一個分支——混沌學——發現了一些讓人著迷的結果。

下面會提到。

(2)線性系統與非線性系統

在物理科學中,如果描述某個系統的方程其輸入(自變數)與輸出(應變數)不成正比,則稱為非線性系統

由于自然界中大部分的系統本質上都是非線性的,因此許多工程師、物理學家、數學家和其他科學家對于非線性問題的研究都極感興趣。

非線性系統跟線性系統相比的特點在于:

  • 不滿足疊加定理(整體不等于部分之和)
  • 不一定存在唯一解(或不一定存在唯一的平衡狀態)
  • 對初始值極度敏感(所以才有”蝴蝶效應”)

結果就是:非線性系統可能會導致混沌、不可預測,或是不直觀的結果。

2、混沌學

(1)混沌學之前

亞里士多德是目前所知的最早論述運動理論的人之一。

再到牛頓力學的世界里人們想象著可以知道參數和規律來作”精確預測“。

然而混沌的發現給了精確預測的夢想最后一擊。

(2)混沌學誕生

混沌學屬于非線性科學。混沌理論(Chaos theory)是關于非線性系統在一定參數條件下展現分岔、周期運動與非周期運動相互糾纏,以至于通向某種非周期有序運動的理論。

所以非線性系統的特點它都有。

第一個明確的混沌系統的例子可能是19世紀末由法國數學家龐加萊(Henri Poincaié)給出。龐加萊是現代動力系統理論的奠基者,可能也是貢獻最大的人,大力推動了牛頓力學的發展。

(3)混沌學的常見誤解

1、混沌是隨機而不可預測的

混沌不是隨機的,而是確定的。 而難以預測是因為在混沌系統中:

  • 對初值進行哪怕及其微小的擾動,都會極大地影響系統后來的變化趨勢。
  • 數值的誤差(包括初值測量的誤差和計算誤差)

但我們無法完美掌握上面兩項,所以混沌顯得隨機,且無法預測。

但在大量混沌系統的普適共性中卻有一些“混沌中的秩序”,即在更高的層面上混沌系統卻是可以預測的。例如通往混沌的倍周期之路,以及費根鮑姆常數。

第3章 信息


1、熵是什么

(1)熱力學

① 定義

化學及熱力學中所謂熵,是一種測量在動力學方面不能做功的能量總數,也就是當總體的熵增加,其做功能力也下降,熵的量度正是能量退化的指標。

打個比方,假設你的車在路上拋錨了,你不得不自己把車推到最近的加油站。用物理學的話講,你做的功等于你推車的力的大小乘以到加油站的距離。在推車的過程中,你將你體內儲存的能量轉化成了車的動能,而轉化的能量就等于所做的功加上輪子與地面摩擦消耗的熱量以及你自己體溫升高所耗費的熱量。這個熱量損失可以用熵度量。是對不能轉化成功的能量的度量

“熵(entropy)”一詞源自另一個古希臘詞匯——“trope”——意思是“變成”或“轉化”。

② 麥克斯韋妖

1871年,麥克斯韋在《論熱能》(Theory of Heat)一書中提出了一個難題,題為“熱力學第二定律的局限”。麥克斯韋假設有一個箱子被一塊板子隔成兩部分,板子上有一個活門。活門有一個“小妖”把守,小妖能測量氣體分子的速度。對于右邊來的分子,如果速度快,他就打開門讓其通過,速度慢就關上門不讓通過。對于左邊來的分子,則速度慢的就讓其通過,速度快的就不讓通過。一段時間以后,箱子左邊分子的速度就會很快,右邊則會很慢,這樣熵就減少了。

這就違背了熱力學第二定律。而當時有的人反駁說一定有什么能量的耗費但沒有被探測到。

后來數學家班尼特( Charles Bennett)證明, 有非常巧妙的方式可以觀察和記住信息——對小妖來說,也就是弄清分子是快是慢——而不用增加熵。班尼特的證明成了可逆計算( reversible computing)的基礎,他證明在理論上可以進行任何計算而不用耗費能量。

不過,班尼特認為,物理學家蘭道( Rolf Landauer)在 20 世紀 60 年代做出的一項發現可以挽救熱力學第二定律:并不是測量行為,而是擦除記憶的行為,必然會增加熵。擦除記憶是不可逆的;如果被擦除了,那么一旦信息沒有了,不進行額外的測量就無法恢復。班尼特證明,小妖如果要工作,到一定的時候就必須擦除記憶,如果這樣,擦除的動作就會產生熱(當初獲取信息則需要額外做功),增加的熵剛好抵消小妖對分子進行分選而減少的熵。

這證明物理和精神并非完全獨立

(2)統計力學

① 定義

熵亦還被用于計算一個系統中的失序現象,也就是計算該系統混亂的程度。

② 統計力學

統計力學(Statistical mechanics)是一個以玻爾茲曼等人提出以最大熵理論為基礎,借由配分函數將有大量組成成分(通常為分子)系統中微觀物理狀態(例如:動能、勢能)與宏觀物理量統計規律 (例如:壓力、體積、溫度、熱力學函數、狀態方程等)連結起來的科學。

例如溫度,統計力學認為宏觀尺度上的屬性(例如熱)是由微觀屬性產生(例如無數分子的運動)

③ 經典力學 vs 統計力學

經典力學分析是確定每個分子的位置和速度,以及作用在分子上的力,并根據這些確定每個分子未來的位置和速度。

而統計力學的方法則不關心各個分子具體的位置、速度以及未來的變化,而是去預測大量分子整體上的平均位置和速度。

統計力學在兩個極端之間搭建了一座橋梁,解釋了宏觀現象是如何從對大量微觀對象的整體上的統計產生。

④ 統計力學局限性

它只給出系統的可能行為。

(3)信息論

信息論對物理學的各領域是否有反向影響還有爭議。

① 介紹

數學家香農(Claude Shannon)發展信息論也是受20世紀的通訊革命推動,尤其是電報和電話的發展。

在1948年,香農將熱力學的熵,引入到信息論,叫信息熵,又被稱為香農熵(Shannon entropy)。

在信息論里面,信息熵是隨機事件不確定性的度量。

具體有點復雜,這里不做展開了。

② 應用

信息論是密碼學和新興的生物信息學的基礎,生物信息學通過分析基因序列的模式測量熵等信息論度量。
信息論也被應用到語言和音樂的分析,以及心理學、統計推斷和人工智能等領域。

③ 前景

一些基于香農信息論的物理學新思路(例如量子信息論和信息物理學)正不斷發展。

2、 熵增定律

熵增定律即熱力學第二定律

熱力學第一定律即能量守恒定律

熵增定律。即熵總是不斷增加直至最大。

熱力學第二定律被認為是定義了“時間之箭”,因為它證明了存在時間上不可逆的過程(比如,熱量自發地回到你的冰箱,并轉化成電能進行制冷)。“未來”可以定義為熵增的時間方向。

有趣的是,熱力學第二定律是唯一區分過去和未來的基本物理定律。“為什么第二定律能區分過去和現在,而其他自然定律卻不能?這也許是物理學中最大的謎團。”

我認為,熱力學第二定律,在自然界的定律中具有至高無上的地位……如果你的理論被發現違背了熱力學第二定律,你就一點希望都沒有,結局必然是徹底崩塌。

第4章 計算


1、哥德堡不完備性定理

大數學家希爾伯特很有信心,斷言“不存在不可解的問題”。

一位25歲的數學家宣布了對不完備性定理的證明,他的發現震驚了整個數學界,這位年輕人名叫哥德爾(KurtG?del)。

哥德爾的證明很復雜。不過直觀上卻很容易解釋。哥德爾給出了一個數學命題,翻譯成白話就是“這個命題是不可證的”。

2、圖靈停機問題

具體可參考這個視頻:動畫通俗解釋-為什么圖靈停機問題計算機永遠無法解答?

結論:計算存在局限

3、總結

量子力學和混沌摧垮了精確預測的希望,哥德爾和圖靈的結果則摧垮了數學和計算無所不能的希望。

第5章 進化


1、生物的熵

熵的減少(生命系統結構越來越復雜,就像設計過的)是自然選擇的結果。這個過程所需的能量來自生物從環境中獲取的能量(陽光、食物等)。

2、現代綜合進化論

(1)介紹

將達爾文理論和孟德爾遺傳學這兩個重要發現結合,再加上群體遺傳學等生物學的分支,共同形成了后來所謂的“現代綜合( the Modem Synthesis)”。

群體遺傳學( population genetics)用來理解在孟德爾遺傳學和自然選擇作用下演化種群的等位基因的動力學。

現代綜合在20世紀30、40年代得到了進一步發展,并形成了此后50年被生物學家普遍接受的一系列進化原則。

具體原則看原書。略。

(2)質疑

古爾德和埃爾德雷奇等人提出,現代綜合預測的生物形態漸變不符合實際的化石記錄:生物形態在很長時間里都沒有變化(也沒有新物種出現),而在(相對)很短的時間里形態卻出現了劇烈變化,并產生出新的物種。這個特點被稱為間斷平衡( punctuated equilibria)。

另有一些人則維護現代綜合,認為化石記錄很不完整,不能做出這樣的推斷。

古爾德同意自然選擇是進化很重要的機制,但他認為歷史偶然生物約束(biological constraints)的作用至少同樣重要。

生物約束則是指自然選擇所能創造的會有局限。顯然自然選擇不能違背物理定律—它不能創造出違反萬有引力定律的飛禽或是無須進食的永動動物。古爾德等人認為,同物理約束一樣,生物約束也對生物的進化有限制。這個觀點很自然延伸出一個結論,就是并不是生物的所有性狀都能用“適應性”解釋。饑餓感和性欲這些性狀顯然能增加我們的生存和繁衍機會。

但有些性狀可能是來源于偶然,或是適應性狀和發育約束的旁效應。古爾德經常批評他所謂的“絕對適應論者”。

20 世紀 60 年代,木村( Motoo Kimura)根據對蛋白質進化的觀察提出了“中性進化”的理論, 80 挑戰自然選擇在進化中的中心地位。

(3)小結

雖然古爾德和埃爾德雷奇等人挑戰了現代綜合的信條,他們卻同所有生物學家一樣,仍然擁護達爾文主義的基本思想。

第6章 遺傳學概要


主要是一些高中生物的遺傳學知識,這里略。

第7章 度量復雜性


1、復雜性不好度量

原因是復雜性科學不止一個,而是有好幾個,每個對復雜性的定義都不一樣。

核心概念缺乏公認的定義是很普遍的。牛頓對力的概念就沒有很好的定義,事實上他不是很喜歡這個概念,因為它需要一種魔術般的“遠距離作用”,而這在對自然的機械論解釋中是不允許的。遺傳學作為生物學領域發展最快和最大的學科,對于如何在分子層面上定義基因的概念也沒有達成一致。心理學家對思維和概念也沒有明確的定義,更不知道它們在大腦中對應的是什么。這還只是部分例子。科學的進步往往就是通過為尚未完全理解的現象發明新術語實現的:隨著科學逐漸成熟,現象逐漸被理解,這些術語也逐漸被提煉清晰。

2、度量方法

用大小度量復雜性

① 介紹

例如進化中,比較生物個體的基因的個數或堿基對的個數。

② 局限性

如果比較堿基對數量,人類比酵母復雜 250 倍,如果比較基因數量,人類則只比酵母復雜 4 倍。 250 倍還是蠻多的,看來人類還是挺復雜,至少比酵母復雜。不過單細胞變形蟲的堿基對是人類的 225 倍,擬南芥的基因與人類的大致一樣多。

用熵度量復雜性

① 介紹

上面有介紹,這里略。

② 局限性

最復雜的對象不是最有序的或最隨機的,而是介于兩者之間。

用算法信息量度量復雜性

① 定義

能夠產生對事物完整描述的最短計算機程序的長度。這被稱為事物的算法信息量。

② 局限性

蓋爾曼認為任何事物都是規則性和隨機性的組合。

用邏輯深度度量復雜性

① 介紹

一個事物的邏輯深度是對構造這個事物的困難程度的度量。

為了更精確地定義邏輯深度,班尼特將對事物的構造換成了對編碼事物的0/1序列的計算。例如,我們可以用兩位二進制數來編碼核苷酸符號:A=00,C=01,G=10,T=11。用這個編碼,我們就能將A、C、G、T轉換成0/1序列。然后編寫一個圖靈機,用編寫好的圖靈機在空白帶子上產生出這個序列,所需要的時間步就是其邏輯深度。

② 局限性

邏輯深度具有很好的理論特征,符合我們的直覺,但是也沒有具體給出度量實際事物復雜性的方法,因為沒有尋找生成指定事物的最小圖靈機的可操作方法,更不要說如何確定機器運算所需的時間。此外也沒有考慮將事物表示成0/1序列的困難。

用熱力學深度度量復雜性

① 介紹

熱力學深度首先是確定“產生出這個事物最科學合理的確定事件序列”,然后測量“物理構造過程所需的熱力源和信息源的總量”。

例如,要確定人類基因組的熱力學深度,我們得從最早出現的第一個生物的基因組開始,列出直到現代人類出現的所有遺傳演化事件(隨機變異、重組、基因復制,等等)。可以想象,人類進化出來的時間比變形蟲要長10億年,熱力學深度肯定也大得多。

② 局限性

同邏輯深度一樣,熱力學深度也只是在理論上有意義,要真的用來度量復雜性也存在一些問題。

也有批評意見指出,勞埃德和裴杰斯的定義中沒有明確界定什么是“事件”。

用計算能力度量復雜性

① 介紹

一種觀點認為,系統的計算能力如果等價于通用圖靈機的計算能力,就是復雜系統。

② 局限性

不過,班尼特等人則認為,具有執行通用計算的能力并不意味著系統本身就是復雜的;應當測量的是系統處理輸入時的行為的復雜性。

這個好難懂。

用分形維度量復雜性

① 分形

分形最經典的例子是海岸線。

  • 你以人或是以蝸牛的視角近距離觀察巖石,相似的景象還是會一次又一次出現。海岸線在不同尺度上的相似性就是所謂的“自相似性”。
  • 你以人或是以蝸牛的視角近距離觀察巖石,去衡量海岸線的長度,也是不一樣。衡量尺度越小,長度也趨近于越大。

現實世界中許多事物都有自相似結構。海岸線、山脈、雪花和樹是很典型的例子。曼德布羅特甚至提出宇宙也是分形的,

但一般來說分形指的是“在任何尺度上都有微細結構”的幾何形狀。

② 分形維

將幾何結構從各邊分成X等份,不斷重復這個過程。每次得到的將是前一次的個拷貝。根據維數的這種定義,直線是1維,正方形是2維,立方體是3維。都沒有問題。現在將這個定義類推到科赫曲線。每次直線段都是之前的1/3長,而得到的則是之前的4個拷貝。根據前面的定義,應該是3維數=4。維數是多少呢?這里我們直接給出結果104(計算過程在注釋中給出),根據前面的規律,維數約為1.26。也就是說,科赫曲線既不是1維也不是2維,而是介于兩者之間。太奇怪了,分形的維數居然不是整數。這正是分形的奇特之處。

但只有完美的分形——可以縮小直至無窮——才有精確的分形維數。像海岸線這類真實世界的有窮類分形事物,我們只能測量近似的分形維數。

③ 用分形維衡量復雜度

分形維表示了物體的“粗糙度”、“凸凹度”、“不平整度”或“繁雜度”;物體的“破碎”度;還有物體的“結構致密”程度。

分形維數一定程度上量化了細節的有趣程度與你觀察的放大率之間的關系。這也就是為何人們對用分形維數度量復雜性感興趣,許多科學家都用其來度量真實世界的現象。

用層次性度量復雜性

① 介紹

文中西蒙提出一個系統的復雜性可以用層次度(degree of hierarchy)來刻畫:“復雜系統由子系統組成,子系統下面又有子系統,不斷往下。”

復雜系統最重要的共性就是層次性不可分解性。西蒙列舉了一系列層次結構的復雜系統——例如,身體由器官組成,器官又是由細胞組成,細胞中又含有細胞子系統,等等。某種程度上,這個觀念與分形在所有尺度上都自相似類似。不可分解性指的是,在層次性復雜系統中,子系統內部的緊密相互作用比子系統之間要多得多。例如,細胞內部的新陳代謝網絡就比細胞之間的作用要復雜得多。

② 局限性

嵌套僅僅描述了生物的結構,而不涉及其功能。

第二部分 計算機中的生命和進化


第8章 自我復制的計算機程序


DNA不僅包含自我復制的“程序”(例如用來解開和復制DNA的酶),同時也編碼了它自己的解釋器(將DNA轉譯成酶的細胞器)。

馮·諾依曼設計的自復制自動機是人工生命科學真正的先驅之一,從原則上證明了自我復制的機器的確是可能的,并且提供了自我復制的“邏輯”,后來證明其與生物的自我復制機制驚人的相似。

馮·諾依曼都是真正的天才。在相對短暫的一生中,他至少在6個領域作出了基礎性的貢獻:數學、物理、計算機科學、經濟學、生物學和神經科學。

第9章 遺傳算法


在對“機器能否復制自身”的問題給予肯定回答后,馮· 諾依曼很自然地想讓計算機(或計算機程序)復制自己和產生變異,并在某種環境中為生存競爭資源。這就會遇到前面提到的“生存本能”以及“進化和適應”的問題。可惜的是馮· 諾依曼還沒有研究進化問題就去世了。其他人很快就開始繼續他留下的工作。 20 世紀 60 年代初,一些研究團體開始在計算機中進行進化實驗。這些研究現在統稱為進化計算( evolutionary computation)。其中最為著名的是密歇根大學的霍蘭德和他的同事、學生進行的遺傳算法( genetic algorithms)研究。

遺傳算法已被用于解決科學和工程領域的許多難題,甚至應用到藝術、建筑和音樂。

第三部分 大寫的計算


第10章 元胞自動機、生命和宇宙


1、介紹

詳細了解可以看這個視頻:用游戲模擬森林火災?什么是元胞自動機?

在 N * M 的格子里,每個格子放著燈泡,燈泡每一步如何“決定”是開還是關呢?它們都遵循一些規則,根據鄰域內燈泡的狀態—也就是相鄰的 8 個燈泡和它自己的狀態——來決定下一步的狀態(是開還是關)。

這個燈泡陣列其實就是一個元胞自動機。元胞自動機是由元胞組成的網格,每個元胞都根據鄰域的狀態來選擇開或關。(廣義上,元胞的狀態可以隨便定多少種,但是這里我們只討論開/ 關狀態。)所有的元胞遵循同樣的規則,也稱為元胞的更新規則,

為什么說這么簡單的系統會是復雜系統的理想化模型呢

因為馮·諾依曼證明他的元胞自動機等價于通用圖靈機(雖然她的結構完全不同于計算機)。元胞的更新規則扮演了圖靈機讀寫頭的規則的角色,而元胞陣列的狀態則相當于圖靈機的帶子——也就是說,它可以編碼通用圖靈機運行的程序和數據。元胞一步一步的更新相當于通用圖靈機一步一步的迭代。能力等價于通用圖靈機的系統(也就是說,通用圖靈機能做的,它也能做)被稱為通用計算機,或者說能進行通用計算。

2、元胞自動機 vs 圖靈機

① 輸入、輸出、中間態

圖靈機略。

我們可以說元胞自動機的信息就是元胞格子在每一步的狀態組合。輸入就是初始狀態組合,輸出則是最終的狀態組合,在每個中間步的信息則根據元胞自動機規則在元胞鄰域內進行傳遞和處理。

② 輸入、輸出、中間態的解讀

圖靈機輸入和輸出的信息的意義來自于人們(程序員或使用者)的解讀。中間步驟產生的信息的意義也來自人們對高級語言命令步驟的解讀(或設計)。

元胞自動機意義來自人們對所執行的任務的認識以及對從輸入到輸出的映射的解讀(例如,“元胞最終都變成了白色;這意味著初始狀態組合中白色元胞占多數”)。但中間步驟產生的信息,在這個層面上描述信息處理就類似于在“機器碼層面”進行描述,我們也需要一種高級語言來理解中間步驟的計算,對元胞自動機底層的具體細節進行抽象。

③ AI 解讀

(雖然目前階段)信息對于計算機本身是沒有意義的,只對人類創造者和“最終使用者”才有意義。

AI的終極目標是讓人擺脫意義的怪圈,并且讓計算機本身能理解意義。這是AI中最難的問題。數學家羅塔(Gian-Carlo Rota)稱這個問題為“意義屏障”,不知道AI是否或何時能“破解”它。

3、局限性

不過,實際上,稍微復雜一點的計算就需要大量邏輯運算,并以各種方式相互作用,因此要設計出能實現復雜計算的初始設置基本不太可能。即使設計得出來,計算也會慢得讓人無法忍受。

因此沒有人用生命游戲(或其他“通用”元胞自動機)來進行真實計算或是模擬自然系統。我們只是想利用元胞自動機的并行特征以及它產生復雜圖形的能力。

正如上面2、元胞自動機 vs 圖靈機所說。

馮·諾依曼結構的計算之所以容易描述,一個原因就是,編程語言層面和機器碼層面可以毫無歧義地相互轉化,因為計算機的設計讓這種轉化可以很容易做到。計算機科學提供了自動編譯和反編譯的工具,讓我們可以理解具體的程序是如何處理信息的。而元胞自動機則不存在這樣的編譯和反編譯工具,至少目前還沒有,也沒有實用和通用的設計“程序”的高級語言。用粒子來幫助理解元胞自動機高級信息處理結構的思想也是最近才出現,還遠沒有形成此類系統的計算理論體系。

第11章 粒子計算


是用遺傳算法設計元胞自動機規則。

看不懂,略。

第12章 生命系統中的信息處理


1、信息與計算

在許多人看來,信息具有本體地位,同質量和能量一樣,被當做實在的第三種基本成分。在生物學中尤其如此,將生命系統描述成信息處理網絡已成為潮流。

信息不像在傳統計算機中那樣,位于系統中的某個具體位置。在這里它表現為系統組分的動態模式和統計結果。

計算是復雜系統為了成功適應環境而對信息進行的處理

2、實例

  • 雖然免疫系統攻擊外來病原體,它也還是有義務在攻擊的毒性和盡可能防止傷害身體之間進行平衡。免疫系統使用了一系列機制來實現這種平衡(目前對這些機制還知之甚少)。其中許多機制都依賴于一組信號分子,被稱為細胞因子( cytokines)。
  • 類似的這種利用信息素與其他個體直接交互的機制可能也是其他種類螞蟻和社會昆蟲集體行為的基礎。

3、信息是如何被傳遞和處理的

(1)采樣探測

沒有哪個個體組分能感知或傳達系統狀態的“宏觀畫面”。信息必須通過空間和時間采樣來傳遞。

由于獲得的信息具有統計性,系統組分的行為就必然是隨機的(至少“不可預測”)。

(2)微粒化探測

微粒化探測復雜生物系統絕大多數都有微粒化結構,它們由大量相對比較簡單的個體組成,個體以高度并行的方式協同工作。這種結構有幾個可能的好處,穩健、效率高、可以演化。還有一個額外的好處就是微粒化并行系統能進行侯世達所說的“并行級差掃描( parallel terraced scan)”。他指的是對許多可能性和路徑同時進行探測,某項探測所能獲得的資源依賴于其當時的成效。搜索是并行的,許多可能性被同時探測,但是存在“級差”,意思是并不是所有可能都以同樣的速度和深度進行探測。利用獲得的信息不斷調整探測,從而有所側重。

不僅如此,微粒化系統天生具有冗余度,因此即使有個體組分不能可靠工作,獲取的信息也只是統計性的,系統還是能正常運轉。冗余度使得對信息有許多獨立的采樣,而且只有大量組分采取同樣的微粒化行動時才會產生效果。

(3)探測需要平衡

隨機性必須與確定性達成平衡:復雜適應系統的自我調節不斷調整各項事務的概率——個體應該向哪里移動,它們應當采取什么行動,以及如何探測龐大空間中的具體路徑。

對于所有的適應性系統,在兩種探測模式中保持適當的平衡都是關鍵。而最優的平衡點隨時間不斷變化。開始時所知的信息很少,探測基本是隨機分散的。隨著信息增多并產生影響,探測逐漸變得具有確定性,集中于對系統的感知進行響應。簡而言之,系統既要探測信息,又要對信息加以利用,不斷調整適應。分散探測集中行動之間進行平衡(即搜索和開發之間進行平衡)可能是適應性和智能系統的共性。

例如,蟻群的解決方案是讓大部分螞蟻采取兩種策略的組合:不斷隨機搜索與簡單地跟隨信息素軌跡并沿途留下更多信息素的反饋機制相結合。

(4)遺留難題

但是在前面描述的復雜系統中,并不存在中央控制或領導者,那么是誰或是什么在覺察當前情勢的意義 ,然后據此做出適當的反應呢?這個問題實際上問的就是什么構成了生命系統的意識或自我意識。對我來說,這個問題是復雜系統研究和整個科學最深的謎團。這個謎團是許多科學和哲學書的主題,但是至今還沒有讓人完全滿意的答案。

第13章 如何進行類比(如果你是計算機)


1、什么是類比

類比是在兩個表面上不同的事物之間發現抽象的相似性的能力。

人們在各種層面上都能很好地認識到兩種事物和情形之間的類似之處,讓各種概念從一種情形流暢地“滑到”另一種情形。

19 世紀哲學家梭羅( Henry David Thoreau)說的,“所有對真理的認識都是通過類比得來。”

2、計算機的類比

計算機的類比能力可以說是臭名昭著。

人類的大部分言辭原則上講都有些模棱兩可,而現代計算機則對上下文一點也不敏感。

明斯基(Marvin Minsky)是人工智能的先驅之一,他曾簡明扼要地總結AI的悖論:“容易的事很難。”

第14章 計算機模型


1、建模的意義

科學家們說是在研究自然,但實際上他們做的大部分事情都是在對自然進行建模,并對所建立的模型進行研究。

理想模型有許多用途:研究一些復雜現象背后的一般機制(例如,馮·諾依曼研究自復制的邏輯);證明解釋某種現象的機制是不是合理(例如,種群數量的動力學);研究簡單模型在變化后的效應(例如,研究遺傳算法的變異率或邏輯斯蒂映射的控制參數R變化所帶來的影響);或者更普遍是作為哲學家丹尼特(Daniel Dennett)所謂的“直覺泵192(intuition pump)”——用來引導對復雜現象進行理解的思維實驗或計算機仿真。

建模的藝術就是去除實在中與問題無關的部分,建模者和使用者都面臨一定的風險。建模者有可能會遺漏至關重要的因素;使用者則有可能無視模型只是概略性的,意在揭示某種可能性,而太過生硬地理解和使用實驗或計算的具體結果樣本。

2、計算機仿真

(1)介紹

理論科學和實驗科學之外又產生了一個新的門類:計算機仿真

計算機模型也必須是可重復的——也就是說,其他人重新構造所提出的模型要能得到同樣的結果。阿克塞爾羅德就極力擁護這種觀點,他寫道:“可重復性是科學積累的基石”。

(2)應用

① 囚徒困境

這就是囚徒困境悖論—用政治學家阿克塞爾羅德(Roert Axelrod)的話說,“每個人都追求自利,使得所有人的利益都受損。“

但本質上自私的個體中是怎么產生出合作的。這不僅僅是個科學問題,也是政治問題。

囚徒困境及其變體作為理想模型體現了合作問題的本質。

第四部分 網絡


第15章 網絡科學 & # 第16章 真實世界中的網絡


1、網絡科學與網絡思維

(1)網絡科學的誕生

在這項著名的實驗中,米爾格蘭姆發現,在送達的信件中,從發信人平均經過5個熟人就送到了收信人。這個發現后來廣為人知,被稱為“六度分隔(six degrees of separation)”。

過去十年中,這些網絡的問題吸引了無數復雜系統研究者,從而產生了所謂的“網絡新科學”。

(2)網絡科學無處不在

許多自然、技術和文化現象經常被描述為網絡,航線圖就是一個明顯的例子。大腦是神經元通過突觸連接起來的巨大網絡。細胞中的遺傳活動是受由基因通過調節蛋白質連接起來的復雜網絡控制。社會則是由各種各樣的關系連接起來的人(或組織)組成的網絡。萬維網則更是現代社會的典型網絡。在國家安全領域,識別和分析可能的“恐怖分子網絡”是很重要的工作。直到不久前,網絡科學都不被視為一個研究領域。數學家研究抽象網絡結構的學科被稱為“圖論”。

(3)網絡思維的重要性

也許最重要的是,這些科學家逐漸意識到,各種高度復雜的網絡系統對人類生活和福祉的影響越來越大,迫切需要有新的思想和方法——真正全新的思考方式——來幫助理解它們。巴拉巴西將這種新方法稱為“網絡思維”。

網絡思維意味著關注的不是事物本身,而是事物之間的關系

(4)網絡科學的重要性

網絡科學的目的就是提煉出這些共性,并以它們為基礎,用共同的語言來刻畫各種不同的網絡。同時網絡科學家也希望能理解自然界中的網絡是如何發展而來的,以及它們是如何隨時間變化的。對網絡的科學理解不僅會改變我們對各種自然和社會系統的理解,同時也會幫助我們更好地規劃和更有效地利用復雜網絡,包括更好的網絡搜索和萬維網路由算法,控制疾病傳播和有組織犯罪,以及保護生態環境。

2、網絡概念

(1)節點和邊

用最簡單的話說,網絡是由邊連接在一起的節點組成的集合。節點對應網絡中的個體(例如神經元、網站、人),邊則是個體之間的關聯(例如突觸、網頁超鏈接、社會關系)。

這表明大部分人的朋友相對較少,極少的人具有很多很多朋友。類似的,在萬維網上,少數網站極受歡迎(很多網站都有鏈接指向這些網站),例如有超過 7500 萬個鏈接指向谷歌,而大部分網站則幾乎沒什么知名度——例如只有 123 個鏈接指向我自己的網站(其中大部分可能都來自搜索引擎)。高連接度的節點被稱為中心節點(hub),它們是網絡中主要的信息或行為的傳遞渠道。

(2)網絡類型

其中有兩類模型被深入地進行了研究,分別是小世界網絡(small-woiid networks)和無尺度網絡(scale-free networks)。

① 小世界網絡

1、介紹:

在這種網絡中大部份的節點彼此并不相連,但絕大部份節點之間經過少數幾步就可到達。

2、特點:

  • 在日常生活中,有時你會發現,某些你覺得與你隔得很“遙遠”的人,其實與你“很近”。
  • 小世界網絡也經常表現出高度的集群性。

3、例子

電影演員網絡。

神經學家已經完整繪制了線蟲的腦神經網絡,并發現線蟲的腦是小世界網絡。最近,神經學家又繪制出了貓、恒河猴等動物甚至人類的一些高級功能腦區的連接結構,并且發現這些網絡同樣具有小世界特性。為什么進化喜歡具有小世界特性的大腦網絡呢?彈性可能是一個重要原因:我們知道神經元會不斷死去,但幸運的是,大腦仍然能正常運轉。大腦的中心節點則是另一回事:比如海馬區(負責短時記憶的網絡的中心),如果受到擊打或是疾病侵襲,后果將會是毀滅性的。

② 無尺度網絡

1、介紹

其典型特征是在網絡中的大部分節點只和很少節點連接,而有極少的節點與非常多的節點連接。

它一種更類似現實世界網絡的小世界網絡。

2、特點

總而言之,無尺度網絡對節點的隨機刪除具有穩健性,但如果中心節點失效或是受到攻擊就會非常脆弱。

網絡在增長時,連接度高的節點比連接度低的節點更有可能得到新連接。直觀上很明顯。朋友越多,就越有可能認識新朋友。網頁的入度越高,就越容易被找到,因此也更有可能得到新的入連接。換句話說就是富者越富。

3、例子

20世紀90年代,谷歌改變了這一切。谷歌提出了一種革命性的思想,用一種稱為“網頁排名(PageRank)”的方法對網頁搜索結果進行排序。其中的思想是網頁的重要性(和可能的相關性)與指向這個網頁的鏈接數量(入連接的數量)有關。

同典型的社會網絡一樣,大部分網頁為低連接度(入連接相對較少),極少部分網頁具有高連接度。

3、網絡傳播

(1)介紹

事實上,理解信息在網絡中的傳播方式是網絡科學現在面臨的最重要的問題。到目前為止我們討論的都只是網絡的結構一例如,靜態的度分布—還沒有討論網絡中信息傳播的動態行為。

(2)副作用

一種更普遍的網絡傳播現象——“連鎖失效( cascading failure)”。連鎖失效現象的存在促使人們關注網絡中的信息傳播以及其如何受網絡結構影響。網絡中的連鎖失效是這樣一個過程:假設網絡中每個節點都負責執行某項工作(例如傳輸電力)。如果某個節點失效了,它的工作就會轉移到其他節點。這有可能會讓其他節點負荷過重從而失效,又將它們的工作傳遞到其他還未失效的節點,這樣不斷發展。結果是失效如同加速的多米諾骨牌一樣擴散,從而讓整個網絡崩潰。

隨著我們的社會越來越依賴計算機網絡、網絡投票機、導彈防御系統、電子銀行,等等,連鎖失效的情況也越來越常見,威脅也越來越大。正如研究這種系統的專家安東諾普洛斯( Andreas Antonopoulos)指出的,“威脅來自復雜性本身”。因此!對連鎖失效及其應對策略的總體研究現在是網絡科學最活躍的研究領域。兩個影響最大的理論分別是自組織臨界性( Self- Organized Criticality, SOC)和高容錯性( Highly Optimized Tolerance, HOT)。 SOC 和 HOT 理論也提出了不同于偏好附連的機制解釋無尺度網絡的產生。這兩個理論各自提出了一組進化和工程系統連鎖失效的普適機制。

第17章 比例之謎


1、比例

(1)什么是比例

比例描述的是一個屬性改變時,其他相關的屬性會如何改變。

(2)生物學的比例

研究的是生物的大小變化時其他屬性會如何變化。

2、比例之謎

(1)以代謝率為例 - 代謝比例理論

① 起源

人們很早就發現,相對于體重大小來說,較小動物的代謝率比較大的動物更快。(生物的代謝率可以定義為細胞將營養轉化為能量的速率。)

倉鼠產生的熱量也應該是老鼠的8倍。但是散熱要通過表皮,而倉鼠的表皮面積只是老鼠的4倍。這是因為動物的表皮面積并不正比于動物的體重(同樣也不正比于體積)。

他提出代謝率同體重的2/3次冪呈比例。這就是所謂的“表皮猜想“。

② 代謝比例理論

這個冪律關系后來被克萊伯修正,即其基礎代謝率水平與體重的 3/ 4 次冪成正比,現在被稱為克萊伯定律( Kleiber' s law)。

”次冪“就是我們常說的”次方“。

這個理論又叫做代謝比例理論(Metabolic scaling theory,或簡單代謝理論),結合了生物學和物理學,也在這兩個領域引起了很大的轟動和爭議。

③ 適用范圍

最近有研究發現, 3/ 4 次冪比例不僅對哺乳動物和鳥類成立,對魚類、植物,甚至單細胞生物也成立。克萊伯定律是建立在對代謝率和體重的測量的基礎上,克萊伯沒有解釋這個定律為什么成立。結果克萊伯定律一直困擾著生物學家們。生命系統的重量范圍很大,細菌不到萬億分之一克,鯨魚則可能超過 10 萬千克。這個規律不僅違背簡單的幾何推理,適用范圍也大得驚人,涵蓋各種大小的生物,也適用于各種生物類型和生境。

再來看看微觀領域,研究組推測,他們的理論可以應用到細胞層面, 3/ 4 指數代謝比例既可以計算單細胞生物的代謝律,也適用于細胞內部分子層面的類代謝運輸過程!甚至包括像線粒體這樣的細胞器內部的類代謝過程。研究組還認為這個理論可以解釋生物 DNA 的變化速率。

在大的方面,代謝比例理論及其擴展已經被應用到整個生態系統。

④ 地位

有人認為代謝比例理論“有統一整個生物學的潛力

廣義代謝理論的涌現對于生物學的重要性將類似于遺傳理論。”

(2)冪律關系

① 介紹

后來生物學家們發現了大量的冪律關系,都是分母為 4 的分數指數。例如心率、生命期、妊娠期以及睡眠時間等。

因此,這些關系也被稱為四分冪比例律( quarter- power scaling laws)。

② 地位

冪律卻在很多現象中都有被發現,以至于一些科學家說它“比‘正態’還要正態”。

(3)產生原因

到底是生物的哪種共性導致了這個簡單而優雅的規律呢?

科學家們對自然界中鐘形曲線分布的成因有很好的理解,但冪律在一定程度上卻還是個謎。

有一種結論是,分形結構是產生冪律分布的一種方式;如果你發現某種量(例如代謝率)遵循冪律分布,你就可以猜想這是某種自相似或分形系統導致的。

圓這樣的二維對象有周長和面積。如果是三維,就分別對應表面積和體積。如果是四維,表面積和體積則分別對應于“表面”體積和超體積——這個量很難想象,因為我們天生擅長思考三維,不擅長思考四維。表面積與體積呈指數為2/3的比例關系,通過類似的論證,就可以知道四維的表面體積與超體積呈指數為3/4的比例關系。

“雖然生物是三維的,內部的生理結構和運作卻表現為四維……分形幾何給了生命一個額外的維度。”

(4)拓展 - 齊普夫定律

① 介紹

如果把一篇較長文章中每個詞出現的頻次統計起來,按照高頻詞在前、低頻詞在后的遞減順序排列,并用自然數給這些詞編上等級序號。

齊普夫用這種方法分析了大量文本(沒有借助計算機),他發現,對于大規模文本,詞頻大致正比于其排名的倒數(也就是 1/ 排名)。這是指數為- 1 的冪律。排名第二的詞的頻數大約是排第一的詞的一半,第三大約是 1/ 3,等等。這個關系現在被稱為齊普夫定律( Zipf' s law),這可能是最著名的冪律。

通俗點就是詞頻分布定律。

② 原因

對齊普夫定律有各種解釋,齊普夫自己提出,一方面,人們一般都遵循“最省力原則( Principle of Least Effort)”:一旦用到了某個詞,對類似的意思再用這個詞就比換其他詞要省力。另一方面,人們希望語言沒有歧義,這又需要用不同的詞來表示相似卻又不完全一樣的意思。齊普夫從數學上證明了這兩種傾向在一起會產生觀察到的冪律分布。

所以齊普夫定律也叫省力法則

結果,幾乎與此同時,讓所有人都大跌眼鏡,心理學家喬治·米勒(George Miller)使用簡單的概率論證明,讓猴子在鍵盤上隨意敲擊,如果(偶然)敲到了空格鍵就斷詞,這樣得出的文本同樣遵循齊普夫定律。

我覺得這個跟鍵盤的排布有關吧。

第18章 進化,復雜化


1、進化是如何創造出復雜性的

(1)基因的結構并不簡單

基因并不像“一根繩子上串著的豆子”。我在中學學生物時,基因和染色體被解釋比喻成一根繩子上串著的豆子(我記得我們還用塑料豆子組裝過模型)。

后來發現基因并不是相互分開的:

  • 有些基因相互重疊——也就是說,它們各自編碼不同的蛋白質(即單個基因可以編碼多個蛋白質。以前一直以為基因和蛋白質是一對一的關系。),但是共用 DNA 核甘酸。
  • 有些基因甚至完全包含在其他基因內部。
(2)跳躍基因

基因可以在染色體上移動,甚至移動到其他染色體。你也許聽說過“跳躍基因( jumpinggenes),”實際上基因是可以移動的,染色體的組成也會被重新排列。這在任何細胞中都有可能發生,包括精子和卵子,也就是說可以遺傳。這樣產生的變異率比 DNA 復制錯誤導致的變異率要高得多。

一些科學家提出,近親甚至同卵雙胞胎之間的差別可能就是這種“可動遺傳因子( mobile genetic element)”造成的。還有人提出,跳躍基因是導致生命多樣性的機制之一

(3)基因網絡的效應

生物系統的復雜性主要來自基因網絡,而不是單個基因獨立作用的簡單加總。

有種非線性系統的感覺。

(4)表觀遺傳學

即使基因的DNA序列不發生變化,基因的功能也會發生可遺傳的變化。最近興起的表觀遺傳學(epigenetics)研究的就是這種變化。一個例子就是所謂的DNA甲基化(methylation)。

(5)非編碼RNA的調控 - 基因開關

2003年,人類基因組計劃發布了完整的人類基因組——人類DNA的全部序列。雖然這個計劃得到了大量新發現,但還是沒有達到許多人的預期。

最近發現,在大部分生物中,DNA轉錄為RNA之后很大部分最終都沒有被譯碼成蛋白質。這些所謂的非編碼RNA對基因和細胞的功能具有調控作用,這些以前都認為是由蛋白質單獨完成的。非編碼RNA的作用是目前遺傳學中一個非常活躍的研究領域。

物種形態多樣性的主要來源不是基因,而是打開和關閉基因的基因開關。這些開關是不編碼蛋白質的DNA序列,通常長度為幾百個堿基對。它們以前被認為是所謂的“垃圾基因”的一部分,但現在發現有基因調控的作用。

根據進化發育生物學,生物的多樣性主要來自開關而不是基因的進化。人類之所以與其他差別極大的物種能有如此多相同的基因,是因為雖然基因是一樣的,基因開關的序列構成卻已進化得不一樣了。進化的主要力量正是這種—長期以來一直被視為“垃圾”的 DNA 的——變化,而不是新基因的出現。

2、考夫曼的研究

第五部分 尾聲


第19章 復雜性科學的過去和未來

1、發揮什么作用

近年來復雜性科學的主題和結果已經觸及幾乎所有科學領域,而且像生物學和社會學這樣的研究領域已經被這些思想深深改變了。不僅如此,一位學者這樣說道:“我認為復雜性科學的一些形式正在改變整個科學思想。

2、現狀

但現代復雜系統科學仍然沒有統一成一個整體,而是松散的大雜燴。

3、期待如何改變

(1)大一統

統一·理論[unified theory,或大統一理論(Grand Unified Theory),縮寫為GUT,通常指物理學的一個目標:用一個理論統一宇宙中的基本力。弦論就是對GUT的嘗試,

希望物理學能徹底理解基本力從而完結的想法是沒有根基的。一個尺度上組分的相互作用會導致更大尺度上復雜的全局行為,而這種行為一般無法從個體組成的知識中演繹出來。”

而現在的狀況是,沒有單一的原理可以適用于所有復雜系統。

(2)等待卡諾

這個領域有個笑話,說我們是在“等待卡諾”。卡諾(Sadi Carnot)是19世紀初的一位物理學家,他提出了熱力學的一些關鍵概念。與之類似,我們也在等待出現適當的概念和數學來描述我們在自然界看到的各種形式的復雜性。

要實現這個目標我們更需要一位牛頓式的人物。我們現在所面臨的概念問題,就類似于微積分發明之前牛頓所面臨的問題。在牛頓的傳記中,科學作家格雷克( James Gleick)這樣描述:“他受困于語言的混亂——有些詞匯定義不清,有些詞匯甚至還沒有出現……牛頓相信,只要他能找到合適的詞匯,他就能引領整個運動科學。……”通過發明微積分,牛頓最終創造了所需的詞匯。借助于無窮小、微分、積分和極限等概念,微積分為嚴格描述變化和運動提供了數學語言。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。