7
越是組織化程度高的策略思維越是需要智慧和技巧。
博弈論在說明個人理性、非理性與集體合理性、集體非理性的互相作用和辯證轉化等方面,起著重要的作用。博弈論也是揭示了個人合理性如何達到集體合理性的橋梁和手段。
它在揭示有意志的個人行為何以形成了不以人的意志為稱移的社會規律的發生發展機制上,與“合力論”有某種不謀之合之處,不過,博弈論與之相比,更趨細密和解釋性。
經典的“囚徒困境”模型,提示出個人之間的理性行為何以可能導致集體的不合理性,個人的最優決策并不必然的會導致集體行為的最優;相反,它可能深刻的揭示出那種社會生產中“企業的有組織、有計劃的生產與整個社會生產的無政府”之間的矛盾。
8
囚徒困境的描述如下:
假設有兩個小偷A和B聯合犯事,私入民宅被告警察抓住。警方將兩人分別置于不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,于是證據確鑿,兩人都被判有罪,各判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑兩年,而坦白者有功被減刑8年,立即釋放。如果兩人都是抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。博弈支付矩陣如下。
對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇“坦白”總是最優的。顯然,對B也是一樣的情況,他也會選擇“坦白”,結果兩人都被判刑8年。
但是,如果他們都選擇“抵賴”,每人只有被判刑1年。在四種選擇組合中,(抵賴、抵賴)即雙方都選擇抵賴其實是一種最優,這就是帕累托最優,這是因為偏離這個行動選擇組合的任何其它選擇組合都至少會使一個人的境況變差。但是,“坦白”是任一個犯罪嫌疑人的占優戰略,而(坦白,坦白)是一個占優戰略均衡,即納什均衡。
9
因此,不難看出,此處納什均衡與帕累托最優存在沖突。
囚徒困境的博弈結果突破了亞當·斯密的“看不見的手”理論,即博弈論似乎證明了個人自私的行為并不一定能夠,在“看不見的手”的指引下產生最佳的社會共同結果,也即人們的經濟行為,其實并非是理性的,或者說個人理性并不能保證集體理性,這樣一來,經濟學的奠基性基礎就動搖了。
當然了,經濟學之所以還要談經濟建立經濟理論,它也沒辦法,只能忽略掉這些非理性的因素,所以我們會發現,經濟學其實是一種理想情境下的哲學思維,因為它的假設前提可能本身就是不明確,或者是矛盾的。
當然,不能將博弈論的見解,與“看不見的手”當成是對立的,它只是指出了“看不見的手”這種理論,奠基性的根本上的矛盾,或者說,如果只是用“看不見的手”來解釋經濟行為是不夠的,這不是形成集體理性的充分條件。
縱觀人類歷史,有過大量的合作與對抗,總體上人類還是合作多于對抗,因此,經濟的理性人的假設,也不能說是全錯的,起碼是部分合理的。
10
在人類社會歷史活動中,存在著大量的長期合作的歷史過程(當然少量的對抗過程),這是因為人類的社會歷史活動本質上是長期、永續的,不僅在空間上并存,而且從時間角度來看,也有起承。因此,研究長期或某一長期階段的前后相繼的,或某個周期性的人類活動的交互作用是有意義的(雖然從歷史長河中是一個片斷)。
博弈論在這方面的貢獻因此也是獨特而有成效的,長期博弈的不同階段是相互依賴,因此博弈參與者的決策不僅受到其過去經驗的影響,而且還要預測未來潛在可能性的影響。
現實生活中大量的行為模式其實都是多階段動態博弈模式,因此重復博弈很難避免,時空不同,可能是動態均衡式的發展,此一時而彼一時也。
博弈理論的數學模型,精確地刻畫了斗爭與同一,沖突與聯合,對抗與非對抗,進攻與防御,強弱攻守的關系,這豐富和細化了馬克思的矛盾學說。因此可以說,博弈理論分析增加了世人對矛盾的斗爭復雜性與同一性形成機制的理解。
11
斗爭何以產生同一性,這是因為重復博弈的存在。
我們知道,在現實世界上,長期關系比短期關系更加容易合作,并且具有效率更高的博弈結果,因此,往往決定性的某一次性的博弈并不存在,甚至是有失偏頗的。
比如對一個人有重大意義影響的事件節點,像高考升學考學歷等這類博弈的后果并不意味著人生被決定了,人們要意識到這種博弈的非完全決定性,甚至人們的唯學歷論的思維方式,會傷害一個人的能動回性,得到的沾沾自喜,沒得到的垂頭喪氣,這只是一種短暫的勝利,而非持久的勝利,如果不能認識到自己的能力可以表現在很多方面,人就容易陷入一種心理誤區,總覺得是因為這個自己才不如人,而不是因為他能力不行,才造成的失敗人生。
我懷疑人類已經開始變得更蠢了,因為沒有了深度思考的結果,從而陷入了別人的思想框架里,也陷入了某種被規定的模式之中,從而失去了自我的意識,和自我的能動力,這種格式化的思維真是可怕,連幸福的概念,也可能是別人給的,而不是他自己創造自己實現自己設置的。
因此,我們的人生也是重復博弈的過程。
從可重復博弈的“囚徒困境”,我們可以得出以下結論:兩個小偷被警察抓住,在“一個坦白一個抵賴就減免坦白者重罰抵賴者”的博弈規則下,兩個小偷的納什均衡是(坦白、坦白)。
如果兩個小偷是在一個重復的博弈中,即他們反復面臨著選擇的話(比如不是一錘子買賣),他們信息共享后,他們會聯合起來抵賴,結果共同抵賴會導致無罪釋放。
因此,重復博弈又導致了信任,從而導致了長期的關系和合作的可能。
囚徒困境說明如果雙方的交易是一次性的,結果一定是誠信缺失,但是如果雙方能夠預期到交易次數增加,那么,受長期利益的驅動,就會相應增加交易雙方誠信的可能性。
因此,信息的透明性,有助于增強人們之間的相互理解,從而將這一錘子買賣(此處這種現象很容易導致騙子的增多,騙子的本質就是一錘子買賣,從而導致誠信消失)轉化為長期的利益關系。
12
因此,集體不理性可以由于重復博弈的存在而變成集體理性。社會應該營造人們的重復博弈的氛圍,從而形成更好的人與人的互動關系。
作為一種社會歷史觀的博弈論,它為消解斯諾《兩種文化》,即科學與人文的分離,所揭示的現在仍然存在兩種文化的對立作出了自己的貢獻,這種結合似乎是如此的必然和自然,這也正預示著馬克思預言的正確性。
必然與自然,前者是說這是自然科學與社會科學發展的趨勢,后者是說,這種結合是自然而非強制的,也不是牽強附會的,而是有機互相統一的。
因此,在博弈論這個新視角下,去研究社會歷史規律,去揭示個人理性何以能走向集體不合理性,然后,個人在選擇中何以去實現社會發展,這都是深有必要的。
若從博弈論所揭示的道理中得到啟發,也許人類可以自覺地設計一種社會機制,在滿足個人理性的前提下,從而達到集體合理性(反之亦然),從而實現馬克思所說的那種理想社會:“每個人的自由發展是一切人的自由發展的條件”。
這似乎可以是一條通行之路。