中國古代有很多民間諺語,單看都貌似很有道理,擺在一起卻又自相矛盾,比如:
兔子不吃窩邊草 ——近水樓臺先得月;
寧可玉碎,不能瓦全——留得青山在,不怕沒柴燒;
一分耕耘、一分收獲——人無橫財不富、馬無夜草不肥;
得饒人處且饒人——縱虎歸山,后患無窮。
又比如,這兩句:善有善報,惡有惡報;人善被人欺,馬善被人騎。
這些俗語,之所以作為民間智慧流傳下來,肯定都自有其道理。而擺在一起產生的沖突感,我以為,主要是源自于“情境的錯置”。也就是說,每一條諺語都有其適用的情境,如果把適用于不同情境的諺語擺在一起,當然便不能自圓其說了。
比如,“寧可玉碎,不能瓦全”,意在強調、推崇“價值層面的持守和保全”,對某些人而言,如果失去了他們所珍視的“價值/精神操守”,則肉體的保全沒有任何意義。而“留得青山在,不怕沒柴燒”,則強調做事要有大局觀,為了更大的目標和“逆襲”,在己方暫時處于劣勢時,要先保全再以圖后謀??梢?,這兩條諺語針對的情境和強調的重點不一樣,根本不能簡單類比。如果情境類似,要遵從哪一條,還得看你看重的是什么,如果看重操守,當“留青山”意味著接受侮辱,意味著對所珍視之價值的否定,則會放棄保全。所以,諺語的比對,一要看所處的具體情境,二要看價值觀的偏好序列。
諺語和俗語,是老百姓在時間長河中針對形形色色的不同情境總結的一些簡單法則,用于指導人們如何自處及如何與他人相處。這些相處之道,大致看,無非是勸人向善、推崇美好的品質,及教人如何使自己處于有利情勢。俗語活潑、實在,不同于生硬的說教,即便是勸人向善,也總是從“好人有好報”這一偏功利性的角度出發,沒好處,誰會信誰又會照著做呢?換句話說,道德榜樣如果恰巧是利益上的成功榜樣, 向善的號召力和效果就越好。
雖然老話勸我們做個好人,因為好人有好報,但實際生活中,我們也常常見到老實人受欺負的例子,因此,俗話也說,人善被人欺,馬善被人騎。那么,究竟做好人是“有善報”呢?還是“被人欺”呢?
還真有西方人較真,用“博弈論”來研究究竟是做好人更有利,還是做壞人更合算。美國政治社會學家艾克斯羅德(R.Axelord)在1980年進行了著名的計算機仿真博弈實驗[注1],在該實驗中,參賽者設計不同的策略進行多輪混戰,并給每輪計分,總分最高者得勝。每個策略都會在“合作”和“背叛”之間組合出牌,如果雙方合作,各得3分,如果都背叛,各得1分,而如果一方合作一方背叛,則合作者得0分,背叛者得5分。因此,出“背叛”牌的回報高,誘惑大,這和真實世界的情境類似,“背叛”的壞人碰到“合作”的好人可以得5分,而碰到同樣“背叛”的壞人,仍然可以得1分,也就是“人善被人欺”。如果僅僅進行一個回合,在不知道對方打“合作”牌還是“背叛”牌的情況下,出“背叛”牌成為最“理性”的選擇,單次博弈就是經典的“囚徒困境”博弈。
第一次實驗,參賽者共提交了14個策略,這些策略五花八門,可以任意選擇“合作”和“背叛”的出牌順序,你可以做個“好人”,大部分時間都選擇“合作”,也可以做陰險的壞人,一直打“背叛”牌,或者在90%的回合里選擇“合作”,然后隨機在10%的回合中出“背叛”牌。艾克斯羅德在比賽中,加了一個自己的策略——隨機策略,就是隨機出“合作”或者“背叛”牌,作為比對的底線(如果你精心設計的策略得分還不如隨機策略,那就是個差策略)。
經過了12萬回合的計算機模擬博弈,實驗的結果美好得讓人懷疑,居然是一個簡單的具有“善良、寬恕”特質的“一報還一報”策略(TFT)勝出。這個策略一開始總是善意地相信對方是好人,選擇“合作”,但如果對方打了“背叛”牌,就“以其人之道還治其人之身”,下一輪也打“背叛”牌,而只要對方在接下來的回合中出了一次“合作”牌,就馬上原諒對方曾經的“背叛”,改回“合作”策略。這個策略,簡而言之,就是第一個回合選擇“合作”,接下來就重復對手上一個回合的出牌。這是個從不主動背叛的善良策略。
還有一個有意思的現象,就是在其他策略中,得分領先的策略都是善良的,得分落后的都是惡意與人為敵的。在第二次實驗中,艾克斯羅德將參賽策略增加到62個(同時也像上次一樣增加了自己的隨機策略),并事先公布了第一次實驗的結果。有意思的是,在明明知道善良的策略有得分優勢的情況下,很多人還是選擇做“壞人”(可能覺得,上一次“壞人”策略輸掉是因為“不夠狡詐”,壞得太沒技術含量)。結果,這一次仍然是TFT等善良策略勝出。
看到這個結果,想做好人又怕吃虧的讀者們是不是覺得可以松一口氣了呢?畢竟還是“善有善報”啊!且慢,要想“好人”在博弈中勝出,是要有條件的。
首先,就像我前面指出的,如果只有一次博弈機會,那“背叛”才是“理性”的策略(囚徒困境),多次博弈才能讓好人勝出。所以,想做“好人”的人們,應對陌生人保持一定的警惕。有句話說“你不可能永遠欺騙所有人”,但每次欺騙不同的人則不是難事。所以,在人來人往,外來流動人口密集的鬧市,一家口味差服務差的餐館很可能屹立不倒,因為它可以每次都接待不同的人。而在顧客群相對固定的社區型餐館,口味差服務差則是作死的節奏了。換句話說,“信任”是通過多次博弈建立的良性互動關系。
為了解決陌生人的博弈問題(陌生人之間通常不是多次博弈),西方通過完善法治,提高陌生人“使壞”的代價,從而降低社會運行的成本,擴展合作秩序。無法處理和調整陌生人的人際關系,則社會合作規模便相當有限,就像中國古代,儒家的一套調整的是熟人之間的關系,講究“君君、臣臣、父父、子子”,講究“老吾老以及人之老、幼吾幼以及人之幼”,整個社會架構和人際關系都以熟人為基石,所以很難將合作規模超出宗族、同鄉。在熟悉的人之間,由于人數和地域的限制,小規模的人在相對封閉的圈子內進行多次博弈,所以容易鼓勵和形成善良的合作策略。一旦超出了熟人的圈子,則“背叛”策略的誘惑便增大。相信大家都看過類似的社會新聞,說某某人在外地作案被抓捕,鄉親們紛紛對記者表示,印象里,此人是個乖孩子,此例雖不能作為普遍例證,但不防作為一個小小的注腳。
另外,“好人”策略在艾克斯羅德的計算機模擬實驗中勝出,還同游戲規則的設定有關,獲勝或者失敗主要靠計分,這是數字游戲,不是生死博弈。在實際生活中,很可能,好人面對壞人的一次“背叛”,就被干掉了,根本沒有機會去“報復”他或者“原諒”他。如果在前幾輪博弈中,好人紛紛因為被“背叛”而死掉,則整個社群中“壞人”就會越來越多,從而整個環境會轉向鼓勵“背叛”的競爭策略。趙汀陽在他的《壞世界研究:作為第一哲學的政治哲學》[注2]中指出,“殺不死”假定是艾克斯羅德仿真實驗不夠“仿真”的bug,“殺不死”假定讓好人可以卷土重來,限制了不擇手段競爭的威力,從而造成了善良策略具有博弈優勢的假象[注3]。
趙汀陽提出,如果取消“殺不死”假定,把實驗規則修改為,若因選擇“合作”而遭到n次背叛(n次得0分),則必須退出比賽,相當于“死掉”,則可以合理想象,最終的勝出者也許還有善良策略,但也可能有惡意策略笑到最后。特別是一旦“合作者”會死掉這一考量影響到其他原本想選擇“合作”策略之人時,可能會有“好人”蛻化成“壞人”的趨勢出現。
因此,在真實世界中,只有完善“法治”,提高“壞人”作惡成本,讓“惡有惡報”真實可見,最好是“現世報”,“好人”才不會“人善被人欺”,繼續有信心做個好人?!吧朴猩茍蟆钡膱螅俗鳛椤昂萌恕北旧磉@一選擇便是福報之外,“合作”秩序的擴展帶來的普遍福祉的提高也是實實在在的好處。
最后,還想提醒大家的是,在計算機模擬實驗中,勝出的“善良”策略可不是任人欺負的“老實人”策略,面對“背叛”時,是要“以眼還眼、以牙還牙”的,正所謂,“人不犯我,我不犯人;人若犯我,我必犯人”,在此“善良”是指,善意相信別人,不主動背叛。事實上,在艾克斯羅德的第二次實驗中,有一個“兩怨還一報”策略,比“一報還一報”策略還要“善良”,該策略允許對手背叛兩次才報復一次,卻成績殿后,因為第二次比賽中,出現了很多精心設計的足夠狡詐的策略,會捕殺“很傻很天真”的人。
所以,要做有原則有脾氣有能力的“好人”,而不是懦弱的“老實人”??梢姡吧朴猩茍蟆焙汀叭松票蝗似邸边@兩句諺語,還是要還原到真實的復雜情境之中,才能具體情況具體分析。
順便提一句,在艾克斯羅德第一次模擬實驗中,參賽者提交的14個策略中,得分最低的是一個最復雜的策略(由一個匿名者提交),正應了那句老話“機關算盡太聰明,反誤了卿卿性命”!
2014-11-16
[注1]:R. Axelord:?Effective Choice in the Prisoner's Dilemma. Journal of Conflict Resolution.24:3-25.1980.
[注2]:趙汀陽在此書的開篇,討論了“政治的發生”議題,在該議題下,探討了古今中外政治博弈發生的初始狀態理論,包括中國的荀子、西方霍布斯的“自然狀態叢林”、羅爾斯的“無知之幕”,及本文涉及的艾克斯羅德仿真博弈實驗。
[注3]:艾克斯羅德在舉行過兩輪比賽后,事實上,又進行了第三輪比賽,只是這次是將第二輪參賽的63種方案再比賽一遍。而這次,比賽的結果不是得出一個分數,而是獲勝的策略會獲得一個自身策略的復制,再投入下一輪比賽,也就是說,失敗的策略會消失,成功的策略會繁殖延續。這就有點像趙汀陽修改的“殺得死”規則,只是,不是在每輪策略捉對廝殺的時候就被“殺死”,而是在大的比賽輪次結束后淘汰失敗策略。關于艾克斯羅德的三次實驗,感興趣的讀者可以參考《自私的基因》第十二章的內容。
【參考書目】
1.《自私的基因》,理查德.道金斯 著,盧允中等 譯,吉林人民出版社,1998.
2.《壞世界研究:作為第一哲學的政治哲學》,趙汀陽 著,中國人民大學出版社,2009.