兵者,詭道也。
以前在跟別人石頭剪刀布的時候,會問對方你打算出什么,對方一旦說出了打算,就開始進入心理博弈階段。對方說出打算出剪刀,那我就會開始思考,對方說的是實話嗎?
如果是實話,那我只要出石頭就好了,但是哪有人會把打算告訴敵人的,所以對方應該是騙我的,他打算出的是布,但再想深一層,如果他也想到我會考慮到他的欺騙行為,那他就會覺得我不會出石頭了,而是剪刀,那么他就會出石頭,所以我只要出布就一定會贏。但如果遇到對方以不變應萬變的情況,就栽了。所以這種情況,還得把對方的智力因素放入考慮因素。
上述例子里,倘若對方以逸待勞,且一直使用這個策略,則該策略叫做支配性策略,但這里不存在納什均衡,也就是兩人使用固定的策略。
萬老師指出,這是“沒有純策略的納什均衡”,但是如果要參加多次罰點球,運用“混合策略”這個系統可以取勝。
以一定的概率往左踢,以一定的概率往右踢。這是顯而易見的,但如果計算概率才是關鍵。
假設我比較喜歡往左邊踢,如果我以各50%的概率,那守門員會堅決撲向右邊,因為我的習慣的存在,守門員會覺得右邊更值得交給運氣。50%的概率雖然無法預測,但我的習慣很容易被對手利用。
那么這個時候要做的就是混合策略,結合自己往左踢和往右踢的進球概率,合理搭配往左踢和往右踢的概率,誤導對方以為不過撲左邊還是撲右邊,我進球的概率都是一樣的。
馮·諾依曼提出的理論——最小最大值定理。就是把對手的最大報償最小化,有兩點,一是按照一定的概率,混合自己的打法,二是這套打法必須讓對手無法利用,也就是所謂的陽謀。你知道我在干嘛,但是你拿我沒辦法。
如果你一直說謊話,其實和說實話一樣。最佳撒謊者是把實話和謊話結合,且別人無法計算出占比。
人類最無法執行隨機性策略,比如要執行以40%和60%的概率來罰點球,是先踢4個左,再踢6個右嗎?這樣安排太整齊了,別人很容易就能發現并加以利用。那交替進行呢?踢了兩次左之后,第三次就很想踢右,守門員很可能就會防守右邊。這其中其實還涉及到一些賭徒謬論,這個放在文末寫。
正確的做法就是執行真實的隨機性,如一本書,翻到頁碼個數是0-3就踢左,4-9就踢右。只要不是真的隨機性,就會被發覺。
足球比賽中,梅西明明很厲害,但在場上看到的表現通常不是他一直持球,突破。因為實力強,所以被重點防守,很大程度上起到的是一個牽制對方防守隊員的作用,球星再強,也要一定概率的傳給隊友,這樣才能讓陣容更加詭異。
這種策略屬于陽謀,就算對方知道你在計算概率,也不知道你的概率是多少。以前看柯南的時候,許多犯罪手法是根據被害人的生活習慣來制定方案的,這使我一度頻繁改變我的放學回家路線。曹操也說過類似的言論,真正的英雄不應該有被敵人利用的規律。
文中所說的賭徒謬論,守門員猜撲左還是撲右,其實跟猜測硬幣的正反面一樣,我們都知道正反面概率是50%,所以有些人會理所當然的以為已經拋了1000次正面了,那第1001次一定是反面,然而第1001次正反面的概率還是各占50%。撲球同理,如果射門的選手左右交替太頻繁,刻意去營造相對平衡的概率,那前兩次射了左邊,第三次很大的概率就是右邊。
博弈論真是魅力四射!