圍棋, 德撲, 下一個是麻將嗎?

繼2016年初AlphaGO以4比1戰勝李世石后,2017年初,AlphaGO的升級版Master又在網上狂勝中日韓全部圍棋高手60局!人們哀嘆計算機智能已經快要碾壓人類了,這時候專家出來安慰咱們吃瓜群眾了。卡耐基梅隆大學計算機科學教授托馬斯·桑德霍爾姆(TuomasSandholm)表示,“自人工智能研究之初,擊敗人類最優秀的選手就一直是驗證人工智能是否取得進展的最有效手段之一。”“與其他游戲相比,撲克帶來了更復雜的挑戰,因為機器需要根據不完整的信息做出極其復雜的決定,而且整個賽事的進展會非常緩慢,且需要應用其它的一些技術。”圍棋是一個完美信息博弈,而撲克是典型的不完美信息博弈游戲,也是我們曾經以為計算機智能面臨的長期挑戰。在一對一有限注德州撲克中,計算機程序曾經取得了一些成功。但是,一對一有限注的德州撲克,全部的決策點只有不到10的14次方個,而一對一無限注中包含10的160次方決策點,圍棋約包含有10的170次方個決策點。

一項名為“大腦對抗人工智能:進步期”(Brains vs.ArtificialIntelligence:UppingtheAnte)的巡回賽于2017年1月11日在美國匹斯堡河流賭場(RiversCasino)正式拉開帷幕。四名職業德州撲克玩家將會在20天時間中與卡耐基梅隆大學的新程序“Libratus”在無限制德克薩斯撲克比賽中共同比賽12萬手牌局。其實,2015年卡耐基梅隆大學已經組織過一次類似的競賽,當時的程序 Claudico輸得挺慘的。

正在人們期待新程序的表現的時候,來自加拿大和捷克的幾位計算機科學研究者在 arXiv 上貼出論文,介紹了一種新算法 DeepStack,使用一種深度學習技術從單人游戲中自動學習的有關撲克任意狀態的直覺形式。研究者在論文中稱,在一項有數十名參賽者進行的44000手撲克的比賽中,DeepStack 成為第一個在一對一無限注德州撲克中擊敗職業撲克玩家的計算機程序。

在感受計算機智能的沖擊以后,再補充介紹一下幾個博弈論的概念:完美、完全、對稱

完美信息博弈是依據一個參與者了解其他參與者的行動信息而定義的,完全信息則是雙方都掌握參與者對他參與人的戰略空間和戰略組合下的支付函數有完全的了解,但行動是有先后順序的,后動者可以觀察到前者的行動,了解前者行動的所有信息,而且一般都會持續一個較長時期。因此完美信息博弈是完全信息博弈的子集,完全信息博弈包含完美信息博弈。
不能獲得其他參與者行動信息的博弈稱為不完美信息博弈,而把每個參與人都了解其他參與人的類型的博弈稱為完全信息博弈,否則為不完全信息博弈。
不完全信息博弈是指對其他參與人的特征、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特征、策略空間及收益函數都有準確的信息,在這種情況下進行的博弈就是不完全信息博弈。博弈參與者對于對手的收益函數沒有完全信息。
在不完全信息博弈中,一個參與者的不被其他參與者了解的類型信息被稱為該參與者的私人信息,如果只有個別參與者擁有私人信息,這種不完全博弈被稱為不對稱信息博弈。

我根據自己的理解畫了個圖:

上面幾段沒看懂是完全正常的,反正你就記住:大多數紙牌游戲是不完全信息博弈。意思就是說:計算機下國際象棋圍棋贏了沒什么了不起,那玩意就是比誰算得快,是體力活,撲克和麻將神馬的才是真正的腦力勞動!以前我們自信計算機智能在這方面不行,簡單說也就是認為計算機智能不會騙人或者不能看出來別人是不是騙他。現在,德撲自己被攻陷了,看看麻將還能堅持多久!希望四川人民加油,借川普當選的西風,再弄出幾種川麻新玩法,延緩一下計算機智能的腳步……

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容