Neil Zhu,簡書ID Not_GOD,University AI 創始人 & Chief Scientist,致力于推進世界人工智能化進程。制定并實施 UAI 中長期增長戰略和目標,帶領團隊快速成長為人工智能領域最專業的力量。
作為行業領導者,他和UAI一起在2014年創建了TASA(中國最早的人工智能社團), DL Center(深度學習知識中心全球價值網絡),AI growth(行業智庫培訓)等,為中國的人工智能人才建設輸送了大量的血液和養分。此外,他還參與或者舉辦過各類國際性的人工智能峰會和活動,產生了巨大的影響力,書寫了60萬字的人工智能精品技術內容,生產翻譯了全球第一本深度學習入門書《神經網絡與深度學習》,生產的內容被大量的專業垂直公眾號和媒體轉載與連載。曾經受邀為國內頂尖大學制定人工智能學習規劃和教授人工智能前沿課程,均受學生和老師好評。
我們本著一種開放的心態來看看這次 OpenAI 的成功一 show,搖身變成世界 Dota2 單挑王。
Dota 曾給我們帶來了很多歡樂,而后推出的 Dota2 雖說玩家數量比不上 LOL,但其在國際上受歡迎程度非同小可。因此 OpenAI 拿這個也沒啥問題。
就在前不久 Elon Musk 懟了 Mark Zuckerberg,說后者不知道現在 AI 達到什么 level 了,應該就是在說這件事。(說到這里為 Facebook 的小伙伴們捏了一把汗,老板被懟了,由于自己的研究沒有到達最牛層次,鍋就得背了。)
OpenAI Bot 背后使用的就是深度強化學習技術,這項技術被看作是實現通用人工智能[1]的一條光明大道。
深度強化學習技術是深度學習和強化學習技術結合的產物。最早就是用在控制游戲上,那還是四年前,DeepMind 的團隊設計了一個模型可以在幾個游戲上超過人類玩家。(這也導致了 Google 對 DeepMind 的驚天收購,4億英鎊)后面的故事大家也都知道了。發 Nature,做 AlphaGo,擊敗歐洲圍棋冠軍樊麾,前世界冠軍李世石,再到現在的世界冠軍柯潔。這里的故事情節跌宕起伏,我們后面系列中會細細介紹。
DQN出現如同機關的開關被觸發,眾多相關的算法層出不窮。最終我們將這些新出來的方法稱為深度強化學習技術,該技術實現了感知和決策的打通。好像我們人類被打通任督二脈一樣,武功會上升幾個層次。因此現在這個方面的研究已經成為大家關注的方向。在很多的重要人工智能學術會議(比如 ICML、NIPS、IJCAI 等)上,這個方向的 keynote、workshop 和 tutorial 均不斷地出現,吸引了眾多科學家和工程師關注。
說了這么多基礎的理論歷史,我們回到這次比賽上。相比較于圍棋,Dota2 本身會有更多的不穩定因素摻雜,比如說里面的兵團和建筑,難度在于更多不確定未知的因素空間疊加。
我們在觀看游戲的時候,DendiBoss 剛開始時好像并沒有將 Bot 放在心上,還和主持人熱情交互,也許這里對其發揮有所影響了吧。(人類有時候表面放松,但內在緊張)但很快第一局經過幾次較量后,Bot 逐漸地穩定下來。
有人說 LOL 可不可以。當然可以。由于 Dota2 和 LOL 是類似的,LOL 的 1v1 的 AI Bot 如果用深度強化學習技術的話,虐一虐人類 top1 也就沒啥問題了,因為他們本質上是一樣的事情。
接下來在類似 Dota2 這類游戲上的挑戰就是多人配合的 5v5,這肯定是需要完成一系列的突破然后整合成一個整體后戰勝人類的。
最新消息,已有不少玩家找到了 Bot 的 bug,好像使用一些 trick 戰勝了 Bot。但我覺得這些“雕蟲小技”應該不是我們關注的焦點,不該拿這些沾沾自喜覺得人類還是厲害云云。技術之勢無法阻擋人類設計 AI 征服這類游戲的腳步。從這點上看,Elon Musk 的擔心不無道理,盡管目前看我們還沒有完全解決多人游戲的難題,但已經在路上數十年之久了。
為何這么說,且聽下回分解。
人和機器的感情又加深了一點點,因為大家都會玩 Dota 2 了哈。以后可以帶幾個 AI 幫你推塔了~
-
artificial general intelligence,又稱 strong AI,表示能夠完成一般任務達到或者超過人類平均水平的 AI ?