譯者 | 李夢
編輯 | Vincent
AI前線出品| ID:ai-front
AI 前線導語:“在 RTS 游戲中進行 AI 研究有著悠久的歷史。在過去的十多年里,研究人員一直致力于構建能打敗最強人類玩家的機器人,但是要走的路還很長。在 2016 年的暴雪嘉年華,DeepMind 和暴雪宣布合作,將為星際爭霸 2 的 AI 研究開放 API。
本文旨在討論 RTS 游戲的一些發展進程,以及 AI 研究在其中的貢獻。要想詳細了解 RTS 游戲相關研究,還請查看 Onta?on、Robertson 和 Watson 等人的文章”。(詳見文末)
過去的十年里,研究人員已經從在 RTS 游戲中獨立研究不同的 AI 技術過渡到了在更復雜的游戲中通過合作和競爭將不同的技術相互匹配。為了這項工作順利進行,需要以下條件:
1、研究人員構建和評估機器人的開放 API
2、可以讓研究人員對比不同技術的競賽
3、用于訓練學習算法的錄制回放
4、人類選手對機器人的性能進行評估
在 2009 年發布的母巢之戰 API 中以上大部分的條件都得到了滿足,但由于平臺的封閉特性使研究人員很難將 AI 系統的訓練過程自動化。隨著星際爭霸 2 環境的公開,研究人員將有機會開發一種能夠在 RTS 游戲中表現出專家級性能的系統。下面一些是我認為的在朝著這一目標的發展歷程中的重大事件。如果有疏漏還請在評論里留言。
1998
星際爭霸 1 的發布
星際爭霸原作是在 1998 年 3 月發布的,資料片母巢之戰也于同年 11 月發布。它迅速風靡全球,并在韓國引發了職業游戲的熱潮。
Freecraft
在星際爭霸之前,1995 年發布了魔獸爭霸 2。魔獸爭霸 2 的克隆版 Freecraft 也在 1998 年首次發布,它后來更名為 Wargus。這個克隆版構建在 Stratagus 游戲引擎上。Freecraft 是 RTS AI 研究的一個重要項目,因為大部分的初始工作都以 Wargus 作為實驗平臺。
2001
學術界對游戲 AI 的興趣
游戲 AI 的一篇重要文章是 John Laird 和 Michael van 在 2001 年發表于《AI Magazine》的文章 Human-Level AI’s Killer Application Interactive Computer Games。這篇文章意義重大,因為它是 AAAI 的出版物中第一批認識到實時游戲可以作為 AI 研究的良好環境。它還改變了學術研究人員試圖將現有方法應用于游戲的心態,轉而考慮為游戲構建全新的和專門的方法。
2002
魔獸爭霸 3 發布
魔獸爭霸 3 的一大特色是高度可擴展的地圖編輯器,它被用來創建獨特的內容,比如最初版本的 DOTA。地圖編輯器還擁有一些腳本功能,可以用來編寫自定義 AI。然而,以這種方式編寫的 AI 僅局限于單一地圖,腳本語言也僅向作者提供了一個命令子集。研究人員可以在這個框架內實現他們的 AI 技術,但不可能用不同的機器人互相測試。
2003
RTS 游戲被推薦為 AI 測試平臺
2003 年,Michael Buro 和 Timothy Furtak 發表了一篇文章稱 RTS 游戲提出了許多構建人類水平的 AI 時需要解決的新穎問題。他們還提議開發一個開源的 RTS 游戲引擎提供給 AI 研究社區使用。
2004
ORTS 發布
接下來一年,Michael Buro 就發布了第一個版本的開源 RTS 引擎——ORTS。這個游戲在圖形和非圖形模式下都可以運行,這讓機器人可以在成千上萬的游戲過程中快速訓練。而使用 ORTS 的一個主要挑戰是,雖然它為人類玩家提供了一個交互界面,但是沒有專家級的人類玩家對機器人進行對抗評估。
第一次 Wargus 研究
Freecraft 更名為 Wargus,它使用 Stratagus 游戲引擎。Wargus 的主要優勢之一是它的開源,這為研究人員打開了一個平臺,讓他們可以使用任何技術進行探索。Wargus 面臨的挑戰是缺乏可以用來分析的錄制回放,它沒有活躍的玩家基礎,而且在測試機器人的互相對抗受到網絡代碼的限制。在使用 Wargus 作為 AI 測試平臺的文章中,Marc Ponsen 是最早的發表者之一。
TIELT 的提出
在 2004 年提出的另一個 AI 項目是 TIELT 系統,它是一個 AI 框架,為多個游戲主題提供統一的 API。該系統的目標之一是讓研究人員可以為一款游戲開發 AI 并將學到的知識轉移到新的游戲中。例如,在 Wargus 中學到的領域知識可能適用于其他 RTS 游戲。我在這里討論 TIELT 正是因為 DeepMind 和暴雪的合作成果之一就是一個 API 和潛在的樣本數據集。對于這個 API 來說,重要的是不要為 AI 的操作做出假設。TIELT 面臨的挑戰在于它沒有提供直接進入游戲狀態的權限,這也就限制了可以利用它的 AI 技術的數量。這個系統許多目標現在都已經在 Facebook 的 ELF 平臺實現了。
2005
Wargus 中的增強學習
Wargus 迅速成為研究人員開發 RTS AI 的環境。2005 年,研究人員開始探索強化學習技術,這正是 AlphaGo 使用的策略之一。最終由于研究人員無法對彼此的工作進行對抗評估導致 Wargus 的工作停滯不前,他們太過依賴一小部分硬編碼腳本的性能。
2006
第一次 ORTS 競賽
在 2005 年公布了第一次 ORTS AI 競賽,該活動在舉辦于斯坦福的 AIIDE 2006 大會上舉行。第一次比賽有 4 個參賽項目,比賽規模逐年增加,直到 2009 年結束。
2007
IICup 啟動
International Cyber Cup 是星際爭霸的第三方服務器平臺。這個服務器對 AI 研究非常重要,因為你可以在這個服務器上運行機器人,不過它不是暴雪官方服務器。這個服務器的另一個優點是為玩家提供了一個字母評分,玩家可以用來輕松地交流技術。例如,我在 2010 年認真玩的時候最高拿到了 D+。
2008
第一次星際爭霸 AI 研究
我所知道的第一篇關于星際爭霸 AI 構建的文章是在 2008 年發表的。Hsieh 和 Sun 通過挖掘數千的游戲錄制構建了一個模型來預測玩家會生產什么建筑和單位。
2009
母巢之戰 API 發布
在 2009 年,我發現了一個叫做 BWAPI(母巢之戰 API)的 Goole 代碼項目,它提供了星際爭霸的編程接口。該庫使用了一個第三方 DDL 工具將 API 注入到星際爭霸的運行環境并提供一系列調用游戲內部函數的掛鉤。自此之后,該項目的貢獻者規模不斷增長并且被移植到了多種語言。它現在托管在 GitHub 上并且有一個 Java 版本。
2010
星際爭霸 2 發布
在 2010 年,星際爭霸 2 自由之翼發布,母巢之戰的競賽也繼續活躍了幾年。2013 年又發布了蟲族之心資料片,2015 年發布了虛空之遺。
第一屆星際爭霸競賽
第一屆星際爭霸 AI 競賽在 AIIDE 2010 舉辦。其主要賽事由伯克利 Overmind 團隊獲勝。競賽中還出現了人對抗機器的表演賽,人類選手輕易地擊敗了 AI 對手。
2011
第二屆 AIIDE 星際爭霸競賽
艾伯塔大學的 Dave Churchill 主辦了第二屆以及后續的 AIIDE 星際爭霸競賽。他編寫了一個錦標賽框架,可以自動運行錦標賽,并修改了一些規則以促進合作,比如要求必須開源提交。
學生星際爭霸 AI 錦標賽
第二屆星際爭霸錦標賽開始后,學生的提交成為重點。錦標賽不再與每年的大會聯系在一起,而是每年舉辦好幾次。
2013
星際爭霸母巢之戰機器人天梯
Krasi0 為星際機器人開發了一個全天候運行的天梯系統。這為研究人員提供了一個評估不同 AI 方法的環境。
2014
星際爭霸 2 自動化玩家
Matt Webcorner 演示了一個星際爭霸 2 機器人,它可以通過攔截 DirectX 命令來推斷游戲狀態。這種方法的主要限制之一是該機器人只能訪問當前顯示在屏幕上的游戲狀態。
2016
AlphGo 擊敗李世石
2016 年 3 月,DeepMind 的 AlphaGo 系統擊敗了圍棋世界冠軍李世石。這次勝利之后,許多人認為星際爭霸將是 DeepMind 的下一個挑戰目標。
Facebook 加入
2016 年 Facebook 的 AI 研究人員開始使用星際爭霸作為強化學習測試平臺。他們發表了一篇關于星際爭霸中的微觀管理的文章。他們的機器人參加了 AIIDE2017 競賽,但是它的學習模式表現不如重點關注腳本的機器人。
暴雪嘉年華公告
在 2016 暴雪嘉年華,DeepMind 宣布他們正與暴雪合作開發一個 AI 的開放平臺。現在 Google 與 Facebook 競相開發專業級星際爭霸游戲的機器人,競爭也變得日趨激烈。
2017
星際爭霸 2 API 發布
暴雪在 8 月 9 日發布了用于編寫機器人的星際爭霸 2API,同時揭曉了一個編寫機器人的工作室。
查看原文:
https://towardsdatascience.com/a-history-of-rts-ai-research-72339bcaa3ee
參考資料
[1]:
https://hal.archives-ouvertes.fr/hal-00871001/document
[2]:https://www.cs.auckland.ac.nz/research/gameai/publications/Robertson_Watson_AIMag14.pdf
-全文完-
人工智能已不再停留在大家的想象之中,各路大牛也都紛紛抓住這波風口,投入AI創業大潮。那么,2017年,到底都有哪些AI落地案例呢?機器學習、深度學習、NLP、圖像識別等技術又該如何用來解決業務問題?
2018年1月11-14日,AICon全球人工智能技術大會上,一些大牛將首次分享AI在金融、電商、教育、外賣、搜索推薦、人臉識別、自動駕駛、語音交互等領域的最新落地案例,應該能學到不少東西。目前大會8折報名倒計時,更多精彩可點擊閱讀原文詳細了解。