進入主題,今天我們將討論主題:如果使用人工智能玩LOL,它可以輕松贏得世界冠軍嗎?
一、人工智能技術和游戲的歷史
? ? ??讓我們把時間追溯到1950年,當時人工智能的重要概念“ Turing Test”首次出現。如果仔細考慮一下,您會發現圖靈測試的項目本質上是一種模仿對抗游戲。人工智能開始模仿人類說話,人類如何區分人工智能和人類本身,兩者開始相互競爭。
2013年,Google宣布使用Deepmind深度學習技術來打破Atari游戲,人們開始關注深度學習技術。什么是雅達利?這個名字聽起來很奇怪,但是您必須熟悉它:
pic02 Atari
是的,Google在深度學習的早期就使用游戲來訓練AI。據了解,在Alphago出現之前,谷歌一直使用Atari游戲來訓練AI。
然后在2016年,Alpha Dog席卷了全球象棋選手。實際上,它也在名為Go的游戲中運行,并且地圖為19x19網格。
2019年,在暴雪嘉年華的現場星際爭霸游戲中,AlphaStar擊敗了職業玩家Serral并取得了很大的成績。
pic03 星際爭霸
此時,您將發現AI技術開發的整個歷史都嵌套在游戲開發的歷史中。
由于Go,Chess和RTS游戲可以幫助研究AI技術,因此根據這種邏輯,LOL和“吃雞”又是什么游戲呢? (斗地主不是問題)
第二,人工智能能否在LOL中贏得冠軍?
讓我從結論開始:我暫時不能,但可以預見未來。
在分析此問題之前,讓我們澄清一下LOL本質上是什么樣的游戲。 LOL的游戲設計師似乎想模擬一場局部戰爭。由于這是一次模擬戰爭,因此必須分為戰略層面和戰術層面。
pic04 戰略與戰術
首先,就戰術而言,我認為不使用某些機器學習方法可能會很好。作為像Alphago這樣的superAI,它的響應能力幾乎是飛秒,并且位置和運動A僅受網絡速度的限制,因此基本上只有adc可以殺死他。使用多種技能來近距離平倉基本上是一種幻想。在卡片視覺控制或閃爍強力控制(例如Pan Sen w)的才能中,Lacus的q技能完全沒用。這是代碼比人更好的地方。犯錯的是人,代碼永遠不會出錯。
pic05 著名場景
但是為什么還沒有出色的LOL AI出現呢?因為人工智能缺乏戰略層面的東西。通常,在玩LOL時,我可能會做出以下戰略決策:開發,攻擊,檢測,協助和撤退。大家都知道,我不會詳細說明這些。 Alphago之所以能夠成功,是因為Go是一款完整的信息游戲,因此有人說Moba在戰爭迷霧中已成為一種不完整的信息游戲。如果計算機看不到我在做什么,它將無法以我為目標。這絕對是不對的。
由于我們提到了不完全的信息博弈,因此貝葉斯告訴我們仍然可以有一個最優方案。為了便于理解,您可以考慮遇到中路錯過時的處理方式。我要么有遠見,然后繼續安心發展,要么我沒有遠見,然后回到塔樓躲起來。當我們將AI放入LOL時,它需要始終感知當前的游戲情況,做出下一步決定,走或停,進攻或后退,要使用的技能以及放置位置。這些決策通常可以基于當前的知識和計算能力量化為概率。這真的是不可能的,不是因為有蒙特卡洛,如果我不知道的話,我會再嘗試幾次來了解概率。換言之,人工智能可以模仿人類去猜測并作出最有利可圖的決定。可以將AI設計成比您和我更詭計多端的設計。
三、那么玩游戲如何改善AI技術?
“我們最需要強調的是游戲AI研究的深刻意義,遠遠超過游戲本身。這是一個充滿挑戰和令人興奮的研究主題。研究的積累經驗,方法和結論可以在更廣泛和更廣泛的范圍內使用。 -reaching范圍的使用:首先,它是開放虛擬世界與現實世界之間的障礙,以增強物理世界的能力,例如無人駕駛汽車和機器人的發展;其次,在游戲中研究智能對話或將成為人工智能的重要途徑;第三,研究游戲中的人員,代理商和環境之間的相互作用可以使諸如智能城市之類的復雜而深遠的項目受益。”
-騰訊人工智能實驗室機器學習中心負責人劉涵
人工智能具有三項重要的能力:感知,判斷和對話。
Alpha Gou看起來很聰明,但在現實世界中,Go板只是2D圖像數據。它反映了游戲獲勝率中的每一步,從而“感知”了每一步的含義。棋盤上的棋子越來越多,感知環境也越來越復雜。
以游戲“ Doom”為例。讓AI玩這個游戲,它感覺是一個2D游戲屏幕,面對屏幕,它需要感知環境中每個元素的含義以提高獲勝率。只是這個游戲環境比Alphago面對的19X19電路板要復雜得多。
pic06 毀滅戰士
這其實更加接近物理世界。
在我們的現實生活中,對無人駕駛車輛物體的識別,相機所感知的僅僅是二維圖片。因此,如果游戲場景中的對象與現實非常相似,則它們可能是通用的。
像《俠盜獵車手》這類游戲,讓AI去控制主角,然后就可以訓練他的認知能力并為AI創建世界觀。
pic07 俠盜獵車手
聽起來像是胡說八道嗎?抱歉,無人駕駛汽車的先驅特斯拉確實使用了專門設計的虛擬訓練場來連續練習AI,以便它可以在短時間內準確識別各種物體和緊急情況。甚至由馬斯克建立的實驗室OpenAI,也真正學習了去年通過“俠盜獵車手”學到的一套自動駕駛系統。據稱,每個人都可以只用一臺計算機和一套正版游戲就可以開發自動駕駛系統!沒錯,實際上是我們玩過的俠盜獵車手,沒想到。
pic08 GTA
人工智能可以通過游戲學習知覺,并且人工智能的決策是相同的。
在現實世界中,無人駕駛汽車需要根據實時感知做出決策,無論是向左轉還是向右轉,加速還是制動。此邏輯在游戲中也有效。面對復雜的游戲環境,人工智能需要始終做出決策以確保游戲的勝利。
如果將AI放入LOL,則它需要始終感知當前的游戲情況,對下一步進行決策,前進或停止,進攻或后退,要使用的技能以及放置位置。
除了感知和決策外,對話也是AI技術應用程序的一項重要功能,并且可以通過游戲來改善這些功能。例如,在著名的電影《她》中,愛上男主角的人工智能本身就是對白游戲。
pic9 “她”
在AI游戲使用人機對話,甚至直接將AI放入模擬對話游戲中。它可以幫助學習和理解人類自然語言的產生原理。
四,附言
? ? ? ?簡而言之,研究游戲AI很困難,但并非不可能。對游戲AI的研究不是要制作功能更強大的游戲插件,而是要使用游戲環境來研究任何環境的復雜交互。將來,這些研究結果可能會應用于物理世界的各個方面,這將是基礎和長期的。
實際上,對于AI而言,請仔細考慮一下,我們的物理世界不是為此而玩的游戲嗎?
“自動駕駛游戲”的勝利條件是無意外到達目的地。
“圍棋”中要想勝利,必須確保贏的概率走向。
“人機對話游戲”的勝利條件是使人與AI難以區分。
尾:對于人類來說,這個“世界”不也是我們大腦正在玩的復雜游戲嗎?