人類如何向AlphaGo學習出人頭地?

張凱? ?17021211151

轉載至:https://mp.weixin.qq.com/s/AG7lkgzxbBNY1yR3nDrY0Q

嵌牛導讀:AI機器人AlphaGo打敗天下無敵手,已經(jīng)出人頭地了。人們何不向AlphaGo(及AlphaGo Zero)學習呢?

嵌牛鼻子:AlphaGo??

嵌牛提問:在當今AI潮流下,企業(yè)和年輕人,如何出人頭地呢?

AlphaGo懂得如何征服自己面對的巨大不確定性棋局,因而超越了人類頂尖高手。學習AlphaGo如何探索機會之后,創(chuàng)客就懂得了如何面對AI的不確定市場。企業(yè)就像AlphaGo一樣,可以超越頂尖的人類競爭對手,出人頭地了。

傳統(tǒng)上,人類的學習偏重于“利用”所學的知識,去發(fā)揮所長,解決問題。如果人類能從AI強化學習得到啟示,強化探索能力,則人人能探索更多可能,得到更多機會,如圖1所示。

在高度不確定性的環(huán)境里,唯有懂得降低風險,才敢大膽探索、提高勝率。一旦你選擇了創(chuàng)客/創(chuàng)業(yè)之路,若能向它學會探索機會的方法,將會協(xié)助你在創(chuàng)業(yè)路途上心想事成,鴻圖大展。

強化學習

探索和利用之間找到平衡

強化學習(Reinforcement Learning)的算法又稱為近似動態(tài)規(guī)劃(approximate dynamic programming,簡稱ADP)。它在探索(在未知的領域)和利用(現(xiàn)有知識)之間找到平衡。探索就是嘗試以前從未想過或做過的事情,以求獲得更高的報酬。利用就是做當前條件下能產(chǎn)生最大回報的事情。

例如,假設在你家的附近有十個餐館,到目前為止,你只在其中的八家餐館吃過飯,了解了這八家餐館中哪家是最好吃的。如果有一天,你的女朋友來看你,你想請她去最棒的餐館晚餐。請問您會如何選擇餐館呢?在這個例子里,利用就意味著你帶她去所知道的八家中最好吃餐館;而探索則是帶她去你從沒吃過的第九家或第十家餐館晚餐。

如果你選擇八家中最好吃的餐館,那么,也許第九家或第十家比這八家都好吃呢?反之,如果你選擇第九家或第十家,也許這兩家也可能比那八家都難吃。

那么,你該如何選擇呢?這就是“探索-利用”困境。強化學習更接近生物學習的本質(zhì),一個標準的強化學習算法必然要包括探索和利用,強化學習更接近生物學習的本質(zhì)。

谷歌的專家們(即人類老師)已經(jīng)把這種“探索和利用”平衡的技巧(算法)教給了AlphaGo(機器學生),讓AlphaGo(及AlphaGo Zero)超越了人類的圍棋頂尖高手。

傳統(tǒng)的人類學習是學以致用(利用所學)為依歸,由于常常受限于現(xiàn)有知識,無論是人類或機器學生都只能得到區(qū)域最優(yōu),如圖2所示。

因此,無論是機器學生或人類學生,一旦具有強化學習能力,都能大大提升其探索未知機會的能力,有信心去探索更大的狀態(tài)空間,從而得到全局最優(yōu),讓學生們成為AI時代的大贏家,人人能探索更多可能,也捕捉到更多好機會。

懂得避風險

才敢大膽探索,才有熱情創(chuàng)新

大膽探索的同時,必須要有效降低風險。這是AI時代人類可以向機器學習的重要一課。AI強化學習已經(jīng)把這種“探索-利用”最佳平衡的算法效益發(fā)揮出來,然而需要搭配一種降低風險的策略。

AlphaGo的目標總是將獲勝機率最大化放在第一位,它會透過尋找確定的搜索途徑實現(xiàn)最低風險的獲勝機會。例如,AlphaGo的行為會傾向為了取勝而放棄更多贏子數(shù),只為了降低不能取勝的風險。

AlphaGo的蒙地卡羅算法給出的是搜索之后的勝率評估,然后AI會根據(jù)這個勝率來選擇落子點。懂得避免風險,才敢大膽探索、熱情創(chuàng)新。因而,AlphaGo能在高度不確定性的圍棋棋局中超越人類高手。

俗語說,商場如戰(zhàn)場,它們都跟圍棋競賽一樣具有高度的不確定性。因而人們(如企業(yè)家)可以從AlphaGo學會如何在商場上,善于面對如圍棋棋局中高度不確定性的市場環(huán)境,超越其他競爭者!

不確定性

與不確定性共舞

向AlphaGo學習,有助于提升人們(如學生)的避風險能力和信心,以便更具備創(chuàng)新精神。就如同,下述這句名言:

When you focus on problems,you’ll have more problems. When you focus on possibilities,you’ll have more opportunities.

當你專注于問題時,你就會有更多的問題;當你專注于可能性時,你就會有更多的機會。

當人們一直專注于問題時,是基于過去經(jīng)驗,評估具有現(xiàn)實條件支撐,力求化解問題或避免問題發(fā)生的或然性(probability),在心中逐漸萌生具有高度的明確感。這種通過或然性思維而得到地明確感稱為或然性明確感。

大家都知道,當面對不確定情況時,人們總是需要明確感才會安心。大多數(shù)人習慣于或然性思維,一直專注于問題,力求化解問題或避免問題發(fā)生的或然性。于是,在心中逐漸萌生具有高度安心的明確感

這種或然性思維得到的明確感稱為或然性明確感,但是,常常會基于經(jīng)驗和現(xiàn)實而過濾掉機率小的可能方案,而失去許多機會。

可能性明確感試圖涵蓋未來各種可能的機會,避免基于經(jīng)驗和現(xiàn)實而過濾掉或機率小的可能方案。然后,逐步探索經(jīng)驗和現(xiàn)實進行否證而去蕪存菁,逐漸提升心中的明確感。即面對復雜和新的未知世界,培養(yǎng)先容納內(nèi)心的不確定性,規(guī)劃方案并采取行動試驗(試錯),逐漸提升明確性和信心。

可能性意味著或然性很小的事件,有人稱之為“黑天鵝”。它的出現(xiàn),初期并不起眼,經(jīng)過一段時間,逐漸產(chǎn)生乘數(shù)效果的巨大效應。為什么會是“當你專注于可能性時,你就會有更多的機會”呢?

因為上述的一段時間是一項寶貴的資產(chǎn),例如,張榮發(fā)先生也是洞悉到物流集裝箱(黑天鵝)而獲得寶貴時間,并且預做準備,因而獲得更多機會。而后來才進入的競爭者,就因缺乏時間資源而失去競爭力。

大多數(shù)人習慣于或然性思維者,他們常常成為失去寶貴時間的后知后覺者,因為他們會覺得黑天鵝,還沒普及流行,尚未成氣候。這種面對不確定,逐步提升心中的明確感,通稱為與不確定性共舞。人們總是需要明確感才會安心?;蛉恍悦鞔_感與可能性明確感,其目的是一致的:滿足內(nèi)心所需的明確感。只是手段不同而已。

例如,一只小獅子肚子餓了,依據(jù)成功經(jīng)驗奮力去追兔子,只是捕獲的兔子日漸減少(可能兔子變敏感了),有些困惑(明確感降低)。這只小獅子的媽媽就教他:肚子餓了,就閉上眼睛睡大覺,不要亂跑。小獅子滿腦困惑,不確定感急速上升,非常不安。但母命難違,只好勉強為之,果然耳朵變靈敏了,清晰地聽見兔子聲音越來越近,然后猛然奔出一抓,輕易捕獲,飽餐一頓,繼續(xù)睡大覺。

君不見,身為野獸之王的雄獅、母獅,常??此葡胨X的表情,真是“總裁獅子心”呀!小獅子專注于問題(如肚子餓了),卻引來更多的問題(如追累了,走不動,引來生命危險)。媽媽教小獅子不要圍繞問題,而專注于可能性(如原來以為兔子不可能自動送上門),反而發(fā)現(xiàn)更多的機會(如更容易填飽肚子的新途徑)。

結 ?語

從AlphaGo下圍棋可以發(fā)現(xiàn),在面對高度不確定性的環(huán)境時,它懂得專注于可能性,探索更多機會,獲得全局最優(yōu)而出人頭地。人類可以從AlphaGo學習到與不確定性共舞的能力,就會如同小獅子一般,探索到更多贏家之道。

作者信息

高煥堂,臺灣VR產(chǎn)業(yè)聯(lián)盟主席、廈門VR/AR協(xié)會榮譽會長兼總顧問

AI不僅僅發(fā)生在對計算要求高的云端,還會出現(xiàn)在數(shù)量更加龐大的物聯(lián)網(wǎng)邊緣端,例如消費電子、汽車電子、工業(yè)控制、測試測量等領域。 為此,本媒體邀請部分AI芯片及EDA/IP廠商,介紹邊緣AI的最新技術進展和解決方案。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,461評論 6 532
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,538評論 3 417
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,423評論 0 375
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,991評論 1 312
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,761評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,207評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,268評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,419評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,959評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,782評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,983評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,528評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,222評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,653評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,901評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,678評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,978評論 2 374

推薦閱讀更多精彩內(nèi)容

  • 觀棋錄本文不代表我的雇主。 一、 很多人都注意到,AlphaGo 的棋風有個有意思的特點:它很少下出「好棋」,也就...
    ChrisAnderson閱讀 546評論 0 2
  • 《布魯克林》講述一個愛爾蘭姑娘艾莉思遠離家鄉(xiāng),獨自一人到美國布魯克林謀生的故事,最后,艾莉思收獲了事業(yè)與愛情。 這...
    我的小宇宙閱讀 293評論 0 0
  • 很多人都希望過的安穩(wěn),然后且幸福。就如同我們父母家人期望的那樣,有一份在別人眼里不錯的工作,自己看來相對可以讓自己...
    檀肆閱讀 302評論 0 1
  • 談起王陽明,大家肯定都會想到他是我國明代著名的哲學家、思想家、政治家和軍事家,是朱熹后的另一位大儒,“心學”流派重...
    小蛐閱讀 265評論 0 0
  • 昨天一直在想怎樣做好個二當家,要怎樣在群里去活躍。還好有個伴可以商量的,就是我的搭檔大當家。在探討什么玩呢?因最近...
    小確幸_48a1閱讀 1,129評論 0 1