AlphaGo項目正式結束:別了,AlphaGo之魂,黃士杰

姓名:顏皓 學號:16020140084 電子工程學院

轉載自:http://www.yidianzixun.com/article/0HucD5qV?s=

【嵌牛導讀】剛剛,DeepMind黃士杰博士發表消息,表示AlphaGo項目正式結束。如果一定要有一個人為AlphaGo的研究劃上句點,黃士杰當之無愧。從AlphaGo第一次出現在公眾視野時,黃世杰便是AlphaGo的最佳代言人。他抬手、落子,行機器之智能,走出一代大師風范。他冷靜、他沉著,他是AlphaGo的“人肉臂”。而他的離開和謝幕,代表了一個時代的終結,也是更加激動人心的開始。

【嵌牛鼻子】AlphaGo、黃世杰

【嵌牛提問】黃世杰的AlphaGo圍棋項目落下了帷幕,而其未來有什么更長遠的發展方面?

【嵌牛正文】

圖片發自簡書App


12月寒冬的最冷一天,這條深夜的臨別感言引爆了朋友圈,熱鬧喧囂的討論更映襯出一個時代終結的孤寂悲涼,黃士杰,一位精通圍棋的AI工程師,他一手造就的AlphaGo,已經登峰造極,而他離去的身影,也或許窺見了人類的未來。大時代的一批傳奇人物謝幕,他是寂寞的,自己培養的AI取代了他,如果一定要有一個人為AlphaGo的研究劃上句點,黃士杰當之無愧。從AlphaGo第一次出現在公眾視野時,黃士杰便是AlphaGo的最佳代言人。他抬手、落子,行機器之智能,走出一代大師風范。他冷靜、他沉著,他是AlphaGo的“人肉臂”。時代的前進腳步從不停歇,人工智能的盛世爆發正在來臨,“人肉臂”黃士杰轉崗,對AlphaGo深情的告別,都是在 AI圍棋的里程碑上落下絢爛的一筆。

針對未來發展方面,黃士杰表示,DeepMind 有興趣的領域除了圍棋之外,還有‘醫療’跟‘機器人’,希望能夠讓世界變得更美好,至于他自己個人的下一步,當然就是選一個有興趣的領域去投入。現場有媒體再次詢問下一個目標是不是挑戰《星海爭霸》、《英雄聯盟》這個模擬策略游戲領域,黃士杰并沒有把話說死,表示:“內部還在討論”。

11月27日,黃士杰在Facebook轉發了一則關于DeepMind將與一些頂尖的研究機構共同投入診斷乳腺癌的AI研究消息。DeepMind將利用最新的機器學習技術,希望能夠快速、準確地檢測出癌癥的跡象,幫助醫生盡早發現癌癥,以便更早的有效治療,此舉或許能捕風捉影體會到黃士杰之后的動態走向。

黃士杰,他就是AlphaGo本身

黃士杰出生于臺灣,1997考入臺灣國立交通大學就讀大學本科,專業為計算機與信息科學。2001年到2003年,在國立臺灣師范大學就讀計算機科學和信息工程碩士。2004年到2011年在國立臺灣師范大學完成了博士學業,博士論文就是“應用于電腦圍棋之蒙地卡羅樹搜索法的新啟發式演算法”。

黃士杰專精于人工智慧領域,碩博士論文都在臺師大資工所教授林順喜指導下完成,據其導師林順喜回憶,黃士杰是個很努力的學生,對圍棋也非常有興趣,是臺師大圍棋社創社社長,就讀時就有圍棋業余6段的資格。

林順喜透露,黃士杰的博士本來5年就可念完,但為了延續研發成果,多念了2年,博士班7年級時,他所開發的圍棋程式“Erica”擊敗了當時國際公認的最強程式“Zen”,并在日本舉辦的國際電腦奧林匹亞中拿下19路電腦圍棋金牌。

黃士杰博士畢業后在加拿大艾伯塔大學做了一年研究員,隨后于2012年加入DeepMind,擔任高級研究員。2014年1月26日,谷歌以5億美元收購了這家日后將會大放異彩的公司。自此,黃士杰在谷歌DeepMind任研究科學家。同年2月,AlphaGo項目正式啟動,團隊只有3個人:哈薩比斯、席爾瓦、黃士杰。

項目啟動伊始,團隊就決定將沿著深度學習和強化學習的方向探索。無疑,這條道路將無比艱難。然而,他們還是上路了。

2014年6月,AlphaGo通過卷積神經網絡學習了很多人類棋譜,能在3毫秒內做出堪比人類的下棋直覺。黃士杰將它命名為“策略網絡”,并在GPU上進行持續的訓練優化。

一年之后,AlphaGo閱讀棋局的能力提升了很多,可以檢索多種局面變化,并且找到最佳的應對方式,可以算出后續40-60步棋。

自此,有越來越多的深度學習專家加入了這個一開始只有三人的團隊。8月,AlphaGo將掌握稱霸圍棋世界最關鍵的能力:形勢判斷。AlphaGo通過自我對弈,訓練出價值網絡,進而可以判斷每一手棋背后代表的勝率。這就形成了形勢判斷的能力。據黃士杰回憶,他當時已經感覺到AlphaGo的強大。10月,樊麾大戰AlphaGo,當時代替AlphaGo落子的正是黃士杰。樊麾輸了。但這一消息當時并未被公布。

2016年1月27日,Nature雜志介紹了DeepMind團隊的AlphaGo,以及樊麾輸了的消息。黃士杰與席爾瓦是這篇論文的第一作者。

又過了2個月,AlphaGo擊敗了李世乭。這次,依舊是黃士杰代替AlphaGo落子。這也是黃士杰第一次出現在觀眾的眼前。

這年年底,一個叫Master的棋手大開殺戒,連續斬殺各路圍棋高手。取得59場連勝之后,Master公布了自己的真實身份:“我是AlphaGo的黃博士”。黃士杰,又是黃士杰。

2017年5月23日,柯潔對面坐的,仍然是黃士杰。在對戰結束后,柯潔說,“黃博士來擺棋,可能更讓我有和AI對戰的感覺。我也特別佩服黃博士,大家看直播也能看到我很愛動,總喜歡活動身體,而黃博士總是一動不動,不上廁所、不喝水、也不吃東西……所以跟黃博士下棋時,我覺得黃博士就是AlphaGo。”

AlphaGo一路廝殺,黃士杰始終在側,甚至可以說,他就是AlphaGo本身。

AlphaGo 小傳

姓名:AlphaGo(Fan,Lee,Master,Zero)

別名:阿老師,阿爾法狗

生日:2014年

出生地:英國倫敦

1、擊敗樊麾

2015年10月,AlphaGo擊敗樊麾,成為第一個無需讓子即可在19路棋盤上擊敗圍棋職業棋手的電腦圍棋程序,寫下了歷史,相關成果在2016年1月發表于Nature

2、擊敗李世石

2016年3月,AlphaGo在一場五番棋比賽中4:1擊敗尖端職業棋手李世石,成為第一個不借助讓子而擊敗圍棋職業九段棋手的電腦圍棋程序,再創歷史。五局賽后韓國棋院授予AlphaGo有史以來第一位名譽職業九段

3、排名短暫超越柯潔

2016年7月18日,AlphaGo在Go Ratings網站的排名升至世界第一。但幾天之后被柯潔反超。

4、Alpha Go化名“Master” 60連勝

2016年的倒數第三天,一個用戶名為“Master”的圍棋用戶,連續在圍棋平臺大開殺戒,“斬殺”包括柯潔、樸廷桓、井山裕太、陳耀燁、申真谞、常昊、古力等各路圍棋高手,最終以以60連勝告終。柯潔連輸三場,期間還因為急性腸胃炎住院……

在第59場時候,“Master”自報家門:“我是AlphaGo的黃博士”。

5、AlphaGo大敗柯潔,柯潔落淚哽咽

2017年5月27日,烏鎮圍棋峰會,柯潔總比分 0:3 敗于AlphaGo。比賽中,柯潔在局面不利時長時間離開,回來后又淚灑現場。賽后柯潔一度哽咽稱:它太完美我很痛苦,看不到任何勝利的希望。

6、AlphaGo Zero橫空出世 自學21天虐Master

2017年10月,DeepMind最新版AlphaGo論文介紹了迄今最強最新的版本AlphaGo Zero:使用純強化學習,將價值網絡和策略網絡整合為一個架構,3天訓練后就以100比0擊敗了上一版本的AlphaGo。

7、AlphaGo教學工具正式上線,柯潔:重新學習圍棋

2017年12月11日,AlphaGo的啟蒙老師、歐洲圍棋冠軍樊麾在微博上透露:“AlphaGo教學工具共有兩萬多個變化,三十七萬多步棋組成,通過AlphaGo的視角,分析并建議圍棋開局的諸多下法。隨后,當今世界圍棋第一人柯潔隨后轉發此條微博,并評論到:“重新學習圍棋。”

AlphaGo已經退休,但技術永存。

謹以此文,致敬AlphaGo,以及研發AlphaGo的人。

圖片發自簡書App
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容