? ? ? ? ?在進入2017年的第一周,Google攜手自己的ALpha GO完成了圍棋人類高手60連斬。這樣的時機正是我們說2016年是人工智能(Artificial Intelligence)元年,以及被科普現在的AI還很弱很弱的一個時機。至少從我目前的觀感來說是如此,雖然AI似乎被賦予了許多完美的想象,強大的能力,但是它處在遙遠的未來。現在的普遍論調是還可以觀望,顯然發展還沒有那么快。
? ? ? 我想知道的是那是有多慢呢?有這樣的疑惑一方面是因為好奇心,因為AI實在是一個太新奇的玩意了;另一方面是陸續地囫圇吞棗的了解了一些新聞和有關專家的點評后,也有一些隱憂。
? ? ?我在暗搓搓地擔心什么呢?
? ? ? 吳軍老師在《智能時代》中給出了一個公式“原有產業+新的技術=新的產業”。停留在歷史課本上的三次技術革命,當時歷史考試如果解答題考意義的話著實頭疼。享受著技術革命的福澤,理所應當地體驗蓬勃發展。
? ? ? ?蒸汽革命時,大批的家庭紡織作坊被取代,在一邊反抗中,機器逐漸取代純手工作業,解放了生產力。與此同時許多人失業。對于這些不幸被新技術取代的人也有幸運之處,機器工廠依然需要人,生產了更多的物質,降低了成本,解決了需求,讓更多人可以穿上好衣服,用上瓷器,更快的把貨物運往各地。在蒸汽機發展的同時,人們勉強跟上時代的步伐,甚至需要更多的人去生產更多的東西。
? ? ? 之后的電氣革命,摩爾革命,都深刻的改變著社會面貌,將許多傳統行業改變。比如通信行業,木心在《從前慢》中這么寫道,“從前的日色變得慢,車,馬,郵件都慢,一生只夠愛一個人。”隨著每一次技術革新,由信件,變成電報,電話,再變成電子郵件,短信,微信。在一次次轉變中,從業者的角色,數量,技能要求發生了變化。
? ? ? ? 回顧歷史,新的技術并沒有減少人的工作機會,而是改變人的工作方式,當然會有人付出代價,即使那些能力固化的人,隨著時間的協調,慢慢大家會習得新技能然后適應。目前的AI發展只能說是為了讓人過得更舒服,有更多自由的時間。
? ? ? ?阿爾法狗雖然厲害,但是它還是由人類在優化算法,也不會自己下棋,而是人類代為執子。之前機器的發展是幫助人類省力,更高更快更強。現在我們要的更多,人類還想少動腦子。現在我們需要自己開車去上班,希望以后動動嘴“Siri,現在我要去辦公室”,然后車子就自己開過去。其實現在也有一些正在發展中的,比如根據你的購物瀏覽習慣推送你想要的商品,根據你在婚戀網站填寫的資料幫你匹配相親對象,讓你少些思考,直接用機器給你準備好的。
? ? ?但是這一次的技術革新又和前三次的不同,以往的技術革新是通過新的工作代替舊的工作,而AI的成熟似乎野心更大,它會減少工作崗位,它替代的是人的角色。
? ? ? 說了這么多,都還是人話。但是沒說到重點,就是現在AI發展有多慢呢?看了一篇文章《人工智能核心概念辨析》,這篇文章對我來說不僅在于文章本身有時候不講人話,還在于它的文章里面還嵌套文章,比如它在講一個概念時會拋出一個鏈接告訴你,你看看我之前的文章里面可是提過喲,多好理解啊。于是我點開鏈接開始看講解這個概念的新的文章,你會發現里面又出現了新的概念,他又給了兩個鏈接(此處小s鼓掌表情)。但是讀完之后,和我之前讀過那些講解AI的妖艷貨可不一樣。如果以后真的被支配了,我還是想知道一點點我是怎么被支配的。
? ? ? ? AI的概念并不是在2016年才被提出,早在圖靈提出圖靈測試的時候就已經開始發展。可是為什么要說2016年是人工智能發展元年呢?目前的看法是因為算法、大數據和硬件的發展,滿足了AI起步的條件。下面我就以一個行業外人的身份,說說我的閱讀理解。
? ? ? ?曾經有一段時間一提到人工智能,人們就會想到一個和人很相像的機器人,但是它們更聰明更強大,比如施瓦辛格的“終結者”,西部世界中的園區。
? ? ? 但是馬上有專家辟謠,
“你們呀,拿衣物,人工智能可不是模仿人,它是一種更高層次的存在,它的形式多種多樣。”
? ? ? ?雖然在外觀上不是人,但是目前人工智能所處的階段還是在模擬生命智能,核心是模擬生物神經網絡(Biological Neural Network,BNN),從而形成人工神經網絡(Artificial Neural Network,ANN)。
? ? ?《人工智能核心概念辨析》介紹了幾種機器目前使用的神經網絡學習方法,看完感覺和自己的一些學習方法很相似,但是沒有像科學家那樣思考自己為什么會這么學,在面對不同的問題哪種學習方法更好。
? ? ? ?目前的人工智能使用的主要技術叫做機器學習。現在機器學習的種類不多,但是量很大,它可以快速閱讀,聽音樂,看圖片等等,然后再去試著歸納接受的資料,應該到外部世界。比如給機器看很多世界名著(大量的輸入),讓它去寫一本書。
? ? ? 種類不多的含義是,它所學應用范圍不廣,但是只要它學會的東西一定是百分百掌握。還是拿寫作舉例,它寫出的文章一定和它看的著作高度關聯,但是它不會創新,它不會主動去和人類溝通,將外界發生的事情也歸納起來寫進它的文章中。
? ? ? ? ?機器學習的核心是人工神經網絡。人工神經網絡就是人為設計的一種神經網絡體系,類似生物的神經系統,它可以幫助機器學習,所以可以說它就是機器的神經系統。從1943年開始,它模仿生物建立起一個神經元(晶體管),到隨后的單層神經網絡,兩層(CPU),多層神經網絡(GPU)去處理越來越復雜的問題。插一句,正是因為GPU這樣硬件的發展,所以它是前文提到人工智能發展三大支柱之一。人工神經網絡包括多種神經模式,其中最著名的就是深度神經網絡。深度神經網絡幫助機器深度學習。
? ? ? ?傳統的深度學習就是我們說的填鴨式教育,題海戰術。給機器海量的數據(大數據)(需要說明大數據中的大不是指代數據量大,它是多維度的大,有興趣自行Google)。
? ? ?當我們采訪阿爾法狗你為什么圍棋下的這么好?它說“因為我知道凌晨四點硅谷的樣子,而且是每個凌晨四點。”是的,阿爾法狗在初入棋壇時相當于下了三千萬的棋譜,到了與李世石下棋時數據量已經達到一億,需要補充說明的是它一局棋只要+1s。還需要補充說明的是分布式的阿爾法狗調用了1202個CPU和176個GPU,什么意思?它還影分身了好多個自己沉迷學習,不能自拔。
? ? ?另一種學習方法叫增強學習,周伯通的左右互搏。阿爾法狗在訓練自己的神經網絡時,也會自己和自己下棋。
? ? ? ?當然題海戰術并不高明,一般都是用于笨人。當一個聰明人遇到一個聰明的老師就不這樣了。要知道并不是所有的公司都有google這樣的大公司當爹,買不起5年高考3年模擬(沒有3000萬的題庫),只能買一套薄薄的習題集時,對它來說做一題就得有一題的收獲(我想到了小蘿卜頭……)。而另一家與Deep Mind齊名的公司,Vicarious,就是大量借鑒人類的神經系統,也就是說把機器的神經系統不斷優化(更聰明),讓它學的少,也學的精,效果還是一樣的。
? ? 最后提到的一種學習方法叫做遷移學習——希望機器可以像人一樣通過學習理解抽象概念再應用到廣泛的領域。比如我們看見一個人禿頂了,下次我們看到一座山上樹木都凋零了,我們會說山禿了。谷歌翻譯就運用了部分遷移能力。比如一名中國學生,他的第一專業是英語,同時還學了二外日語。如果他學得很好,他不用學日語和英語之間的互相翻譯,也可以給一個英國人和日本人充當翻譯。
? ? ?同時深度學習也分監督學習和無監督學習。同字面意思,監督學習,就是人有意思的訓練它,告訴它這是蘋果,那是香蕉。無監督學習,就是把蘋果香蕉一起都給它,讓它自己對收集的資料進行分類。
? ? ?以上是這篇文章的概述。
? ? ? ? ?
? ? ? ?所以可以看出目前AI高度依賴人類,阿爾法狗在和李世石下完棋后到化身“MASTER”這段時間,是人類工程師不斷優化它的神經網絡,而不僅僅是它自己和自己又多下了多少盤棋,一個很有意思的詞叫做“訓練”。通過與李世石下棋暴露出來的思維漏洞,在這一階段得到優化改進。通過60盤與人族棋手的快棋,Deep Mind的工程師想知道阿爾法狗是否如預期進步了,結果是它幾乎做到每一盤棋都勝對方半目(無論是什么棋力的選手),表明阿爾法狗在棋盤上的絕對控制力,它的底層邏輯是如何下勝率高,同時阿爾法狗采用的是CNN神經網絡模式,這是一種廣泛運用在識別技術中的模式。也就是說每落一子,對它就是一個新的棋局。從人的角度來說,就是這個狗沒有情緒,不受過去影響。人族這一波撲的不虧……
? ? ? ?前面說的東西總讓人感覺有些大而不當,似乎不管你這狗下棋多厲害,和我們老百姓沒有半毛錢關系。我個人認為還是有些關系。
? ? ? 從短期來看,一方面AI的能力較弱,可是同樣能夠起到對個人能力的延伸;簡答的如對各種語言的翻譯,復雜一點自動駕駛車輛,再復雜一點比如IBM公司用自己的AI機器人Watson通過快速閱讀2000萬頁的文獻幫助束手無策的醫生診斷疑難雜癥。做你的私人律師,讓你每一句的證詞勝率最大化等等。這些AI幫助人類更快更好的完成許多事情。
? ? ? 另一方面,AI的三大支柱由少部分公司所控制,只有少部分的AI有機會閱讀那么多的資料,擁有那么多客戶的購買力,足跡,財富收入等數據,也只有少部分的AI擁有先進的神經網絡和足夠多的GPU。同時只有部分人可以獲得能力的提升,從而全面碾壓更多人。比如假以時日AI在醫療診斷和治療上準確性更高,顯然擁有它的人就會更好的被治療。擁有AI律師的被告,對法律條文了如指掌,對案件分析,場上每個人的話語、情緒、對方律師的習慣深入研究,這樣的人打贏官司可能性就更大。
? ? ? ?對行業內部也會有沖擊,當你在就醫時你選擇相信誰?你的人族醫生告訴你你得了這個病,應該服用這個藥物。轉頭你的AI對你說你得的是另外一種病,應該用另一種藥,它能快速給你所有診斷依據,它告訴你為了你又讀了多少文獻(而人族醫生讀完得花幾百年時間),根據你既往的用藥習慣和身體反應,選擇了治療效果更好的藥物。
? ? ? ? 簡而言之,在“弱人工智能”(這不是專業詞匯,只是打個比方)的情況下,一小部分人擁有了更強大的能力,獲得了更多的資源,拉大了身而為人的差距。所以還是和我們有點關系吧。
? ? ? ?從長期來看(也不知道我能不能看到),就是AI可能會有意識。這里不談了,人類還沒有搞清楚自己的意識是怎么一回事。比如最近的一部美劇《西部世界》對意識的討論,只能說是對意識的一種看法而不是定論。
? ? 讀到這里如果你被我煽動地產生了一絲絲杞人憂天,那我就繼續跟你掰扯掰扯。
? ? ? ? 首先如果你對AI的近期發展看好,也擔心人與人的差距會因此加劇,那就投資你所相信的。你相信Google的大數據能力和神經網絡優化能力,你相信Amazon在產業鏈和智能家居的優勢,你相信阿里巴巴對你每一次消費場景,金額、內容的精準掌握,你相信騰訊公司對你人際關系的掌握(每一條聊天內容都是它絕佳的語料分析資料)那你就用資金去投資它們,跟緊帶路人。
? ? ? ?其次,人也沒那么差勁。要不怎么現在更多人喜歡玩網絡游戲而不是單機游戲呢?因為虛擬人物背后是一個個實實在在的人啊。(還有為什么不能打qq麻將,非要買麻將牌回來四個人一起打呢?為什么?)
(當然不排除影片《Her》中出現的情況,主人公更愿意和一個聊天機器交往,have imaginary sex,并且這機器后來劈腿幾百個人族……找誰說理去?)特別是在所謂“弱人工智能”階段,有些事就算機器做的很好,但是你還是希望一個人來做,提供“人性化”的服務。(not sex)。比如前文提到的醫生梗,Geoff Colvin在他書中《Humans Are Underrated:What High Achievers Know That Brilliant Machines Never Will》就舉出一個論據,病人在面對在一線接觸患者的臨床醫師的判斷和專門搞科研的醫學家的判斷之間,病人更相信臨床醫師。因為人更傾向于“人與人面對面交往”這個過程,對抽象的數據根本不買賬。
? ? ? ? 所以現階段想贏過機器,最容易的方法就是更有人情味一些,從事一些創意型的工作,領導具體人的工作,這是目前機器替代不了的。當然更高級的方式,就是去研究腦神經科學,學設計神經網絡。
以上我說的每句話都是錯的。
禪定時刻
? 《人工智能核心概念辨析》一文其實大篇幅介紹的是幾個神經網絡,雖然有些復雜但是好有意思,你不得不驚嘆生物的神經網絡到底是誰設計的,篇幅限制下次寫。
參考文獻
1.吳軍。《離你最近的一次變革紅利,你該抓住》
2.Haoskism,混沌巡洋艦。《人工智能核心概念辨析》。
3.王爍。《機器人崛起時代的生存策略》。
4.萬維鋼。《有些事兒我們不想讓機器干》
5.和菜頭。《就不要對AI抒情了》。