如上圖,區別三者最簡單的方法:想象同心圓,人工智能(AI)是半徑最大的同心圓,向內是機器學習(MachineLearning),最內是深入學習(DeepLearning)。人工智能是最早出現的,也是最大、最外側的同心圓;其次是機器學習,稍晚一點;最內側,是深度學習,當今人工智能大爆炸的核心驅動。
人工智能,機器所賦予的人的智能
我們目前可以實現的還是局限于「弱人工智能」(Narrow AI)。這些技術能夠像人類一樣執行特定的任務,或者比人類做的更好。像 Pinterest 上的圖像分類,Facebook 上的人臉識別等。
這些都是弱人工智能實踐中的例子。這些技術展示了人類智力的一些方面。但如何展示?這些智力是從哪里來的?這些問題促使我們進入到下一個階段,機器學習。
機器學習,一種實現人工智能的方法
機器學習最根本的點在于使用算法來分析數據的實踐、學習,然后對真實的事件作出決定或預測。而不是用一組特定的指令生成的硬編碼軟件程序來解決特定任務,機器是通過使用大量的數據和算法來「訓練」,這樣就給了它學習如何執行任務的能力。
機器學習是早期人工智能人群思考的產物,多年來形成的算法包括決策樹學習、歸納邏輯編程、聚類、強化學習、貝葉斯網絡等等。正如我們所知,所有這些都沒有實現強人工智能的最終目標,而早期的機器學習方法甚至連弱人工智能都沒有觸及到。
隨著時間的推移,學習算法改變了這一切。
深度學習, 一種實現機器學習的技術
放貓(Herding Cats):YouTube 視頻抓拍的貓的形象是深度學習的第一次突破性展示
在過去的幾十年中,早期機器學習的另一種算法是人工神經網絡。神經網絡的靈感來自于我們對人類大腦生物學的理解:所有這些神經元之間的相互聯系。在一定的物理距離內,生物大腦中的任何神經元可以連接到其他神經元,而人工神經網絡有離散的層、連接和數據傳播的方向。
例如,你可以把一個圖像分割成很多部分,這些可以輸入到神經網絡的第一層。在第一層中的單個神經元,然后將數據傳遞到第二層。第二層神經元做它的任務,等等,直到最后一層,那么最終結果就產生了。
每個神經元都為其輸入分配權重,分配的權重正確與否與執行的任務相關。結果,最終的輸出由所有的權重所決定。這樣,還是以「停止」標志牌為例。將「停止」標志牌圖像的元素抽離分析,然后由神經元「檢查」:其八邊形的外形,消防車火紅的顏色,鮮明的字母,交通標志的大小,處于運動或靜止的狀態。神經網絡主要任務是總結是否是個停止標志。隨即,基于權重、經過深思熟慮「概率向量」的概念出現。該案例中,該系統中
86% 的可能是停止標志,7% 的可能是速度限制標志,5% 的可能性是掛在樹上的風箏等等。這樣,網絡結構便會告知神經網絡是否正確。
但這個例子還是非常超前。因為直到最近,神經網絡還是被人工智能研究所忽略。實際上,在人工智能出現之初,神經網絡就已經顯現了,在「智能」方面還是產生很小的價值。問題是甚至最基本的神經網絡都是靠大量的運算。不過,多倫多大學的
Geoffrey Hinton 領導的一個研究小組始終專注于其中,最終實現以超算為目標的并行算法的運算且概念的證明,但直到 GPU得到廣泛利用,這些承諾才得以實現。
回到之前「停止」標志的例子。神經網絡是被調制或「訓練」出來的,并且不時遇到錯誤的應答。它所需要的就是訓練。需要呈現成百上千甚至上百萬的圖像,直到神經元輸入的權重被準確調制,那么實際上每次都能得到正確的信息,無論是否有霧,無論晴天還是雨天。只有在那一點,神經網絡才學會一個停止標志是什么樣的,Facebook上你媽媽的臉是什么樣,又或者是吳恩達(Andrew Ng)教授 2012 年在 Google 上學習到的貓的樣子。
吳恩達的突破在于將這些神經網絡顯著增大,增加了層數和神經元,并通過系統的訓練運行大量的數據。在吳教授所舉案例中,數據就是 YouTube 視頻中 1000 萬張圖像。他將深度學習中添加了「深度」,也就是這些神經網絡中的所有層。
通過在某些場景中深度學習,機器訓練的圖像識別要比人做得好:從貓到辨別血液中癌癥的指標,再到核磁共振成像中腫瘤。Google 的 AlphaGo 先是學會了如何下棋,然后它與自己下棋訓練。通過不斷地與自己下棋,反復練習,以此訓練自己的神經網絡。
深度學習,賦予人工智能光明的未來
深度學習使得許多機器學習應用得以實現,并拓展了人工智能的整個領域。深度學習一一實現了各種任務,并使得所有的機器輔助變成可能。無人駕駛汽車、預防性醫療保健、甚至的更好的電影推薦,都觸手可及或即將成為現實。人工智能就在現在,也在未來。有了深度學習,人工智能可能甚至達到像我們暢想的科幻小說一樣效果。