原文鏈接:淺談人工智能:現狀、任務、構架與統一
讀完四萬字不光是對朱教授眼中當前人工智能的各種情況會有一個全面的了解,而且也會被他作為一個科學研究者卻同時具有的深厚的文史知識所深深折服。
摘要
本文首先在引言中提到,目前的人工智能領域并沒有被大多數人全面的認識,所以有此文。
前三小節,起題,講了人工智能的現在過去與未來。
第四節,提出觀點“小數據大任務”,反駁當前“大數據小任務”的模型。
第五節到第十節,從六個領域圍繞任務、認知等等來討論什么,如何才能得到上面這種“小數據大任務的”模型。
最后一節,給出總結與展望,人工智能應當成為智能科學,給予達爾文與牛頓體系的統一。
引言
人工智能沉寂了許久后突然火了起來,政府媒體都對其進行大力追捧,但是追捧的同時卻又是一種不理智的體現,在沒有對人工智能有全面認識而下的片面的判斷。
然而,難以全面認識當前的人工智能領域也是有原因的。
- 人工智能是個非常大的領域。可以歸納為計算機視覺、自然語言處理、認知推理、機器人學、博弈和倫理、機器學習。 然而實際上這幾個領域也會互相交叉。深度學習只是其中的很小一部分,各個研究人員們無異于盲人摸象。
- 人工智能發展的斷代現象。 跟人工智能發展歷史有關。
1. 現狀
人工智能的研究,簡單來說,就是要通過智能的機器,延伸和增強(augment)人類在改造自然、治理社會的各項任務中的能力和效率,最終實現一個人與機器和諧共生共存的社會。
智能機器應當是有自主感知、認知、決策、學習、執行和社會協作能力,符合人類感情、倫理和道德理念的。
雖然目前大家看到很多機器人還有智能系統的展示,如日本的機器人、波士頓動力、聊天機器人等等。但是這些系統往往都只能在一個設定好的環境下運行,而且在現實應用中有很多缺陷。
最主要的問題是缺乏物理和社會的常識。 而常識就是我們在這個世界生存的最基本的知識。
2. 未來目標:烏鴉的啟示
鸚鵡和烏鴉的比較。
鸚鵡往往只能進行學舌,卻并不理解自己在說什么,就像是我們現在進行數據驅動的聊天機器人一樣,不能把說的話對應到物理世界和社會中的物體、場景、人物上去,不合邏輯。
而烏鴉呢,這里有一個來自日本的烏鴉的故事,通過觀察,學會利用汽車開堅果,并且會看紅綠燈。這個烏鴉帶來了三點啟示。
- 它是一個完全自主的智能。可以感知、認知、推理、學習、和執行。
- 它不需要大數據訓練,通過少量數據就能弄明白。
- 烏鴉的腦只有人的1%大,功耗0.1-0.2瓦,就實現了功能。
這一切都向我們昭示著,這里還有很大的機會在里面,我們如何才能用科學手段實現這個烏鴉的解呢。
3. 歷史:“春秋五霸”到“戰國六雄”
這里用中國歷史來類比人工智能六十年的幾起幾落。
第一階段:前三十年以數理邏輯的表達與推理為主。相當于最初的有著各種成套體系的周朝,雖然相對松散。
第二階段:后三十年以概率統計的建模、學習和計算為主。第一階段之后,主要分為五大領域:計算機視覺、自然語言理解、認知科學、機器學習、機器人學。也就是春秋五霸。都有著各自的圈子。這一階段主要代表人物。
現在:隨著“五霸”不斷擴張,在一個平臺進行交互。這幾個學科之間已經開始出現融合了,與戰國時期情況比較像,加上從人工智能分出來的博弈倫理,剛好可以湊出“戰國六雄。”
以上就是AI的過去現在與未來。之后進入下一個主題,既然我們進入這樣一個大融合時代,那么用一個什么樣的構架把這些領域和問題統一起來呢。
4. AI研究的認知構架:小數據,多任務
智能系統的兩個基本前提條件:
- 物理環境客觀的現實與因果鏈條。
- 智能物種與生俱來的任務與價值鏈條。
所以在有了以上兩個前提條件之后,我們在定義好智能系統基本行動功能后,在定義好模型的空間(包括價值函數),只能系統就應該能夠自主生存下來,學會認識世界、利用世界、改造世界。
那么又是什么驅動了模型的學習過程呢?
第一,外來的數據;
第二,內在的任務。把智能體都看成一個模型的話,任何模型都將由數據與任務來共同塑造。
當前的大多數深度學習方法,都屬于“大數據、小任務范式”。用大量數據來訓練特定的模型,造成結果是模型不能泛化和解釋。
而朱教授提倡的是一個相反的思路,“小數據、大任務范式”,用大量的任務來塑造智能。(其實這些讓我想到了,最近一些Meta-learning(元學習)方面的研究,嘗試讓智能體學會怎么解決很多任務,以任務為驅動。)
那么又該如何定義這個大量任務呢?人感興趣的任務又有哪些,是什么樣的空間結構?這個問題,現在還一直說不清楚,是人工智能發展的一個巨大挑戰。
有了以上前提知識,下面就是對六大領域的介紹,看能否從中找到共性、統一的框架和表達模型。
5. 計算機視覺:從深到暗
首先列舉了幾個被主流忽視的一些問題。
-
幾何嘗試推理與三維場景構建。人們根據常識對一張圖片就能推理出三維空間,而現在CV是通過多視角特征來推斷。這里提出了一個概念,時空因果的解釋圖(Spatial,Temporal and Causal Parse Graph),即STC-PG。
img 場景識別的本質是功能推理。當人們看到一個三維空間時,會想象這里可以用來干什么,通過想象出來的動作,來理解場景。
物理穩定性與關系的推理。
意向、注意和預測。
任務驅動的因果推理與學習。
那么什么是任務,任務就是改變場景中某些物體的狀態,稱為流態。圖像中的場景和人的動作,其實就是因果關系的推理,所謂因果就是:人的動作導致了某種流態的改變。所以理解圖片,就是這些這些反應流態改變的蛛絲馬跡,而要注意到這些是需要大量來源于圖像之外的知識的。
感知的圖像往往只占5%,提供一些蛛絲馬跡;而后面的95%,包括功能、物理、因果、動機等等是要靠人的想象和推理過程來完成的。
而對于感知圖片的理解可以表達為一個STC-PG,幾點要注意的是。
- 這個STC-PG是想象出來的。
- 大量的運算屬于“top-down”自頂向下的計算過程,這是深度學習中沒有的。
- 這樣學習任務只需要極少的例子。
基于以上,視覺研究的未來,將在于如何發掘那些隱藏的95%的知識,這也就是為什么標題從深到暗。
6.認知推理:走進內心世界
上面說到的暗物質,就要涉及到感知與認知了,進入內心世界。內心世界反映外部世界,同時受動機任務的影響和扭曲。要讓只能提理解下面這些概念。
- Ta看到什么了?知道什么了?什么時候知道的?這其實是對視覺的歷史時間求積分。
- Ta現在在關注什么?這是當前的正在執行的任務。
- Ta的意圖是什么?后面想干什么?預判未來的目的和動機。
-
Ta喜歡什么?有什么價值函數?
而要達到這些,其中一個很重要的就是如何達成共識,也就是分析共通的知識,價值觀。這樣才能通過這些共識推斷出上面所提到的四個問題。
怎么達成共識?那么語言就是形成共識的重壓工具了。
7. 語言通訊:溝通的認知基礎
語言產生基礎是人要尋求合作。但是同時如果沒有上面提到的認知基礎,那么語言就只是空洞的符號,對話不可能發生。
在人與人之間交流時,往往是需要假設一些前提,比如說我知道的東西、你知道的東西、我知道你知道的東西、你知道我知道的東西、我們共同知道的東西。
語言也可以用STC-PG來表達。
8. 博弈倫理:獲取、共享人類的價值觀
這里提到機器人若是要與人交流,那么就必須懂得人類價值觀,了解人類的價值函數。這樣才能推斷出,人接下來要干什么。
而有了價值函數后,在多人環境下,各個價值函數形成競爭與合作,最后達成準平衡態。
9. 機器人學:構建大任務平臺
之前提到“小數據,大任務”,那么機器人就將是一個大任務的科研平臺。
人和機器人要執行任務,就要把人物分解成一連串動作,每個動作改變環境中的流態。機器人重構環境,然后用任務的視角來看待場景,將場景根據單個任務分成單任務地圖。之后通過這些單任務地圖,來組合規劃成復雜的任務,也可以利用STC-PG。
這里舉了一個他們實驗室的例子。
10. 機器學習: 學習的極限和“停機問題”
這里想要探討,在什么條件下,學習過程會終止,之后系統也就達到極限。
首先,到底什么是學習?
比如現在的機器學習主要分三步:
- 定義一個損失函數,代表一個小任務,比如人臉識別;
- 選擇一個模型,比如一個10層神經網絡,需要數據來擬合;
- 拿到大量標注數據,然后就可以擬合參數了。
但是這種學習,沒有因果,沒有行動,只是純粹的、被動的統計學習。
而真正的學習,是一個交互的過程。學生和老師之間有互動,這種學習過程建立在6節講的構架中,這里講這種學習過程稱為通訊學習。
通訊學習的構架中包含大量的學習模式,包括以下七種學習模式:
- 被動統計學習:用大數據擬合模型
- 主動學習:學生主動問老師要數據
- 算法教學:老師跟蹤學生進展和能力,來設計例子來幫助學習
- 演示學習:廣泛應用機器人學,手把手教機器人做動作
- 感知因果學習:通過觀察別人行為的因果,而不用做實驗驗證,學出的因果模型
- 因果學習:動手實驗,控制其他變量,得到可靠因果模型
- 增強學習:學習決策函數與價值函數的一種方法
從以上可以看出,現在如火如荼的深度學習其實只是廣義學習框架中的很小一部分,而學習有時AI中的一部分,所以現在這種將深度學習等同AI,無疑坐井觀天。
其次,學習的極限是什么?
影響學習極限的因素有很多,如教學的動機,教學的方法,能力問題,還有價值函數...
而學習的極限,也就是停機問題,就是在考慮這些因素的情況下,學習的動態過程達到的各種平衡態。
11. 總結:智能科學--牛頓與達爾文體系的統一
首先物理學的發展史就是一部追求物理世界統一的歷史,第一次大統一就是牛頓的經典力學。
然而物理學將生物的意志排除在研究以外,這正好是智能科學要研究的對象。智能科學研究的是一個物理與生物混合的復雜系統。
智能作為一種現象,就表現在個體與自然、社會群體的相互作用和行為過程中。朱教授相信這些行為和現象必然有統一的力、相互作用、基本元素來描述。
然而和物理學不同的是,同時智能科學也會更加復雜,在于:
- 物理學面對的是一個客觀的世界,而智能科學研究的是,物理世界映射到每個人的腦中而形成的主觀與客觀融合的世界,也就是每個人腦中的模型。
- 物理學可以將各種現象隔離出來研究,而智能科學可能一張圖片就包含了大量的模型,人的一個簡單動作就包含了很復雜的心理活動,很難隔離。
回到之前的烏鴉的例子,智能科學研究的物理與生物系統有兩個基本前提:
- 智能物種與生俱來的任務與價值鏈條。
- 物理環境客觀的現實與因果鏈條。
智能科學必須要考慮的就是這兩個基本前提,而人工智能要變為智能科學,本質也必將是達爾文與牛頓這兩個理論體系的統一。