前言:
2016年1月24日,人工智能先驅馬文·明斯基逝世,他在人工智能史上有著特殊重要地位,其思想的深度與原始性有時遠在許多人的理解范圍。但人工智能領域也曾因明斯基等人的XOR邏輯算子“判”了神經元網絡“死刑”,而陷于10年的寒冬之中。本文作者曾與明斯基有過數次私人交流,有感于其在人工智能領域的特殊貢獻,特撰文紀念。
文 | 王飛躍(中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任)
● ● ●
為了紀念剛剛去世的人工智能創始人之一、認知科學家馬文·明斯基(Marvin Minsky)教授,《IEEE Intelligent Systems》(簡稱IS)雜志正組織相關領域專家及明斯基生前的學生與朋友,撰寫悼文,懷念這位在人工智能史上有著特殊重要地位的先驅者和開拓者。
什么是智能?人工智能之父的回答
“What magical trick makes us intelligent? The trick is that there is no trick. The power of intelligence stems from our vast diversity, not from any single, perfect principle.”
——Marvin Minsky
Source/Notes
The Society of Mind(1987),p.308
到底有什么神奇的訣竅使我們如此智能?訣竅就是根本沒有訣竅。智能的力量來源于我們自身巨大的多樣性,而非來源于某一單個的、完美的準則。
——譯文來自王飛躍的報告
作為IS雜志的前任主編和現任名譽主編,我也責無旁貸,同時邀請了人工智能另一位重要的先驅與開拓者、斯坦福人工智能實驗室的尼爾斯·尼爾森(Nils Nilsson)教授參與。由于時間太短,正在夏威夷海濱度假的尼爾森無法完成,但提醒我邀請明斯基早期在MIT的博士畢業生丹尼·博布羅(Danny Bobrow)和波特·拉斐爾 (Bert Raphael)。
丹尼和波特都是自然語言處理的先驅,其中丹尼的博士論文是關于文字代數問題求解的STUDENT程序,波特的博士論文是關于語義信息搜索回取的SIR程序。事實上,STUDENT和SIR都是基于LISP寫的,這是一種通用的高級計算機程序語言,曾長期壟斷人工智能領域的應用,算是人工智能在早期NLP(自然語言處理,Natural Language Processing)的里程碑工作。
丹尼后來成為美國人工智能學會(AAAI)以及認知科學學會的主席,也曾擔任《人工智能》雜志主編;波特與尼爾森等發明了A*搜索方法,研發了世界上第一臺可移動智能機器人ShaKey,他還參與創辦了《人工智能》雜志并任主編。
有趣的是,當年丹尼和波特在美國倫塞利爾理工學院(Rensselaer Polytechnic Institute,簡稱RPI)讀大學時是室友,1957年畢業后,二人分別去了麻省理工學院和布朗大學讀碩士;后來在一次野營時相會,丹尼問波特在做什么,波特說正研究彈性波多散射問題,丹尼說這聽起來沒多大意思,他正研究如何用相機識別他老師明斯基的光頭,只要他走進房間,計算機就喊:“Hello,Marvin!”。一周后,波特申請轉到MIT,成為明斯基的學生,畢業后去了斯坦福國際咨詢研究所(SRI International,美國一家民間研究機構),真的開發起利用相機進行視覺識別和導航的機器人ShaKey!
記得我曾告訴波特,我也是從美國倫塞利爾理工學院的機器人與自動化實驗室畢業時,他則感慨當年RPI既無自動化,也無機器人和AI(人工智能,Artificial Intelligence),就連計算機課程都沒有。其實當年MIT也沒有這些,他們兩人的AI博士學位還是從數學系得來的。
1.明斯基:一位真正的科學思想家
邀請完兩位前輩,我自己如何寫卻成了問題。他們都與明斯基有很長的交往和很深的淵源,都認為他是一個開放、真誠、友好、幽默、具有卓越創造性的人。
細數起來,25年前去MIT面試機器人助理教授時,我與明斯基有過一次會面,另有兩次是通過互聯網交流:分別是6年前因他入選“人工智能名人堂”,編輯部試圖舉辦新聞會議和4年前因他的學生、我的前輩和朋友戴夫·華爾茲(Dave Waltz)去世的兩次郵件往來,除此之外,并沒有更多的感性認識。而且,對于明斯基的學術思想,我的看法和認識也比較復雜,雖然越來越贊成并獲益于其觀點和概念,但仍然還在過程之中,至今還沒有完全定型。
雖然如此,在我眼里明斯基是一位真正意義上的科學思想家,而且其思想的深度與原始性有時遠在許多人的理解范圍之外,由此受到質疑并引起爭議。對此我深有體會:上世紀80年代中期,當我正掙扎著完成自己關于智能機組織與協調理論的博士論文時,明斯基發表了他著名的《The Society of Mind》,此書曾給我很大的希望,以為真找到通向智能機的“金光大道”了。但我還沒有讀完,就意識到對一個剛入門的研究生來說,這條路幾乎是不可能走通的。實驗室有的同學甚至聲稱:“就是你給明斯基的‘ Agents’加上再漂亮的數學公式和具體的邏輯程序,答辯委員會的教授們也不會通過你的論文”。美國倫塞利爾理工學院是一個工程思維主導的地方,客氣的教授認為他的想法是“ decent speculation”(優美的假說)或者“too philosophical”(過于哲學),而有人則直接認為這些雜文 “almost nothing to do with real AI”(與真正的人工智能毫無關系)。
畢業之后,我才開始重新認識明斯基關于Agents的想法,在NASA的火星移動機器人Spiderobot項目中進行嘗試,這還是在MIT的布魯克教授(Rodney Brook)關于機器人行為編程控制的Situated AI方法有了一些成功之后。九十年代末,當我自己開始基于代理控制(Agent-based Control, ABC)方法研究時,才真正感受到當時明斯基的Agents思想的大膽與深刻。
今天,計算與AI技術的處境已發生了翻天覆地的變化,這一切似乎是“水到渠成”,而且我個人感覺,最近二十年上下AI都主要是沿明斯基的Agents思路發展。同時,我個人也認為自己關于默頓系統、社會計算、基于虛實二像性的平行系統之平行智能的工作似乎也已進入明斯基30年前所設想的人工智能新世界。這恰如明斯基所說的:“ You don't understand anything until you learn it more than one way”!(對于一個事物,除非從多個途徑學習,否則你什么也不知道。)
除了明斯基發表的《The Society of Mind》之外,1986年還出版了人工智能和認知科學發展史上的另一部里程碑式的著作《Parallel Distributed Processing》(簡稱PDP)。這使我有幸,更準確地來講是個人的不幸,同時讀了三本書:1965年出版的《Learning Machines》,1969年發表的《Perceptrons》,以及Rumelhart、McClelland及PDP研究小組編著的PDP,外加Rosenblatt(主要是Perceptron)、Widrow(主要是Adaline)、機器學習和我的導師關于Learning Control等方面的論文。
尼爾森的書《Learning Machines》給出了當時學習機器和神經元網絡的最全面的數學分析,但除了引理、定理外,幾乎沒有例子,特別是數值例子,使其成為“陽春白雪”、曲高和寡,由此失去了在工程師中快速傳播推廣神經元網絡的機會。
明斯基和Seymour Papert——我一直戲稱他為See more Papers(多讀文獻之意)教授,一位自己十分敬重的智慧教育學家和知識機器的倡導者——在他們的書中,用一個再簡單不過的XOR邏輯算子差不多“判”了神經元網絡的“死刑”,使其十年多幾乎無人問津,直接導致了人工智能的第二個“冬天”,而且是“嚴冬”。
而就在1986年,當明斯基的《The Society of Mind》欲在人工智能領域引發另一次浪潮或更學術地講一次Paradigm Shift(典范轉移,又稱范式轉移,用來描述在科學范疇里,一種在基本理論上對根本假設的改變。后亦應用于各種其他學科方面的巨大轉變。)之際,PDP中基于Back-Propagation(反向傳播,是“誤差反向傳播”的簡稱,是一種與最優化方法結合使用的,用來訓練人工神經網絡的常見方法)的多層神經元網絡揭掉了明斯基和Papert貼在神經元網絡上的“死咒”,使其“起死回生”,也使明斯基的聲譽有所損失。
我相信這是為什么Agents和明斯基的其他學術思想沒有更快興起的一個重要原因,也是為什么后來Brook和Agents的倡導者沒有更明確、更有力地闡明明斯基的原始貢獻的重要原因。
然而,在當時我更傾向于明斯基和Papert在《Perceptrons》里對神經元網絡(Neural Networks,簡稱NN)的評論,認為其基本模型有局限性和致命的缺陷,合起來的網絡說不定會有這樣或那樣的問題,至少計算上不是很有效。特別是讀McCulloch-Pitts神經元模型原文時,覺得內容與題目(A Logical Calculus of Ideas Immanent in Nervous Activity)相差太遠,幾乎有讀喬治·布爾(George Boole)的《Laws of Thought》的感覺:看懂的太簡單,看不懂的覺得根本就是文學思想,不是硬科學(Hard Science)。
正在這段時間,我的導師的另一位學生,一位IBM的在職工程師,其關于Boltzmann網絡的工作覺得明明是錯的,但導師仍然支持,后來論文也發表了,更使我對NN的研究產生了偏見。
而且,明斯基和Papert的書使得人工智能研究的大方向穩定在以推理和邏輯編程為主的“符號”系統之上,而不是以NN為代表的計算智能方法,對于剛從計算力學“逃出”不久的我而言,當然心里更愿意接受。一直到畢業后,我才開始改變自己的認識,九十年代初開始了關于模糊神經網絡(Neuro-Fuzzy Networks ,簡稱NFN) 方面的工作,構造了通用的九層網絡,以及相應的學習算法,希望將語言層次的知識轉化成數值層次的模型。
2.明斯基與神經元網絡理論(NN)的糾葛
回想起來,NN乃至計算智能之所以一直游離在人工智能的主流之外,與明斯基有相當的關系。這也給了IEEE創辦NN Council,還有后來的NN學會,即改名后的計算智能學會(CIS)的機會。而且,后來以NN和支持向量機(Support Vector Machine,SVM是一種監督式學習的方法,可廣泛地應用于統計分類以及回歸分析)為主要起步方法的機器學習理論在廣泛應用之后仍長期不被主流的人工智能學者所接受,似乎也與明斯基的影響有關。好在今天的機器學習,特別是深度學習已然成為人工智能的主力,以符號邏輯為主的人工智能和以數值建模為主的計算智能也逐漸邁向合二為一。
其實NN的“災難”并不能真正地怪罪于明斯基。在《Perceptrons》和明斯基等人于1971年撰寫的關于MAC項目的進展報告中,明斯基等人把對NN的學術指責非常嚴格地限制于單層和“線性閾值”網絡,而不是后來的多層和“Sigmoid非線性閾值”網絡。但他們的“文學性”描述卻十分清楚地告訴大家:盡管他們不能證明多層NN基本上是無用的,但十分自信地認為這些網絡作為計算學習器件是不夠的。
科學是科學,文學是文學,大家忘了McCulloch和Pitts的原始文章已“證明”NN可實現所有的布爾邏輯算子,當然包括XOR、尼爾森的《Learning Machines》第6章也證明了多層網絡Layered Machines的一般性能力,而結果還是明斯基和Papert一個小小的XOR反例就使NN塵封十余年、陷人工智能于“冬天”的境地。
其實要怪只能怪自己不動腦、盲從,把文學當科學。這點反過來印證了明斯基所擅長的謎語式警句:“In science, one can learn the most by studying what seems the least”。(在科學里,研究似乎最不起眼東西,往往可以學到最重要的。)
唯一讓自己感覺不適的是,NN重生以后,明斯基和Papert聲稱他們過去無意也沒有把他們在《Perceptrons》中關于XOR的結論放大到整個NN,是別人誤解了他們的真正意圖。換言之,有人愿意將其文學語言當成科學描述,怪不得他們。我在理性上認同明斯基和Papert的說法,但《Perceptrons》明明白白往“死”里攻擊當時風頭正健的Perceptron,其提出者正是明斯基的高中校友和學術上的同事加“朋友”Frank Rosenblatt,就連他們書的封面也以象征Perceptron無能與致命缺陷的雙螺旋連通圖(而且還是用了令人尷尬的色彩)示之,感性上我很難覺得他們兩人是無辜的。
另外別忘了,明斯基很自豪他在自己的博士論文中提出了世界上第一個隨機連接的神經元網絡模型,同時認為人腦就是簡單而有局限的元件組成的“人肉機器(Meat Machines)”。而且,明斯基還在此前兩年出版的一本關于形式語言和計算基礎理論的大學教科書《Computation: Finite and Infinite Machines》里,與眾不同地引入了神經元模型,大力提倡利用神經元網絡構造理論計算機。
令人寬慰的是,1971年,Rosenblatt英年早逝,死于意外事故(也有人說是自殺)之后,明斯基和Papert將修正后的新版《Perceptrons》獻給了Frank Rosenblatt。
說起明斯基的 《Computation》 ,還有幾句相關的題外話。我跟付導師(Minor Advisor) Robert McNaughton (羅伯特·麥柯納赫頓)學習形式語言時,直接上研究生的課。因無計算機專業的大學背景,羅伯特推薦了 《Computation》 自修補課。讀后感覺這是一本深而易讀的優秀教材,特別是明斯基關于Post定理的證明。獨出心裁、簡明清晰、令人印象深刻。而且,作為一個剛到美國的中國留學生,很高興在書中看到對首位在計算機和人工智能領域里開拓的王浩教授工作的高度評價。書中證明了“Wang Tiles(王氏瓷片)”與圖靈通用機等價,同樣具有不可決定性(Undecidability)。
王浩是位著名的哲學家、數學邏輯學家和計算機科學家,在哈佛哲學家奎因的名下完成博士學位(盡管后來王浩對奎因有許多批評),也是羅伯特的師兄和研究數理邏輯的引路人。王浩晚年與 Godel 交好,成立 Godel 學會,致力于研究 Godel 哲學思想。 忘了是1989還是1990年,我當面向王浩提起此事,才知道“王氏瓷片”是王浩自己的一位博士生首先命名的,并證明了其不可決定性,而明斯基是這位學生博士答辯委員會的成員,所以非常了解這方面的工作,后來證明了“王氏瓷片”與圖靈機的等價性(此事我一直不明白,但不是此處討論的問題)。更有趣的是,當我同王浩講起系里有位教授人工智能的老師認為明斯基是位“文學家、作家、半個哲學家”時,王浩回應到:一、顯然這位教授沒有看過明斯基的“小說”; 二、明斯基不是“半個哲學家”,至少是“一個半哲學家"!
3.“符號”學派與認知學派之爭
細思一下,人工智能史上的這一“事件”有著令人“哭笑不得”的效果。尼爾森是AI中力推邏輯推理的“符號”學派(所謂“純凈派”)之主力。對計算智能方法不能說有“敵視”,但起碼支持不力,可他的第一本專著《Learning Machines》本來應興起計算智能與機器學習的時代之“火”,卻無疾而終,或者說后來被明斯基和Papert撲滅了。明斯基是AI的認知計算和“玄妙”學派(廣義的“邋遢”派)之開山,沒想到其《Perceptrons》卻狙擊了計算智能十余年,反過來成就了“符號”學派。這段歷史,符合其《The Society of Mind》的框架,活生生的一幕默頓系統動力學之戲,值得社會學家和歷史學家仔細地去研究。
我隱約地感覺當年第一位AI之“父”John McCarthy離開MIT去斯坦福創立新的人工智能實驗室與明斯基有關。按McCarthy的說法,是他召集了1956年的Dartmouth會議,提出了“人工智能”一詞,明斯基只是應邀參會。接著,McCarthy發明了LISP語言,理所當然成了現代AI“符號”學派的開山鼻祖。而明斯基一直自稱也被公認是AI的“認知科學家”,更傾向于Cybernetics(控制論,臺灣稱為模控學,是研究人等動物與機器之間通訊的規律,現代信息技術的理論基礎之一)創始人諾伯特·維納(Norbert Wiener)教授關于人工智能的想法:連續邏輯、連續信號或連續數學為主,而非離散邏輯、離散符號或離散數學。
實際上,在Dartmouth的夏季會議之前,維納過去的學生和同事已經于同年的春天在MIT校園里組織了一次關于認知科學的研討會。此會是否對接下來夏天的人工智能研討有影響,我目前無法知道,但無論如何,背后都有維納的影響。而且,維納與McClelland及Pitts的決裂,斷送了當時計算方法引導AI發展的趨勢,客觀上為后來符號方法在AI的興起創造了機會。
但MAC項目中的AI部分,主導者卻成了明斯基,原因或許與項目資助人DARPA的Licklider博士的興趣有關,其心理學和通信的背景,會更傾向于Wiener所指明的方向,結果導致McCarthy的離開,使斯坦福成為MIT MAC Project的競爭對手和“純凈派”的大本營。當然這一切都是我的猜想,目前并無任何材料和考證。
今年年初我去俄勒岡州拜訪退休的尼爾森教授,還談起他的《Learning Machines》和明斯基的《The Society of Mind》,希望有時間回頭細讀,結果得到他購贈的一本來自英國格拉斯哥大學(Glasgow University)圖書館的1965年原版《Learning Machines》。沒想到回到北京后,辦公室送來一份湛廬文化董寰總編的禮物,明斯基《Emotion Machines》的中譯本《情感機器》。我曾略讀過英文版,但當時整體上并不認同其思路,也不相信其中的一些結論,正要把中文本帶在出差的路上細讀的時候,傳來了明斯基去世的消息。
兩本書,一個不幸的消息,加上谷歌AlphaGo算法大勝歐洲圍棋冠軍的《自然》論文和隨之而來關于深度學習及“人類vs人工智能”的討論熱浪,逼著自己花時間去讀相關論文,也讓我頓然失去了細讀《情感機器》的心情。或許,還是先看看尼爾森的小冊子《Understanding Belief》,理解信念到底為何吧。
不管信念為何,在一件事上我必須表明對明斯基教授的敬佩,就是他從不與自己的學生合作寫文章,但竭力為他們創造自由良好的成長環境,甚至連自己的家都成了學生們隨時可以來聊天吃飯的“俱樂部”。丹尼還記得明斯基請他去MIT教授餐廳吃飯,見過一個人,他還以為也是一個學生,結果竟是大名鼎鼎的維納Wiener教授。同任IS雜志主編(我的前任),也是《Science》雜志在信息領域的唯一編委,RPI計算機教授詹姆斯·漢德勒(James Hendler)也講了類似的故事: 他做學生參加會議時,明斯基請他一起吃飯,并說還請了另外一人,希望他不要失望,到后令詹姆斯大吃一驚,原來他是人工智能的另一位“開山之父”、圖靈獎和諾貝爾經濟獎得主哈伯特·西蒙(Herbert Simon)教授。明斯基對學生的扶持與風格,可見一斑。
隨思亂筆,零散的回憶,算是自己對明斯基這位真正的科學與技術之思想家的懷念與致敬!
附錄
2012年,時任IEEE IS雜志主編王飛躍提議建立“人工智能名人堂”,Minsky是入選的十位之一。
Minsky1967年出版的唯一一本形式語言與計算理論大學教本,首次引入了神經元模型和基于神經元網絡的理論計算機,并對華裔哲學家、邏輯學家和人工智能的開拓者王浩的工作進行介紹。
1969年,Minsky和Papert發表《Perceptrons》,其狹義科學分析通過廣義文學語言的描述封殺了神經元網絡研究十余年,將人工智能研究推入第二個"冬天"。史稱"The Perceptron Controversy"或"The XOR Affair"。有人甚至聲稱Perceptron的發明人,英年意外死亡的Rosenblatt就是因此而自殺的。
1986年,Minsky出版了他第一本面向大眾也是最有影響的專著《The Society of Mind》。本應立即引導人工智能走向新世界,但這一年,神經元網絡起死回生,重新崛起,客觀上延緩了Minsky思想的傳播。但近二十年,人工智能大體上還是沿著Minsky的特定領域代理Agents交互的思路發展。
2006年Minsky完成的《情感機器》,至今毀譽參半,沒有被人充分理解,形成共識。書一出版,就因其中壓根沒有提及生物神經情感專家(也是歌唱家、作曲家)LeDoux的工作和專著《情感大腦》而受指責。Minsky在書中認為意識、情感、推理都是思維,從而也就是智能之不同的方式而已。意識不是單一的"自我(Self)",而是不同心理過程所組成的"分布式云(Decentralized Cloud)"。而且,應該把大腦看成血肉構成的交換機,實現人工智能的途徑就是如何使我們的理智(Mind)更像思維機器,而不是使機器更像人類。
王飛躍,主要研究領域為智能控制、智能機器、社會計算、平行系統、知識自動化等。1990年獲美國倫塞利爾理工學院(RPI)計算機與系統工程博士學位。現為中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任,國防科技大學軍事計算實驗與平行系統技術研究中心主任,中國科學院大學中國經濟與社會安全研究中心主任, 青島智能產業技術研究院院長。
(責任編輯 徐可 葉水送)
知識分子,為更好的智趣生活。
關注請加微信號:the-intellectual或長按下方二維碼。投稿、授權事宜請聯系:zizaifenxiang@163.com。