回答朋友的問題,順帶還粗略看了一篇經濟學論文:(Polayni's Paradox and the Shape of Employment Growth)。以下是隨手記下的一些內容。
Polanyi Paradox
“我們能比我們自身所意識到的知道更多。” (We can know more than we can tell.)——這是匈牙利籍英國哲學家 Michael Polanyi 提出的理論。理論指出,人類能夠從事的一些簡單的活動,實際上需要的理解力比我們預想的要多出很多。這樣的知識很難被機械,自動化或計算機所替代。論文中稱為隱性知識(tacit knowledge)。盡管計算機能夠有日益增長的性能,能有人腦無法比擬的速度與準確性,卻無法完成在人腦看來非常簡單的事情。比如與人類交流,駕駛汽車,從事具有一定創造性的工作等。
Polanyi 的理論在人類工作自動化與智能化的進程中得到了驗證。論文將需要有高度創造性,直覺,問題解決能力,勸說能力,且需要較高教育水平的工作歸類為“抽象(abstract)”工作,將需要有應變能力,視覺語言理解能力,人際交流能力的,并不需要較高教育水平的工作歸類為“手工(manual)”工作。這兩類工作非常難被自動化的機器替代。所以,科技水平和自動化水平的發展的結果是工作不斷向兩極分化:具有高學歷,高技術要求的工作和低學歷,低技術要求的工作的份額持續增長,而需要中等學歷,能被高度自動化機器替代的工作的份額持續縮減。
然而如文中提到,盡管科技的發展使工作份額向兩極化,薪酬卻沒有同樣的趨勢。高技術含量,高學歷的工作能夠從技術的發展中獲利,使得薪酬隨之增長。而低學歷要求的工作卻不會享受如此待遇。
機器學習
既然 Polanyi 悖論表示,人類所有的“隱性知識”是機器無法替代的。隨著機器學習的發展,我們可能值得重新思考這一問題。
機器學習發展自模式識別(Pattern Recognition),和人工智能領域內的機器學習理論(Computational learning theory),與統計學,優化理論都有很強的聯系。(來自Wikipedia)。
機器學習的基本思想是,從大量的樣本數據中總結獲得規律,從而對未知的數據的輸入進行相應的推斷。針對不同的問題,機器學習有不同的算法。常見的有人工神經網絡,決策樹,聚類算法等等。
比如下棋。計算機處理與人類下棋的算法屬于決策樹算法。計算機計算出兩方在未來 10 到 20 步內所有可能的下法,得到一個決策樹模型,并對所有下法的結果進行評估。評估的方式是一個預先設定好的公式。得到所有步驟的“分數”后,計算機將采取最優解。也就是說,和人類的思考方式不同,計算機通過暴力計算出未來所有的步驟,再從所有可能的結果中選取最優。對于人類來說,在有限的下棋時間內這是一個不可能完成的任務,但對計算機來說卻是最直接的。(參考:How Chess Computers Work)
另外如論文中提到,盡管機器學習領域在突飛猛進,在各個領域有了廣泛的應用,但對很多很基本的問題上的表現可能還不如一個小孩。文中舉了谷歌在所有 Youtube 視頻中搜索貓的例子。谷歌動用了 16,000 個處理器計算這個問題。從結果的截圖來看,表現非常不錯,但把幾個咖啡杯當成了貓。
有相關領域的科學家斷言,隨著計算機算力的不斷發展,機器學習通過暴力窮解得到的結果可能近似甚至超過人類的水平。也有人表示,機器在很長一段時間內只能解決人類工程師向機器準確描述的問題,處理一些例行的問題,而無法應付特殊情況。
對人類工作的影響
無論機器學習是否能夠完全替代人工,有一點是可以確認的:通過科技發展提高生產力是人類文明永恒不變的主題。機器學習將大幅提高人類的工作效率,從而降低很多行業對人類工作的需求。從這一點看來,Polanyi 悖論和本文的觀點仍是適用的:大量需要重復工作,缺少人際交流的工作將逐漸被取代。然而從另一面看,機器學習在很長的一段時間內仍然無法完全替代人類的思考,因此具有創造性,需要應變能力,需要人類交流性質的工作仍將保留下來,并成為未來計算機時代的主流。
舉一個親身經歷的例子:在美帝有很多公司的客服在收到電話后會直接接通一個機器人回答你的問題。這個機器人已經具備相當的語音識別的能力,可以通過你自然語言的描述,針對性地回答你的問題,或者為你接通人工客服。這是機器學習在自然語言當中的應用一例。這樣的機器人可以為公司省下大量的客服的需求,縮減了市場對客服工作的要求。以前人類認為機器無法完成的任務已經開始被逐漸取代。人類工作將向更加無法被機器替代的工作轉移。
附送一則喜劇片段。我認為很好地詮釋了機器學習的強大,以及局限性。