昨晚我們討論一些問題之后,潛意識中的醞釀,在睡覺前使一個詞突然進入我腦子里:仿生。引起了我一些思考:
很多重大科學的突破都是“仿生”的結果,比如,從飛鳥到飛機,從向日葵到太陽能電池板的排列方法,還有遺傳算法,模擬退火算法,神經網絡等。某種意義上講,數學也是一種高度抽象的“仿生”,伽利略說“數學是上帝的語言”,而基督徒則認為上帝用語言創造世界。解決我們遇到難題的最基本思路,除了直覺、邏輯推理以及前輩們的經驗知識之外,最重要的就是觀察地球上的生物怎么做,自然界的基本規律是什么?萬物互聯也是本人深信不疑的信念。
我們的問題是:多個人同時講話,怎么用MIC陣列區分?從上面所提到的"仿生"的角度來思考,就是要回答這樣一個問題:多個人同時講話,人是怎么來區分的?通過直覺很容易想到,MIC相當于人的耳朵,人能夠靈敏的區分多個人同時講話,靈敏的耳朵都是不夠的,而是需要耳朵和大腦同時工作才能精確的做到。人為什么有兩個耳朵,而不是一個,或者三個,四個?人有兩個耳朵而不是一個,其實就是波束成型/陣列天線的基本原理,兩個耳朵能夠判斷波達方向,進而獲得聲音源的方位,而一個耳朵不行。我甚至懷疑第一個發現陣列天線原理的人,很有可能就是"仿生"人有兩個耳朵,從人的耳朵想到的。人有兩個耳朵,而不是三個,四個,原因可能是:第一,自然界傾向于對稱;第二,兩個耳朵足夠用,自然界遵循"最大效率原則"。
語音/語意識別領域經歷的幾十年的黑暗時期,沒有像樣的成果,就是因為從一個錯誤的角度看待問題,在一個錯誤的方向上使力。但自從語音識別從語義分析的角度切換到統計分析的角度,一下子就解決問題了。我覺得之所以語音/語意識別在很長時間里陷入泥沼,就是因為之前的科學家并沒有"仿生”,也就是他們沒有認真思考這樣的問題:人是如何識別語音/語意的?常識告訴我們,人是通過幼兒期聽父母的說話學習語音識別,在學校通過教科書訓練理解能力,最終人的語言理解力越來越好,訓練的越充分的人,語音/語意識別能力越強。而統計模型解決語音/語意識別問題就是模仿人,通過大量的樣本訓練機器。之前的語意/語法分析,耗費大量的人力,絞盡腦汁使用各種排列組合的知識,但在違背自然原則的錯誤方向上,越努力越悲劇。
回到我們最初的問題:多個人同時講話,怎么用MIC陣列區分?從"仿生"和常識的角度,MIC是無法區分的,即使能區分也只能在MIC能做到的范圍內,比如簡單的定位區分。如上所述,真正的語意區分則是需要"仿生",需要MIC和大腦同時工作,各司其職。MIC能做的可能只是提高信噪比這個層面。人之所以能區分多個人同時講話,經過訓練的大腦是關鍵因素。但是如果在一個錯誤的不符合常識的角度,去絞盡腦汁的思考如何用MIC陣列無限度的區分多個人講話,很可能會像早期語音/語意識別的的科學家那樣無功而返,事倍功半。進一步展開講,人除了經驗和耳朵,還有眼睛,這是一個重要的因素,因此將攝像頭加入MIC陣列中是個必然趨勢,因為第一,這符合上面所提的"仿生"的思想以及人們的常識,第二,攝像頭的價格必然會越來越便宜。
我還想談另外的一些想法和疑問。其實也是我在面試的最后想跟您聊的,由于您的時間另有安排因此那個話題并沒有展開。這個問題就是物聯網會給社會帶來哪些變化?會以怎樣具體的方式給人們省錢,省時間,解決問題或者提高效率?這樣的方式符不符合人的直覺和常識以及事物的本質?
我們可以回顧一下IT界的創業前輩,談談我所理解的喬布斯和馬斯克。
喬布斯能夠在1970s想到人人都該有一臺計算機,因為計算機能夠極大提高普通人的生活效率,豐富人們的生活,包括他當時竟然提到的網上購物將成為流行。這些想法在當時是極具思維穿透力的,當然在現在是理所當然的常識。喬布斯的想法也符合上面所提的自然界的“最大效率原則”。他的這些極具創新的想法和他不屈不撓的執行力,最終帶來巨大的商業成功。2007年的iphone,其實也是喬布斯在1970s想到的人人都該有一臺計算機的延伸:人人都該有一臺“移動”的計算機。iphone最終獲得了比Mac大的多的成功,由于喬布斯吸取了Mac失敗的經驗,也由于人使用手機的頻率比電腦大的多。Mac開創性的將“所見即所得”的視窗操作系統商業化,以及后來iphone所用的iOS系統所采用的“觸控”和“擬物”,也是一種我上面所提的“仿生”思想的具體應用:人有天然理解能力和做事方式,人天然使用手指來做事情。沒有這樣的“仿生”思想,蘋果是不可能獲得群眾基礎的,也不可能成功。當然不得不提一句,后來喬納森將iOS改成“扁平”設計是違背喬布斯的初衷的。最后也要回答,iphone之前的掌上電腦和層出不窮的PDA,為什么不能成功?我想是也是因為它們都不符合“仿生”的思想,沒有抓住人天然的本性,沒有群眾基礎,它們的操作系統都違反人性。
馬斯克能夠借著1990s互聯網的東風獲得成功,是因為他看準網上支付以及將報紙的信息搬上互聯網。這在當時來看是不可思議的,一手交錢一手交貨以及在報紙上刊登信息是再正常不過的事情了。當然了,對現在的人來講完全反過來了,不這樣做才不可思議。因為很顯然,網上支付以及將報紙上的信息搬上互聯網是符合“最大效率原則”的,這樣做是能提高人們的生活效率的,給人們省錢,省時間。馬斯克能第一個這樣做,在他之前沒有人敢這樣做,是因為馬斯克能拆掉思維的墻,看到事物的本質,敢于創新,不從眾。
回到問題,我想請教您:您如何看待物聯網的本質?物聯網會給社會帶來哪些變化?會以怎樣具體的方式給人們省錢,省時間,解決問題或者提高效率?這樣的方式符不符合人的直覺和常識以及事物的本質?貴公司在物聯網這個趨勢中充當什么樣的腳色?