王煜全 036|語音互動是智能設備更好的交互方式
今日內容看點
通過閱讀今天的內容,你將會掌握以下三個問題的答案:
在智能語音領域,為何蘋果的 Siri 最早入場,如今卻被競爭對手超越?
小公司在面對大公司的收購邀約時,該如何抉擇?
智能語音下一步將如何進化?
一、來自挪威的風暴獵人 Dag Kittlaus
今天讓我們來認識一位在智能語音入口方面的大牛,挪威人 Dag Kittlaus。
這個名字,大家可能一下子反應不過來,但如果大家用過 4S 以后的蘋果手機,一定不會對 Siri 這個詞陌生。是的,Dag Kittlaus 就是給 Siri 取名的那個人。
嚴格來說,Dag 應該是美國人,因為他出生在美國,并在美國接受了小學到大學的教育,不過他的母親 Liv 是挪威人,并且從小就經常帶 Dag 和他的兄弟回挪威探親,所以 Dag 對挪威非常喜愛,喜愛到大學畢業以后跑到挪威去念了 MBA,畢業之后又在挪威呆了7年。
據 Dag 的母親說,Dag 從小是一個坐不住的人,熱衷于嘗試各種運動,包括體操、跳傘、深海潛水等等,他的膽子也很大,喜歡做風暴獵人,叫 Storm Chaser,也就是開著車近距離去觀察龍卷風的那個人。為此,他購買了一整套的雷電監測系統以及一系列的氣象檢測設備,幾乎是一個半專業的氣象學家了。
二、Siri的由來
說起 Siri 名字的由來,這也是一個挪威女性的名字,在挪威語中,Siri 意為“beautiful victory”,美好的勝利。在挪威期間,他在當地著名的電信公司 Telenor 擔任過副總裁,也因此與挪威著名氣象學家、實業家 Siri Kalvig 共事過一段時間, Dag 總是說這段經歷非常美好,他曾經也想把 Siri 作為名字送給自己的女兒。但可惜他的第一個孩子是兒子,于是 Siri 就成為他第一個公司的名稱了。
我們知道 Siri 語音助手是在2011年 iPhone4s 發布的時候由蘋果發布的,其實早在2007年的時候, Siri 的雛形就已經誕生在斯坦福的人工智能研究中心,叫:
SRI International Artificial Intelligence Center
當時 Dag 作為進駐企業家,叫 Entrepreneur-In-Residence,在斯坦福研究中心準備他的新公司,因此認識了 DARPA 的 CALO 計劃的首席架構師叫 Adam Cheyer。人工智能語言學技術的大牛Tom Grunber,并且獲得了2500萬美元的風險投資,在2008年就正式成立了 Siri 公司。
DARPA 的這個 CALO 計劃,全稱叫做 Cognitive Assistant that Learns and Organizes。實際上就是美國國防部倡導的一個基于人工智能來實現智能助手的項目,所以 Dag 當時創建的 Siri 可以說天時、地利、人和都具備,既請來了 CALO 計劃的技術大牛做硬科技的支撐,又借助了硅谷的風險資本。?
三、Siri邂逅蘋果
2010年2月,Siri 公司在蘋果的應用商店推出了同名的語音助手 APP,叫 Siri。
當時的功能已經和今天的 Siri 差不多,甚至還更強了,你可以和它聊天,讓它幫忙打車,預定餐廳,買電影票。這種新鮮的應用迅速得到了社會的關注,沒多久,Siri 就占據了蘋果應用商店里面 Lifestyle,生活這個板塊的第1位。
三周后,更讓 Dag 吃驚的是,喬布斯親自打電話給他,希望收購 Siri。
一開始的時候 Dag 感到很猶豫,雖然他做 Siri 是沖著智能手機 iPhone 去的,但是把第一個女兒嫁給了蘋果,還是讓他有些難以割愛。可是喬幫主畢竟是營銷的天才,他答應把 Siri 作為 iPhone 的一個核心功能推廣。如果 Siri 作為 iPhone 的核心功能而不是應用商店里的 APP,Siri 的技術可以被更多的用戶使用和了解。所以最后喬布斯終于說動了 Dag,蘋果以2億美元收購了 Siri 公司,1年之后 iPhone4S 發布的時候,果然推出了人工智能語音助手 Siri,拉開了蘋果進軍人工智能語音助手的序幕。
事實上,喬布斯并沒有說錯,在成為蘋果的默認應用之后,Siri 迅速被用戶熟知。全球至少有超過5億人使用過 Siri,按照 Siri 2億的月活用戶和1億的日活用戶來說,這的確遠遠超出了 Siri 剛剛誕生時的用戶數量。
然而,出于對蘋果全球策略的考慮,Siri 開發的重心被迫從原來的人工智能語音助手功能轉向了支持更多的語言,執行更簡單更不容易出錯的任務這個方向。
被收購前 Siri 有許多的合作商,包括訂餐、雅虎推薦等,超過45個服務,而嫁入蘋果之后,Siri 只支持寥寥幾個服務。Siri 早期投資人 Gary Morgenthaler 就說:Siri 在被蘋果收購后的第3年能做的事甚至還不如2010年剛剛被推出的時候多。
在2011年喬布斯逝世的第二天,Dag 就從蘋果辭職了,而且 Siri 當時的 CTO Adam,也在幾個月之后離開了。
如今的 Siri 還是不斷地被改進,不僅在手機上,還能在智能手表和蘋果電腦上使用,而且也逐漸開放了部分的 API 接口,供第三方開發者調用。但是,沒有了創始人陪伴,更像是一個沒有靈魂的木偶。在包括亞馬遜、微軟、谷歌等等各家互聯網巨頭的語音助手的夾擊下,有些黯然失色了。
四、關于Siri的啟示
過早被收購,對每一個初創公司來說并不是最好的歸宿。
對于還具有巨大成長潛力的小公司來說,大公司固然可以提供更多的用戶和大平臺,但如果發展方向與原始方向背離,或者平臺過于封閉,反而容易導致小公司過早失去發展資源而退化。
Siri 在推出 APP 3周之后接到喬布斯的收購電話,如今聽起來更像是一個傳說。但是之后的漸漸失色,證明了小公司并入大公司之后成長的艱難。
另外,公司創始人的價值觀匹配也非常重要。根據 Siri 的 CTO Adam 的說法,如果喬布斯還能夠活著,他可能會繼續留下來。
五、Siri 2.0 – Viv
正如 Dag 的母親所說,Dag 是個坐不住的人,離開蘋果后的第2年他就繼續創業,成立了新的公司,叫做? Viv Labs,Viv 實驗室。Viv 是一個源自拉丁語的詞,意思是就是 Live,就是生機。
從某種意義上說,Viv 是2008年誕生的 Siri 公司的重生版,也就是 Siri2.0。
Viv 的 Logo
1. 機器自動編程技術 “Program Synthesis”?
首先,Viv 在技術上利用了一種叫做 Program Synthese 的自動編程技術,來突破目前人工智能助手僅能回答簡單問題的壁壘。
具體來說,就是讓人工智能程序聽懂主人復雜的指令,然后自動生成代碼來完成任務。
比如,你問它,今天傍晚,在我去女友家的路上,請幫我挑一家性價比高的花店,里面有賣我女友上次很喜歡的那種花。
回答這個問題,需要分析許多小問題,比如地理位置信息,本地的商家信息,以及情侶的交往記錄。
目前的智能助手,通過事先編程擁有了龐大的數據庫,能夠自如地回答一個個分散的問題,但如果遇到需要具體情況具體分析的問題,還是搞不定。但這類的問題卻是人們日常生活中最常提問的, 所以目前的智能助手還是弱人工智能。
那相對而言,Viv 卻可以先將大問題分散成小問題,然后通過自動編程尋找每個小問題的答案,并且進一步串聯答案,篩選出用戶需要的回答。這樣一來,Viv 就顯得更加貼近實用。
2. 團隊與愿景 (Global Brain)?
為了保持技術的先進性,Dag 還請來當時一起創建 Siri 的元老,包括 CTO Adam Cheyer,和斯坦福畢業的 Siri 工程師 Chris Brigham。
左→右: Adam Cheyer、Dag Kittlaus、Chris Brigham
此外,為了和包括 Google Now、Microsoft Cortana,,以及 Amazon 的 Alex 在內的各大高手較量,Dag 還挖來了 IBM 人工智能系統 Watson 的創始人之一 David Gondek 和德州大學達拉斯分校的 Mark Gabel 擔任首席科學家。
和 Siri 創建時一樣,Viv 很快就獲得了合計2250萬美元的 A 輪和 B 輪投資,這其中的投資人包括了 Facebook 的扎克伯格和李嘉誠的維港投資。
2016年韓國三星公司提出收購 Viv,這一次 Dag 吸取了 Siri 的經驗,接受了三星的收購,但是 Viv 還是要作為一個獨立的公司運營。所以在 Dag 的 Linkedin 履歷上,你可以看到他既是三星移動的副總裁,也同時是 Viv Labs 的 CEO。
對于 Viv,Dag 希望將其做成一個更加通用的人機交互平臺,就好比當前 Siri、藍牙等 Logo 被印在產品上代表一種通用通訊標準,Dag 希望有一天用戶一看到 Viv,就明白這是一個可以和它語音互動的產品。
比如你看到某個冰箱上印有 Viv 的 Logo,就可以自然而然地問,現在冰箱里的牛奶是不是快過期了,雞蛋還有幾個呀,是否需要馬上預定,而冰箱也會通過你的語音來識別你,如果家里來了客人問同樣的問題,還會幽默地表示拒絕回答。
Viv 的團隊的最終愿景是成為一個“Ubiquitous Global Brain”,一個無處不在的全球大腦,通過自然而然的人類語言互動來理解人類,并幫助人類更好地與周圍環境互動,這與谷歌、亞馬遜等等各大公司的智能助手出發點一致,甚至說更偉大。
畢竟,最早出名并且商業化的人工智能語音助手 Siri 就來自 Dag 的團隊,他們的想法也更加深刻。
最后,有意思的就是 Dag 除了沒有喬布斯的壞脾氣外,還有著一些與喬布斯很類似的地方:
比如,他和喬布斯一樣,是 Viv 團隊中唯一的非工程師,卻擁有非凡的商業直覺和領導力。 在創建 Siri 前,他擔任過 Telenor Mobile 通訊公司的副總,也在摩托羅拉做過近5年的高管。
又比如,在去年11月的時候,他被檢測出了一種非常罕見的胰腺腫瘤,這和喬布斯曾經被檢測出的一模一樣。
今年初的時候,腫瘤已經被移除,巧的是,參與手術的一位護士名字正好叫 Siri。不知道當時如果 Dag 說出“Hey Siri”時,護士和他的 iPhone 同時回應是個什么樣的場面。
今日知識小結
我們介紹了 Siri 之父 Dag Kittlaus 的生平和他創建 Siri 以及 Siri2.0——Viv 背后的故事,主要有三點想分享:
一個技術團隊的發展往往需要天時地利人和,Siri 的出現生逢其時,因為語音互動確實是智能設備更好的互動方式。但因為過早被收購,后續在發展上反倒被后來者超越了。
小公司在進行并購之后遇到的問題和挑戰也值得重視。Siri 在接受蘋果收購之后,被迫放棄了原有的發展方向,失去了創始人的支持,成為被囚禁的玩偶公主。同時這也是大公司為了滿足公司全球發展,無可奈何的策略。
我們注意到在美國連續創業者的重要性。如果沒有 Siri 的第一次失敗,Viv 在第二次收到三星收購的時候就不會堅持獨立運營。也正是因為 Siri 的主要創始團隊都在 Viv,Dag 能夠很快募集到資金,招募到優秀人才加盟。重新把自己業務有聲有色地做起來。
今日思考題
設想 Viv 如果不是和三星合作而是和中國的企業合作,請問,有哪些中國企業會是它最好的合作伙伴呢?
希望大家打開思路,一起貢獻自己的智慧。
萬維鋼 日課002 | 屠龍術的日常應用
《莊子》里有個典故,說有人花了三年的時間和無數金錢去學了“屠龍術”,但學成歸來之后他發現白學了,因為現在已經沒有龍了。
我們說的自由技藝,就有點像是屠龍術。古代學習自由技藝的都是貴族,現在這么多老百姓的孩子學什么政治學、國際關系,難道真的都去管理國家嗎?顯然不可能。
但這可不等于說學屠龍術沒用。今天咱們繼續說喬治·安德斯的《你可以做任何工作》。這本書里就列舉了很多屠龍術在普通公司日常工作中的應用。
咱們講三個真實的故事。
1.研究國際關系的項目經理
有個女青年叫康諾利(Connolly),在斯坦福大學學的是國際關系專業。康諾利選擇國際關系專業可能是因為她喜歡到各國旅游,還喜歡政治。她高中的時候就作為學生代表去過很多國家參加活動,還在奧巴馬競選陣營里面當過志愿者。上大學期間,她到南非待了很長一段時間,學了當地的語言,還做了各種調研。康諾利特別擅長理解各國的文化,能跟完全不同文化背景下的人打交道。
像這樣的人才,能干什么工作呢?她最初的成功,是在 WikiHow 做項目經理。WikiHow 有點像是中國的百度知道,用大量教人干這干那的文章從搜索引擎獲得流量,然后靠廣告賺錢。
康諾利負責的項目是把 WikiHow 弄成多語言版本。公司已經擁有大量英文文章,但是不知道怎么用低成本的方法把這些文章翻譯成其他語言,特別是一些第三世界國家的語言,比如說印度尼西亞語。
最廉價的辦法顯然不是在美國找會印尼語的人,而是去印尼找會英語的人。康諾利到各個國家找當地的人來翻譯WikiHow上的文章,她的國際關系技能還真用上了。哪怕是完全不熟悉的文化環境,康諾利也能迅速識別每個人到底能干什么,到底想要什么,然后和這些人談判。比如亞洲文化尊敬年長的人,她見到年長的人就會給足夠的禮敬 —— 但同時還有辦法讓他們完成該干的工作。
國際政治還教會了康諾利變通的智慧。最初,公司的設想是找一些當地精通英語的人來翻譯。結果康諾利發現,很多英語好的人寫作能力并不怎么樣。她發現最好的辦法是找那些英語水平一般,但是擅長用本國語言寫作的人。其實 WikiHow 上的文章本來就挺簡單,英語不用太好也容易理解。
在印尼,康諾利先是從首都雅加達招了一批人。她把這些人分成兩組,一組負責翻譯,一組負責編輯。結果兩組人合伙騙她 —— 負責翻譯的人用 Google 的自動翻譯系統隨便翻譯了一下,然后負責編輯的人居然就給通過了。康諾利馬上想到應對的辦法,她開除了雅加達的團隊,去了印尼一個邊遠省份的二三流大學,雇大學的師生來干這個活兒,結果這些人干的特別認真,翻譯質量很高。
所以有些事兒你不到現場了解就做不好。各國文化要求不同的文章內容。中東地區禁止飲酒,阿拉伯語版中就不能有《怎樣在自家釀造伏特加酒》這樣的文章;俄羅斯禁止大麻,俄語版中就不能有有關大麻油的內容。那像《怎樣第一次親吻一個女孩》這篇文章怎么辦呢?有個埃及人認為阿拉伯世界不可接受這樣的文章,但中東的一些女孩反而表示這樣的文章可以有 —— 康諾利真的得像一個外交官一樣協調這些事情。
事實證明項目經理這個工作非常適合自由技藝專業的人。在過去十五年內,全世界項目經理的崗位增長了500%! 想要干好項目經理,你得有批判性思維能力,有跨學科的見識,還得擅長處理人際關系。 你能不能協調好自己的團隊,能不能從外面獲得幫助?
當然項目經理也得有點技術,不過技術不是關鍵。康諾利剛到公司的時候連 Excel 制表軟件都不怎么會用,但是 Excel 能有多難?康諾利現用現學上手很快。對一個連國際關系都能擺平的人來說,這都不叫事兒。
2.IBM的社會學家
我們知道 IBM 是個高科技公司,專門做一些軟件、人工智能、技術支持之類的事情,但是它也雇了很多學自由技藝的人。
比如有個叫米克(Meeker)的人,學的是社會學,但不是名校畢業。米克的特點是實地調研的能力非常強。
還在上大學的時候,導師就建議米克去越南待半年,研究課題是越南革命。米克到了越南,很快就學會了越南語,能跟當地人自由交流,然后他就決定留在越南再干幾年。當時有很多西方公司在越南開設業務,米克就幫這些公司去搞商業談判、促成和當地公司的合作。他既了解越南文化,又了解西方文化,工作做得很好,兩頭通吃,很快就出名了。
事實上,你把上面說的“越南文化”改成“人工智能”,米克的工作模式也行得通。
所以他就被 IBM 挖過去了。最初 IBM 讓米克負責給自己的人工智能項目“華生”聯系商業合作,后來 IBM 看上了區塊鏈概念,專門成立了一個部門推廣區塊鏈業務,米克就被調到了這個部門。
區塊鏈,是一個技術性非常強的東西,熱門歸熱門,但是一直到現在能真正把“什么是區塊鏈”這個問題給解釋清楚的人也很少很少。IBM 想建立一個區塊鏈商業圈,急需能向任何商業人士解釋區塊鏈的人。米克就是這個人。
米克不但能在短時間內學會越南語,還能在短時間內理解區塊鏈。他把從 IBM 能找到的所有有關區塊鏈的資料都讀了,了解了全部細節。不論你是想聽概念還是想聽技術,米克都能給你說明白。
比如說,這本書的作者安德斯并不懂技術,所以米克是這么給安德斯解釋區塊鏈的 ——
區塊鏈的本質是信任。在原始村落里,鄰居種糧食你家養豬,那他家的糧食是怎么種的你非常清楚,你家的豬是怎么養的他也非常清楚,你們兩個搞商品交換肯定互相都放心。但是在現代社會,你要買有機的三文魚,那你怎么知道這個三文魚是不是真的有機食品呢?魚是在哪兒打撈的,怎么運輸,到你手上的時候經歷了哪些人的轉手,你無從得知,所以你沒有信任感。
區塊鏈就能解決這個問題。區塊鏈把有關這條魚所有相關的生產和運輸信息都記錄下來、然后以去中心化的形式存儲,誰也沒法刪除改動,那么人們就能充分了解整個供應鏈的所有情況。
有了這個介紹,你大概就已經對區塊鏈有點概念了。如果你還想了解技術細節,米克還能給你講細節。
這就是社會學給米克鍛煉出來的能力。能調研、能學習、還能表達。米克的原則是講任何東西都要考慮聽眾的視角,只有充分理解聽眾,對談話背景非常敏感,你才能把這個工作做好。
3.投資界的哲學家
我們熟悉的《黑天鵝》《反脆弱》這兩本書的作者納西姆·塔勒布有個身份是期權交易員,他賺了很多錢,但是因為書寫得太好,人們更愿意把他當成一個哲學家。金融大鱷索羅斯是哲學家卡爾·波普的弟子,也希望被視為哲學家,但是因為金融玩得太大,人們還是把他當成一個交易員。
這個要點是有很多搞金融的人其實是學哲學出身的。創始人、高管、普通員工都有。今天如果你是哲學系的畢業生,去華爾街找工作的時候你會有一種親切感。
安德斯重點講的人物是卡爾·伊坎(Carl Icahn)。伊坎是那種發條推特就能影響蘋果股價的人,個人身價是170億美元。
伊坎喜歡的商業模式是收購一個很有潛力但表現并不好的公司,重組這個公司,告訴管理層應該怎么改革,改好了再賣掉。
伊坎以前就是學哲學的,哲學跟這種工作有什么關系呢?伊坎說,哲學的一個智慧,就是看你在混沌不明的情況下能不能做出自己的判斷,在互相矛盾的情況下能不能正常行事 —— 這其實是咱們精英日課專欄說過多次的道理。
收購一個公司之后,伊坎對管理層的重組改革,就運用了這個精神。
安德斯在《華爾街日報》當過記者,他跟伊坎有過很多次交流。伊坎有一個很重要的特點,就是他總要跟人解釋清楚他為什么要這么干。他先說一遍自己的改革意見,再說一遍那個公司管理層的不同意見,然后還要解釋一下為什么管理層錯了,管理層缺少了什么關鍵信息才犯了這個錯誤。
伊坎善于轉換不同的視角來看一個問題。他堅持自己的觀點,同時又尊重別人的意見。
這就是一種哲學家氣質。關鍵詞是“矛盾”!哲學讓你學會適應矛盾。
再比如說,排名很高的風險投資者中,有很大的比例的人以前都是學習跟金融沒有關系的專業,其中學哲學的人有很多。其中有個投資者是這么說的 ——
想要做一個成功的投資者,你得同時擁有兩個素質,這兩個素質看似是矛盾的。首先,你要非常有主見,你一定要相信自己這個投資能成功,你才敢干。第二,你還要有一個開放的頭腦,能夠隨時接受新的信息,勇于推翻自己之前的決定。既要堅持、又要改變,很矛盾,典型的哲學家氣質。
這個道理我們在第一季專欄中《風險投資人的養成》這期節目提到馬克·安德森的時候,也說過。
***
自由技藝是統治世界的技術,現在你看,這些自由技藝專業的畢業生雖然沒進政府部門,但是真的正在統治世界 —— 至少也是在運轉這個世界。
當然他們可不是一畢業就能統治世界。考察美國剛畢業5年的各專業平均工資排名,排第一的是計算機,平均年薪63,500美元,前幾名都是實用的技能,而哲學專業平均年薪只有44,700美元,往后是政治、歷史、英語、心理學專業,一年只能掙三四萬美元。(表一)
表一
但是你考察那些畢業10年到20年這個區間的各專業收入,學自由技藝的人的工資水平就逐漸增高。排最前面的還是計算機,平均年薪111,000千美元,但這時候學哲學的達到了84,000美元,學政治學的是79,900美元,已經分別排到第三和第四位。(表二)
表二
然后你再考察各專業最成功的人才一生的總收入,前十名里面第一位就是政治學,一生收入481萬美元;第二位是歷史,375萬美元;哲學排第四,346萬美元。(表三)
表三
這就是自由技藝的后勁。你的起薪不高,但是如果你學到了真本事,最后一定會拔尖。
| 我的評論
我對中國的文科教育不太了解,但我感覺如果你學的是人文學科,那么學習大概有三個層次。
第一層是“學事實”。你得記住哪個年代發生什么事兒,哪個皇帝有什么政策之類。
第二層是“學觀點”。比如怎么評價太平天國運動,甚至各位名家的觀點,你得知道。
這些事實和觀點,固然是必備的專業素質,但是如果你畢業以后就不搞這個專業了,它們就只是談資而已。
第三層,是“學方法”。你能不能直接考察一下當時的原始材料,比如說太平天國相關的經濟數據,清朝大臣的什么奏折之類,從中得出自己的觀點,還能說服別人接受你的觀點。這才是批判性思維,這才是真正值錢的技能。
試想一個掌握了批判性思維的人,如果還能鉆研一點最新的科技,他怎么可能找不到好工作呢?
| 由此得到
表面上看畢業以后都改行了,但實際上學哲學的人的確靠著哲學氣質,學社會學的人的確靠著社會學修養,學國際關系的人的確運用了國際政治手段在做事。他們把軟技能和具體的公司業務結合在一起,都取得了成功。
但是話說回來,懷才畢竟不是懷孕,軟技能很難體現在大學成績單和簡歷上。那你怎么才能讓別人知道你有這些技能呢?咱們下次再說。