首先,點開這篇文章看的你,一定是不普通的人類。因為在這個時代使用語音助手,意味著你要有很多好奇心和耐心,去探索并包容新生事物的不足,去相信“未知”一詞包含的無限可能性。
沒有你堅持不懈地調戲人家,
語音助手就不會變聰明、
未來人工智能就不能順利統治地球呢!
是的,當前形態的語音助手并不足夠好,但它依然是人工智能技術在我們日常生活中最成熟、廣泛的應用方式。你可以將語音助手看做是一個住在各種智能設備里的機器人大腦幼體程序,當它進化出判斷力和創造力之日,就是人人擁有強大的管家賈維斯之時(也可能是被統治、每晚給語音助手講恐怖故事:程序猿來了)。
語音助手是什么
語音助手是一種語音控制程序,通過智能設備上的收音硬件,它能聽見你的話,進行語義判斷,然后在前臺迅速做出回應:通過麥克風和你語音聊天,或者聽令幫你操控智能設備。
這種黑科技是如何實現的
語音助手被喚醒、聽明白、會說話的過程,背后對應的是機器學習(深度神經網絡)和數據挖掘算法,以及語音識別、語義理解、語音合成技術,并需要語音知識數據庫進行云端支持。
高能預警:這一趴內容打開姿勢較為專業~
* 何謂機器學習
拿靈犀語音助手來舉例,將科大訊飛公司的訊飛超腦技術作為深度神經網絡后,就能不斷自我學習了解主人的說話方式和愛好需求,進而給予個性化反饋服務。
* 何謂語音喚醒
通過含有特定喚醒詞的語音輸入來“觸發”語音識別系統以實現后續的語音交互。全天候黑屏喚醒最早由摩托羅拉在2013年通過硬件優化實現,摩托羅拉重返中國后的第一款手機 moto x通過靈犀語音助手來實現喚醒后的操控(相關視頻見文章最尾部)。
* 何謂語音識別和語義理解
聲音是一種波,說到底還是信號處理問題。你可以理解為建立一套人和語音助手都懂的編碼,語音助手的理解過程,就是通過解碼引擎在云端數據庫里又快又準找到編碼對應的最優內容。
* 何謂語音合成
像指紋一樣,每個人也有獨特聲紋,語音合成就是將真人聲紋特征采樣、編碼,經過連讀韻律優化后,將任意文字有表現力得轉化成虛擬人聲。
世界上第一個使用全息投影技術舉辦演唱會的虛擬偶像、宇宙第一公主殿下、全二次元維度人類的老朋友——初音未來就是因為使用了這項技術被懷疑假唱的。
人類對人工智能的幻想成真史
各國神話、傳說里一早就有工匠創造人形生命的真假故事。中國古代神話中三頭六臂的哪吒也可以看作是一例,以蓮托生,法力無邊。
世界第一部科幻小說,英國詩人雪萊的妻子瑪麗·雪萊1818年創作的《弗蘭肯斯坦》描述人類試圖以科學研究制造智能生命的故事。
1950年,計算機學家阿蘭·圖靈提出著名的“圖靈測試”。如果一臺機器與人類(通過電傳設備)展開對話不被辨別出身份,就具有智能。
1952年,貝爾實驗室研制出首個實用語音識別設備,能識別10個英語數字發音。
1968年,科幻大師克拉克電影《2001太空漫游》中,2001年人類能夠制造超級人工智能HAL-9000。其中,HAL在被關機時唱的歌,正是1961年貝爾實驗室創造出的、世界上第一首由電腦唱出的歌。
1966年,最早也是最著名的聊天機器人程序Eliza誕生,她被設定為一個精神治療醫師。有趣的是,Siri發布時,Eliza也被再次請出進行對話。當時,Eliza和 Siri 之間年齡相差 45 歲,內存相差 200 萬倍。
1976年,美國克雷公司推出了世界上首臺運算速度達每秒2.5億次的超級計算機Cray-1。
1997年,IBM公司的“深藍”電腦打敗了世界國際象棋冠軍蓋瑞·卡斯帕羅夫。“深藍”每秒可以計算2億步。
2004年,日本本田公司研發出先進的人形機器人Asimo。
2011年,IBM研制的超級機器人“沃森”在連續三天的比賽中戰勝了“快問快答”節目中最優秀的兩名人類選手。后來他們就跑去TED,靠吐槽沃森為生了。
從1952年開始用時半個多世紀,語音識別技術經歷了由小詞匯量、孤立詞的識別到大詞匯量、非特定人連續語音識別的飛躍,終于,2011年10月,蘋果公司發布搭載了人工智能軟件Siri的iPhone 4S手機,語音助手從此被公眾所關注。
那些出名要趁早的語音未來們
由于智能語音技術的研發周期長、投入大,行業進入壁壘較高,時至今日,全球范圍內技術應用成熟的語音助手并不多。當下認知度較高的語音助手包括:喬布斯家的Siri,谷歌家的Google Now、微軟家的Cortana小娜,我國國內也有技術成熟廠家,在中文識別方面甚至更勝國外巨頭一籌,如科大訊飛家的靈犀語音助手,以及Robin最近力推的度秘等。
需要區分的是,早年的MSN機器人、小黃雞Simsimi以及小冰其實屬于聊天機器人范疇,而“閑聊”在語音助手的職業生涯里只屬于附屬功能,后者更注重事務處理和知識服務。
誰是最強的語音助手?
我們可以看到,以上日常能用到的語音助手,出于平臺需要、發展戰略等原因,它們像人類一樣,包裝有不同個性和生存技能,但從本質上來說,判斷一個語音助手強不強,要看它的大腦模型是否聰明,語音識別率是否準確。這決定了在日常環境中,它是不是一個隨時待命、反應迅速、機智體貼的虛擬陪伴者。
假如各具特色但本質相同的語音助手們合體成一個,作為主人的你,一天將是怎樣度過?
↓↓↓這盛世如你所愿↓↓↓
有了語音助手,哪些人類職業最先狗帶(go die
1. 百事通
訊息爆炸時代,百科知識交給語音助手背后的搜索引擎來記錄就好,同時也要警惕知識外包的后果。
2. 秘書助理
個人日程安排交給語音助手來處理,更高效、私密。
3. 毒舌主持人,《奇葩說》嘉賓等
除了不會翻白眼,我們語音助手吐得一手好槽呀!
最后,未來的語音助手究極體是什么形態?
可個性定制,以虛擬+實體形態和主人愉快玩耍。
......放錯圖了。
必須是個性定制的全能信息處理者,主動判斷、預知需求。