記得幾年前看過一部名為《her》的電影,講述在不遠的未來人與人工智能相愛的科幻愛情電影。主人公在一次偶然機會接觸到最新的人工智能系統(tǒng)OS1,它的化身薩曼莎擁有迷人的聲線,溫柔體貼而又幽默風趣。主人公通過耳機與虛擬的智能助理薩曼莎聊天,最終發(fā)展成為一段奇異愛情......
電影里的語音技術(shù)是如此美好,反觀現(xiàn)實世界基于菜單模式的語音交互則很原始,撥打移動聯(lián)通或銀行的客服電話,往往要聽一大堆的內(nèi)容,然后按鍵選擇,進入下一層,再聽一大堆內(nèi)容,再按鍵選擇……實在是浪費生命。什么時候才能改為問答式的語音互動,比如撥通電話后直接問您需要什么服務(wù),我說查剩余流量,就能直接告訴我結(jié)果呢。
這部影片上映于2013年,而最近幾年隨著人工智能及人機語音交互技術(shù)的快速發(fā)展,市場上已經(jīng)出現(xiàn)了基于自然語言交互的智能產(chǎn)品,比如亞馬遜的對話機器人Echo、Google Now。
在某些場景,相比于移動互聯(lián)網(wǎng)時代的觸摸交互方式,自然語音交互方式的使用體驗更好。
舉2個例子:
1、當你跑步時,你要給朋友打電話,需要掏出手機,點亮屏幕解鎖后進入電話應(yīng)用,然后再找到朋友的手機號碼撥打,總共需要六、七步才行。而未來你可以直接對智能耳機說你要給誰打電話,耳機就能給對方打電話,一步搞定。
2、當你在開車時,朋友給你發(fā)了一條語音微信,類似于上面的操作步驟大概需要四步才能聽到語音內(nèi)容,另外你在開車也不方便去伸手操作。而未來你可以直接對手機說“請打開微信自動播出最新一條語音”就可以了,也是一步搞定。
人天性懶惰,所以這種更方便的人機交互模式時代必然會來到,而這種交互模式的變革,也將重塑互聯(lián)網(wǎng)行業(yè)的產(chǎn)業(yè)鏈,帶來新的市場機遇。
在移動互聯(lián)網(wǎng)時代,用戶如果想要購物或使用各種在線生活服務(wù),需要在手機上安裝指定的APP,通過APP去操作。
而在自然語音交互時代,用戶使用服務(wù)的入口不在是手機APP而是提供語音識別+對話的引擎,所有的應(yīng)用服務(wù)商都要跟這個語音引擎對接,間接地為用戶提供服務(wù)。
如此一來,這個語音引擎就成為新一代的互聯(lián)網(wǎng)水電煤基礎(chǔ)設(shè)施,而這正是今天亞馬遜、Google等巨頭正在追求的事情。
由于我目前在做第三方支付產(chǎn)品,因此比較關(guān)注未來語音引擎對已有支付產(chǎn)品的影響。我覺得屆時傳統(tǒng)的支付產(chǎn)品將遭遇語音引擎的挑戰(zhàn),因為語音引擎掌握了用戶入口及各種服務(wù)資源,能夠促進交易的產(chǎn)生,而支付作為交易的下游,支付習慣很容易被改變。
這種情況已經(jīng)出現(xiàn),見下面這條微博,希望大家不要當條段子一笑而過。
現(xiàn)在的小孩看到什么屏幕都會去觸摸,而以后的小孩看到什么東西都會跟他對話,因為他覺得這跟自己爸爸媽媽溝通是一樣的,都可以用語音交互。
我的一位朋友,說自從給他兒子買了個360兒童機器人后(可以給孩子看審核過的動畫,講故事,學成語,視頻聊天,隨時隨地遠程看孩子),現(xiàn)在他兒子看見什么都會試著用語音指令了。
相信在不久的將來,自然語音交互模式一定會改變我們的生活方式,包括手機、穿戴式設(shè)備、智能家居、電器、玩具、汽車等等,當語音功能介入到上述產(chǎn)品里面,這個產(chǎn)品的性質(zhì)就會發(fā)生變化。當我們在使用一個工具的時候,我們從來沒有想過需要跟這個工具交流。 但是當工具可以像人一樣與我們進行交流,那么在我們內(nèi)心深處,就會認為它是一個有感情、有人格的東西。
未來,你跟你的耳機,也許真的可以談一場戀愛。