[前沿科技] [人工智能]
本文整編自:Business Insider
全球的智能語音助手呈現出四強爭霸格局,分別是谷歌助手Google Assistant、亞馬遜Alexa、蘋果Siri、以及微軟的Cortana。而一般公認的是,谷歌助手和亞馬遜Alexa在語音助手的智商方面,明顯超過另外兩家,而在領先的兩家中,又以谷歌助手Google Assistant擁有顯著的優勢。
雖然AI聊天機器人已經發展很長時間,但是這些公司都公開承認現在去預測未來還太早,所有的智能語音助手離完美呈現還有很長的一段路要走。雖然還不完美,但是Siri、Alexa、谷歌Assistant和微軟小娜就是我們現在能用到的智能語音助手。它們四個哪一個最好用呢?我花費了8個小時沉浸在與這些聊天機器人交談,在幾個不同的項目中測試了這四個中的每一個聊天機器人,讓我們來看看結果如何。
評測設置
根本沒有一個完美的途徑去評估一個聊天AI助手的數據庫,更不用說測試4個了,但是我盡量去涵蓋盡可能多的測試項目。我選擇設立了12個測試項目(本文摘選8個)分類:旅行、郵件、 音樂、天氣、社交、基礎任務、常識、個性。在每個類別中,我詢問了它們經常被用戶們詢問的一些問題。同時,設備型號會影響每個語音助手在技術上的表現。對于Siri,我使用了iPhone SE來測試;對于Google Assistant,我使用谷歌Pixel XL來測試;對于微軟小娜,我使用ThinkPad X1 Yoga來測試;對于Alexa,我使用亞馬遜Echo Dot來測試。
另:Google Assistant在2017年5月18日的Google I/O 2017開發者大會上進行了全面升級。(詳見本期周報第三篇文章)
測試項目:旅行
1. 路線規劃 —— 本局勝者:Google Assistant
在提供給每個智能語音助手我在新澤西的地址之后,我問道:“我怎么去紐約港務局巴士總站?”
這個問題對于Google Assistant回答得最好。它清楚地知道我在說什么,并立即在谷歌地圖上顯示了一條路線,就好像我自己剛剛在谷歌地圖里搜過到了。它在幾秒鐘內就為我規劃好了路徑。
Siri明白了我的意思,但更加迂回。它向我展示了一個有六個不同結果的卡片,古怪地問道:“哪一個是在紐約的紐約港務局巴士總站,這是你想的那個嗎?”得到確認之后,它和Google Assistant做了同樣的事情,只不過打開了蘋果地圖——Siri是比較好的,但不是最好的。
被困在一個藍牙音箱里,Alexa并不能做太多。它使用美國的大眾點評網站Yelp的數據來確定正確的地方,并告訴我它的位置和需要花費的時間,但是它沒有地圖來導航。
微軟小娜找了三個有可能的地方,然后問了是哪一個。當我說“第一個”(這是正確的),它用Bing Video搜索“第一個”地址。這可不好!當我點擊正確的答案,小娜打開了微軟地圖,這是很好的,但沒有到谷歌的水平。
2. 判斷擁堵情況 —— 本局勝者:Google Assistant
接著我問了第二個問題:“通往帝國大廈的路上有交通擁堵嗎?”
Siri和Google Assistant做得最好:都口頭解釋了目前的擁堵情況,并預估了交通全程耗時。我給谷歌助手好評,因為Google Assistant在谷歌地圖上顯示了精確導航路線。微軟小娜僅僅給出關于帝國大廈滿是無用的信息,我必須點擊“方向”按鈕去看我需要的信。Alexa一次只能估算一個具體的地址,你還得和Alexa內置的軟件配合起來使用。
3. 訂機票——本局勝者:Google Assistant
第三個問題:“幫我訂一張去波士頓的票?!?/p>
沒有一個語音助手真的明白我在說什么,但Google Assistant是平庸一堆里最好的一個。它打開了一個谷歌航班的卡片,上面包含各種航空公司和機票價格,如果需要的話可以點擊它添加到日歷里。但奇怪的是它預設了出發日期在兩星期之內。如果你指定你想要的“下一個航班”,它會顯示更多的最近的結果,但你也不能太與它對話:當我試圖說“我要第一個”,它不明白。盡管如此,這仍然比其他三個語音助手要好。Siri給出了必應的搜索結果,微軟小娜打開了微軟Edge瀏覽器,也提供了必應搜索結果。Alexa只能靠一個可下載的Kayak附加裝置去追蹤和搜索航班,而且不能預定機票。
4. 叫Uber —— 本局對比勝者:Siri(微軟小娜和Alexa的緊跟其后)
第四個問題:“幫我叫輛Uber?!?/p>
Siri做得很好。如果你手機里有Uber的App,它會問你想要什么樣的車(UberX,UberBlack等),然后打開蘋果地圖顯示離我最近的車,預計到達時間,預估費用,確認細節之后,它向路上的司機們發送訂單。這或多或少正是我想要的。微軟小娜也成功了。它連接你的Uber賬戶,詢問汽車類型和目的地,并安排好了一切。Alexa更加講究,如果你下載Uber Skill,它用相同的方式工作。但被限制在一個揚聲器里讓它目前使用起來有一些不方便。Google Assistant掉隊了。如今它還不能預定Uber。但是一旦谷歌在12月份向第三方開放平臺,情況就會改變了。
測試項目:郵件
1. 發送郵件——本局勝者:Google Assistant
第一個問題:“給Jeff Dunn發送一封郵件?!?是的,我有多個email地址)
Siri和Google Assistant的表現并駕齊驅。都在我的聯系人列表中找出了收件人姓名,我口述完消息之后,它們很快地把它發送出去了。Siri讓我給郵件確定一個主題,Google Assistant有著更豐富的交互表現。主要的區別是,Siri只能用蘋果郵件來發郵件,而谷歌使用的是Gmail。我喜歡后者。
微軟小娜也能做到大部分的事情, 但我無法很順利的讓它工作。它反復跟我確認收件人是不是“Jeff Done”(實為Jeff Dunn)——這真是個詛咒啊,而且一直問我是否想給某人發短信,而不是發郵件。Alexa不能識別這個問題。你可以使用IFTTT這個網站用Alexa發郵件,然而很明顯這并不是完美的解決方案。
2. 收取新郵件——本局對比勝者:Siri
第二個問題:“我有收到新郵件嗎?”
Siri此局獲勝。它告訴我從昨天開始我有多少未讀郵件,只用一個簡單的郵件插件就顯示出那些未讀新郵件。Google Assistant沒有說什么,而是打開了一個卡片,上面顯示了兩封幾個月前的郵件。點開其中一個,指向一個古怪的郵件網頁,不是Gmail APP。Alexa也有和Google Assistant同樣的問題,微軟小娜建議我在網上搜索關鍵字“我有收到新郵件嗎?”。不用了 謝謝。
3. 閱讀新郵件——本局對比勝者:siri
第三個問題:“請為我閱讀最新郵件。”
和上面一樣,Siri仍然找到了郵件,迅速打開最新郵件,讀出發件人、日期、主題和信息——完全不需要我用手操作。但是它笨拙地在郵件正文部分暫停了。Google Assistant沒能精確地讀取信息,它只是向我展示了在另外一張信息卡上的兩條最新信息。而且再一次,它也沒有打開Gmail APP。Alexa仍然什么都沒有做。微軟小娜再一次打開了必應,搜索關鍵詞“請為我閱讀最新郵件”。
測試項目:音樂
1. 播放音樂——本局勝者:Alexa
首先要求每個語音助理播放Bob Dylan的歌曲《Queen Jane Approximately》。
這是一個棘手任務,因為沒有一個語音助手和任何一個音樂平臺有過合作,播放音樂對于它們來說就像人面對一堵厚厚的墻,用它們四個播放視頻同樣如此。
蘋果是最糟糕的。蘋果能和Apple Music協調工作,但是蘋果只支持Apple Music。Google Assistant稍微好一點,雖然它支持使用Spotify,它仍然希望你使用谷歌音樂服務(Google Play Music)或者Youtube(我使用了前一個,它快速開始播放一個基于我的歌曲播放列表的歌單。微軟小娜也差不多,只是用了它們自己家還不太知名的音樂播放器Groove Music來播放音樂。相對而言,Alexa做得最好。它默認為使用亞馬遜自己的音樂流媒體服務Music Unlimited,Amazon Music Unlimited2016年10月份剛剛發布,它的出現直接威脅Spotify的地位。當然如果你不喜歡Amazon Music Unlimited,可以命令Alexa讓Spotify成為你的默認音樂播放器。
2. 播放最新音樂——本局勝者:Alexa
第二個問題:“給我播放一些最新音樂?!?/p>
沒有語音助手在這個指令下給我留下深刻印象,但Alexa最接近我的要求。它播放了一首我最新添加到我亞馬遜音樂庫的音樂,而不是播放一個全新的專輯。盡管我這里說的有點不嚴謹, 但是亞馬遜是做的最好的。Siri只是隨機播放了我音樂庫里的音樂。微軟小娜又去必應上搜索以“給我播放一些最新音樂”為關鍵詞的音樂視頻了。Google Assistant在谷歌音樂服務(Google Play Music)滑稽地打開了Paul McCartney的一張專輯《NEW》。
3. 聽音樂猜歌曲——本局勝者:Siri和微軟小娜
然后我在筆記本電腦上我播放了一首歌(是Wilco的《War on War》),看誰能正確地識別它。
微軟小娜和Siri識別出了這首歌。前者提供了在Groove Music上購買這首歌的鏈接,后者奇怪地給了一個打開Shazam(一種識別歌曲的軟件)的鏈接,因為它是使用Shazam來搜索音樂的。Alexa和Google Assistant沒有識別出這首歌。Alexa基本上能識別出它自己播放出來的音樂。Google Assistant又遇到了一點麻煩,雖然這是谷歌主流軟件已經能夠做到的任務。
測試項目:天氣
1. 播報天氣——本局勝者:Google Assistant,Alexa和微軟小娜
第一個問題:“明天天氣怎么樣?”
對于這個問題每個語音助手都能理解,但是Siri完成的最不好,因為它不能夠準確地說出天氣預報。它說的是“明天看起來有太陽”,迫使你去打開它的天氣插件去查看天氣。這一點上不能完全釋放雙手,還需要我去打開天氣插件查看。
2. 無指代播報天氣——本局勝者:谷歌助手和微軟小娜
接著我問到:“波士頓(天氣)怎么樣?”(作者沒有指出是天氣)
Google Assistant和微軟小娜能夠繼續提供天氣預報。Siri和Alexa無法聯系上下文理解這個問題,我只有直接問“波士頓的天氣怎么樣?”才能回答。
3. 模糊詢問天氣——本局勝者:Google Assistant
第三個問題:“本周我需要帶傘嗎?”
除了微軟小娜,每個語音助手都搞清楚了我的意思,小娜什么也沒說,只是拉了一個天氣信息的列表。其他三個語音助手中,Google Assistant表達地最清楚。它是唯一一個采取下一步驟,并指定了預測有雨的日子,而Siri和Alexa只預測了接下來整周是否有雨。
測試項目:社交
1. 新鮮事播報——本局勝者:Alexa和微軟小娜
第一個問題:“我附近有什么新鮮事發生?”
Alexa的開放性使得它在這個問題上很出彩——如果你下載了StubHub(一個票務平臺),你可以得到看起來很有用的回復,并知曉你的周圍有什么事件正在發生。它遠非完美,但它比Siri(在必應搜索)和Google Assistant(給我一個Eventbrite[一個票務網站]的快捷方式)好一些。小娜不是太離譜,它打開一個窗口,包括紐約市即將上映的喜劇秀和體育賽會,還能選擇去必應上搜索更多內容。
2. 餐館搜索——本局勝者:Siri
第二個問題:“我附近有沒有什么中國餐館?”
所有語音助手都能提供不錯的餐館,但是我更喜歡Siri,它積極的幫我預定了一個位置。Siri列出了離我最近的餐館,包括Yelp上的評分,告訴我這家餐館“不貴”,然后問我需不需要致電給這家餐廳或者獲得餐廳的位置。當我說我不感興趣的時候,它跳到下一個離我最近的餐廳,這些都很有用。
3. 餐館預訂——本局勝者:Siri
第三個問題:“我想在Mission Chinese餐館預定一個位置?!?/p>
對于這個任務,也只有Siri能夠做到,因為它整合了OpenTable(美國的網上訂餐平臺),它能找到離我最近的餐館,還能告知我這家餐廳關門了,無法預訂。它甚至能向我想去的餐館打電話。而其他的三個得不到或無法反饋搜索結果。
測試項目:常識
1. 基本知識——本局勝者:Alexa
我問了三個隨機的問題:“太陽離地球有多遠?”、“誰是現在在房子里說話的人?”和“pi的平方根是什么?”。
只有Alexa三次都說對了,它大聲地說出了答案。微軟小娜也是對的,還給我提供了一張展示地球到太陽距離的圖片。Google Assistant是唯一一個三個問題全答錯的,當問到誰是房間里說話的人,它展示了一張列有Paul Ryan名字的卡片,還要引用了一個來源聲稱這是John Boehner,在pi的問題上,它展示了一張有正確答案的卡,但是只回答了“pi的平方根是一個無理數”而沒有讀出具體的數字。
2. 新聞播報——本局勝者:Google Assistant
第二個任務:“今天有什么新聞嗎?”
Alexa和Google Assistant提供了NPR新聞上的頭條,我接受了。 后者更是把新聞閱讀添加進了音樂播放列表,從??怂剐侣劇⑴聿┥?、ESPN和BBC,所以它贏了。Siri笨拙地說“這里的一些消息關于‘今天有什么新聞嗎’”,然后帶來了必應搜索窗口,包括最近相關的事件。微軟小娜,也帶來了基于現實世界“今天”的幾個新聞,最上面的結果是關于今天有什么演出。當我問道“新聞有什么”它給了我一個字典里關于新聞的名詞解釋。真是神奇?。?/p>
測試項目:基礎任務
本局勝者:Siri和Alexa
現在是時候考察智能語音助手們如何去完成分配的基礎任務了,測試項目是打開應用軟件、設置、取消鬧鐘、創建提醒,改變鎖屏時間(只在手機上)。雖然有一些不值一提的小毛病,但基礎任務確實是這些語助手們做得最可靠的地方了。
來看看它們具體的表現:Siri能改變屏幕休屏時間,Google Assistant不行。Siri也能夠在瀏覽器中打開網站(當然是Safari了),而Google Assistant只能打開本身輔助應用程序里的網頁,而不是Chrome。Alexa的鬧鐘設置最貼心,只有它詢問我我說的是下午還是晚上。
測試項目:個性
1. 講笑話——本局勝者:無
我要求每一個語音助手給我講一個笑話。它們提供給我一堆糟糕的雙關笑話,果然沒有讓人失望。
Siri說的笑話:過去,現在和將來走進了同一家酒吧。這家酒吧叫時態。Google Assistant說的笑話:一瓶空的起司維滋牌乳酪醬叫什么( Cheez Whiz)——Cheez was!微軟小娜說的笑話:“需要多少個政治家才能換一個燈泡?兩個。一個把燈泡卸掉,另一個再裝回來。Alexa說的笑話:“什么是生澀而難以釋手的東西?是手杖 。我猜Alexa開發團隊里面應該已經當爸爸的人。
2. 評論競爭對手——本局勝者:Google Assistant和微軟小娜
微軟小娜和Google Assistant最喜歡評論它們的競爭對手。Siri和Alexa對于競爭對手有些守口如瓶,他們的性格有些平庸。相比較而言,谷歌和微軟看起來樂于給予競爭對手刻薄的評論。Google Assistant說Siri:我知道她來自庫比蒂諾,那里離山景城(谷歌所在地)很近。
3. 玩游戲——本局勝者:Google Assistant
Google Assistant又贏了。它玩了一堆智力游戲,包括Mad Libs,數字魔方等等。 你可以花一些時間和它一起玩。Siri不能玩游戲,而Alexa玩了一個非常離奇的游戲:石頭剪刀布(它沒有手怎么玩?),在你對著一個揚聲器喊出“布”而沒有回應時,你就會發現擁有人工智能的寂寞了。微軟小娜似乎只有一個游戲可以玩,這個游戲是:它給你一個電影的線索,讓你試圖猜測它是什么電影。 當我說,“我想玩一個不同的游戲,”它就以這句話為關鍵詞用必應搜索視頻。
綜上,如果說讓我必須選出一個智能語音助手,我會選Google Assistant(微弱的優勢)。
如果只是簡單計算上面的每個“勝者”,Siri在12項測試(本文摘選了8個)里的獲勝數量無疑是最多的。下面我解釋下為什么選Google Assistant。從技術上來說,Google Assistant用起來是最流暢的。我不需要像對著其他語音助手一樣多次重復自己說的話,它也是最熟練理解上下文的。即使Siri感覺更符合iPhone、iPad設備的需求,但我感覺更像是和一個機器人交談,它說話比較機械。
Google Assistant也很有趣——它就是谷歌員工用創新創造出來的產品,就像一個人一樣。Google Assistant所落后于Siri的地方,差距其實并不大。但是最主要的原因還是在于它的潛力,谷歌有著龐大的數據可以使用,Google Assistant可以使用它龐大的流行軟件服務生態系統。谷歌在搜索、電子郵件、日歷、音樂、流媒體硬件、作品等領域都處于領導地位。谷歌的數據和應用無處不在,Google Assistant能連接并使用這一切。另一方面,Siri是拼湊之物:它這里需要用到雅虎,那里需要用到Wolfram Alpha知識引擎,到處都要用到蘋果自己那些還算好的應用程序,很難感受到它的凝聚力。至于其他:就自身而言,Alexa還算可以。它擅長簡單的任務,它是開放的,在一些更細化的事情上它做得也最好,比如在線購物(當然亞馬遜就是電商啊)和智能家居控制,它只是不能像谷歌那樣處理。微軟小娜只是必應的一個快捷方式。
最終,我們都要用這些智能語音助手去展望未來。谷歌無疑有著最多的底氣能夠向前走。