為何機器講話的聲音難以動聽?但做到了卻又令人恐怖

機器之心Synced


你也許看過IBM Watson在2009年智力競賽節目Jeopardy!上的精彩表現,又或者瞥過一眼該科技公司讓Watson和網球女將Serena Williams,經濟學家Richard Thaler,和搖滾音樂人Bob Dylan對話的最新廣告。

即使沒有,你也應該在某個時間段和會說話的計算機接觸過。但是,創造一個能交談并且有說服力的電腦真的很難。在紐約時 報周一的報道中,專欄作家John Markoff就討論了創造IBM Watson語音功能背后的心血,并探討了創造更加自然、可令人接受的電腦語音的不易。

語音功能是人機交互的迷人挑戰之一:當涉及到聲音通訊,社交和情感線索是非常重要的。如果類似Apple Siri和Amazon Alexa的助手軟件的聲音不自然,溝通將會很不愉快。假設類似的系統不能夠識別用戶的語調并相應地適度調節自己的聲音,那結果也會很令人煩惱。用戶在無 奈中反復問同一個問題,感覺就像被不斷生產相同回復的人工聲音侮辱了智商。

自Siri問世以來,筆者就撰文寫過在創造可以娛樂用戶的產品同時,應該避免惹怒他們的重要性。事實上,把人工智能融 入到現有社會結構的需求,解釋了為什么我們覺得有必要給機器人分配類似性別的特征。也許這甚至可以解釋為什么Apple最近收購了Emotient,一家 專注于理解和應對人類情感的公司。

同樣有趣的是擁有一個真正引人入勝的情感功能強大的計算機,像導演Spike Jonze在電影《她》中刻畫的那樣。不過,就連它也很難解碼并且模仿人類溝通的細微之處。正如IBM Watson多式聯運實驗室的高級經理Michael PichEny對紐約時報說的那樣:「一個好電腦的界面是一件藝術品,并應該被視為藝術品來對待。」

隨著機器學習和運用人工智能的傳播,技術人員正面臨著人工智能變得太過真實的問題——近乎毛骨悚然的實感。

其中一個突出的領域是科技驅動的語音技術,紐約時代專欄作家John Markoff寫道。當類似Apple的Siri,Amazon的Alexa的聲控助理被安裝進像iPhone和Amazon Echo的設備,軟件設計師開始注意語言和如何跨越讓令擬人技術有毛骨悚然感覺的「恐怖谷」(uncanny valley)。 該理論的假設指出,由于機器人與人類在外表、動作上相似,所以人類亦會對機器人產生正面的情感;直到一個特定的程度,他們的反應便會突然變得極其負面。哪 怕機器人與人類只有一點點的差別,都會顯得非常顯眼刺目,使整個機器人顯得非常僵硬可怖,使人有面對行尸走肉的感覺。可是,當機器人和人類的相似程度繼續 上升,相當于普通人之間的相似度的時候,人類對他們的情感會再度回到正面,產生人類與人類之間的移情作用。

「恐怖谷理論」(uncanny valley)在1970年由日本機器人專家森政弘提出。隨著機器學習創業公司的萌芽和類似Google和Facebook的巨型科技公司涉水人工智能領域,「恐怖谷理論」變成了一個越來越困擾技術人員的現象。它可以催生我們對人工智能的恐懼,導演Thomas Gibbon甚至在2014年指導過同名舞臺劇。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 對于人工智能來說,前60年的人工智能歷程,可以用“無窮動”來形容;后60年的人工智能發展,可以用“無窮大”來期許。...
    補習club閱讀 5,111評論 1 73
  • 注:轉載請注明出處 本報告通過對Siri的分析,了解和學習人工智能助手在現有市場的應用情況,為制作機器人產品提供一...
    Sunflower的夏天閱讀 5,864評論 1 6
  • 姓名:于川皓 學號:16140210089 轉載自:https://www.zhihu.com/question/...
    道無涯_cc76閱讀 1,225評論 0 2
  • 年初有關Alphago的圍棋人機大戰著實引起民眾不小的關注。正好機緣巧合在圖書館遇到《智能爆炸》這樣一本應景的好書...
    5008de82a597閱讀 4,900評論 3 23
  • 我畢業了,漫漫讀書十幾載,不知道要怎么去習慣已經不再是學生,我畢業了,覺得好不舍,不知道社會會把我渲染成什么樣子,...
    limpid戀空閱讀 152評論 0 0