chatbot的原理是什么?
人機對話通常是靠背后的數據庫 & 文本檢索支撐,然而數據庫覆蓋不到海量人類對話怎么辦?還有幾個解決思路:
- 語言模型,可以把它看作各種語言規則的疊加,能夠覆蓋大約20%的問題,但準確度很差。
- 生成式對話,模仿翻譯模型進行的逐字映射,在用于訓練的樣本集內生成效果很好,樣本集外準確度不高。
- 萬金油回復,走完所有流程依然得不到一個好的回復,就拋出萬能隨機語。這種情況下的準確度往往比前兩者還高出些許。
檢索部分利用的是相似度算法,顧名思義,相似度即是比對輸入的一句話與庫中現存文本的相似程度,并取出答案;實現相似度計算,又需要借助切詞、句法分析、實體抽取等等。
那么輸入和輸出之間疊加了如此多復雜的環節,是不是意味著我們就可以得到一個體驗比較好的chatbot了?
答案是NO。
在深度學習技術廣泛運用于視覺領域、聲音領域的今天,文本處理依然存在著難以逾越的技術鴻溝;在處理龐雜的非結構化文本上,機器學習帶來的提升往往不如人工編輯答案來的直接。
而前期對文本數據進行預處理的環節也帶來了巨大損耗,包括文本的清洗、抽取等,更何況現在用戶數據保密性越來越受到重視,獲取高質量的自然對話數據由技術問題轉變成了商務合作問題。
這說明什么?
以目前的技術水平,實現chatbot還是要借助自然對話的語料積累。一個以chatbot作為核心技術創業的公司,必須深諳市場與產品化的哲學,否則很快就會喪失生存空間。
而SNS類公司具備文本積累的天然優勢,例如新浪微博。機器學習算法又不存在門檻。聊天機器人 —— 披著光鮮的AI外衣,實際上做的大部分是臟活累活,雖然可以形成有效的迭代周期,但無法短平快地進行產品定位調整。
短板必須依托技術躍遷才有可能帶來突破。能做出卓越貢獻的通常是MIT,GOOGLE這類研發實力雄厚的機構或公司,能力集成公司只有默默地等待開源代碼。
沒有一點好消息嗎?
這些年來市場對chatbot產品依然保持著旺盛的需求,一個會摔倒會賣蠢的虛擬貓就輕易讓用戶投入上千句對話,那么加入其它能力(功能、問答,甚至人臉識別、語音合成等)之后呢,用戶黏性會提升嗎?
可以,但效果不明顯。而且前提是你的機器人對白顯得沒有那么無聊。打個比方,一個“不無聊”的示例:
用戶:你好
BOT:找我干嘛?
一個“無聊”的示例:
用戶:你好
BOT:你也好
想讓用戶無休止地和機器人聊下去,單純保證準確度是不夠的。這其中包含兩個要素:
準確度是底線。不能總是答非所問,這取決于數據庫的數量與QA關聯度;
有趣的對白。人工編輯答案聊起來反而缺乏激情,即使它準確度足夠高。自然產生的對話往往那么不經意,試想正在撩妹的你和正在撩機器人的你,你會對哪個更上心,你會對一個機器人刻意幽默嗎?
就算一定程度上解決了上述這兩個難題,chatbot還存在一個致命缺陷:
前言不搭后語,邏輯不通 —— 沒有上下文。一個典型的例子:
用戶:你在干嘛?
BOT:我在陪女朋友逛街
用戶:你有女朋友?
BOT:怎么可能,我是女的
對于一些邏輯嚴密的用戶,遇到這種對話會直接放棄。好在我們的用戶并不都是這樣的,如果他們愿意,還是會嘗試順著對話繼續往下聊。
有時候,聰明的PM們也會故意制造問題,讓用戶贏得心理優勢,從而提升CPS —— 平均交互輪次:比如故意輸掉成語接龍、用戶輸入講笑話的指令時,故意不講等等,這些小心機也會起到一些效果,但都無法解決根本問題。
此外,分類問題也很棘手。當用戶輸入一個query時,他到底是想要閑聊呢,還是在認真地提問?機器人很難通過分類將“你爸爸是做什么工作的?”正確地歸類到聊天,而不是知識性問答。我們所指的知識性問答,通常是“人為什么會呼吸”、“天為什么是藍的”這類具有普遍正確性的問題。
看起來,chatbot的未來似乎很渺茫
2015年是人工智能的一次浪潮,站在2017年年初的時間點上來看,浪潮正在衰退。在通用域進行淺嘗輒止后隨之放棄,轉作垂直場景的,如智能家居、車載系統的大有人在。而siri、echo這類產品憑借出色的燒錢能力,即使短期內無法商業化,也可以依托強大的平臺迭代下去。
創業公司用一整年的時間調整策略,摸索的結果是又回到了解決方案提供商的角色。這個意識來得有點晚 —— 市場需求才是決定產品形態的最終導向,而不是愿景。
現實是,chatbot若想獨立產品化,面對的風險非常高。
雖然市場存在大量這樣的需求:無論是實體機器人生產商還是創建了虛擬角色的公司,都想嘗試賦予機器人一枚真正的“靈魂”。實際上讓機器顯得富有“生命力”可以不單靠言語交流來體現,還有故意摔倒、跟著音樂揮舞手臂、搖頭晃腦等等,但讓機器人開口說話依然是最強烈的訴求(商家們多么想迎合大眾對于科幻的期待)。
產品化的思路
chatbot作為一種人機交互方式,圍繞著其他品類的產品運作了起來。收集對話數據、挖掘用戶需求,逐漸形成支撐產品體驗的各種要素 —— 甚至一個好的IP形象,都會讓用戶多花幾倍時間在與虛擬機器人閑聊上。
微軟小冰很早就這么做了:通過塑造蠻不講理的少女形象,以及宣傳中的情感慰藉能力,籠絡了大批閑聊用戶。
但是問題來了,小冰是有套路的,用戶很快會熟悉她的對話套路,然后離開。
為了留住用戶,同時(還是)為了收集數據,小冰從14年起就開始保持每周迭代兩個功能的頻率,支撐至今。在支持中小開發者、微信運營者的層面,小冰的服務也盡量地貼心:可以分析微信公眾號的文章,做到“智能推薦”(盡管顯得還不是非常智能)、識別朋友圈截圖從而輔助官方賬號運營等等...
圍繞chatbot核心,小冰團隊利用一些現有的、成熟的AI能力,來體現少女小冰的“智能”,看起來似乎卓有成效,但是小冰也沒擺脫那個缺陷:“套路”不是人為加上去的,而是天然存在的 —— 數據庫永遠覆蓋不到人類的全部對話,在40%的最常見的聊天內容背后,是無窮無盡的長尾問題...
在認清這個基本現狀后,小冰團隊也不再強調“IQ”的重要性,轉而頻繁提及“EQ”了。說是揚長避短,倒更像是應對技術天花板的營銷手段。
GOOGLE的做法則是做一款社交軟件,把chatbot“嵌入”進去。用戶在與人交流的間隙,ELLO就會打岔進來,或者依據用戶發給對方的照片推薦相關回復,如評論一朵花、一個旅游目的地等。再解決一些叫外賣、查天氣的基本服務,一個具備完整閉環的AI對話產品也就這樣被塑造出來了。
新意總是層出不窮的,但像alphago那樣叫座容易,像“正經”產品那樣獲利就難了。
結語
一個會開口講話、看似能理解你意思的機器人也遠沒有想象中那么神秘。問題就在于規劃宏偉藍圖和迎合市場打造“爆品”之間,似乎總存在一些難以調和。創業公司如何應對,全看其背后的價值觀了。
至少,對于人機對話領域的產品經理而言,也許跟一群像模像樣的geek共事才是最大的收獲:)