PM淺談聊天機器人

chatbot的原理是什么?

人機對話通常是靠背后的數據庫 & 文本檢索支撐,然而數據庫覆蓋不到海量人類對話怎么辦?還有幾個解決思路:

- 語言模型,可以把它看作各種語言規則的疊加,能夠覆蓋大約20%的問題,但準確度很差。

- 生成式對話,模仿翻譯模型進行的逐字映射,在用于訓練的樣本集內生成效果很好,樣本集外準確度不高。

- 萬金油回復,走完所有流程依然得不到一個好的回復,就拋出萬能隨機語。這種情況下的準確度往往比前兩者還高出些許。

檢索部分利用的是相似度算法,顧名思義,相似度即是比對輸入的一句話與庫中現存文本的相似程度,并取出答案;實現相似度計算,又需要借助切詞、句法分析、實體抽取等等。

那么輸入和輸出之間疊加了如此多復雜的環節,是不是意味著我們就可以得到一個體驗比較好的chatbot了?

答案是NO。

在深度學習技術廣泛運用于視覺領域、聲音領域的今天,文本處理依然存在著難以逾越的技術鴻溝;在處理龐雜的非結構化文本上,機器學習帶來的提升往往不如人工編輯答案來的直接。

而前期對文本數據進行預處理的環節也帶來了巨大損耗,包括文本的清洗、抽取等,更何況現在用戶數據保密性越來越受到重視,獲取高質量的自然對話數據由技術問題轉變成了商務合作問題。

這說明什么?

以目前的技術水平,實現chatbot還是要借助自然對話的語料積累。一個以chatbot作為核心技術創業的公司,必須深諳市場與產品化的哲學,否則很快就會喪失生存空間。

而SNS類公司具備文本積累的天然優勢,例如新浪微博。機器學習算法又不存在門檻。聊天機器人 —— 披著光鮮的AI外衣,實際上做的大部分是臟活累活,雖然可以形成有效的迭代周期,但無法短平快地進行產品定位調整。

短板必須依托技術躍遷才有可能帶來突破。能做出卓越貢獻的通常是MIT,GOOGLE這類研發實力雄厚的機構或公司,能力集成公司只有默默地等待開源代碼。

沒有一點好消息嗎?

這些年來市場對chatbot產品依然保持著旺盛的需求,一個會摔倒會賣蠢的虛擬貓就輕易讓用戶投入上千句對話,那么加入其它能力(功能、問答,甚至人臉識別、語音合成等)之后呢,用戶黏性會提升嗎?

可以,但效果不明顯。而且前提是你的機器人對白顯得沒有那么無聊。打個比方,一個“不無聊”的示例:

用戶:你好

BOT:找我干嘛?

一個“無聊”的示例:

用戶:你好

BOT:你也好

想讓用戶無休止地和機器人聊下去,單純保證準確度是不夠的。這其中包含兩個要素:

準確度是底線。不能總是答非所問,這取決于數據庫的數量與QA關聯度;

有趣的對白。人工編輯答案聊起來反而缺乏激情,即使它準確度足夠高。自然產生的對話往往那么不經意,試想正在撩妹的你和正在撩機器人的你,你會對哪個更上心,你會對一個機器人刻意幽默嗎?

就算一定程度上解決了上述這兩個難題,chatbot還存在一個致命缺陷:

前言不搭后語,邏輯不通 —— 沒有上下文。一個典型的例子:

用戶:你在干嘛?

BOT:我在陪女朋友逛街

用戶:你有女朋友?

BOT:怎么可能,我是女的

對于一些邏輯嚴密的用戶,遇到這種對話會直接放棄。好在我們的用戶并不都是這樣的,如果他們愿意,還是會嘗試順著對話繼續往下聊。

有時候,聰明的PM們也會故意制造問題,讓用戶贏得心理優勢,從而提升CPS —— 平均交互輪次:比如故意輸掉成語接龍、用戶輸入講笑話的指令時,故意不講等等,這些小心機也會起到一些效果,但都無法解決根本問題。

此外,分類問題也很棘手。當用戶輸入一個query時,他到底是想要閑聊呢,還是在認真地提問?機器人很難通過分類將“你爸爸是做什么工作的?”正確地歸類到聊天,而不是知識性問答。我們所指的知識性問答,通常是“人為什么會呼吸”、“天為什么是藍的”這類具有普遍正確性的問題。

看起來,chatbot的未來似乎很渺茫

2015年是人工智能的一次浪潮,站在2017年年初的時間點上來看,浪潮正在衰退。在通用域進行淺嘗輒止后隨之放棄,轉作垂直場景的,如智能家居、車載系統的大有人在。而siri、echo這類產品憑借出色的燒錢能力,即使短期內無法商業化,也可以依托強大的平臺迭代下去。

創業公司用一整年的時間調整策略,摸索的結果是又回到了解決方案提供商的角色。這個意識來得有點晚 —— 市場需求才是決定產品形態的最終導向,而不是愿景。

現實是,chatbot若想獨立產品化,面對的風險非常高。

雖然市場存在大量這樣的需求:無論是實體機器人生產商還是創建了虛擬角色的公司,都想嘗試賦予機器人一枚真正的“靈魂”。實際上讓機器顯得富有“生命力”可以不單靠言語交流來體現,還有故意摔倒、跟著音樂揮舞手臂、搖頭晃腦等等,但讓機器人開口說話依然是最強烈的訴求(商家們多么想迎合大眾對于科幻的期待)。

產品化的思路

chatbot作為一種人機交互方式,圍繞著其他品類的產品運作了起來。收集對話數據、挖掘用戶需求,逐漸形成支撐產品體驗的各種要素 —— 甚至一個好的IP形象,都會讓用戶多花幾倍時間在與虛擬機器人閑聊上。

微軟小冰很早就這么做了:通過塑造蠻不講理的少女形象,以及宣傳中的情感慰藉能力,籠絡了大批閑聊用戶。

但是問題來了,小冰是有套路的,用戶很快會熟悉她的對話套路,然后離開。

為了留住用戶,同時(還是)為了收集數據,小冰從14年起就開始保持每周迭代兩個功能的頻率,支撐至今。在支持中小開發者、微信運營者的層面,小冰的服務也盡量地貼心:可以分析微信公眾號的文章,做到“智能推薦”(盡管顯得還不是非常智能)、識別朋友圈截圖從而輔助官方賬號運營等等...

圍繞chatbot核心,小冰團隊利用一些現有的、成熟的AI能力,來體現少女小冰的“智能”,看起來似乎卓有成效,但是小冰也沒擺脫那個缺陷:“套路”不是人為加上去的,而是天然存在的 —— 數據庫永遠覆蓋不到人類的全部對話,在40%的最常見的聊天內容背后,是無窮無盡的長尾問題...

在認清這個基本現狀后,小冰團隊也不再強調“IQ”的重要性,轉而頻繁提及“EQ”了。說是揚長避短,倒更像是應對技術天花板的營銷手段。

GOOGLE的做法則是做一款社交軟件,把chatbot“嵌入”進去。用戶在與人交流的間隙,ELLO就會打岔進來,或者依據用戶發給對方的照片推薦相關回復,如評論一朵花、一個旅游目的地等。再解決一些叫外賣、查天氣的基本服務,一個具備完整閉環的AI對話產品也就這樣被塑造出來了。

新意總是層出不窮的,但像alphago那樣叫座容易,像“正經”產品那樣獲利就難了。

結語

一個會開口講話、看似能理解你意思的機器人也遠沒有想象中那么神秘。問題就在于規劃宏偉藍圖和迎合市場打造“爆品”之間,似乎總存在一些難以調和。創業公司如何應對,全看其背后的價值觀了。

至少,對于人機對話領域的產品經理而言,也許跟一群像模像樣的geek共事才是最大的收獲:)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,406評論 6 538
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,034評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,413評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,449評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,165評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,559評論 1 325
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,606評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,781評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,327評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,084評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,278評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,849評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,495評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,927評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,172評論 1 291
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,010評論 3 396
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,241評論 2 375

推薦閱讀更多精彩內容