淺談人工智能產(chǎn)品設(shè)計——情感分析

姓名? :? 李小娜

轉(zhuǎn)載至 :

http://www.lxweimin.com/p/39500574fdd4

[嵌牛導(dǎo)讀] :

? ? ? 情感分析是自然語言處理中的一項技術(shù),也是文本挖掘中常用的方法。在產(chǎn)品中應(yīng)用情感分析技術(shù)也不少見,例如新浪的輿情大數(shù)據(jù)平臺運用情感分析對全網(wǎng)數(shù)據(jù)進行挖掘。另外在一些電商產(chǎn)品中,也會運用情感分析來進行商品評論挖掘,作為推薦系統(tǒng)的一部分。本文主要結(jié)合情感分析技術(shù)的應(yīng)用談?wù)勅斯ぶ悄墚a(chǎn)品的設(shè)計。

[嵌牛鼻子] : 人工智能產(chǎn)品設(shè)計? 互聯(lián)網(wǎng)產(chǎn)品設(shè)計? 情感分析產(chǎn)品設(shè)計

[嵌牛提問] : 人工智能產(chǎn)品的設(shè)計主要關(guān)注哪些?

[嵌牛正文] :

一、人工智能產(chǎn)品設(shè)計與互聯(lián)網(wǎng)產(chǎn)品設(shè)計的區(qū)別


人工智能產(chǎn)品的定義較為廣泛,智能硬件、機器人、芯片、語音助手等都可以叫做人工智能產(chǎn)品。本文討論的人工智能產(chǎn)品主要是指在互聯(lián)網(wǎng)產(chǎn)品中運用人工智能技術(shù)。

1、從用戶需求的角度看:

互聯(lián)網(wǎng)產(chǎn)品主要著手與解決用戶的痛點,對于C端產(chǎn)品來說,痛點就是指的個人想解決而無法解決的問題,如個人想要美化自己的照片,但是他不會復(fù)雜的PS軟件,于是美圖秀秀就可以解決這個痛點。從KANO模型中,就是滿足用戶的基本需求與期望需求。

人工智能產(chǎn)品(在互聯(lián)網(wǎng)產(chǎn)品中運用人工智能技術(shù))則是要滿足用戶的興奮需求。如將情感分析運用到電商的產(chǎn)品評論中,用戶則可以通過可視化的數(shù)據(jù)展示來大致對產(chǎn)品有個全面、直觀的了解,而不再需要自己一頁一頁的翻看評論內(nèi)容。



2、產(chǎn)品設(shè)計角度看:

互聯(lián)網(wǎng)產(chǎn)品主要關(guān)注點在于用戶需求、流程設(shè)計、交互設(shè)計、商業(yè)模式等。著眼于用戶需求,設(shè)計滿足用戶需求的產(chǎn)品,通過合理的流程設(shè)計、交互設(shè)計達到產(chǎn)品目標,進而實現(xiàn)商業(yè)目標。典型的思路是發(fā)現(xiàn)用戶需求——>設(shè)計滿足用戶需求的產(chǎn)品——>迭代完善、產(chǎn)品運營——>商業(yè)變現(xiàn)。

人工智能產(chǎn)品關(guān)注點在于模型的構(gòu)建,它不再是對于布局、交互的推敲,而是通過選擇合適的數(shù)據(jù),構(gòu)建合適的模型,最終呈現(xiàn)出來的是好的效果。什么是好的效果呢?這就需要引入評測指標。互聯(lián)網(wǎng)的評測指標有我們熟知的留存率、轉(zhuǎn)化率、日活躍等,那么人工智能的產(chǎn)品主要是通過一些統(tǒng)計指標來描述,以情感分析為例,把情感分析看成一個分類問題,則可以使用P、R、A、F值來描述。

1)查準率(Precision):P值,衡量某類分類中識別正確的比例,如情感分析中,有10條被分類為“正向”,其中8條是分類正確的(由人工審核),那么P=8/10=80%

2)查全率(Recall):R值,又叫查全率,又叫召回度,指的是某類被被正確分類的比例,同樣以情感分析為例,100條數(shù)據(jù)中有10條是正向的,機器分類后,這10條中有7條被分類為正向,則R=7/10=70%.

3)F值,因為P值和R值通常是兩個相互矛盾的指標,即一個越高另一個越低,F(xiàn)則是兩者綜合考慮的指標,不考慮調(diào)節(jié)P、R權(quán)重的情況下,F(xiàn)=2PR/(P+R)

4)精確度(Accuracy):這個最好理解,就是被準確分類的比例,也就是正確率。如100條數(shù)據(jù),90條是被正確分類的,則A=90/100=90%。

以上指標越高,說明模型效果越好。

二、情感分析產(chǎn)品設(shè)計

我們從上面內(nèi)容可以知道,人工智能產(chǎn)品設(shè)計關(guān)注:數(shù)據(jù)——>模型——>效果評估。

現(xiàn)在我們以情感分析為例子說明產(chǎn)品設(shè)計的過程。

1)數(shù)據(jù):

數(shù)據(jù)的選擇對最終模型的結(jié)果有直接影響,情感分析,根據(jù)不同的目的,選擇的數(shù)據(jù)也不同。如將情感分析運用于電影票房預(yù)測,則一些更新及時、內(nèi)容豐富的數(shù)據(jù)源,如微博,是比較好的選擇。如果是應(yīng)用于商品的評價,如電子產(chǎn)品,很多評測內(nèi)容是無法在短短幾句話內(nèi)描述清楚的,這時候微博不是個好的選擇,選擇論壇上更新較慢、但是詳細的內(nèi)容就比較適合。

如果能在產(chǎn)品的早期就有引入人工智能的打算,則可以在產(chǎn)品中事先做好數(shù)據(jù)采集。

2)模型:

在選擇模型中,產(chǎn)品需要了解不同的模型的優(yōu)缺點,進而選擇更加合適的模型。在情感分析中,NB、SVM、N-gram都是常用的模型,其中SVM效果最好(這是已有的結(jié)論),如果是其他的智能產(chǎn)品,可能需要算法團隊進行實驗,給出測試數(shù)據(jù),進而選擇合適的模型。

3)效果評估:

效果評估在上文中已經(jīng)描述得比較清楚,具體指標不再贅述。

4)產(chǎn)品呈現(xiàn):

最后這一步,是將結(jié)果展示給用戶。在情感分析中,我們可以選擇雷達圖、詞云、情感趨勢圖來展示結(jié)果。取決于產(chǎn)品屬性,如電商產(chǎn)品評論挖掘,可以使用詞云;




如輿論分析,可以使用情感趨勢圖。




三、總結(jié)

人工智能產(chǎn)品的設(shè)計要關(guān)注:數(shù)據(jù)、模型、評判、呈現(xiàn)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容