Opinion mining and sentiment analysis

Neil Zhu,簡書ID Not_GOD,University AI 創(chuàng)始人 & Chief Scientist,致力于推進(jìn)世界人工智能化進(jìn)程。制定并實施 UAI 中長期增長戰(zhàn)略和目標(biāo),帶領(lǐng)團(tuán)隊快速成長為人工智能領(lǐng)域最專業(yè)的力量。
作為行業(yè)領(lǐng)導(dǎo)者,他和UAI一起在2014年創(chuàng)建了TASA(中國最早的人工智能社團(tuán)), DL Center(深度學(xué)習(xí)知識中心全球價值網(wǎng)絡(luò)),AI growth(行業(yè)智庫培訓(xùn))等,為中國的人工智能人才建設(shè)輸送了大量的血液和養(yǎng)分。此外,他還參與或者舉辦過各類國際性的人工智能峰會和活動,產(chǎn)生了巨大的影響力,書寫了60萬字的人工智能精品技術(shù)內(nèi)容,生產(chǎn)翻譯了全球第一本深度學(xué)習(xí)入門書《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》,生產(chǎn)的內(nèi)容被大量的專業(yè)垂直公眾號和媒體轉(zhuǎn)載與連載。曾經(jīng)受邀為國內(nèi)頂尖大學(xué)制定人工智能學(xué)習(xí)規(guī)劃和教授人工智能前沿課程,均受學(xué)生和老師好評。

Opinion mining and sentiment analysis: Motivation

現(xiàn)在我們的地圖已經(jīng)探索到了觀點挖掘和情感分析,這是一項非常具有挑戰(zhàn)性和有趣的問題。我們看看現(xiàn)在可以做到什么程度。

Paste_Image.png

Objective vs. Subjective Sensors

Paste_Image.png

如何找到或者說確定那個文檔的觀點呢?首先我們看看觀點的定義

什么是觀點 opinion?

Paste_Image.png

觀點大概就是一個描述了觀點持有人相信或者認(rèn)定某事物的主觀陳述(相對于客觀陳述或者事實描述,不可以證明正確或者錯誤),而且相信或者認(rèn)定本身也是依賴于文化、背景和上下文關(guān)系。

觀點的表示

  • 基本表示
  • 觀點持有者:是誰的觀點?
  • 觀點目標(biāo):是關(guān)于什么的觀點?
  • 觀點內(nèi)容:觀點本身是什么?
  • 增強的觀點表示
  • 觀點的上下文:在什么情境下(時間,位置),表示的觀點?
  • 觀點的情感:觀點告訴我們關(guān)于觀點持有者的感受(正面、反面)?

產(chǎn)品評論(顯見持有者和目標(biāo))

稍微容易挖掘和分析

  • 基本表示
  • 觀點持有者:是誰的觀點? 評論者 X
  • 觀點目標(biāo):是關(guān)于什么的觀點? 產(chǎn)品:iPhone 6
  • 觀點內(nèi)容:觀點本身是什么? 評論文本
  • 增強的觀點表示
  • 觀點的上下文:在什么情境下(時間,位置),表示的觀點? Year = 2015
  • 觀點的情感:觀點告訴我們關(guān)于觀點持有者的感受(正面、反面)? 正面

新聞中的語句(隱式持有者和目標(biāo))

Paste_Image.png

這個例子說明了觀點目標(biāo)和持有者都不是顯見的,隱藏在文本中間,需要更深的NLP技術(shù)才能挖掘和分析

觀點的變體

  • 觀點持有者: Individual vs. group
  • 觀點對象: One entity, a group of entities, one attribute of
    an entity, someone else’s opinion, etc.
  • 觀點內(nèi)容:
  • Surface variation: one sentence/phrase, a paragraph, a whole article
  • Sentiment/emotion variation: positive vs. negative, happy vs. sad,
    etc.
  • 觀點上下文:
  • Simple context: Different time, location, etc.
  • Complex context: Potentially includes the entire discourse context of
    an opinion

文本中的不同類型的觀點

Paste_Image.png

可以看到有如下幾種類型:

  • 觀測到的觀點
  • 報告的觀點
  • 作者的觀點
  • 間接/推測的觀點

觀點挖掘的任務(wù)

Paste_Image.png

為何進(jìn)行觀點挖掘?

  • 決策支持
  • 幫助消費者選擇產(chǎn)品或者服務(wù)
  • 幫著投票者決定投誰
  • 幫助制定新的規(guī)則
  • 理解人類
  • 幫助我們理解人們的偏好(從而更好地服務(wù)他們;優(yōu)化搜索,推薦的效果)
  • 幫助我們進(jìn)行廣告(精準(zhǔn)廣告投放)
  • 志愿者調(diào)查(人類作為sensor;聚合觀點)
  • 商務(wù)智能
  • 市場調(diào)研
  • 數(shù)據(jù)驅(qū)動的社會科學(xué)研究
  • 基于文本的預(yù)測中獲得性能的提升
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容