Neil Zhu,簡書ID Not_GOD,University AI 創(chuàng)始人 & Chief Scientist,致力于推進世界人工智能化進程。制定并實施 UAI 中長期增長戰(zhàn)略和目標,帶領(lǐng)團隊快速成長為人工智能領(lǐng)域最專業(yè)的力量。
作為行業(yè)領(lǐng)導(dǎo)者,他和UAI一起在2014年創(chuàng)建了TASA(中國最早的人工智能社團), DL Center(深度學(xué)習(xí)知識中心全球價值網(wǎng)絡(luò)),AI growth(行業(yè)智庫培訓(xùn))等,為中國的人工智能人才建設(shè)輸送了大量的血液和養(yǎng)分。此外,他還參與或者舉辦過各類國際性的人工智能峰會和活動,產(chǎn)生了巨大的影響力,書寫了60萬字的人工智能精品技術(shù)內(nèi)容,生產(chǎn)翻譯了全球第一本深度學(xué)習(xí)入門書《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》,生產(chǎn)的內(nèi)容被大量的專業(yè)垂直公眾號和媒體轉(zhuǎn)載與連載。曾經(jīng)受邀為國內(nèi)頂尖大學(xué)制定人工智能學(xué)習(xí)規(guī)劃和教授人工智能前沿課程,均受學(xué)生和老師好評。
Opinion mining and sentiment analysis: Motivation
現(xiàn)在我們的地圖已經(jīng)探索到了觀點挖掘和情感分析,這是一項非常具有挑戰(zhàn)性和有趣的問題。我們看看現(xiàn)在可以做到什么程度。
Objective vs. Subjective Sensors
如何找到或者說確定那個文檔的觀點呢?首先我們看看觀點的定義
什么是觀點 opinion?
觀點大概就是一個描述了觀點持有人相信或者認定某事物的主觀陳述(相對于客觀陳述或者事實描述,不可以證明正確或者錯誤),而且相信或者認定本身也是依賴于文化、背景和上下文關(guān)系。
觀點的表示
- 基本表示
- 觀點持有者:是誰的觀點?
- 觀點目標:是關(guān)于什么的觀點?
- 觀點內(nèi)容:觀點本身是什么?
- 增強的觀點表示
- 觀點的上下文:在什么情境下(時間,位置),表示的觀點?
- 觀點的情感:觀點告訴我們關(guān)于觀點持有者的感受(正面、反面)?
產(chǎn)品評論(顯見持有者和目標)
稍微容易挖掘和分析
- 基本表示
- 觀點持有者:是誰的觀點? 評論者 X
- 觀點目標:是關(guān)于什么的觀點? 產(chǎn)品:iPhone 6
- 觀點內(nèi)容:觀點本身是什么? 評論文本
- 增強的觀點表示
- 觀點的上下文:在什么情境下(時間,位置),表示的觀點? Year = 2015
- 觀點的情感:觀點告訴我們關(guān)于觀點持有者的感受(正面、反面)? 正面
新聞中的語句(隱式持有者和目標)
這個例子說明了觀點目標和持有者都不是顯見的,隱藏在文本中間,需要更深的NLP技術(shù)才能挖掘和分析
觀點的變體
- 觀點持有者: Individual vs. group
- 觀點對象: One entity, a group of entities, one attribute of
an entity, someone else’s opinion, etc. - 觀點內(nèi)容:
- Surface variation: one sentence/phrase, a paragraph, a whole article
- Sentiment/emotion variation: positive vs. negative, happy vs. sad,
etc. - 觀點上下文:
- Simple context: Different time, location, etc.
- Complex context: Potentially includes the entire discourse context of
an opinion
文本中的不同類型的觀點
可以看到有如下幾種類型:
- 觀測到的觀點
- 報告的觀點
- 作者的觀點
- 間接/推測的觀點
觀點挖掘的任務(wù)
為何進行觀點挖掘?
- 決策支持
- 幫助消費者選擇產(chǎn)品或者服務(wù)
- 幫著投票者決定投誰
- 幫助制定新的規(guī)則
- 理解人類
- 幫助我們理解人們的偏好(從而更好地服務(wù)他們;優(yōu)化搜索,推薦的效果)
- 幫助我們進行廣告(精準廣告投放)
- 志愿者調(diào)查(人類作為sensor;聚合觀點)
- 商務(wù)智能
- 市場調(diào)研
- 數(shù)據(jù)驅(qū)動的社會科學(xué)研究
- 基于文本的預(yù)測中獲得性能的提升