Template-based Question Answering over RDF Data 筆記

一、摘要

先引入問題。由于數據的大量增長,采用直觀的途徑獲取信息越來越重要,問答系統是一個既滿足直觀性又滿足表達能力的折衷方案。

然后介紹通用的做法,有什么難點。將問題轉化問rdf三元組,去知識庫中檢索答案,該方式不能很好的表示自然語言問題的語義,很多問題回答不了。

接著介紹本文的方法。對問題進行深層語義解析,產生一個sparql查詢模板,該模板能完整的映射問題的語義結構。利用統計實體識別和謂詞檢測等方法填充模板中的槽。

最后表明本系統的回答問題的能力要優于其他系統。

二、介紹

先介紹通常情況的問答解析思路,把問題轉化為N個三元組來表示,然后去知識庫中檢索。

然后舉了幾個把問題轉換成sparql模板的例子,重點描述了含有more than、most的例子。

三、模板生成

利用Pythia,通過借助領域無關詞庫和領域相關詞庫產生自然語言問題的句法樹(詞匯化鄰接樹算法)和語義表示。

四、實體識別

名詞短語和名詞采用通用的識別算法(字串相似度)。謂詞檢測采用知識庫和BOA pattern結合的方法,定義support、typicity和specificity給謂詞打分,得分最高的就是最佳謂詞表達式(自然語言問題)—謂詞(知識庫)的映射關系。

五、query排序與查詢

經過三、四兩個環節會產生多個spraql查詢,根據相似性分數和顯著性分數,以及類型一致性檢查、空結果剔除等方法,獲得合適的query。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 前面的文章主要從理論的角度介紹了自然語言人機對話系統所可能涉及到的多個領域的經典模型和基礎知識。這篇文章,甚至之后...
    我偏笑_NSNirvana閱讀 14,089評論 2 64
  • Spring Cloud為開發人員提供了快速構建分布式系統中一些常見模式的工具(例如配置管理,服務發現,斷路器,智...
    卡卡羅2017閱讀 134,947評論 18 139
  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 173,349評論 25 708
  • 知識圖譜(Knowledge Graph)是當前學術界和企業界的研究熱點。中文知識圖譜的構建對中文信息處理和中文信...
    茍雨閱讀 7,493評論 0 11
  • 每天用25分鐘學習一項技能,
    高剛高剛閱讀 85評論 0 0