實體關系抽取

實體屬性關系抽取

  • 針對語料:通用語料
  • 抽取關系:通用實體關系
  • 抽取級別:句子級別

關系類型(通用文本)

關系 例子 類型
隸屬關系
個人 和誰結婚/是誰的媽媽 per->per
組織 什么的發言人/**的總統/什么公司的CEO per->org
人為 擁有/發明/生產() per|org ->art
空間位置關系
臨近 靠近/ loc->loc
指向/方向 位于某處南部/ loc->loc
整體與部分關系
組織 某個部門(a unit of/ a parent of) org->org
政治 簽署/附加/吞并 獲取 gpe->gpe(地理政治實體)
image.png

關系類型(ACE2003)

角色關系:將一個人與組織或地緣政治實體聯系起來

子類型:成員、擁有者、子公司、客戶、公民

整體與部分關系:

抽取類型

  • 任何名詞都可以當作候選實體
  • 任何動詞都可以當作候選關系

人的屬性

  • 性別
  • 出生日期
  • 出生地
  • 工作

產品的屬性

  • 描述信息
  • 價格

概念的屬性

企業的屬性


實體屬性抽取方法

  1. 基于模式和規則
    1. 人工構造規則和模式進行匹配
    2. 優點:準確率比較高
    3. 缺點:需要人工構造,依賴于特定領域,較難擴展和維護
  2. Bootstrapping方法
  3. 有監督方法
  4. 無監督方法
  5. 遠程監督方法

基于規則

基于統計

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容