實體屬性關系抽取
- 針對語料:通用語料
- 抽取關系:通用實體關系
- 抽取級別:句子級別
關系類型(通用文本)
關系 | 例子 | 類型 | |
---|---|---|---|
隸屬關系 | |||
個人 | 和誰結婚/是誰的媽媽 | per->per | |
組織 | 什么的發言人/**的總統/什么公司的CEO | per->org | |
人為 | 擁有/發明/生產() | per|org ->art | |
空間位置關系 | |||
臨近 | 靠近/ | loc->loc | |
指向/方向 | 位于某處南部/ | loc->loc | |
整體與部分關系 | |||
組織 | 某個部門(a unit of/ a parent of) | org->org | |
政治 | 簽署/附加/吞并 獲取 | gpe->gpe(地理政治實體) |
image.png
關系類型(ACE2003)
角色關系:將一個人與組織或地緣政治實體聯系起來
子類型:成員、擁有者、子公司、客戶、公民
整體與部分關系:
抽取類型
- 任何名詞都可以當作候選實體
- 任何動詞都可以當作候選關系
人的屬性
- 性別
- 出生日期
- 出生地
- 工作
產品的屬性
- 描述信息
- 價格
概念的屬性
企業的屬性
實體屬性抽取方法
- 基于模式和規則
- 人工構造規則和模式進行匹配
- 優點:準確率比較高
- 缺點:需要人工構造,依賴于特定領域,較難擴展和維護
- Bootstrapping方法
- 有監督方法
- 無監督方法
- 遠程監督方法