wordnet介紹

wordnet是以同義詞集合(synset)作為基本建構單位進行組織的,即每個同義詞集是網絡里的一個結點,每個同義詞集合都代表一個基本的語義概念并且這些集合之前由各種關系連接。

詞語類型

共包含4種類型的詞匯,名詞,動詞,形容詞和副詞,各自被組織成一個同義詞的網絡。

關系類型(詳可見參考文獻5)

上下位關系(動詞、名詞)、蘊含關系(動詞)、相似關系(名詞)、成員部分關系(名詞)、物質部分關系(名詞)、部件部分關系(名詞)、致使關系(動詞)、相關動詞關系(動詞)、反義關系(形容詞)、近義關系(形容詞)、關系性形容詞(形容詞)、相關關系(形容詞)、屬性關系(形容詞)、反義關系
(副詞)、衍生關系(副詞)
注:
名詞有一棵上下位詞關系樹,根節點為entity,動詞有559棵上下位詞關系樹。
屬性關系(形容詞):如heavy是weight(名詞)的屬性
衍生關系(副詞):大部分副詞都從形容詞衍生得到,如happily衍生于happy
wordnet官網的relation部分介紹了wordnet中的主要關系

python wordnet

python的nltk包提供了讀wordnet的接口


下載nltk wordnet數據后的地址

參考資料

  1. wordnet官網https://wordnet.princeton.edu/
  2. python wordnet使用方法https://blog.csdn.net/King_John/article/details/80252594
  3. 知乎的一篇介紹https://zhuanlan.zhihu.com/p/26461511
  4. nltk wordnet文檔http://www.nltk.org/howto/wordnet.html
  5. wordnet關系https://wenku.baidu.com/view/18c6c532b90d6c85ec3ac6de.html#
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 介紹 WordNet是包含語義信息的英語詞典。 wordnet根據單詞的語義分組,相同語義的單詞組合在一起稱為sy...
    ltochange閱讀 3,727評論 0 0
  • 概述 nltk是一個自然語言處理工具包,在NLP領域中,最常使用的一個Python庫。https://yiyibo...
    HyRer閱讀 4,359評論 0 1
  • 基本概念 1. 語料庫 語料庫(corpus)就是存放語言材料的倉庫(語言數據庫)。 基于語料庫進行語言學研究-語...
    SpareNoEfforts閱讀 8,352評論 0 12
  • 自然語言處理教程 原文:Natural Language Process 譯者:飛龍 協議:CC BY-NC-SA...
    布客飛龍閱讀 33,010評論 6 68
  • 1. 說明 ?今天討論的是自然語言中的知識抽取和知識表示,換言之,就是如何從大量的書籍文獻中剝離出我們關心的...
    xieyan0811閱讀 4,352評論 0 0