一、早期知識表示簡介
知識特性:相對正確性、不確定性、可表示性、可利用性
知識分類:常識性知識、領域性知識(作用范圍);事實性知識、過程性知識控制知識(作用及表示);確定性知識、不確定性知識(確定性);邏輯性知識、形象性知識(結構及表現(xiàn)形式)
早期知識表示方法:一階謂詞邏輯(例:has_son(X,Y))、產(chǎn)生式規(guī)則(IF
---THEN---置信度CF)、框架、語義網(wǎng)絡(節(jié)點-弧-節(jié)點)、邏輯程序、缺省邏輯、模態(tài)邏輯
Horn邏輯,一階謂詞邏輯的子集
原子Atom:P(t1,t2..,tn)?
規(guī)則Rules由原子構建:
has_child(X,Y):-has_son(X,Y)??
事實是沒有體部和變量的規(guī)則? ?has_child(Helen,Jack):-
描述邏輯:一階謂詞邏輯的可判定子集,用于描述概念和屬性
概念:一個領域的子集?{x|Student(x)}
關系:該領域上的二元關系?{|friend(x,y)}
個體:一個領域內的示例?{XiaoMing}
TBox:包含內涵知識,描述概念的一般性質,例:Mother、Person、has_child
ABox:包含外延知識,描述領域中的特定個體,例:Mother(Helen)
框架
在框架理論中,框架就是知識表示的基本單位
組成:槽:用于描述所論對象某一方面的屬性
? ? ? ? ?側面:用于描述相應屬性的一個方面
優(yōu)點:描述完善和全面,質量高,允許數(shù)值計算
缺點:成本高,對知識庫的質量要求非常高,表達形式不靈活,難與其他形式數(shù)據(jù)集關聯(lián)使用。
產(chǎn)生式模式:
優(yōu)點:自然性、模塊性、有效性、清晰性
缺點:效率不高(規(guī)則庫龐大、匹配費時),不能表達具有結構性的知識
語義網(wǎng)絡
節(jié)點:表示各種事物、概念、情況、屬性、動作狀態(tài)等,每個節(jié)點可以帶有若干屬性;
弧:表示各種語義聯(lián)系,指明它所連接的節(jié)點之間某種語義關系。
二、 基于語義網(wǎng)的知識表示框架
知識表示(representation)
什么是RDF(資源描述框架,Resource Description Framework)?
Resource:頁面、圖片、視屏等任何具有URI標識符
Description:屬性、特征和資源之間的關系
Framework:模型、語言和這些描述的語法
在RDF中,知識總是以三元組(triple)形式出現(xiàn):(主,謂,賓)
RDF也是一個圖模型(節(jié)點-邊-節(jié)點),資源和屬性用URI標識(可以理解為ID)
RDF允許空白節(jié)點,一個資源可以是匿名的即不被URL標識(_:X),例,haofen是某一次KG講座的講者
RDF是數(shù)據(jù)模型(RDF/XML、Turtle、N-Triples),不是序列格式化
封閉世界假設-開放世界假設
例:(CCF ADL,speaker,Haofen)并不意味著CCF ADL講座只有一位講者,而是CCF ADL
講者至少有一位講者
帶標注RDF:時間、不確定性、空間、信任等
RDF和RDFS(RDF Schema)
RDFS為RDF模型提供了一個基本的類型系統(tǒng),是在RDF基礎上提供了一個術語、概念等的定義方式,以及哪些屬性可以應用到哪些對象上。
知識查詢:
SPARQL簡介
是RDF的查詢語言,可以對不同的數(shù)據(jù)集撰寫復雜的連接,由所有主流數(shù)據(jù)庫支持
本體可以填充知識與查詢之間的語義間隙
Thank you for your reading ,? welcome to correct my mistakes!!!