前言:
知識應(yīng)用的難點在于只是推理,只是推理的難點在于知識表示。因此,知識表示是基于知識的人工智能應(yīng)用中的核心部分。?
知識表示的五個主要角色是:
(1)知識表示是一種代理,基于事務(wù)的表示,我們嗚嗚時間而是通過思考和推理就可以得到有關(guān)外部世界的結(jié)論;
(2)知識表示是一組本體論約定的集合,說明我們以什么樣的方式來思考世界;
(3)知識表示是智能推理的組成部分:推理需要對知識進行表示,但知識表示不是推理的全部;
(4)知識表示是高效計算的媒介:通過對知識進行有效組織,支持高效的推理;
(5)知識表示是人類表達的媒介:基于通用表示框架,方便人們表達和分享對世界的認知。
1. 經(jīng)典知識表示理論
1.1 邏輯
邏輯本身根據(jù)復(fù)雜性從簡單到復(fù)雜分為:命題邏輯、一階謂詞邏輯、高階邏輯。
命題邏輯吧一個命題看成是一個二值的邏輯變量,具有真和假兩種可能。在經(jīng)典的邏輯學(xué)中,一個命題要么真要么假,沒有中間狀態(tài);但在概率邏輯中,會對這種假設(shè)進行松弛,使命題可以以不同的概率處于真和假之間的狀態(tài)。
如果鯨目中的一類背部有背鰭,那么它是海豚科。
X1=鯨魚有背鰭; X2=這種鯨魚屬于海豚科
Z1=(X1?X2)
謂詞邏輯分為一階為此邏輯和高階謂詞邏輯,主要區(qū)別在于是佛可以量化謂詞或集合。(高階邏輯應(yīng)用少,不做介紹)
一階謂詞邏輯可簡稱為一階邏輯,它在命題邏輯的基礎(chǔ)上增加了量詞的概念。具體地,一階邏輯的基本語法元素是表示對象、關(guān)系和函數(shù)的符號,其中對象對應(yīng)常量符號,關(guān)系對應(yīng)謂詞符號,函數(shù)對應(yīng)函詞符號。對象是指一些事物的個體或類別,如‘張三’、‘水蜜桃’、‘湯姆科魯茲’等。關(guān)系或謂詞是指一種映射,例如‘兄弟’是一個謂詞,對于對象‘張三’,兄弟(張三,x)是謂詞對對象的操作,其中x可以是張三、李四等一個或多個對象,也可以是空。函詞是代表全函數(shù)的一種特殊的謂詞形式,它要求每一個定義域中的對象具有一個映射值,例如‘國籍’就是一個函詞,因為一般情況下每個人都有且只有一個國籍。‘湯姆科魯茲’是函詞‘國籍’定義域中的一個對象,那么謂詞邏輯要求國籍(湯姆科魯茲,x)中的映射必須在值域中。
謂詞邏輯相比于命題邏輯的優(yōu)勢是可以表達對象的集合,而不用逐一列舉所有對象,它通過量詞能夠?qū)崿F(xiàn)對對象集合的描述,一階謂詞邏輯中有2種量詞:全稱量詞(?)和存在量詞(?)。 舉例:?x 海豚(x)? x有背鰭
1.2 語義網(wǎng)絡(luò)
語義網(wǎng)絡(luò)(semantic network)是奎利恩1966年在研究人類聯(lián)想記憶時提出的一種心理學(xué)模型。該模型認為人類的記憶時由概念間的聯(lián)系實現(xiàn)的。啟發(fā)他的有兩點:一是 人腦記憶的重要特征是人腦中不同信息片段之間的高度連接;二是高度相關(guān)的概念能夠比不太相關(guān)的概念更快地會議起來。
語義網(wǎng)絡(luò)是一個通過語義關(guān)系連接的概念網(wǎng)絡(luò),它將知識表示為相互連接的點和邊的模式,其中個,節(jié)點表示實體、時間、值等。邊表示對象之間的語義關(guān)系。語義網(wǎng)絡(luò)本質(zhì)是一種有向圖表示的知識系統(tǒng),節(jié)點代表的是概念,邊表示概念之間的語義關(guān)系。
語義網(wǎng)絡(luò)中的關(guān)系有很多類型,包括:
(1)實例關(guān)系(isA):含義是‘是一個’,體現(xiàn)的是‘具體與抽象’的概念,表示一個事物是另一個事物的一個實例,如:小王是一個人
(2)分類關(guān)系(aKO,a kind of):含義是‘是一種’,體現(xiàn)的是‘子類與超類’的概念,表示一個事物是另一個事物的一種類型,如:籃球是一種球。
(3)成員關(guān)系(a-member-of):含義是‘是一員’,體現(xiàn)的是‘個體與集體’的關(guān)系,表示一個事物是另一個事物的一個成員,如:小宇是一位公務(wù)員
(4)屬性關(guān)系:指事物和其屬性之間的關(guān)系,常見的屬性關(guān)系有:have,狗有尾巴;can,魚能游泳;其他屬性,如人的身高、年齡等。
(5)聚合關(guān)系,也稱包含關(guān)系:指具有組織或結(jié)構(gòu)特征的‘部分與整體’之間的關(guān)系,如:凳子是桌子的一部分。
(6)時間關(guān)系:指不同時間在其發(fā)生時間方面的先后次序關(guān)系。常見的如‘在前’、‘在后’
(7)位置關(guān)系:指不同事物在位置方面的關(guān)系,如‘在’、‘在上’、‘在內(nèi)’等等
(8)相近關(guān)系:指不同事物在形狀、內(nèi)容等方面相似或相近,如:獅子和老虎在食物鏈的位置非常接近。
可以按照論元個數(shù)把關(guān)系分為一元關(guān)系、二元關(guān)系和多元關(guān)系。一元關(guān)系可以用一元謂詞P(x)表示,P可表示實體/概念的性質(zhì)、屬性等,如:鳥有翅膀、魚能游泳。二元關(guān)系可用二元謂詞P(x,y)表示。其中,x,y為實體,P為實體之間的關(guān)系,如‘北京是中國的首都’,可表示為首都(中國,北京)。 多元關(guān)系在語義網(wǎng)絡(luò)中可轉(zhuǎn)化為多個二元關(guān)系的組合,然后利用合取把這種多元關(guān)系表示出來。語義網(wǎng)絡(luò)表示多元關(guān)系示例圖:
語義網(wǎng)絡(luò)與一階謂詞具有相同的表達能力,不同的是,它用最簡單的一種統(tǒng)一實行描述所有知識,非常有利于計算機的存儲和檢索。語義網(wǎng)絡(luò)的缺點是,它僅用節(jié)點及其關(guān)系描述知識,推理過程不想謂詞邏輯表示方法那樣明了,需要針對不同關(guān)系做不同處理,推理方法還不完善。
典型的語義網(wǎng)絡(luò),如知網(wǎng)(Hownet),它是一個以漢字和英語的詞語代表的概念為描述對象,以解釋概念與概念之間以及概念屬性之間的關(guān)系為基本內(nèi)容的語言認知知識庫/常識知識庫。知識是一個系統(tǒng),是一個包含關(guān)系的系統(tǒng)。
值得一提的是:一個人比另一個人有更多知識,說到底是他不僅掌握了更多的概念,而且掌握了更多的概念之間的關(guān)系以及概念的屬性與屬性之間的關(guān)系。
1.3 框架
從認知學(xué)的角度,框架理論繼承了認了認識世界的方式,對現(xiàn)實世界中各種事物,人類都是以一種類似于框架的結(jié)構(gòu)存儲在記憶中。 當面臨一個新事物是,人就從記憶中找出一個合適的框架,并根據(jù)實際情況對框架中的具體值進行填充,填充的部分被稱為槽(slot),框架及槽的粒度根據(jù)人類對事物認知程度而定。
例如:
框架以強大的結(jié)構(gòu)式表達能力和接近于人類思維過程的特性,被應(yīng)用于多個領(lǐng)域?qū)<蚁到y(tǒng)的構(gòu)建以及通用知識的表達,如FrameNet是一個經(jīng)典的基于框架表示的知識庫,它定義了1000多個不同的框架、10000多個詞法單元、總計標注了超過150000個例句。
1.4 腳本
腳本是一種與框架類似的知識表示方法,是由Schank等人于20世紀70年代提出的。腳本通過一系列的原子動作來表示事物的基本行為,按照時間順序描述事物的發(fā)生,類似于電影劇本。腳本表示的知識有確定的時間或因果順序,必須是前一個動作完成后才會觸發(fā)下一個動作的開始。
腳本用來表示一個動態(tài)的過程而非靜態(tài)知識的表示方法,與框架有著不同的目的。
2. 語義網(wǎng)中的知識表示方法
2.1 語義網(wǎng)表示方法
語義網(wǎng)最初的目的就是為了對萬維網(wǎng)的功能進行擴展以提高其智能程度,因為人們也將語義網(wǎng)稱為Web3.0。語義網(wǎng)是由萬W3C發(fā)起的,萬維網(wǎng)的創(chuàng)始人Tim Berners Lee期望語義網(wǎng)可以更加有效地組織和檢索信息,從而使計算機能夠利用互聯(lián)網(wǎng)豐富的資源完成智能化應(yīng)用任務(wù)。
與框架不同的是,語義網(wǎng)的表示更加靈活,它不需要對具體多個側(cè)面的屬性定義另一個框架,而是直接定義屬性和屬性關(guān)系建立他們之間的聯(lián)系,在拓撲結(jié)構(gòu)上可看成是一個圖或網(wǎng)絡(luò),這也是語義網(wǎng)名字的由來。
2.2 語義網(wǎng)知識描述體系
語義網(wǎng)知識表示體系主要包括三個層次:
XML,可擴展標記語言,XML 以文檔為單位進行表示,不能顯示第定義標簽的語義約束;RDF,資源描述框架,可看成是XML 的擴展或簡化。RDF資源的屬性、類的描述,以及類別間一般到特殊的層次結(jié)構(gòu)語義,一起由RDF Schema進行定義;OWL,網(wǎng)絡(luò)本體語言,owl是本體的語義表示語言,它建立在RDF和RDF Schema的基礎(chǔ)之上。owl能夠表達本體智慧和刻畫屬性之間關(guān)系(如 逆關(guān)系、函數(shù)約束、有且僅有等),為了更好的對邏輯和推理進行描述,owl洗后了描述邏輯等邏輯語言。
rdf局限于二元謂詞,rdfs則限制于子類和屬性層次及其屬性的定義域、值域。owl在rdf和refs的基礎(chǔ)上定義了自己獨有的原,主要包括頭部和主題兩部分。
頭部:owl描述一個本體時,預(yù)先制定一系列的明明空寂那,包括:xmlns:owl,xmlns:rdf,xmlns:rdfs,xmlns:xsd等,并使用命名空間中預(yù)定義的標簽來形成本體的頭部。
主題:owl的主題是用來描述本體的類別、實例、屬性之間相互觀瀾的部分,它是owl的核心。
3. 知識圖譜中的知識表示方法
表示框架
通常,一個知識本體主要涵蓋以下幾個方面的內(nèi)容:
(1)事物;(2)概念;(3)屬性;(4)關(guān)系;(5)函數(shù);(6)約束;(7)規(guī)則;(8)公理
知識圖譜用節(jié)點對應(yīng)事物或概念,用邊對應(yīng)它們之間的關(guān)系。知識圖譜用統(tǒng)一的形式對只是定義和具體實例數(shù)據(jù)進行描述,各個具體實例數(shù)據(jù)只有在滿足系統(tǒng)約定的‘框架’約束下運用才能體現(xiàn)‘知識’。知識圖譜中的知識定義和實例數(shù)據(jù)及其相關(guān)的配套標準、技術(shù)、應(yīng)用系統(tǒng)構(gòu)成了廣義的知識圖譜。
狹義的知識圖譜可以看成是知識庫的圖結(jié)構(gòu)表示。本章描述的知識圖譜 局限咋現(xiàn)存的具有圖結(jié)構(gòu)的三元組知識庫上,泛指三元組r(h,t)知識組成的有向圖結(jié)構(gòu)。
更具體地,知識庫中的實體可作為知識圖譜中的界定啊,而知識庫中的實時作為知識圖譜中的邊(包含邊兩端的節(jié)點),邊的方向由頭實體指向尾實體的,而兩實體間的關(guān)系類型就作為邊的類型。
4. 知識圖譜的數(shù)值化表示方法等(略)
小結(jié):主要介紹了不同的知識表示方法,主要包括邏輯、語義網(wǎng)絡(luò)、框架和腳本等方法。以及語義網(wǎng)和語義的背景及知識描述體系,知識圖譜的表示和存儲等方法大量使用了語義網(wǎng)的標準和體系。