知識圖譜的應(yīng)用,大致可以分為兩類:通用知識圖譜和行業(yè)知識圖譜。我們?nèi)粘I钪薪佑|最多的是通用知識圖譜,如:Wikipedia,百度百科就屬于這一類;行業(yè)知識圖譜更多是相面某個特定的行業(yè)或者專業(yè)領(lǐng)域,如治療、金融、法律行業(yè)的智能客服。下面我們來簡單了解一下這兩類的區(qū)別。
下述部分資料引用自@PlantData
一、通用知識圖譜
面向通用領(lǐng)域
Google最初提出的知識圖譜是面向全領(lǐng)域的通用知識圖譜。
常識性知識為主
常識也可以稱為普通知識,即一個生活在社會中的心智健全的成年人所應(yīng)該具備的基本知識,包括生存技能(生活自理能力)、基本勞作技能、基礎(chǔ)的自然科學(xué)以及人文社會科學(xué)知識等。這句話就是常識,百度百科給的。
結(jié)構(gòu)化的百科知識
通過對知識分析后可分解成多個互相關(guān)聯(lián)的【實體-關(guān)系-實體】或【實體-屬性-值】,各組成部分間有明確的層次結(jié)構(gòu),其使用和維護(hù)通過數(shù)據(jù)庫進(jìn)行管理,并有一定的操作規(guī)范。
強(qiáng)調(diào)知識的廣度
強(qiáng)調(diào)的是廣度,因而強(qiáng)調(diào)更多的是實體,很難生成完整的全局性的本體層的統(tǒng)一管理。
使用者是普通用戶
主要應(yīng)用于面向互聯(lián)網(wǎng)的搜索、推薦、問答等業(yè)務(wù)場景。主要目的是讓普通用戶能理解、能使用。
二、行業(yè)知識圖譜
面向某一特定領(lǐng)域
指面向特定領(lǐng)域的知識圖譜,對某一領(lǐng)域知識的深入挖掘。
基于行業(yè)數(shù)據(jù)構(gòu)建
有嚴(yán)格與豐富的數(shù)據(jù)模式,行業(yè)知識圖譜中的實體通常屬性比較多且具有行業(yè)意義。
基于語義技術(shù)的行業(yè)知識庫
通過對行業(yè)術(shù)語、資料的語義進(jìn)行處理,從而形成某一個行業(yè)專用的知識圖譜,如何通過語義技術(shù)構(gòu)建行業(yè)知識圖譜,會在后續(xù)的文章中進(jìn)行分享。
強(qiáng)調(diào)知識的深度
強(qiáng)調(diào)的是深度,對準(zhǔn)確度要求非常高,通常用于輔助各種復(fù)雜的分析應(yīng)用或決策支持。
使用者是行業(yè)人員
目標(biāo)對象需要考慮行業(yè)中各種級別的人員,不同人員對應(yīng)的操作和業(yè)務(wù)場景不同,因而需要一定的深度與完備性。
三、總結(jié)
· 通用知識圖譜的廣度,行業(yè)知識圖譜的深度,相互補(bǔ)充,形成更加完善的知識圖譜。
· 通用知識圖譜中的知識,可以作為行業(yè)知識圖譜構(gòu)建的基礎(chǔ);而構(gòu)建的行業(yè)知識圖譜,再融合到通用知識圖譜中。
壹吐
目前AI的應(yīng)用,需要在某個最小化的業(yè)務(wù)場景中進(jìn)行試驗,更多的是需要對特定行業(yè)的深度挖掘,而行業(yè)知識譜圖恰恰符合這一特性;至于通用知識圖譜,就交給大公司吧:)