語義網研究系列(一)——語義網的產生

(2010-03-24 16:11:56)

在業界工作久了,也淡忘了珞珈山上曾經的書生意氣。翻出我的博士論文,挑出一些有意義的部分,逐步發表,希望能夠有益于后來者的學習研究。

隨著互聯網應用的高速發展,網上信息資源的數量正以幾何級數爆炸性增長。據統計,目前萬維網(WWW)上的網頁數量就超過了10億個。一方面,大量信息資源的出現,為人類知識寶庫積累了豐富的數字信息;另一方面,傳統的互聯網技術僅僅是實現網絡資源的連接,并不考慮網絡資源間的結構組織,導致各種知識無序、零散的分布在成千上萬的存貯介質上。過于龐大的互聯網資源對于網上應用產生了各種各樣復雜的技術問題,這些問題[]往往又可以歸結到一個問題,即如何在浩如煙海的網上信息資源中準確、快速的找到用戶需要的信息。

要解決這個搜索問題,核心在于找到有序的網上信息資源的組織方法。語義網(Semantic Web)技術正是找到這種方法的一枚鑰匙。分析一下現代網絡搜索技術,無論是google、yahoo還是msn等搜索引擎,根本上來講它們采用的都是文本匹配這種最簡單的搜索方式。文本匹配方式可以解決一些應用要求較低的搜索問題,但對于應用要求較高的問題(如希望知道兩個事務之間的聯系等),或文字匹配容易產生混淆的情況下,這種方式就不能勝任了。幾乎每個經常使用網絡搜索引擎的用戶都會有這樣的體驗,就是搜索結果往往和自己所期望得到的信息不匹配。比如在google中輸入關鍵詞“黃牛”希望查找有關這種家畜的資料,我們找到的結果除了包括這種家畜的網頁以外,還有“黃牛黨”、“老黃牛氣沖天的說”等。

2001年,萬維網的發明人TimBerners-Lee在《科學美國人》(American Scientist)上發表了著名的文章“the Semantic Web”[1],引起廣泛關注。這是公認的語義網技術產生的里程碑。Berners-Lee的文章指出:語義網是對現有Web的擴展,這種擴展將信息賦予定義良好的意義,更加便利計算機和人的協同(The Semantic Web is an extension of the current web inwhichinformation is given well-defined meaning, better enabling computers and people to work in cooperation.)。在隨后的數年間,學界掀起了語義網技術研究的熱潮,并圍繞語義網技術的各個層次、環節展開了全面深入的討論。傳統的知識工程領域的研究者也紛紛加入,使得語義網技術得到較快的發展。目前,以英國的曼徹斯特大學、美國斯坦福大學、馬里蘭大學、德國卡爾斯魯爾大學AIFB研究所、德累斯頓技術大學、荷蘭Vjrve自由大學等為代表的大批科研院所的眾多科研人員都致力于語義網各方面技術的研究和開發,很多系統正在進入實用階段。近年來,歐盟更是斥巨資支持歐洲地區的語義網研究??梢哉f,語義網技術目前正處于其發展的高峰期。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容