掃盲帖——關(guān)于網(wǎng)絡(luò)

一、資源描述框架(Resource Description Framework, 簡稱 RDF)

是一個用于表達(dá)關(guān)于萬維網(wǎng)(World Wide Web)上的資源的信息的語言· 它專門用于表達(dá)關(guān)于Web資源的元數(shù)據(jù), 比如Web頁面的標(biāo)題、作者和修改時間,Web文檔的版權(quán)和許可信息,某個被共享資源的可用計劃表等。然而,將“Web資源(Web resource)”這一概念一般化后,RDF可被用于表達(dá)關(guān)于任何可在Web上被標(biāo)識的事物的信息,即使有時它們不能被直接從Web上獲取。比如關(guān)于一個在線購物機(jī)構(gòu)的某項產(chǎn)品的信息(例如關(guān)于規(guī)格、價格和可用性信息),或者是關(guān)于一個Web用戶在信息遞送方面的偏好的描述。

二、關(guān)聯(lián)數(shù)據(jù)(Linked Data )

Linked data 最早是在 2007 年 5 月,由 Chris Bizer and Richard Cyganiak 向 W3C SWEO 提交的一個項目申請 Linked Open Data Project 中提出來的。Linked data 提出的目的是構(gòu)建一張計算機(jī)能理解的語義數(shù)據(jù)網(wǎng)絡(luò),而不僅僅是人能讀懂的文檔網(wǎng)絡(luò),以便于在此之上構(gòu)建更智能的應(yīng)用。例如:Amazon 上圖書可能與 MySpace 上的人之間可能存在關(guān)聯(lián),因為圖書的作者有可能在 Myspace 上注冊賬號。總之,Linked data 最大的特點便是將不同的數(shù)據(jù)關(guān)聯(lián)起來。

Linked data 包含一些基本原則:

(1)資源。在發(fā)布一個領(lǐng)域的數(shù)據(jù)之前,我們需要確定要發(fā)布的資源是什么。任何事物,只要你認(rèn)為是有意義的,有被引用必要的,都可以稱之為資源。

(2)資源標(biāo)識。任何一個資源都用一個 HTTP URI(Uniform Resource Identifiers)來標(biāo)識。之所有要用 HTTP URI 來標(biāo)識,是希望數(shù)據(jù)能夠通過 HTTP 協(xié)議訪問,真正實現(xiàn)基于 Web 的訪問與互聯(lián)。

(3)資源描述。資源可以有多種描述,例如 HTML,XML,RDF 以及 JPEG文檔。?Web 的文檔主要通過 HTML 格式來表示,數(shù)據(jù) Web 的數(shù)據(jù)主要通過 RDF格式(Resource Description Framework)來表示。RDF 將一個資源描述成一組三元組(主語,謂語,賓語)。

例如:

王老師 教授 英語課

(主語) (謂語) (賓語)

主語用來表示需要描述的資源,謂語用來表示主語的某個屬性(例如:姓名,出生日期)或者某個關(guān)系(例如,雇傭,認(rèn)識,教授等),賓語表示了屬性的值或者關(guān)系的值。主語,謂語都需要要用 HTTP URI 來表示。賓語可以用 HTTP URI 標(biāo)識另一個資源,也可以是字符串表示的文本。我們可以把主語看作是類資源,而將謂語看作是類資源的屬性資源,賓語或者是類資源或者是文字型資源。根據(jù)賓語的種類,可以將三元組分為兩類:文字型三元組以及非文字型三元組,第二種可以看作是類資源之間的關(guān)聯(lián)。

三、語義網(wǎng)(Semantic Web)

語義網(wǎng)的概念是由萬維網(wǎng)聯(lián)盟的蒂姆·伯納斯-李(Tim Berners-Lee)在1998年提出的一個概念,實際上是基于很多現(xiàn)有技術(shù)的,也依賴于后來和text-and-markup與知識表現(xiàn)的綜合。蒂姆·伯納斯-李在2006年普林斯頓大學(xué)演講和后期接受媒體采訪時公開表示,他最初將這種智能網(wǎng)絡(luò)命名為語義網(wǎng)或許不夠貼切,也許更準(zhǔn)確的名稱應(yīng)該是數(shù)據(jù)網(wǎng)(外語:Data Web)。

語義網(wǎng)就是能夠根據(jù)語義進(jìn)行判斷的智能網(wǎng)絡(luò),實現(xiàn)人與電腦之間的無障礙溝通。它好比一個巨型的大腦,智能化程度極高,協(xié)調(diào)能力非常強(qiáng)大。在語義網(wǎng)上連接的每一部電腦不但能夠理解詞語和概念,而且還能夠理解它們之間的邏輯關(guān)系,可以干人所從事的工作。它將使人類從搜索相關(guān)網(wǎng)頁的繁重勞動中解放出來,把用戶變成全能的上帝。語義網(wǎng)中的計算機(jī)能利用自己的智能軟件,在萬維網(wǎng)上的海量資源中找到你所需要的信息,從而將一個個現(xiàn)存的信息孤島發(fā)展成一個巨大的數(shù)據(jù)庫。

例如,某天早上你突然想去可可西里旅游,于是你打開電腦,連通語義網(wǎng),輸入“預(yù)訂今天下午兩點到六點之間任意時刻的到可可西里的飛機(jī)票”,此刻你的計算機(jī)代理將先與你所住地點航空公司的代理進(jìn)行聯(lián)系,獲得符合你要求的飛機(jī)票信息,然后聯(lián)系航空公司的訂票代理,完成訂購。你不必像現(xiàn)在這樣上網(wǎng)查看時間表,并進(jìn)行拷貝和粘貼,然后打電話或在線預(yù)訂機(jī)票和賓館等,安裝在你計算機(jī)上的軟件會自動替你完成上述步驟,你所做的僅僅是用鼠標(biāo)按幾個按鈕,然后等著送飛機(jī)票的人上門甚至直接去機(jī)場登機(jī)就可以了。

在瀏覽新聞時,語義網(wǎng)將給每一篇新聞報道貼上標(biāo)簽,分門別類的詳細(xì)描述哪句是作者、哪句是導(dǎo)語、哪句是標(biāo)題。這樣,如果你在搜索引擎里輸入“老舍的作品”,你就可以輕松找到老舍的作品,而不是關(guān)于他的文章。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容