1.背景介紹
微格式:建立在已有的、被廣泛采用的標準基礎之上的一組簡單的、開放的數據格式
(microformats.org官方定義)。是把語義嵌入到HTML以便有助于分離式開發而
制定的一些簡單約定,是兼顧人機可讀性設計的數據表達方式,對Web網頁進行語義注解的方法。
這種方法依托于標準的Web頁面寫作技術,例如,XHTML,這樣引入語義信息對瀏覽器等所有現存
的Web技術沖擊最小。采用Microformat的 Web頁面,在XHTML文檔中給一些標簽(Tag)增加一些屬性
(attribute),這些屬性對信息的語義結構進行注解,處理XHTML文檔的軟件,例如,瀏覽器等,
如果不認識這些屬性可以跳過,并不造成任何不良影響(ITPUB)簡單點說:通過語意相關讓內容人機可讀
2.知識剖析
網頁上的允許的微格式數據包括事件、人物、地點等,它可以被其他的軟件檢測到,并提取出相應的信息,以及對信息進行索引、搜索、跨平臺的參考,把這些信息以其他形式重復使用或組合。目前已具備完整規范的微格式還包括:hCard、hCalendar、XOXO、XFN、VoteLinks和3個“rel-”微格式:rel- license、rel-nofollow和rel-tag。
3.編碼實戰
北京:39.90556;116.39139
簡單的微格式
我們從上面的描述知道,微格式實際就是為現有的(X)HTML元素添加元數據
和其他屬性,增強語義。那么我們就來看一個簡單的微格式應用吧。
而現在我們要為這個代碼元素a加上rel屬性。
上面的鏈接標記的a標簽包括rel=”home”屬性,該屬性顯示鏈接的目標頁面是該網站的首頁。
通過為已有的鏈接元素添加語義化屬性,就為這個鏈接添加了具體的結構和意義。
4.擴展思考
微格式在實際應用中的意義和作用又是什么呢?
在爬取Web內容時,能夠更為準確地識別內容塊的語義;
對內容進行操作,包括提供訪問、校對,還可以將其轉化成其他的相關格式,提供給外部程序和Web服務使用。
5..參考文獻
參考一:博客
6.更多討論
Microformat有效地在Web文檔中增加語義信息,然而,現有Web上的海量信息
全部改造成符合該標準的內容顯然是不現實的,一種替代方法就是給現有的互聯網內容增加一個
語義描述層,這一層可以獨立于原信息頁面進行建設,MetaSeeker工具包是這類解決方案的佼佼者。
ppt:ptteng.github.io/PPT/PPT/css-12-Microformat.html#/
視頻: