PageRank算法R語言實踐
數(shù)據(jù)集
利用人工構(gòu)造的數(shù)據(jù)集,隨機地生成具有10個對象的有向圖
第一步:加載R包
library(igraph)
第二步:隨機生成具有10個對象的有向圖
g<-random.graph.game(n=10, p.or.m=1/4, directed =TRUE)
第三步:畫有向圖
plot(g)
第四步:計算PageRank
pr<-page.rank(g)$vector
第五步:顯示每個對象的PageRank
df <-data.frame(Object=1:10,PageRank = pr)
arrange(df,desc(PageRank))
PageRank算法原理
1 PageRank,網(wǎng)頁排名,又稱網(wǎng)頁級別、Google左側(cè)排名或佩奇排名,是一種由搜索引擎根據(jù)網(wǎng)頁之間相互的超鏈接計算的技術(shù),而作為網(wǎng)頁排名的要素之一,以Google公司創(chuàng)辦人拉里·佩奇(Larry
Page)之姓來命名。Google用它來體現(xiàn)網(wǎng)頁的相關(guān)性和重要性,在搜索引擎優(yōu)化操作中是經(jīng)常被用來評估網(wǎng)頁優(yōu)化的成效因素之一。Google的創(chuàng)始人拉里·佩奇和謝爾蓋·布林于1998年在斯坦福大學(xué)發(fā)明了這項技術(shù)。
2 PageRank通過網(wǎng)絡(luò)浩瀚的超鏈接關(guān)系來確定一個頁面的等級。Google把從A頁面到B頁面的鏈接解釋為A頁面給B頁面投票,Google根據(jù)投票來源(甚至來源的來源,即鏈接到A頁面的頁面)和投票目標(biāo)的等級來決定新的等級。簡單的說,一個高等級的頁面可以使其他低等級頁面的等級提升。
參考文獻
本文轉(zhuǎn)載自http://www.360doc.com/userhome.aspx?userid=26290960&cid=10