機器學(xué)習(xí)算法實現(xiàn)(一):PageRank

PageRank算法R語言實踐

數(shù)據(jù)集

利用人工構(gòu)造的數(shù)據(jù)集,隨機地生成具有10個對象的有向圖

第一步:加載R包

library(igraph)

第二步:隨機生成具有10個對象的有向圖

g<-random.graph.game(n=10, p.or.m=1/4, directed =TRUE)

第三步:畫有向圖

plot(g)

第四步:計算PageRank

pr<-page.rank(g)$vector

第五步:顯示每個對象的PageRank

df <-data.frame(Object=1:10,PageRank = pr)

arrange(df,desc(PageRank))

PageRank算法原理

1 PageRank,網(wǎng)頁排名,又稱網(wǎng)頁級別、Google左側(cè)排名或佩奇排名,是一種由搜索引擎根據(jù)網(wǎng)頁之間相互的超鏈接計算的技術(shù),而作為網(wǎng)頁排名的要素之一,以Google公司創(chuàng)辦人拉里·佩奇(Larry

Page)之姓來命名。Google用它來體現(xiàn)網(wǎng)頁的相關(guān)性和重要性,在搜索引擎優(yōu)化操作中是經(jīng)常被用來評估網(wǎng)頁優(yōu)化的成效因素之一。Google的創(chuàng)始人拉里·佩奇和謝爾蓋·布林于1998年在斯坦福大學(xué)發(fā)明了這項技術(shù)。

2 PageRank通過網(wǎng)絡(luò)浩瀚的超鏈接關(guān)系來確定一個頁面的等級。Google把從A頁面到B頁面的鏈接解釋為A頁面給B頁面投票,Google根據(jù)投票來源(甚至來源的來源,即鏈接到A頁面的頁面)和投票目標(biāo)的等級來決定新的等級。簡單的說,一個高等級的頁面可以使其他低等級頁面的等級提升。

參考文獻

本文轉(zhuǎn)載自http://www.360doc.com/userhome.aspx?userid=26290960&cid=10

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容