1、復雜網絡
復雜系統:整體是其各部分的總和以及各部分間的 交互。
如何研究網絡:圖論。
隨機圖:G(n,p),具有 n 個節點、任意兩個節點間以概率 p 存在連邊的圖。
如何研究 復雜網絡:統計物理 + 計算科學。傳統圖論不再適合于復雜網絡的研究。
網絡中節點連接模式:同配,相似而相連;異配,相異而相連。
社區結構:“內部連接緊密、外部連接稀疏” 的節點集合,高度重疊、相互嵌套。
網絡中存在大量三角形,形成 結構平衡,是網絡演化的微動力。
小世界模型:
- 隨機網絡:低聚集性,短直徑
- 規則網絡:高聚集性,長直徑
偏好連接:BA模型
- 生長
- 偏好連接:富者愈富
2、圖排序
將節點按照重要度排序:
-
介數中心度
通過節點 v 的最短路徑的期望個數 例子
-
距離中心度
定義:節點 x 到其他節點距離之和的倒數。
另一種定義:距離倒數的和??朔贿B通圖面臨的問題。
-
譜中心度
網絡鄰接矩陣的主特征值對應的特征向量
Katz中心度是泛化的譜中心度
PageRank
直觀解釋:被很多 重要 頁面 指向 的頁面是 重要 的頁面。
計算方法:任意給定一個初始歸一化向量,反復左乘轉移概率矩陣,直至收斂。
保證收斂充分條件,措施:
- 各態歷經性:任意兩個節點,都是雙向可達的;非周期的。
- 不可約簡
PageRank收斂特性,例子:
- 收斂速度快。一般100輪之內會收斂。
- 分塊收斂。網絡具有局部聚集特性,同一個塊內的節點,其PageRank值
收斂速度相近。 - 序收斂比值收斂更快
個性化PageRank:隨機跳轉向量使用任意非負歸一化向量代替,實現排序的個性化。例子
HITS
Hub:導出鏈接
Authority:導入鏈接
基本假設:
- 被很多高hub頁面指向的頁面具有高authority值
- 指向很多高authority頁面的頁面具有高hub值