指數隨機圖模型 ERGM(Exponential Random Graph Models)
指數隨機圖模型(Exponential Random Graph Models,ERGM),也稱為 p* 模型,是一種用于分析網絡數據的統計模型。該模型通過考慮圖中節點和邊之間的依賴關系,來捕捉網絡結構的復雜性。ERGM 的基本思想是,通過定義一系列統計量(稱為圖統計量),這些統計量反映了圖的結構特征,然后使用這些統計量來描述網絡的生成過程。
ERGM 的主要步驟包括:
定義圖統計量:
圖統計量是網絡中結構特征的定量表示,例如節點的度數分布、三角形閉包、節點屬性的同質性等。這些統計量反映了網絡中的局部和全局結構特征。構建概率模型:
ERGM 假設給定圖統計量的線性組合(加權和)可以用于描述網絡的概率分布。具體來說,ERGM 模型的形式可以表示為:
-
是隨機關系集;
是特定的關系集,當
時表示有連接,
時表示無連接,這種連接既可以是有向的,也可以是無向的。
-
是模型參數,
是模型對應的統計量,
是影響因素,
是歸一化常數,確保概率和為 1。
- 給定該分布中的特定圖
,它出現的概率可以通過該公式進行推導,并且依賴于網絡
中的統計值
和對應參數
,因此,ERGM可以解釋某一網絡中的各種可能結構規律。
參數估計:
通過最大似然估計(MLE)或貝葉斯方法來估計模型參數。由于歸一化常數
的計算涉及所有可能圖的遍歷,因此參數估計過程通常需要使用蒙特卡羅方法或偽似然估計。
模型檢驗和診斷:
通過檢查模型的擬合優度和殘差來評估模型的合理性。例如,可以使用 MCMC 方法生成樣本網絡,并將其與實際網絡進行比較,以驗證模型的擬合情況。
ERGM 的優點在于它能夠靈活地捕捉網絡中的復雜依賴關系和結構特征。然而,由于模型的計算復雜性,特別是對于大規模網絡,模型的估計和檢驗過程可能會比較耗時。
應用領域
ERGM 被廣泛應用于社會網絡分析、生物網絡研究、通信網絡建模等領域。例如,在社會網絡分析中,ERGM 可以用于研究社交網絡中的節點之間的關系模式和影響因素,識別關鍵節點和社區結構。
示例
假設我們有一個包含 10 個節點的社交網絡,節點之間的連邊表示友誼關系。我們可以定義一些圖統計量,如節點的度數(表示每個節點的朋友數量)、三角形閉包(表示朋友的朋友也是朋友的情況)。通過這些統計量,ERGM 可以用來分析和預測網絡的結構特征,例如預測哪些節點更可能形成新的友誼關系。
參考文獻
- Robins, G., Pattison, P., Kalish, Y., & Lusher, D. (2007). An introduction to exponential random graph (p*) models for social networks. Social Networks, 29(2), 173-191.
- Wasserman, S., & Faust, K. (1994). Social Network Analysis: Methods and Applications. Cambridge University Press.
library(statnet)
library(ergm)
library(sna)
# 讀取數據
data("faux.magnolia.high")
fmh <- faux.magnolia.high
plot(fmh,displayisolates=FALSE,vertex.cex=0.8)
# 讀取數據成分--》計算度數和節點個數之間的關聯
table(component.dist(fmh)$csize)
# 描述圖
summary(fmh)
# 按類別繪制不同顏色的圖
plot(fmh,displayisolates=TRUE,vertex.col="Grade",vertex.cex=0.8)
# 節點度的計算
fmh.degreedist <- table(degree(fmh,cmode="indegree"))
fmh.degreedist
#根據分類變量來查看度數分布情況
summary(fmh ~ degree(0:8,"Sex"))
# 內含三元組
summary(fmh ~ triangle)
# 內含邊+三元組
summary(fmh ~ edges + triangle)
# 混合矩陣
mixingmatrix(fmh,"Grade")
mixingmatrix(fmh,"Race")
# ermg
model_ergm<-ergm(fmh ~ edges)
summary(model_ergm)
# 網絡密度
exp(-6.998)/(1+exp(-6.998))
# 模型結果
names(model_ergm)
model_ergm$coefficients
# 擬合結構=增加星形==>模型退化
model_ergm1<-ergm(fmh ~ edges+kstar(2)+kstar(3))
summary(model_ergm1)
# 擬合結構=增加三角形==>模型退化
model_ergm2<-ergm(fmh ~ edges+triangle)
summary(model_ergm2)
simu<-simulate(model_ergm1,burnin=1e+6,verbose = TRUE,seed = 9)
mixingmatrix(simu,"Race")
mixingmatrix(fmh,"Race")
# 采用圖形觀測實際值和觀測值之間的擬合差異
plot(summary(fmh ~ degree(0:10)),type="l",lty=1,lwd=2,xlab="Degree",ylab="Count")
lines(summary(simu ~ degree(0:10)),type="l",lty=2,lwd=3,xlab="Degree",ylab="Count")
legend("topright",legend = c("observed","simulated"),lwd = 2:3,lty =1:2)