這兩天做項目分析用到了GLMM模型,由于不明白GLMM和我之前學習的線性回歸模型有啥區別,就差了點相關資料,今天匯總一下吧。
線性回歸 --> 線性混合效應模型
我們知道,線性效應模型通常會將因變量分解成固定效應和誤差項,比如:
,在這里所有不感興趣、非系統性或不可測的因素都可以作為誤差項。
但是線性模型要求每個樣本之間互相獨立(還要求數據滿足多元正態分布),而在分析時往往會出現時間相關或者空間相關的樣本,因此人們就在線性回歸模型的基礎上建立了線性混合模型,所謂“混合”就是將固定效應與隨機效應進行混合了的意思,形如:
模型中多出來的
便是隨機效應。
這種隨機效應的表達是是這樣式兒的:,其中express是隨機斜率,factor是隨機截距。
那什么因素可以作為隨機效應放入模型中呢?其實吧,那些具有某種相關性的因素,也就是使樣本之間不互相獨立的那種因素我覺得就可以作為隨機效應。比如說,同一個體在多個時間點上多次采樣的樣本,就可以把時間放入固定效應,把個體放入隨機效應。
另外就是,如果把個體當做隨機因素,由于個體有個水平,因此會產生
個截距值。