孟德爾隨機(jī)化(Mendelian Randomization) 統(tǒng)計功效(power)和樣本量計算

1 統(tǒng)計功效(power)概念

統(tǒng)計功效(power)指的是在原假設(shè)為假的情況下,接受備擇假設(shè)的概率。

用通俗的話說就是,P<0.05時,結(jié)果顯著(接受備擇假設(shè)); 在此結(jié)論下,我們有多大的把握堅信結(jié)果的顯著性,此時需要用到power來表示這種“把握”。

統(tǒng)計功效(power)的計算公式為 1-β。

說到β,要提一下假設(shè)檢驗中的一型錯誤和二型錯誤。

一型錯誤,用 α 表示,全稱 Type-I error;

二型錯誤,用 β 表示,全稱 type-II error;

有個比較經(jīng)典的圖表示 Type-I error 和 type-II error:

image

(圖片來源忘了,侵刪)

因此,Power越大,犯第二型錯誤的概率越小,我們就更有把握認(rèn)為結(jié)果是顯著的。

下面分別從網(wǎng)頁版代碼版講一下怎么計算power和樣本量,網(wǎng)頁版代碼版均可完成分析,任選其一。

2 網(wǎng)頁版計算孟德爾隨機(jī)化power和樣本量

網(wǎng)頁版的見地址https://shiny.cnsgenomics.com/mRnd/

2.1 網(wǎng)頁版計算孟德爾隨機(jī)化power

計算power需要用到7個輸入?yún)?shù),分別為sample size, α, βyx, βOLS, R2xz, σ2(x), σ2(y)。 見下圖:

image
image

第一個參數(shù)sample size,指的是研究的樣本量大小;在這里假定樣本量是1000;

第二個參數(shù)是 α,指的是一型錯誤(Type-I error),默認(rèn)0.05;

第三個參數(shù)是βyx,指的是暴露變量和結(jié)局變量之間 真實 的相關(guān)系數(shù)。如何理解 真實 呢,以大胸和不愛運動為例,在校正了性別和年齡等一系列可能會影響大胸和不愛運動的變量后得到的回歸系數(shù),稱為暴露變量(不愛運動)和結(jié)局變量(大胸)真實的相關(guān)系數(shù);

第四個參數(shù)是βOLS,指的是暴露變量(不愛運動)和結(jié)局變量(大胸)之間 觀察到 的相關(guān)系數(shù),跟βyx的區(qū)別在于,這里不校正協(xié)變量;

第五個參數(shù)是R2xz,指的是工具變量(一般指SNP)對暴露變量(不愛運動)的解釋度;

第六個參數(shù)是σ2(x),指的是暴露變量(不愛運動)的方差;

第七個參數(shù)是σ2(y),指的是結(jié)局變量(大胸)的方差;

有了這7個參數(shù)以后,我們就可以計算power了。 power結(jié)果如下所示:

image

2.2 網(wǎng)頁版計算孟德爾隨機(jī)化樣本量

這個步驟同計算power的步驟,唯一不同的是,這個步驟是通過給定power,計算該power下需要的樣本量;

image

在這里,我們給定的power是0.8,其他的參數(shù)同上面的步驟,得到的樣本量如下所示:

image

3 代碼版計算孟德爾隨機(jī)化power和樣本量

該代碼出自網(wǎng)站https://github.com/kn3in/mRnd

3.1 代碼版計算孟德爾隨機(jī)化power

在Rscript中運行results函數(shù)(以下代碼完全照搬,不要修改任何參數(shù)):

results <- function(N, alpha, byx, bOLS, R2xz, varx, vary, epower) {
    
    threschi <- qchisq(1 - alpha, 1) # threshold chi(1) scale
    f.value <- 1 + N * R2xz / (1 - R2xz) #R2xz, Proportion of variance explained for the association between the SNP or allele score (Z) and the exposure variable (X)
    con <- (bOLS - byx) * varx # covariance due to YX confounding
    vey <- vary - byx * varx * (2 * bOLS - byx)
    
    if (vey < 0) {
    
        data.frame(Error = "Error: Invalid input. The provided parameters result in a negative estimate for variance of the error term in the two-stage least squares model.")
    
    } else {

        if (is.na(epower)) {
        
            b2sls <- byx + con / (N * R2xz)
            v2sls <- vey / (N * R2xz * varx)
            NCP <- b2sls^2 / v2sls
            # 2-sided test
            power <- 1 - pchisq(threschi, 1, NCP)
            data.frame(Parameter = c("Power", "NCP", "F-statistic"), Value = c(power, NCP, f.value), Description = c("", "Non-Centrality-Parameter", "The strength of the instrument"))    
        
        } else {
        
            # Calculation of sample size given power
            z1 <- qnorm(1 - alpha / 2)
            z2 <- qnorm(epower)
            Z  <- (z1 + z2)^2
            # Solve quadratic equation in N
            a <- (byx * R2xz)^2
            b <- R2xz * (2 * byx * con - Z * vey / varx)
            c <- con^2
            N1 <- ceiling((-b + sqrt(b^2 - 4 * a * c)) / (2 * a)) #ceiling返回對應(yīng)數(shù)字的'天花板'值,就是不小于該數(shù)字的最小整數(shù)
            data.frame(Parameter = "Sample Size", Value = N1)
        
        }
    }
}

隨后運行以下如下命令:

results(N=1000,alpha=0.05, byx=1.3, bOLS=1.41, R2xz=0.01, varx=1, vary=116.6, epower=NA)

各個參數(shù)代表的意義如下所示:

alpha=0.05 #Type-I error rate

N=1000 # Sample size

byx=1.3 #the regression coefficients for the association between exposure (X) and outcome (Y) variables (adjusted for confounders).

R2xz=0.01 # genetic instrument that explains R2xz=0.01 of variation in exposure (X)

bOLS=1.41 # the regression coefficients for the association between exposure (X) and outcome (Y) variables (no confounder-adjustment)

varx=1 # Variance of the exposure variable (X)

vary=116.6 #Variance of the outcome variable (Y)

得到的結(jié)果如下所示:

image

3.2 代碼版計算孟德爾隨機(jī)化樣本量

該步驟與前面一致,運行results函數(shù)后,再運行如下命令:

results(N=NA,alpha=0.05, byx=1.3, bOLS=1.41, R2xz=0.01, varx=1, vary=116.6, epower=0.8)

各個參數(shù)代表的意義如下所示:

alpha=0.05 #Type-I error rate

epower=0.8 # 1-(type-II error rate)

byx=1.3 #the regression coefficients for the association between exposure (X) and outcome (Y) variables (adjusted for confounders).

R2xz=0.01 # genetic instrument that explains R2xz=0.01 of variation in exposure (X)

bOLS=1.41 # the regression coefficients for the association between exposure (X) and outcome (Y) variables (no confounder-adjustment)

varx=1 # Variance of the exposure variable (X)

vary=116.6 #Variance of the outcome variable (Y)

得到的結(jié)果如下所示:

image

原文出處:Brion M J A, Shakhbazov K, Visscher P M. Calculating statistical power in Mendelian randomization studies[J]. International journal of epidemiology, 2013, 42(5): 1497-1501.


此推文感謝彭師姐推薦~


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,527評論 6 544
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,687評論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 178,640評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,957評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 72,682評論 6 413
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 56,011評論 1 329
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,009評論 3 449
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 43,183評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,714評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 41,435評論 3 359
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,665評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,148評論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,838評論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,251評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,588評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,379評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 48,627評論 2 380