Famliy-based關聯分析

為什么要做基于家系的關聯分析?

關聯分析是挖掘復雜疾病致病位點的一個有效方法。在人類的疾病基因研究中,一般有兩種方法:一是條件-對照法(case-control, CC);二是傳遞連鎖不平衡法(transmission disequilibrium test, TDT) (Spielman et al.,1993)。條件對照法要考慮到如何使患者組與正常對照組相匹配,以及人群、地理和社會背景等。而在這些不同條件下,等位片段的頻率往往有很大的差異,這一現象被稱為群體分層(populationstratification)。在條件-對照研究中出現陽性結果時,產生關聯可以有3種原因:一是這個位點就是致病位點;二是這個位點與疾病位點存在連鎖不平衡(LD);三是這種關聯性是由于混雜因素(Confounder)造成的虛假聯系。在條件一對照研究中出現陽性結果時,產生關聯可以有3種原因:一是這個位點就是致病位點;二是這個位點與疾病位點存在連鎖不平衡(LD);三是這種關聯性是由于混雜因素(Confounder)造成的虛假聯系。這種混雜很大程度上是群體分層(患病組與對照組在種族、人類學起源、臨床情況甚至年齡或社會階層等方面若不匹配,尤其是群體的遺傳背景差異造成的兩組間遺傳標記等位基因頻率的差異,則可導致假陽性結果,即群體分層[Population stratiifcation]問題[AltshulerDetal,2000]引起的,為克服這一問題,在研究方案的設計上必須注重病例組與對照組相匹配,對家系樣本需增加患者父母未傳遞的等位片段作匹配比較。當某一特定等位片段在傳遞時出現的概率比隨機的概率顯著增多時,則認為存在連鎖不平衡。基于此原理的遺傳統計方法有對隱性遺傳模式非常有效的傳遞不平衡(transmission disequilibrium test,TDT),以及患者家系對照者分析(affected family—based controls,AFBAC)、單倍型相對風險率分析(haplotyperelativerisk,HRR)等方法。TDT是在家系內進行關聯分析(即famliy-based關聯分析),觀察雙親(至少一個是雜合子)將標記位點等位基因傳遞給患者的頻率。

famliy-based關聯分析原理

傳遞不平衡檢驗(TDT)是Spielman 在 1993 年發明的,它結合了連鎖分析(觀察家系內部的傳遞關系)和關聯分析(基于普通人群,不需更多的同胞樣品)的優點。傳遞不平衡檢驗(TDT)是一個對連鎖的檢驗,而不僅僅是連鎖不平衡。在連鎖存在的情況下,此法能有效地應用于關聯分析。

TDT是一個對連鎖的檢驗,還是對連鎖不平衡,或同時對兩者的檢驗,曾經是爭論的內容(Hodges E, 1993;1994;suarezBKetal, 1994;spielmanRsetal, 1994;1996;EwensWJetal,1995。對這個問題的解答依賴于樣本的特性;如果樣本由一組無關的病例及其雙親組成,那么TDT同時是連鎖和連鎖不平衡的檢驗(ShamPcetal,1995a);另一方面,如果數據是由從一個大家系中獲得的,此家系中所有的患者都共享一個從一個共同的祖先遺傳下來的疾病等位基因,這種情況下TDT則是一個對連鎖的檢驗。總的來說,TDT在所有情形下都是一個有效的連鎖不平衡檢驗,但對連鎖不平衡的敏感程度依賴于樣本中獨立的祖先疾病等位基因的數目。由于大多數用于TDT分析的樣本會包含許多單獨的家系,TDT可以被認為是對連鎖的檢驗,而隨著連鎖不平衡程度的增加其效能也跟著增加。一般情況下,當通過病例一對照研究已經揭示在人群水平上某標記位點與某性狀(如疾病)間存在某種相關性(無論是真實還是虛假的關聯)時,進行傳遞不平衡檢驗可以排除一些虛假關聯的結果。通常在使用病例-對照研究確定存在關聯,再使用這種方法進一步檢驗,從而排除病例對照研究中由于人群層化等因素造成的假陽性結果。

TDT 以患者及生物學父母為研究對象,檢測雙親將某個遺傳標記等位基因傳遞給受累后代是否表現為連鎖不平衡。TDT 僅考慮遺傳標記等位基因從雜合子父親或母親傳遞到受累后代的頻率,而且這些概率偏離 0.5 的情況也只發生在一種情況下,即當遺傳標記等位基因和疾病基因位點之間既存在連鎖又存在等位基因關聯的時候(假設群體中標記位點總體上不存在對孟德爾分離的偏離)。

TDT原理如下:

famliy-based關聯分析優勢

TDT只有在遺傳標記和致病基因位點之間存在關聯關系的前提下才能檢測到連鎖,如果這個前提不成立,那么TDT甚至不能檢測到緊密連鎖的兩個位點之間存在的連鎖關系,而傳統的連鎖分析方法不需要這個前提。與傳統的連鎖分析相比,TDT的優點;1.對同樣的數據,TDT比單倍型分析靈敏度更高;2.TDT可以用于只有一個患者的簡單核心家庭同時也可以用于有多個患者的大家系,對于患者數目不等的多個家系而言,TDT分析能直接將它們的數據合并進行分析,不會造成統計上的復雜性;3.TDT做為一個有效的連鎖檢驗方法不依賴于任何遺傳模式,雖然它對隱性遺傳模式較顯性遺傳模式更為有效;4.無論前提的關聯是由何種原因造成,無論層化現象存在與否,TDT分析都是對無連鎖(=1/2)假設的有效檢驗;5.當遺傳標記位點與致病基因位點相距很近或本身就是致病基因位點時,TDT比傳統連鎖分析更能有效檢驗出連鎖(Spileman RS et al,1996;ThomsonGSetal,1995;EwensWJetal,1995。)當樣本由無親緣關系的簡單核心家庭組成時,遺傳標記等位基因傳遞獨立性的假設成立,TDT分析(xZt動還可以作為遺傳標記與致病基因位點之間是否存在關聯的有效檢驗(sPilemanRSetal,1996。與患者一正常對照模式的關聯分析相比,TDT分析檢測關聯的優點;1.消除了患者一正常對照模式的關聯分析中患者群體和對照群體遺傳背景差異造成的影響,可完全消除種族分層引起的誤差;;2.只有連鎖位點之間存在的關聯才能被檢測到;3.利用家庭關系可以對個體基因分型的準確性進行檢驗;4.父母各自對子代患者的影響可以區分開來;5.可以利用家庭關系對相鄰的多個遺傳標記構建單倍型,并分析單倍型和疾病的關系(Thomson Gs etal, 1995)。

當然,TDT分析也有其自身的局限性,由于一些疾病發病年齡較晚,親代資料很難收集,TDT分析結果同樣受到許多因素的影響,如;外顯率不全,表型模擬,遺傳異質性,致病基因型相對危險度(Genotypic relative risk, CRR)大小,致病基因和遺傳標記等位基因頻率,致病基因突變位點出現的年代,遺傳標記與致病基因位點之間起始連鎖不平衡程度大小,突變率和它們之間的重組率等。所以同樣需要大的樣本量才有利于嚴格意義的顯著性結果的發現(Xiong MM et al, 1998; AbelLet al, 1998; Schaid DJ, 1998。

family-based關聯分析缺點

①中老年發病患者中的雙親多已亡故,而不易取得標本;

②疾病異質性將明顯降低相關分析的檢出率,按疾病病理生理性狀(又稱中間性狀)分成亞組或直接研究中間性狀的相關位點,將有助于解析疾病的易感位點;

③由于外顯不全,發病晚,對照群體內可存在尚未發病的個體,導致影響檢出率;

④由于對遺傳標記的雜合度要求較高,雙親必須是雜合子才能進行TDT分析,故SNP標記在TDT分析中較難發揮作用。

famliy-based關聯分析一般流程

?????? 1)選擇樣本,確定分析群體。Family-based關聯分析樣本是患者及其生物學父母

?????? 2)收集樣本的表型,注意疾病亞型區分

?????? 3)對樣本基因基因分型

?????? 4)標記過濾,除了去除低質量、缺失率高的標記外還要去除不符合哈迪溫伯格平衡的標記

?????? 5)傳遞不平衡檢測

Family-based關聯分析軟件

1UNPHASED

軟件特性:

?? Analysisof nuclear families and unrelated subjects, and combinations of the two

?? Analysisof discrete or quantitative traits

?? Maximumlikelihood treatment of missing genotype data and uncertain haplotypes

?? Globalassociation tests and tests of individual haplotypes

?? Conditioningtests that allow for previous associations of linked loci

?? Inclusionof information from additional tag markers

?? Supportfor non-genetic covariates including parent-of-origin

?? Permutationtests allowing for multiple testing

軟件鏈接:https://sites.google.com/site/fdudbridge/software/unphased-3-1

參考文獻:Dudbridge F (2008) Likelihood-based association analysis for nuclear families and unrelated subjects with missing genotype data. Hum Hered 66:87-98(606次引用)

2Polyunphased

Unphased的升級版,也是基于C++寫的,有命令行和JAVA界面兩種操作。相比于Unphased可以同時分析雙歧表型(如某一疾病存在亞表型)。

軟件路徑:https://github.com/abureau/polyUnphased

參考文獻:Polyunphased:an extension to polytomous outcomes of the?Unphased?package forfamily-based genetic association analysis.

3FBAT776

采用McNeman檢驗,FBAT軟件不足:未提供等位基因傳遞與未傳遞的數值;

參考文獻:

Implementing a unified approach to family‐based tests of association. NM Laird,?S Horvath, X Xu?- Genetic epidemiology, 2000 - Wiley Online Library(被引914)

S Horvath, X Xu,NM Laird. The family based?association test method: strategies for studying general genotype–phenotype associations. European Journal of Human Genetics, 2001 (被引776)

軟件路徑:https://content.sph.harvard.edu/fbat/default.html

4)PBAT

FBAT的升級版,PBAT可以計算power、可用于數量性狀、也可以同時做多個性狀/標記/模型

下載路徑:https://www.hsph.harvard.edu/pbat/download/

5)PLINK

采用McNeman檢驗,PLINK軟件的不足是未提供信息家系數。當信息家系親代傳遞和未傳遞給患兒的等位基因數之和小于40時,PLINK軟件的perm選項可提供確切概率

軟件鏈接:http://zzz.bwh.harvard.edu/plink/fanal.shtml

6)TRANSMIT

該軟件通過分析遺傳標記等位基因從父母到子代患者的傳遞情況來檢驗該遺傳標記與疾病位點之間的關聯情況,其主要的有點在于它能夠分析由多個位點等位基因所構成的單體型從父母到子代的傳遞情況,即使在基因型相位未知或少量父母基因型缺失的情況下。

7)Mendel

Mendel是一個包含個分析選項主要采的復合程序包,可對數量和質量遺傳性狀進行統計分析。Mendel軟件可以提供多個等位基因(如STR標記)的TDT檢驗。Mendel提供了兩種類似的運算方法,分別命名為TDT1(chi-sequare TDT statistic)和TDT2(largest standerdized residual TDT statistic)

除此之外還有:GENEHUNTER, UNPHASE,ASPEX

*原創文字,如果覺得對你有幫助留下你的贊哦~*

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容