Rakyan VK, Down TA, Balding DJ, Beck S (2011) Epigenome-wide association studies for common human diseases. Nat Publ Gr 12:529–541. doi: 10.1038/nrg3000
摘要| 盡管全基因組關(guān)聯(lián)研究(GWAS)在鑒定與常見(jiàn)疾病相關(guān)的基因座方面的成功,但大部分的因果關(guān)系仍然不明。 基因組技術(shù)的最新進(jìn)展使我們能夠開(kāi)始大規(guī)模研究人類疾病相關(guān)的表觀遺傳變異,特別是DNA甲基化的變異。 這種表觀基因組范圍的關(guān)聯(lián)研究(EWAS)提供新的機(jī)會(huì),但也產(chǎn)生在GWAS中未遇到的新挑戰(zhàn)。 我們討論EWAS設(shè)計(jì),隊(duì)列和樣本選擇,統(tǒng)計(jì)顯著性和功效,混雜因素和隨訪研究。
闡明人類復(fù)雜疾病(也可換成整個(gè)生物界所有有意義的性狀)的遺傳和非遺傳決定因素是生物醫(yī)學(xué)研究的主要挑戰(zhàn)之一。近年來(lái),全基因組關(guān)聯(lián)研究(GWASs)已經(jīng)為150多種疾病和其他性狀發(fā)現(xiàn)了> 800個(gè)SNP關(guān)聯(lián)1。盡管對(duì)于任何人類復(fù)雜疾病還不知道完整的遺傳基礎(chǔ),但是對(duì)外顯子 - 并且最終完整的基因組 - 的確定有望識(shí)別大多數(shù)致病性遺傳變異。然而,現(xiàn)在越來(lái)越感興趣探索非遺傳變異,包括表觀遺傳因素如何影響復(fù)雜的疾病病因2-4。
細(xì)胞的表觀基因組是高度動(dòng)態(tài)的,由遺傳和環(huán)境因素的復(fù)雜相互作用控制5。正常細(xì)胞功能依賴于表觀基因組穩(wěn)態(tài)的維持,這進(jìn)一步突出表現(xiàn)在表觀基因組擾動(dòng)和人類疾病,特別是癌癥之間的許多報(bào)告的關(guān)聯(lián)4。然而,迄今為止這種關(guān)聯(lián)的大多數(shù)研究已經(jīng)進(jìn)行或者具有不足的基因組覆蓋(例如,幾十到幾百個(gè)基因座),但是足夠的樣品量,或者具有更接近全基因組的覆蓋度(數(shù)千個(gè)基因座)但樣本量不足。因此,對(duì)于任何人類復(fù)雜疾病,我們?nèi)匀徊恢揽蓺w因于個(gè)體間表觀基因組變異的表型變異的比例。這個(gè)問(wèn)題只能通過(guò)大規(guī)模,系統(tǒng)的表觀基因組等價(jià)的GWAS-表觀基因組范圍的關(guān)聯(lián)研究(EWASs)來(lái)闡明,如2008年首次提出的(參考文獻(xiàn)6)。至少對(duì)于DNA甲基化(DNAm),現(xiàn)在可以獲得在分辨率和通量上與高度成功的GWAS芯片直接相當(dāng)?shù)募夹g(shù),其允許大約500,000(500K)SNP的基因分型。
但是,如何進(jìn)行EWAS?除了GWAS和EWAS共有的考慮因素(例如,適當(dāng)?shù)募夹g(shù)和樣品量),EWAS的設(shè)計(jì)在樣品選擇方面有特定的考慮。 DNAm模式對(duì)組織和發(fā)育階段是特異性的,它們也隨時(shí)間而變化。此外,EWAS關(guān)聯(lián)可以是所涉及的表型的因果性和相應(yīng)的 - 與GWAS的區(qū)別,提出了相當(dāng)大的挑戰(zhàn)。在這里,我們?cè)谠O(shè)計(jì)和分析有效的EWAS的背景下討論這些考慮,記住EWAS可能隨著信息和經(jīng)驗(yàn)的積累而演變,就像GWAS一樣。
表觀遺傳變異和復(fù)雜疾病
表觀遺傳信息的類型。哺乳動(dòng)物中的表觀遺傳信息可以以多種形式傳播,包括有絲分裂穩(wěn)定的DNAm,組蛋白和非編碼RNA(ncRNA)的翻譯后修飾。對(duì)于DNAm,主要形式是在胞嘧啶 - 鳥嘌呤二核苷酸(CpG)的背景下胞嘧啶的甲基化。然而,最近的研究結(jié)果表明CpH甲基化(其中H = C / A / T)可能比以前更常見(jiàn)的7.8。由十一位易位(TET)甲基胞嘧啶雙加氧酶催化,5-羥甲基化9,10胞嘧啶(hmC)是另一種形式的DNAm。雖然細(xì)節(jié)仍不清楚,越來(lái)越多的證據(jù)表明hmC在基因調(diào)控和分化中的作用11。組蛋白修飾包括(僅舉幾個(gè))核心組蛋白的氨基末端尾中的一個(gè)或多個(gè)氨基酸的單 - ,二 - 或三甲基化,乙酰化和瓜氨酸化5。最近,已經(jīng)發(fā)現(xiàn)ncRNA可以自我繁殖并且獨(dú)立于下面的DNA而被傳遞;換句話說(shuō),他們可以“表觀遺傳”地傳遞監(jiān)管信息12,13。這樣的ncRNA包括短微小RNA(miRNA),PIWI相互作用RNA(piRNA)和大型基因間非編碼RNA(lincRNA)等。
健康和疾病的表觀遺傳變異。考慮到二倍體人類表觀基因組含有> 108個(gè)Cs(其中> 107個(gè)是CpG)和> 108個(gè)組蛋白尾巴,所有潛在的變化,目前未知但是潛在的表觀遺傳標(biāo)記的范圍。最經(jīng)研究的表觀遺傳標(biāo)記是DNAm,BOX 1討論DNAm變化的最常見(jiàn)的特征和背景。在單個(gè)CpG位點(diǎn)的DNAm變異被稱為甲基化可變位置(MVP),其可以被認(rèn)為是SNP14的表觀遺傳學(xué)等價(jià)物。很少,每個(gè)等位基因的僅兩條DNA鏈之一上的CpG被甲基化。這被稱為半甲基化,并且它可能反映在增殖細(xì)胞中DNAm維持中的復(fù)制后滯后。如果DNAm在多個(gè)相鄰的CpG位點(diǎn)被改變,這被稱為差異甲基化區(qū)(DMR)。 DMR在長(zhǎng)度上變化相當(dāng)大:它們通常<1kb,但是它們可以超過(guò)1Mb15。
直到最近,MVP和DMR主要在核心啟動(dòng)子,CpG島(CGI)和印跡差異甲基化區(qū)域(iDMR)的背景下進(jìn)行研究;然而,越來(lái)越清楚的是DNAm是高度動(dòng)態(tài)的,甚至在這些區(qū)域之外。例如,最近的一項(xiàng)研究發(fā)現(xiàn),組織和癌癥特異性DMRs優(yōu)先發(fā)生在鄰近CGI的區(qū)域 - 所謂的CGI海岸16。 DNAm還在沉默重復(fù)元件中具有關(guān)鍵作用,這也可能對(duì)疾病病因17,18造成影響。
DNAm變異在復(fù)雜疾病中的作用主要在癌癥的背景中探討,可以被認(rèn)為是早期EWAS。這些研究的結(jié)果已被廣泛討論4,19,關(guān)鍵的一般結(jié)論是腫瘤發(fā)展與CGI的DNAm增加,重復(fù)元件的損失印跡和表觀遺傳重塑相關(guān),特別是衛(wèi)星DNA的DNAm損失20, 21。對(duì)于非惡性的,常見(jiàn)的復(fù)雜疾病,例如糖尿病或自身免疫,表觀遺傳組分僅剛剛開(kāi)始研究。支持表觀遺傳組分參與這些疾病的觀察包括以下。首先,對(duì)于任何復(fù)雜疾病的單卵雙生子協(xié)調(diào)幾乎從未100%。近來(lái),對(duì)于系統(tǒng)性紅斑狼瘡22和自閉癥譜系障礙23不一致的單性雙胞胎的小規(guī)模EWAS已經(jīng)在單卵型對(duì)中發(fā)現(xiàn)了疾病相關(guān)的表觀遺傳學(xué)差異。其次,幾種復(fù)雜疾病(例如1型糖尿病)的發(fā)病率在一般人群中上升,并且在移民人口中經(jīng)常改變,這表明非遺傳因素的作用。第三,流行病學(xué)證據(jù)表明,在子宮或早期兒童環(huán)境中次優(yōu)的可能對(duì)成年期的疾病結(jié)果(例如2型糖尿病)有影響,這種現(xiàn)象稱為“發(fā)育重編程”(參考文獻(xiàn)25)。目前,子宮環(huán)境的分子記憶的主要候選是表觀遺傳修飾,包括DNAm26-28。
表觀遺傳變異作為疾病的結(jié)果或原因。如上所述,表觀遺傳變異可以是疾病的病因或可以作為疾病的結(jié)果而出現(xiàn)。作為疾病的結(jié)果,直接或間接可能出現(xiàn)表觀遺傳變異 - 其實(shí)例可包括自身免疫性疾病中免疫相關(guān)細(xì)胞的長(zhǎng)期改變,2型糖尿病中改變的代謝調(diào)節(jié)或體細(xì)胞突變誘導(dǎo)的表觀遺傳改變癌癥。然而,將其與導(dǎo)致疾病過(guò)程的表觀遺傳變異區(qū)分開(kāi)并不是直截了當(dāng)?shù)模ㄎ覀儗⒃谙旅娓敿?xì)地討論),但是永遠(yuǎn)不是至關(guān)重要的;這是因?yàn)樗鼘⒂兄陉U明疾病相關(guān)變異的功能作用及其在診斷或治療方面的潛在效用。實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵步驟是確定變異是否存在于任何明顯的疾病跡象之前。在這方面,考慮如何在疾病之前出現(xiàn)這樣的表觀遺傳變異是有用的。首先,它可以是遺傳的,因此存在于所有組織中,包括胚系(即,跨代表觀遺傳),盡管這種現(xiàn)象的程度尚不完全清楚。第二,它可以隨機(jī)出現(xiàn),如果發(fā)生在早期(例如子宮內(nèi))發(fā)展中,則出現(xiàn)全身性[29,30],或者可以局限于一個(gè)或幾個(gè)組織31,32,如果它發(fā)生在出生后或在成人期間。第三,它可能是環(huán)境誘導(dǎo),通過(guò)成人生活方式相關(guān)因素,如飲食或吸煙33,甚至在子宮內(nèi);即,發(fā)育重編程(如上所述)。
還有可能的是,潛在的基因型影響表觀遺傳變異,最近由幾個(gè)研究表明34-39。含有影響甲基化狀態(tài)的遺傳變異的基因座被稱為甲基化數(shù)量性狀基因座(methQTLs)34。在大多數(shù)甲基喹唑啉酮中,與順式基因型的相關(guān)性是最顯著的。有一些證據(jù)表明遺傳變異也可以影響反式的表觀遺傳狀態(tài),但這似乎不像順式效應(yīng)那樣普遍。此外,重要的是要注意,在大多數(shù)這些以前的研究中,真正的致病性遺傳變異沒(méi)有明確地鑒定,并且大多數(shù)甲基化QTL在順式基因型和表觀基因型之間沒(méi)有表現(xiàn)出嚴(yán)格的一對(duì)一關(guān)系;相反,指定的基因型產(chǎn)生增加的甲基化概率。 Feinberg和Irizarry2最近爭(zhēng)論的小鼠和人類基因組中的遺傳變異的存在,不改變平均表型,而是表型的變異性;這可以通過(guò)可變甲基化區(qū)域進(jìn)行表觀遺傳學(xué)調(diào)節(jié)(VMR,參見(jiàn)框1)。 MetQTLs的存在為綜合GWAS和EWAS揭示通過(guò)表觀遺傳變異發(fā)揮其功能的基因型提供了強(qiáng)有力的論證(稍后討論)。
這些methQTLs也會(huì)影響等位基因特異性甲基化(ASM,參見(jiàn)BOX 1)。在這種情況下,穩(wěn)態(tài)甲基化水平在同一細(xì)胞內(nèi)的兩個(gè)等位基因不同。然而,ASM也可以在沒(méi)有任何特定基因型 - 表觀遺傳型相關(guān)性的情況下發(fā)生。例如,親本印記,X染色體失活和一個(gè)等位基因的隨機(jī)單等位基因甲基化都是ASM的實(shí)例,其不是由甲基化和非甲基化等位基因之間的基礎(chǔ)基因型差異引起的。
最后,還值得考慮的是,在一些情況下,疾病相關(guān)的表觀遺傳變異可能在疾病發(fā)作之前出現(xiàn),但可能不是疾病本身的原因。這種類型的epi現(xiàn)象可能是由于混雜,其中環(huán)境因素(如吸煙)或遺傳變異誘導(dǎo)異常的表觀遺傳狀態(tài)和疾病。
表觀遺傳變異和復(fù)雜疾病之間的這些潛在關(guān)系對(duì)EWAS的設(shè)計(jì)和分析有重要的影響。首先,它們將確定待采樣的最相關(guān)的組織和細(xì)胞類型。第二,反向因果關(guān)系和混雜是EWAS設(shè)計(jì)的特殊問(wèn)題。盡管有相當(dāng)多的證據(jù)表明癌癥中的表觀遺傳干擾4和其他非惡性疾病的新證據(jù)22,23,40-42,但是這些研究都沒(méi)有能夠最終區(qū)分因果性和后果性遺傳變異:長(zhǎng)期以來(lái)被認(rèn)識(shí)的問(wèn)題43 。雖然任何EWAS與疾病的關(guān)聯(lián)都是潛在的進(jìn)步,但是能夠識(shí)別因果關(guān)系的方向?qū)O大地幫助確定表觀遺傳變異的有用性,例如,疾病進(jìn)展的標(biāo)記,通過(guò)治療逆轉(zhuǎn)的目標(biāo)與epi藥物(即,對(duì)epi基因組有影響的藥物),或通過(guò)監(jiān)測(cè)藥物誘導(dǎo)表觀遺傳變化的動(dòng)力學(xué)的藥物反應(yīng)的措施。
分析表觀遺傳變異
支持大規(guī)模GWAS的主要發(fā)展之一是引入強(qiáng)大但可負(fù)擔(dān)的基因分析技術(shù),特別是SNP陣列。只有最近有表觀基因組分析技術(shù)達(dá)到大型EWAS變得可行的階段。為了使這些研究成為可能,標(biāo)記或分子必須是穩(wěn)定的,適合于高通量分析,并且在常規(guī)臨床樣品中容易獲得。自動(dòng)化全基因組譜分析方法也必須可用。目前,DNAm(特別是CpG甲基化)是EWAS最合適的標(biāo)記。其他表觀遺傳標(biāo)記可能與DNAm一樣重要(或更多),但是,在臨床標(biāo)本中既不容易獲得,也不適于高通量加工。此外,在不同的表觀遺傳標(biāo)記之間有許多完善的相關(guān)性,因此分析DNAm可以,雖然間接提供組蛋白修飾狀態(tài)和RNA動(dòng)力學(xué)的信息5。
原則上,基于排序和基于陣列的分析技術(shù)可以用于EWAS。這兩種技術(shù)的最常見(jiàn)的平臺(tái)已被廣泛審查44和獨(dú)立基準(zhǔn)45,46,并在BOX 2中列出。作為這種類型的研究的典型,選擇取決于平衡覆蓋,分辨率,準(zhǔn)確性,特異性,吞吐量和成本47。最終,基于測(cè)序的技術(shù)可能占據(jù)主導(dǎo)地位,但我們認(rèn)為,基于陣列的方法(如用于GWAS的方法)是目前最適合EWAS的方法。如BOX 2所述,有定制和現(xiàn)成平臺(tái)的選項(xiàng),涵蓋上述選擇。
其中,最近發(fā)布的Illumina 450K Infinium Methylation BeadChip似乎是第一波EWAS最有希望的,提供了全基因組覆蓋(> 450K CpG位點(diǎn)),分辨率(單堿基對(duì))和吞吐量(每個(gè)芯片12個(gè)樣本和每次運(yùn)行多達(dá)96個(gè)樣本)。
研究EWAS的設(shè)計(jì)
在本節(jié)中,我們討論EWAS的最有信息的研究設(shè)計(jì),關(guān)于研究主題的類型和解決反向因果關(guān)系的問(wèn)題。圖1示出了所討論的四個(gè)示例的一些優(yōu)點(diǎn)和缺點(diǎn)。
回顧性(病例對(duì)照)。最常用的GWAS設(shè)計(jì)涉及基于其表型招募的不相關(guān)個(gè)體(例如,病例和對(duì)照)。許多病例對(duì)照樣品已經(jīng)可用,在一些情況下具有可以與表觀基因組數(shù)據(jù)整合的基因型和表達(dá)數(shù)據(jù)。然而,回顧性研究不能確定確定的表觀遺傳變異是否歸因于疾病相關(guān)的遺傳差異,疾病后過(guò)程或疾病相關(guān)藥物干預(yù)。使用病例對(duì)照研究來(lái)鑒定表觀遺傳變異和臨床相關(guān)表型之間的關(guān)聯(lián)的早期實(shí)例包括關(guān)于代謝功能障礙48和用他莫西芬治療的研究49。
父子孫對(duì)。這些可用于EWAS,其目的在于鑒定表觀遺傳標(biāo)記的跨代傳播(BOX 3)。最近已經(jīng)證明,喂養(yǎng)F0代雄性小鼠高脂肪或低蛋白飲食從斷奶到交配時(shí)間,結(jié)果F1代后代變化的代謝型胎兒28,50。由于精子將非常少的(如果有的話)細(xì)胞質(zhì)材料傳遞給后代,這些實(shí)施例表明由F0雄性的次優(yōu)飲食誘導(dǎo)的表觀遺傳變異體的跨代傳播。使用親代 - 后代三重體的表觀基因組譜的類似策略可用于人類。例如,如果有證據(jù)表明父親環(huán)境影響后代的表型結(jié)果,可以在后代中進(jìn)行綜合表觀基因組和基因組譜,以鑒定改變的表觀遺傳變異。然后遺傳信息可用于消除遺傳修飾因子引起表觀遺傳變異的可能性。這樣的研究設(shè)計(jì)將需要使用能夠檢測(cè)等位基因特異性差異的分析方法,需要足夠的功率,并需要對(duì)父母環(huán)境暴露的可靠測(cè)量。
單純雙胞胎。與感興趣的疾病無(wú)關(guān)的單純雙胞胎代表了EWAS的有用資源,因?yàn)槿魏我谚b定的疾病相關(guān)的表觀遺傳變異體不能由種系遺傳變異引起32,51。然而,除非雙胞胎縱向招募,這是很少可能的,這些研究不能用于區(qū)分原因和后果的原因前面討論的原因。招募大量不一致的同卵雙胞胎為一個(gè)良好的研究是一個(gè)潛在的問(wèn)題,但一些大型雙資源可用(見(jiàn)更多信息)。
縱向隊(duì)列。縱向隊(duì)列設(shè)計(jì)在最初無(wú)疾病的人(理想地從出生)在多年的過(guò)程中,記錄疾病事件和其他表型變化和采取生物樣品。它們建立起來(lái)是昂貴的,但是許多這樣的研究已經(jīng)在進(jìn)行,其中一些涉及用于EWAS的適當(dāng)?shù)慕M織(參見(jiàn)更多信息)。例如,英國(guó)1946年的出生隊(duì)列52提供了超過(guò)5000個(gè)人的樣本和數(shù)據(jù)(迄今為止)65年。與許多病例對(duì)照設(shè)計(jì)相比,這些研究的兩個(gè)主要優(yōu)點(diǎn)是避免了由于病例和對(duì)照的招募中的差異而導(dǎo)致的混雜以及由于在風(fēng)險(xiǎn)因子的測(cè)量中的病例對(duì)照差異而導(dǎo)致的偏差。縱向研究對(duì)于建立疾病相關(guān)表觀遺傳變異的時(shí)間起源和穩(wěn)定性也是非常有價(jià)值的,從而有助于區(qū)分因果遺傳變異與后果變異。如果還記錄了環(huán)境影響,可以將這些影響與表觀遺傳變化相關(guān)聯(lián)。
縱向疾病不和諧單卵雙胞胎隊(duì)列將傳達(dá)排除遺傳影響疾病相關(guān)的外來(lái)遺傳變異的額外優(yōu)勢(shì),但這種隊(duì)列很少可用于常見(jiàn)疾病的EWAS。以下討論折衷的兩階段研究設(shè)計(jì),其涉及用于發(fā)現(xiàn)階段的疾病不一致的單合子雙胞胎隊(duì)列和用于復(fù)制階段的不同的縱向隊(duì)列。
EWAS的組織選擇
在GWAS中,大多數(shù)組織類型適合于鑒定種系遺傳變異,通常使用從患者血液或血液細(xì)胞衍生的細(xì)胞系中提取的DNA。然而,疾病相關(guān)的表觀遺傳變異可以是組織特異性的。由于大多數(shù)EWAS使用活體個(gè)體,DNA樣品只能從某些來(lái)源容易地獲取,例如血液,頰,唾液,毛囊,尿和糞便。例如,血液和血液亞型與自身免疫性疾病或基于血液的癌癥相關(guān),并且如果表觀遺傳變異體存在于全體范圍內(nèi),則任何組織都將足夠(如果在早期胚胎發(fā)生中在發(fā)育重編程期間誘導(dǎo)的情況) 。然而,對(duì)于許多疾病,需要探索替代的組織來(lái)源。這些可以包括測(cè)定無(wú)細(xì)胞的血清DNA - 包括來(lái)自流入血液的增殖細(xì)胞的DNA(如對(duì)于大多數(shù)癌癥發(fā)生的)或死后DNA,但是如果目的是建立因果關(guān)系,則后者是不太合適的選擇。事實(shí)上,直到表觀基因組譜可以以非侵入性方式(例如,通過(guò)成像技術(shù)53)和/或使用小組織生物體54常規(guī)執(zhí)行,仍然是執(zhí)行有效的挑戰(zhàn)
用于腦基礎(chǔ)和某些其他疾病的EWAS。
另一個(gè)重要問(wèn)題是組織異質(zhì)性。所有組織由多種細(xì)胞類型組成(例如,血液含有> 50種不同的細(xì)胞類型)。如果疾病相關(guān)變異局限于僅代表抽樣組織的一小部分的某種細(xì)胞類型,則可能無(wú)法檢測(cè)到變異。疾病狀態(tài)本身也可以改變組織中細(xì)胞類型的組成(例如,發(fā)炎組織將具有略微不同的細(xì)胞類型與非發(fā)炎組織的組成)。因此,測(cè)量的病例和對(duì)照之間的表觀遺傳學(xué)差異可能僅反映細(xì)胞類型組成的差異,而不是真實(shí)的表觀遺傳學(xué)差異。最后,血斑(或Guthrie)卡是另一個(gè)有價(jià)值的DNA來(lái)源。這些在出生后立即在許多發(fā)達(dá)國(guó)家常規(guī)使用臍帶或腳跟血液。在幾個(gè)國(guó)家已經(jīng)建立了包括DNA和可能的其他組織的生物庫(kù),以及表型信息更多信息)。
EWAS設(shè)計(jì)示例
沒(méi)有一個(gè)適合所有目的的EWA??S設(shè)計(jì);相反,最合適的設(shè)計(jì)取決于所需的結(jié)果。這可以從可以進(jìn)行的許多可能的EWAS設(shè)計(jì)中的兩個(gè)假設(shè)示例的形式來(lái)最好地示出。
疾病風(fēng)險(xiǎn)表觀遺傳標(biāo)記的EWAS。讓我們假設(shè)我們有興趣識(shí)別在自身免疫性疾病發(fā)作之前出現(xiàn)的DNAm變體。我們可以開(kāi)始通過(guò)對(duì)與疾病不一致的單卵雙胞胎進(jìn)行全基因組DNAm分析來(lái)鑒定免疫效應(yīng)細(xì)胞中疾病相關(guān)的MVP(即與疾病相關(guān)的血細(xì)胞亞群),這不是由于遺傳變異。然后我們可以采取這些MVP,并在來(lái)自前瞻性隊(duì)列的相同類型的免疫效應(yīng)細(xì)胞中檢測(cè)它們,以在疾病發(fā)生之前和之后取樣的無(wú)關(guān)個(gè)體中的這些位點(diǎn)處觀察DNAm。可以在疾病發(fā)作之前被驗(yàn)證的任何MVP因而是候選因果變化,并且不能歸因于疾病后效應(yīng),例如長(zhǎng)期藥物或免疫相關(guān)效應(yīng)。主要的隨訪研究可以包括與基因表達(dá)和其他表觀遺傳標(biāo)記的相關(guān)性,以調(diào)查受影響的途徑。總的來(lái)說(shuō),這個(gè)EWAS設(shè)計(jì)結(jié)合了來(lái)自兩個(gè)獨(dú)立隊(duì)列的疾病相關(guān)組織的分析,允許發(fā)現(xiàn)和驗(yàn)證MVP并消除各種混雜因素。
藥物反應(yīng)表觀遺傳標(biāo)記的EWAS。幾個(gè)癌癥研究已確定可能潛在地用于監(jiān)測(cè)疾病進(jìn)展甚至對(duì)治療的反應(yīng)的表觀遺傳變異4。這些變體中的一些通過(guò)測(cè)定由原發(fā)性腫瘤脫落到患者血清中的DNA來(lái)檢測(cè),因此提供相對(duì)直接的評(píng)估進(jìn)展的方法55。 EWAS還可以在藥物治療之前,期間和之后測(cè)量患有特定形式的癌癥的單身病人的血清中的DNAm狀態(tài)。這可能潛在識(shí)別預(yù)測(cè)對(duì)實(shí)時(shí)治療的最佳反應(yīng)的表觀遺傳標(biāo)記。癌癥相關(guān)的表觀遺傳變異體(即遺傳或環(huán)境)的根本原因不需要知道,也不需要直接分析原發(fā)性腫瘤,因?yàn)樵撟儺愺w是進(jìn)展或反應(yīng)的有效量度。
EWAS的統(tǒng)計(jì)考慮
樣本量大小和功效。在2005年,正如GWAS波即將破裂一樣,Wang等人發(fā)表了一篇有影響的評(píng)論,爭(zhēng)論大樣本量來(lái)檢測(cè)小的影響,他們強(qiáng)調(diào)了次要等位基因頻率(MAF)和效應(yīng)大小的作用在確定SNP關(guān)聯(lián)測(cè)試的能力。他們還討論了群體遺傳學(xué)理論的MAF譜的預(yù)測(cè)與群體內(nèi)的SNP以及預(yù)測(cè)效應(yīng)大小分布的(限制的)理論和數(shù)據(jù)。相應(yīng)的論證對(duì)于EWAS來(lái)說(shuō)并不那么引人注目,但是相關(guān)的參數(shù)甚至更難以預(yù)測(cè),因?yàn)閿?shù)據(jù)和相關(guān)理論的缺乏。 DNA等位基因通常不會(huì)跨細(xì)胞變化,并且現(xiàn)在可以以低錯(cuò)誤率進(jìn)行分型。相比之下,甲基化狀態(tài)可以是組織特異性的,并且可以在組織內(nèi)的細(xì)胞,細(xì)胞內(nèi)的等位基因(ASM)以及在罕見(jiàn)的情況下在等位基因內(nèi)的DNA鏈(半甲基化)之間變化。因此,對(duì)于來(lái)自一個(gè)個(gè)體的組織樣品,在CpG位點(diǎn)測(cè)量的甲基化狀態(tài)在0和1之間,因?yàn)樗羌?xì)胞,等位基因和鏈的平均值,并且由測(cè)量誤差進(jìn)一步模糊。在這里,我們使用關(guān)于DNAm變體的頻譜的有限的可用信息,以及它們對(duì)常見(jiàn)疾病的效應(yīng)大小,暫時(shí)提出在三種情況下的功率計(jì)算。目前尚不清楚擬議的情景是多么現(xiàn)實(shí),但我們希望至少能夠刺激對(duì)EWAS設(shè)計(jì)的這一重要方面的進(jìn)一步討論和調(diào)查。
最近的甲基化分析報(bào)道,平均68%的CpG位點(diǎn)在人外周血單核細(xì)胞中甲基化57。在基因組上下文中存在巨大差異:高CpG密度區(qū)域中的CpG位點(diǎn)幾乎總是未甲基化的,CGI和5'-UTR也是如此。相比之下,3'-UTR,內(nèi)含子和重復(fù)元件主要是甲基化的。 ASM的速率估計(jì)在0.3%和0.6%之間(大于單獨(dú)印記的比率)。發(fā)現(xiàn)半甲基化是罕見(jiàn)的(<0.2%,其包括非CpG甲基化和不完全的bisulphite轉(zhuǎn)化)。甲基化譜不對(duì)稱:幾乎沒(méi)有接近100%甲基化的位點(diǎn),但幾乎完全未甲基化的位點(diǎn)并不罕見(jiàn)。
在圖1在圖2a,b中,三種不同類別的個(gè)體('甲基化','中間'和'非甲基化')的假設(shè)甲基化譜已經(jīng)組合以在病例和對(duì)照中產(chǎn)生總頻率譜。這些形成了表1中報(bào)道的功效模擬的基礎(chǔ)。病例和對(duì)照之間的平均甲基化率的差異提供了效應(yīng)大小的流行概述,但它不反映甲基化譜的差異或其他特征的差異。它也不反映甲基化率的相對(duì)量級(jí),而如果對(duì)照中罕見(jiàn)的表觀基因型在病例中幾乎不存在,則這可能比更常見(jiàn)的表觀基因型的平均率的相同差異更重要。
賠率比率是二元表型的遺傳效應(yīng)大小的公認(rèn)的度量。如果我們認(rèn)為病例(或?qū)φ眨┲心硞€(gè)位點(diǎn)的平均甲基化率代表在病例(或?qū)φ眨┙M織樣本中隨機(jī)選擇的DNA鏈的甲基化概率,則我們可以計(jì)算甲基化優(yōu)勢(shì)比(methor) 。該methOR與普通優(yōu)勢(shì)比相同,除了采樣單元是DNA鏈而不是個(gè)體。因此,methOR是來(lái)自待甲基化的隨機(jī)病例的組織樣品中的隨機(jī)DNA鏈的可能性,除以對(duì)照的相同幾率。這提供了結(jié)合相對(duì)幅度的效應(yīng)大小的測(cè)量,但是,與速率的平均差異一樣,它也不允許甲基化譜的特征(例如其方差)的情況和對(duì)照之間的差異。至于其他比值比,methOR在前瞻性和回顧性研究中是可比的,其價(jià)值僅衡量關(guān)聯(lián),并不暗示因果關(guān)系。
表1給出了來(lái)自圖1的三組甲基化譜的基于模擬的功率估計(jì)。 2.他們有類似的甲基化,雖然病例對(duì)照差異的平均甲基化率是相同的a和b,但不是c。 a和b之間的功率值不同的事實(shí)強(qiáng)調(diào)了沒(méi)有效應(yīng)大小的單數(shù)量度,因?yàn)楣β嗜Q于病例和對(duì)照中的整個(gè)甲基化譜。然而,對(duì)于在我們的模擬中進(jìn)行的邏輯回歸分析,methOR給出了比速率差異更好的功率指導(dǎo)。當(dāng)methOR為1.25左右時(shí),800個(gè)病例+ 800個(gè)對(duì)照的樣本量足以在情景c而不是a或b時(shí)在α= 10-6的顯著性水平下實(shí)現(xiàn)80%的功率(參見(jiàn)下一節(jié)討論基因組EWAS的廣泛意義)。當(dāng)methOR為約1.5時(shí),400 + 400的樣本大小對(duì)于b和c而不是α在α= 10-6處給出80%的功率。
目前對(duì)于涉及疾病的表觀遺傳變異體的甲基化譜的實(shí)際差異知之甚少,并且關(guān)于樣本大小的建議將需要與新出現(xiàn)的數(shù)據(jù)一起演變。最近關(guān)于吸煙對(duì)甲基化的影響的報(bào)告58鑒定了位于凝血因子II(凝血酶)受體樣3(F2RL3)中的CpG位點(diǎn)處的一個(gè)強(qiáng)締合,其中中值甲基化率為95%,從未吸煙, 83%為重度吸煙者,給出12%的差異和methOR = 2.7。甲基化狀態(tài)在從未吸煙的人中比在重吸煙者(四分位數(shù)范圍分別為0.94-0.96和0.78-0.88)不太可變。對(duì)于這樣強(qiáng)烈的影響,65名重度吸煙者和56名非吸煙者的樣本量足以檢測(cè)這種關(guān)聯(lián)。然而,已知吸煙是健康的最重要的環(huán)境因素之一,因此感興趣的其他效應(yīng)大小可能小得多。如果我們將1.5作為目標(biāo)methOR值,那么追求具有少于400個(gè)案例和400個(gè)控制的EWAS似乎不具有成本效益,其中800個(gè)將優(yōu)選實(shí)現(xiàn)良好的權(quán)力。這遠(yuǎn)遠(yuǎn)小于2000案例和控制,這成為威康信托案例控制聯(lián)盟(WTCCC)研究59后GWAS的事實(shí)上的標(biāo)準(zhǔn)最低樣本量,反映了EWAS和GWAS的效應(yīng)大小不能直接比較的事實(shí)。似乎可能的是,效應(yīng)大小和因此功率將根據(jù)基因組背景顯著變化,在這種情況下,P值的全基因組排序不令人滿意60和考慮功率的貝葉斯支持措施更合適。然而,目前仍有一些信息用于通知貝葉斯效應(yīng)大小的先前分布。