生物信息學聯和孟德爾隨機化(Mendelian Randomization,MR)是一種最新流行的研究方法,結合了生物信息學和遺傳學的優勢,旨在深入探究單個遺傳風險評分(Genetic Risk Score,GRS)或特定基因型與多種表型之間的潛在聯系。生物信息學聯和孟德爾隨機化的結合,可以被視為孟德爾隨機化研究的一種更加完善的形式。它充分利用生物信息學技術,如基因組學、轉錄組學和蛋白質組學,以分析基因型和表型之間的潛在因果關系。這一方法為我們提供了一種強大的工具,可以幫助解決復雜的生物醫學問題。在生物信息學聯和孟德爾隨機化中,研究者可以利用遺傳變異作為自然隨機化實驗的工具,從而評估特定基因型對不同表型的影響。通過合理的數據分析和統計建模,研究人員可以得出關于基因型與健康或疾病之間因果關系的結論。這種方法不僅有助于理解遺傳和疾病之間的關系,還為精準醫學的發展提供了寶貴的線索。盡管在國內尚未嶄露頭角,但這一研究領域前景廣闊,擁有巨大的潛力。
孟德爾隨機化聯和生物信息學分析的優勢所在:
01
全面性分析:孟德爾隨機化聯和生物信息學分析結合了遺傳學、基因組學、表觀遺傳學、代謝組學等多個層面的數據,使得研究更為全面。這有助于全面了解生物系統的運作方式,包括基因與表型之間的關系。
02
高效性與大規模分析:生物信息學工具和方法的發展使得大規模數據的高效處理成為可能。孟德爾隨機化聯合生物信息學分析可以同時處理數百至數千個樣本和基因,從而加速研究進程,提高數據的可靠性。
03
發掘潛在基因關聯:孟德爾隨機化聯和生物信息學可以幫助鑒別基因與表型之間的因果關系,而非僅僅是關聯。這有助于找到真正對生物學過程和疾病發病機制有影響的基因。
04
探索表觀遺傳學:該方法還允許分析表觀遺傳學的角色,包括DNA甲基化、組蛋白修飾等,這些因素在基因調控中起關鍵作用。
05
數據整合與交互作用:孟德爾隨機化聯和生物信息學分析有助于整合不同數據類型,如基因表達數據、SNP數據、DNA甲基化數據,揭示它們之間的交互作用和如何影響生物表型。
06
預測治療靶點:通過深入了解基因與疾病之間的關系,該方法有望幫助識別新的治療靶點,推動個體化醫學的發展。
下面為大家分享一篇1區高分文獻“氧化應激基因表達、DNA甲基化和腸道微生物區系相互作用引發克羅恩病:一項多組學孟德爾隨機研究”
克羅恩病(CD)是一種慢性復發性炎癥性腸病,主要影響胃腸道,常伴隨腸外表現和肛周疾病。盡管CD的確切病因尚不為人明了,但研究表明它可能涉及多種因素的復雜相互作用,包括遺傳變異、環境因素、免疫功能障礙以及腸道微生物區系的參與。
其中,氧化應激(OS)被認為在CD的多因素病理生理過程中扮演重要角色。氧化應激是指氧化劑和抗氧化劑之間的失衡,與CD的發展密切相關。多個與氧化應激相關的基因,如NOS2A、NOX1和DUOX2,已被發現參與CD的發病機制。這些基因的過度表達與腸道屏障受損、微生物失調和細菌入侵有關,突顯了宿主氧化應激信號與腸道微生物區系之間的緊密聯系。
盡管有越來越多的研究表明CD中存在與氧化應激相關的基因,但目前仍未全面確定它們與CD之間的潛在因果關系。為了更深入地了解這一問題,研究者采用了多組學整合方法,如孟德爾隨機化(MR),以確定CD治療靶點的關鍵調控因子,包括血液中基因表達介導的因果變量。這一研究提出了一項基于多組學的孟德爾隨機化研究,旨在確定CD中氧化應激相關基因在血液和腸道組織中的可能因果效應和分子機制。此外,研究還進行了敏感性分析和部分復制,以確保結果的可靠性和一致性。這一研究有望為CD的治療和預防提供新的見解和方向。
研究方法
研究設計和數據來源如下:
從GeneCards數據庫提取與氧化應激(OS)相關的基因,使用關鍵詞“氧化應激”,并根據先前方法中的相關評分≥7分。
從Gene Expression Omnibus(GEO)數據庫獲得6個公開的腸道活檢的轉錄組數據集,包括克羅恩病(CD)患者和健康對照(HC),進行薈萃分析以確定CD中與OS相關的差異表達基因(DEGs)。
CD的遺傳關聯研究(GWAS)匯總統計數據來自兩個獨立的炎癥性腸病(IBD)GWAS的薈萃分析,包括歐洲人群中的12,194例CD患者和28,072例HC樣本。
從eQTLGen中獲得了血液中與OS相關基因的eQTL匯總統計數據,包括來自37個數據集的31,684例個體的血液基因表達遺傳數據。
血液中的mQTL匯總數據來自布里斯班系統遺傳學研究(n = 614)和洛錫安出生隊列(n = 1366)的薈萃分析。
腸道中的eQTL數據來自基因型組織表達(GTEx)項目(n = 860)和1000IBD隊列(n = 299),專注于距離基因起始和末端1 mb內的cis-eQTL和cis-mQTL。
糞便中的mbQTL數據來自荷蘭微生物組項目(DMP)研究,包括7738名個體的數據,以評估宿主遺傳對腸道微生物群的影響。
為了進行外部驗證,招募了46名治療未經驗的CD患者和44名HC受試者,收集腸道活檢和糞便標本,并進行RNA測序和shotgun宏基因組測序。
統計分析包括:
使用線性回歸模型對CD和HC患者之間與OS相關的DEGs進行Meta分析,同時進行年齡、性別、體重指數和用藥情況的調整。對腸道DEGs分別進行分析,并使用Metafor R包進行固定效應薈萃分析。對腸道cis-eQTL和cis-mQTL進行Meta分析,使用SMR和共定位分析來檢測SNPs對表型的影響是否由基因表達、DNA甲基化和腸道微生物區系等分子特征介導。使用MR方法進行敏感性分析,以檢測個體因果效應的異質性。共定位分析評估腸道基因表達和微生物區系之間的潛在相互作用,并使用COLOCC R包確定共同因果變異。
重復性分析包括:
從Meta分析中選擇顯著的DEG結果來檢驗CD患者和HC對照組之間的關系。評估腸道基因表達與途徑相關微生物分類群豐度之間的相關性。細胞類型特定的富集物和調節元件分析使用CSEA-DB和eFORGE進行,以研究腸道DEGs是否對特定細胞類型具有特異性。
分析結果
1.Meta分析的基本情況:
研究目的是了解氧化應激相關基因在CD中的作用。共納入6個基因表達數據集(3個微陣列數據集和3個RNA-seq數據集),比較了CD(704例)和HCS(212例)患者的腸道組織中的RNA表達。
2.鑒定與氧化應激相關的差異表達基因(DEGs):
下載了817個相關性分數為≥7的與氧化應激相關的基因。通過Meta分析,鑒定出438個DEGs在CD組織和對照組織中差異表達。
CD和HCS患者之間六個腸道基因表達數據集的Meta分析。總體而言,在所有6個腸道轉錄組數據中出現的817個基因中,有708個基因被評估為CD患者和HCS患者之間的表達差異。火山曲線圖顯示了x軸上的Meta Effect大小,而y軸上顯示了?log10變換后的Meta P值。紅點是438個顯著差異表達基因(Deg),灰點代表非顯著表達基因。虛線表示經基因測試次數校正后FDR<0.05的顯著閾值。使用B細胞類型特異性濃縮分析數據庫來研究腸道DEGS是否是小腸和結腸中任何細胞類型所特有的。X軸表示來源于腸道組織和血液的細胞類型。圓點代表77種小腸和結腸細胞類型,由23種一般分類按重要性降序標注。虛線是FDR<0.05的顯著閾值。
3.針對DEGs進行細胞類型特異性表達分析(CSEA):
指出與氧化應激相關的DEGs在腸道細胞中顯著豐富。暗示上皮細胞在調節腸道氧化應激和維持黏膜內環境穩定中的重要作用。
4.尋找候選致病基因:
認為在CD和HCS患者中觀察到如此數量的DEGs可能解釋了疾病的合理因果關系。目標是尋找CD的候選致病基因,并探索其在血液中基因調控的潛在表觀遺傳學機制。
5.遺傳調控分析:
使用三步SMR方法,整合了與CD相關的SNP數據、DEGs、eQTL和mQTL數據,鑒定了與CD相關的候選致病基因。發現與STAT3、GPX3、MUC1、CD40、Park7、PRKAB1和NDUFS1等基因的表達和遺傳調控有關。
三步SMR分析利用血液組織對CD的假定原因OS基因和機制進行了優先排序。眾所周知的和新的CD-原因OS基因的例子。A,C位點縮放圖顯示了CDGWA3、cis-mQTL和cis-eQTL在STAT3和GPX3附近的一致遺傳效應(從上到下,最小P<1×10?5)。B、D三步SMR提示基因表達與甲基化介導的CD發病有顯著因果關系(均<0.05,Heidi檢驗P>0.05)。從左到右:基因表達與CD GWAs之間的SMR,基因甲基化與CD GWAs之間的SMR,基因甲基化與表達之間的SMR
6.基因-微生物區系相互作用分析:
進一步研究腸道OS基因的作用,包括MUC1、CD40、PRKAB1等基因在腸道微生物區系中的相互作用。提出MUC1的遺傳變異可能會影響其基因表達和微生物區系代謝產物的產生,增加CD的風險。CD40和PRKAB1也被認為在免疫相關和微生物區系代謝中起作用。
SMR和共定位分析了CD中腸道原因OS基因的優先順序以及與腸道微生物途徑的相互作用。左側方框顯示基因表達與CD GAs之間的SMR(均為SMR FDR<0.05;Heidi檢驗P>0.05),右側方框通過共定位分析顯示cis-eQTL和mBQTL之間的位置比較(均PPH4>0.5)。R2值表示變異體和頂部SNP之間的連鎖不平衡(LD)。A-C分別為MUC1、CD40和PRKAB1基因。
7.驗證研究:
在獨立的樣本中驗證了Meta分析的DEG結果,發現在CD中這些基因的表達發生了強烈的變化。
外部隊列驗證。中山大學第一附屬醫院(FAH-SYS)的隊列,包括腸道總RNA-SEQ和糞便元基因組學數據,納入驗證分析。Meta分析發現CD和HC的差異表達基因共有388個(88.79%),兩者變化一致(Spearman等級相關系數r_s=0.84,P=2.2×10~(?)23)。X軸和y軸分別表示從Meta分析和FAH-sys隊列估計的Z分數。黃點代表388個一致的DEG,而灰點代表未驗證的。分別對DEGS、與途徑相關的分類群以及分類群與基因表達之間的關聯進行B-D驗證(從左到右)。從上到下的面板分別是MUC1、PRKAB1和CD40基因。PWY.7237、P164.PWY和PWY.5101中可能涉及的分類群選自MetaCyc數據庫注釋。
文章小結
在這項研究中,作者采用了多種數據來源和分析方法來深入研究與氧化應激(OS)相關的基因在克羅恩病(CD)中的作用。首先,從GeneCards數據庫提取了與OS相關的基因,并使用基因表達總表(GEO)數據庫獲取包括CD患者和健康對照的腸道活檢組織的轉錄組數據。還得出了CD的遺傳關聯研究(GWAS)匯總統計數據,以及血液和腸道組織的基因表達和甲基化數據。此外還從現場招募了CD患者和健康對照,進行了RNA測序和元基因組測序。
在統計分析方面,使用線性回歸模型對CD患者和健康對照之間的腸道差異表達基因(DEG)進行Meta分析,考慮了年齡、性別、體重指數和用藥情況的調整。還對腸道cis-eQTL和cis-mQTL進行Meta分析,使用SMR和共定位分析來檢測SNPs對表型的影響是否由基因表達、DNA甲基化和腸道微生物區系等分子特征介導。此外,進行了敏感性分析,以檢測個體因果效應的異質性。
在共定位分析方面,評估了腸道基因表達和微生物區系之間的相互作用,并使用COLOCC R包來確定共同因果變異。最后,進行了重復性分析,選擇了Meta分析中顯著的DEG結果來檢驗CD患者和健康對照組之間的關系,并評估腸道基因表達與途徑相關微生物分類群豐度之間的相關性。還進行了細胞類型和調節元件分析,以研究腸道DEG是否對特定細胞類型具有特異性,并評估DNA甲基化位點的監管簽名濃縮。這一綜合性研究有望為CD的機制提供新的見解和治療靶點。