機器學習識別與潛在發(fā)病機制相關的骨質疏松癥代謝相關因素

Typing characteristics of metabolism-related genes in osteoporosis

骨質疏松癥中的代謝相關基因的類型特征

發(fā)表期刊:Front Pharmacol

發(fā)表日期:2022 Sep 15

影響因子:5.988

DOI:? 10.3389/fphar.2022.999157

一、研究背景

????????骨質疏松癥是一種全身性的代謝性骨病,發(fā)病率不斷上升。它的特點是骨量減少,骨的微觀結構惡化,骨脆性和骨折的風險增加。骨質疏松癥主要表現(xiàn)為骨質疏松性骨折,包括身體不同部位的骨折,尤其是髖部骨折。

????????人類包括多種生物,如動物,主要通過碳水化合物、脂肪和蛋白質來攝取潛在的能量,但也有涉及幾種酶的特定生化級聯(lián)進行分解。在生理上,許多代謝途徑中的基因和路徑對許多細胞的代謝功能至關重要。因此,這些基因和途徑的失調(diào)或失衡會導致細胞功能紊亂和各種代謝性疾病。盡管有大量證據(jù)表明骨病和代謝紊亂之間可能存在聯(lián)系,但這些代謝網(wǎng)絡中的具體參與者和分子相互作用仍然不清楚。同時,組學技術促進了對各種臨床疾病的分子變化的開發(fā)和探索。同時,利用基因組學、轉錄組學、蛋白質組學和代謝組學等多組學技術,是促進臨床疾病正確治療的關鍵。

二、材料與方法

1、數(shù)據(jù)來源

1) 以 "osteoporosis "和 "Homo sapiens "為關鍵詞:GSE56814(42個正常和31個骨質疏松癥樣本)、GSE56815(40個正常和30個骨質疏松癥樣本)、GSE35959(9個正常和5個骨質疏松癥樣本)和GSE7429(10個正常和10個骨質疏松癥樣本);GSE35959和GSE7429微陣列數(shù)據(jù)被用作外部驗證數(shù)據(jù)集

2) 以前的研究已經(jīng)確定了2752個代謝相關的基因,編碼所有已知的人類代謝酶和轉運器

2 、分析流程

1) 聚類分析:使用集合相似性網(wǎng)絡融合和共識聚類算法(SNF-CC)來觀察骨質疏松癥患者的基因表達模式和聚類識別;根據(jù)聚類結果繪制多組學熱圖,并用于從多組學數(shù)據(jù)中識別、驗證和可視化分子疾病亞型

2) 新陳代謝相關的骨質疏松癥亞型的差異性基因表達譜:R語言limma包進行亞型之間的基因比較分析,并使用Venn diagram方法得出共同的代表性DEGs

3) 通路富集分析和蛋白質圖譜的可視化:基因富集;使用Proteomaps將差異分析中的蛋白質數(shù)據(jù)可視化

4) 篩選與骨質疏松癥代謝相關的特征基因:利用排名靠前的mrmr基因構建了一個SVM分類器,并應用增量特征選擇(IFS)方法來確定作為特征基因的最佳數(shù)量

5) 特征基因表達的數(shù)據(jù)驗證:驗證特征基因的表達情況,并通過繪制小提琴圖將數(shù)據(jù)可視化

6) 免疫相關物分析:xCell

流程圖

三、實驗結果

01 - 骨質疏松癥亞型的差異性基因表達譜

????????作者從Gene Expression Omnibus(GEO)數(shù)據(jù)庫下載了骨質疏松癥患者的基因表達和臨床數(shù)據(jù),包括GSE56814、GSE56815、GSE35959和GSE7429。首先,對GSE56814和GSE56815數(shù)據(jù)集的表達譜進行主成分分析,揭示基因表達數(shù)據(jù),如圖2A,B所示。其次,通過整合相似性網(wǎng)絡融合和共識聚類算法(SNF-CC),在骨質疏松癥患者隊列中計算CPI(藍線)和差距統(tǒng)計(紅線),確定了最佳的聚類數(shù)量。其中,當k=3時,共識矩陣熱圖仍能保持清晰明確的邊界,說明樣本的聚類是穩(wěn)定和穩(wěn)健的(圖2C)。將這三種骨質疏松癥亞型定義為C1、C2和C3。最后,通過主成分分析確定了三種骨質疏松癥亞型,如圖2D所示。

圖2

????????此外,作者用代謝基因熱圖繪制了代謝途徑,顯示高BMD(中位絕對偏差)組與C1亞型聚在一起,低BMD組與C3亞型聚在一起(圖3A),繪制了不同BMDS之間三種亞型的百分比條形圖。其中,C1亞型在高BMD骨質疏松癥患者中占較高比例,C3亞型在低BMD骨質疏松癥患者中占較高比例,C2亞型在不同BMD骨質疏松癥患者中占類似比例。如圖3B所示,使用R語言limma包進行亞型之間的基因差異分析,并繪制維恩圖以確定每個亞型的代表性基因,其中1501個在三個亞型之間共享。同時,對于不同的亞型C1、C2和C3,分別確定了1351、8和158個差異表達的基因(圖3C),并繪制了火山圖。

圖3 每個亞型的代表基因

02 - 代謝相關差異基因的多組學富集圖譜

????????為了可視化不同亞組的特征基因的富集信息的差異,并利用其他生物信息學工具確認富集分析中得到的結果,作者將三個亞組的特征基因分別上傳到網(wǎng)絡上的互動軟件proteomaps。在創(chuàng)建的蛋白圖可視化矩形中,整個區(qū)域被劃分為代表頂級類別的彩色編碼多邊形,頂級類別區(qū)域又被細分為疾病區(qū)域亞類、功能相關蛋白共享共同區(qū)域亞類和相關基因共享共同區(qū)域亞類,如圖4所示。C1亞型在代謝方面關于生物合成、氨基酸代謝、脂質和類固醇代謝的富集,主要蛋白是K00718,主要基因是FUT。C2亞型在中央碳代謝、糖酵解途徑、K00002蛋白、基因AKR1A1方面代謝豐富。C3亞型代謝富集于多糖的生物合成、糖代謝途徑,主要蛋白為k07968、k01197、k03909,主要基因為B4GALT3、HYAL2、TFPI。

圖4 蛋白質圖譜途徑分析圖

03 - 骨質疏松癥中代謝相關基因的篩選和差異性表達

????????作者可視化了不同骨質疏松癥亞型的差異基因,如圖5A所示。根據(jù)篩選出的前160個mRMR基因,通過構建100個SVM分類器并應用增量特征選擇(IFS)方法來確定作為特征基因的最佳數(shù)量,如圖5B所示。當基因數(shù)量為10個時,MCC峰值為0.386,這10個基因被認為是與骨質疏松癥的代謝有關的特征基因,包括GPR31、GATM、DDB2、ARMCX1、RPS6、BTBD3、ADAMTSL4、COQ6、B3GNT2和CD9。隨后,根據(jù)10個候選基因在不同的骨質疏松癥亞型中的表達情況繪制了可視化的小提琴圖。GPR31、DDB2、RPS6、ADAMTSL4和COQ6在C1和C2亞型中表達,C1>C2。GATM、ARMCX1、BTBD3、B3GNT2和CD9在C1和C2亞型中表達,C1<C2。在C2和C3亞型中GATM和ARMCX1的表達,C2>C3。ADAMTSL4和COQ6在C2和C3亞型中表達,C2<C3。有趣的是,在C1與C3的比較中沒有統(tǒng)計學意義,如圖5C所示。

圖5

04 - 特征基因表達數(shù)據(jù)的驗證

????????根據(jù)GSE35959和GSE7429數(shù)據(jù)集中GPR31、GATM、DDB2、ARMCX1、RPS6、BTBD3、ADAMTSL4、COQ6、B3GNT2和CD9基因表達情況,我們繪制了小提琴圖進行數(shù)據(jù)可視化的表達驗證。其中,在綜合數(shù)據(jù)中GPR31的表達,高BMD<低BMD,如圖6A所示。GPR31在GSE7429數(shù)據(jù)中表達,高BMD>低BMD,DDB2在GSE7429數(shù)據(jù)中表達,高BMD>低BMD,如圖6B所示。在GSE35959數(shù)據(jù)中GPR31和DDB2表達,正常組<骨質疏松組,而ARMCX1和ADAMTSL4在GSE35959數(shù)據(jù)中表達,正常組>骨質疏松組,如圖6C所示。

圖6 表達式差異的小提琴圖

05 - 免疫相關因素分析

????????最后,用xCell來推斷64種免疫和基質細胞類型的GPR31、GATM、DDB2、ARMCX1、RPS6、BTBD3、ADAMTSL4、COQ6、B3GNT2和CD9基因。如相關圖所示,這些細胞分別由16、15、14、10、17、13、27、19和24個代表細胞組成。每個基因的代表細胞主要包括NKT(自然殺傷性T細胞)、iDC(不成熟樹突狀細胞);CLP(普通淋巴祖細胞)、cDC(Xonventional樹突狀細胞);Th1細胞(1型T輔助細胞)、漿細胞、CD4 Tem(CD4效應記憶T細胞)、類開關記憶B細胞;肥大細胞、巨噬細胞M2。CD8 T細胞,B細胞;mv內(nèi)皮細胞(微血管內(nèi)皮細胞);類開關記憶B細胞,NKT(自然殺傷T細胞);Th1細胞(1型T輔助細胞),CD4 Tem(CD4效應記憶T細胞);成纖維細胞,嗜堿性細胞,MSC(間充質干細胞);血小板,巨核細胞,HSC(造血干細胞),如圖7所示。

圖7 免疫和基質細胞組成的相關圖

四、結論

????????基于對骨質疏松癥患者基因表達的聚類分析和機器學習,作者確定了不同的代謝相關亞型和骨質疏松癥的特征基因,這將有助于為骨質疏松癥的代謝相關發(fā)病機制提供新思路,為后續(xù)研究提供新方向。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內(nèi)容