今天繼續給大家分享2020年11月4日在3區《DNA and Cell Biology》(IF=3.191)刊登的一篇生信分析在肝癌研究應用的文章,文章標題:Bioinformatic Analysis to Identify a Multi-mRNA Signature for the Prediction of Metastasis in Hepatocellular Carcinoma
研究背景
肝細胞性肝癌HCC是肝癌的主要組織學亞型,占原發性肝癌的90%,是全世界癌癥相關死亡率的第三大常見原因。遺傳、表觀遺傳改變、慢性乙型肝炎、丙型肝炎病毒感染、黃曲霉毒素暴露、吸煙、肥胖和糖尿病等是肝癌的主要危險因素。肝癌預后差的原因是復發率和轉移率高。所以這篇論文的作者采用了生信分析方法構建一個分子模型以篩選出更準確預測HCC患者的腫瘤轉移風險。
給大家看一幅早期HCC的真實照片
A&D:MRI的照片;B:超聲照片;C:CT照片
Holzwanger DJ, Madoff DC. Role of interventional radiology in the management of hepatocellular carcinoma: current status. Chin Clin Oncol. 2018 Oct;7(5):49. doi: 10.21037/cco.2018.07.04. Epub 2018 Aug 7.
HCC的臨床分期
數據來源
1.GEO數據庫中獲取包含1035個患者的GSE14520、GSE54236、GSE36376三個數據集。
2.選取GSE85680數據集分析血清外泌體的基因表達情況。
3.選取GSE36076數據集分析外周血單核細胞的基因表達情況。
研究思路
1.從公開數據庫中獲取HCC相關的數據集,準備做數據分析。
2.做差異表達分析和基因共表達網絡分析
3.做LASSO Cox回歸模型
4.風險評分模型的驗證
5.hubgene的功能富集分析和蛋白互作網絡的構建
6.用SPSS軟件做統計學分析,P值小于0.05則具有顯著性差異。
研究結果
1.鑒定轉移性HCC相關的DEGs
作者用了GER2R網絡工具從GSE14520、GSE54236、GSE36376數據集鑒定DEGs。接著用WGCNA方法對GSE14520進行分析,結果發現共有8個基因模塊明顯地跟轉移性HCC有相關性。最后把245個上調基因和97個下調基因鑒定出來并做進一步分析鑒定。
2.構建轉移性HCC的mRNA分子識別標志
作者用那342個具有相似生物學作用的DEGs從GSE14520數據集中構建出能有效預測HCC metastasis的mRNA signatures。作者把221個患者的基因分類為高表達和低表達。P<0.25和AUC>0.55范圍內選出候選mRNA并構建LASSO的Cox模型。分析的基因包括糖蛋白GYG1、TNF受體超家族成員TNFRSF21等等。
3. 27個mRNA signature的GSEA和PPI網絡
為了鑒定27個mRNA signature的生物學功能,作者進行基因富集分析。大多數基因參與外泌體和有膜的細胞器的形成以及參與代謝、轉運和氧化還原反應,也跟HCC metastasis
過程有著密切關系。接下來,作者用STRING數據庫構建PPI網絡,分析27個mRNA標志分子的潛在關系。結果發現每個標志分子都緊密相連著,它們都位于關鍵的節上。當中三個基因SOX4、SLC25A20、TNFRSF21在外周血單核細胞中差異表達。
文章的主要亮點
-作者自己構建了綜合性多個mRNA識別標志作為預測早期轉移性HCC的模型。
-作者他們分析的27個mRNA基因,發現全部都富集在外泌體、膜界細胞器和電子載體,還參與到轉運和代謝生物學過程中。
-作者用WGCNA和LASSO方法篩選出的基因都參與了腫瘤形成過程,跟HCC轉移有關。
文章的不足之處
--文章中的基因轉錄數據只是用RNA測序完成的,而非定量RT-PCR。因為RNA測序不需要用內參基因。
--文章的數據都是來自于網絡上公開數據庫,有些關鍵的臨床病理特征是找不到的,這可能限制了mRNA識別標志的應用。
--這篇研究論文也沒有用臨床樣本做過驗證。所以在下一步研究需要用臨床樣本以能確認這些分子標志具有預測HCC轉移的價值。
文章的研究結論
總體而言,文章作者通過網絡數據庫,構建出一個能預測HCC轉移的模型。另,這27個基因面板可以用于尋找共調控miRNA網絡以及預測轉移性HCC的分子標志物。因此作者這項研究能在臨床上進一步幫助改進高轉移性HCC患者的個性化治療策略。
今日分享到此結束,如果有朋友對生信工具不太熟悉,趕緊點贊,跟著我們一起學習吧~?
我們時刻都在努力學習,這樣可以帶給你更多幫助!