中國人是否對新冠病毒更易感? 包含幾大數據庫揭示
轉載大師???2020年2月19日 pm3:12???研究進展???閱讀 350
中國人是否對新冠病毒更易感?
作者:陳瑛、單科家
太長不看版:目前并沒有證據支持東亞人對新冠病毒更易感這一觀點
具體解讀
截止2020年2月19日7點中國的新型冠狀病毒肺炎(COVID-19)確診患者累計已經超過7萬4千例,但影響新冠病毒(SARS-CoV-2)易感性的人口學因素仍不清楚。由于非典和新冠肺炎都爆發于中國,部分學者提出了東亞人更容易感染這兩種冠狀病毒的觀點。SARS-CoV和SARS-CoV-2刺突蛋白與細胞膜蛋白ACE2有較強的結合能力,后者是這兩個病毒進入細胞的唯一已知受體。中國科學院遺傳與發育生物學研究所錢文峰課題組的博士后陳瑛與博士生單科家通過比較不同年齡、性別和種族人群中ACE2的表達水平和遺傳多態性,嘗試尋找SARS-CoV和SARS-CoV-2的潛在易感人群。相關文章于2月18日放置于學術預印本網站preprints.org上,題目為“Asians and Other Races Express Similar Levels of and Share the Same Genetic Polymorphisms of the SARS-CoV-2 Cell-Entry Receptor”。
閱讀原文:https://www.preprints.org/manuscript/202002.0258/v1
如何尋找ACE2差異表達的人口學影響因素?
作為生物大數據分析背景的研究者,我們首先產生了兩個思路:
第一個思路是利用The Genotype-Tissue Expression Project(GTEx,基因型-組織表達研究計劃)建立的數據庫直接尋找答案。GTEx數據庫收錄了上百個人類個體多種組織的轉錄組數據(樣品提供者生前已同意將這些樣品在死后用于相關的科學研究)。我們可以通過該數據直接判斷ACE2是否在亞洲人的肺部表達更高。然而,盡管GTEx項目收集了500多個肺轉錄組,但是其中來自亞洲人的樣品極少(~1%,見下圖),不適合回答我們的科學問題。
(來自https://gtexportal.org/home/tissueSummaryPage)
我們的第二個思路是聯用GTEx項目和The 1000 Genomes Project(1KGP,千人基因組計劃)的數據開展研究。GTEx項目通過全基因組關聯分析已經找到了大量決定某個基因在特定組織表達水平的位點 (eQTL,簡而言之,可以根據該位點的DNA序列判斷某個基因在特定組織的表達水平);而1KGP則收集了來自于26個分布于全球的各個種族人群的2504個個體的基因型數據(見下圖)。
(來自https://www.internationalgenome.org/home)
通過聯用GTEx和1KGP,我們可以首先查看GTEx中鑒定到的ACE2在肺部表達的eQTL,然后分析這些eQTL在1KGP中不同人群間的分布狀態,進而推測ACE2在不同人群肺部的表達水平。然而,盡管GTEx鑒定出了一系列ACE2的eQTL(見下圖),絕大多數都在神經系統,沒有一個是決定該基因在肺部表達水平的。
(來自https://gtexportal.org/home/gene/ACE2#eQTLBlock)
既然以上兩種思路都行不通,我們開始考慮使用The cancer genome atlas(TCGA, 癌癥基因組圖譜項目)中的數據作為替代方案。
如何使用癌癥基因組學數據鑒定ACE2差異表達的人口學影響因素?
TCGA中收錄了594例的肺腺癌患者以及551例的肺鱗癌患者的肺部樣品。前期研究顯示肺腺癌可能與SARS-CoV與SARS-CoV-2侵染的肺細胞類型關系更為密切,而且ACE2也確實在肺腺癌樣品中表達水平更高,因此我們接下來的研究也集中于肺腺癌樣本。這些肺腺癌患者有著不同的年齡、性別和種族,潛在可以用于研究ACE2在肺部表達水平的人口學相關因素。
然而特別值得注意的是,如果ACE2表達本身受到癌癥發生的影響,則TCGA數據顯然不可以用來研究健康人群ACE2的表達。為此我們比較了這些患者的腫瘤組織和正常肺組織(癌旁組織)中ACE2基因的表達水平,發現二者并無顯著差別(下圖A)。另外,ACE2的表達水平既不影響肺腺癌患者的生存概率(下圖B),也不隨癌癥的發展而顯著變化(下圖C)。這些結果說明已有的海量癌癥轉錄組數據可以用來研究影響ACE2表達水平的人口學因素。
ACE2在癌癥發生過程中的表達水平不變
?
我們發現,ACE2的肺部表達水平和年齡存在正相關,年齡越大ACE2的肺部表達水平越高(下圖A),這一發現可能可以部分解釋老年人更易感新冠肺炎的觀察。男性和女性ACE2的肺部表達水平并無差異(下圖B),該結果與中國疾控中心發布的截止于2020年2月11日的超7萬病例的流行病學特征一致(確診病例男女比例武漢為0.99:1,全國為1.06:1)。
在TCGA的肺腺癌數據中,只有7例為亞洲人。為了擴大亞洲人肺腺癌的樣本量,我們進一步整合了翟巍巍課題組在新加坡收錄的來自于181個華裔肺腺癌患者的260份轉錄組數據。分析發現亞洲人ACE2的肺部表達水平并沒有顯著高于其他人種(下圖C)。
年齡(A)、性別(B)和種族(C)對ACE2表達水平的影響
?
是否可能東亞人其他組織的ACE2表達水平的高于非洲人和歐洲人?
ACE2基因編碼血管緊張素轉化酶2,本身在腎素-血管緊張素系統中發揮功能,只是被SARS-CoV和SARS-CoV-2借用來侵染細胞。ACE2在肺部只是中等程度表達,而更高表達于腎臟、消化道以及睪丸(下圖,病毒感染后的癥狀上更多表現為肺炎可能是因為病毒可以更輕易通過飛沫傳播接觸到肺細胞)。
(來自https://gtexportal.org/home/gene/ACE2#geneExpression)
已有報道這些ACE2高表達的組織在重癥患者中也會被SARS-CoV或者SARS-CoV-2感染。那是否可能東亞人由于在其他組織的ACE2表達水平的高于非洲人(黑人)和歐洲人(白人)而更易感呢?我們篩選了TCGA中所有ACE2表達高于肺腺癌的癌癥類型,發現不僅是肺部,在其他ACE2高表達的組織中,ACE2的表達水平在不同人種之間都沒有顯著差別(下圖,從左到右分別對應頭頸、胃、胰腺、結腸、直腸、以及兩種腎組織)。當然這還是比較初步的結果,未來需要進一步增加亞洲人的樣本量進行比較。
其他ACE2高表達的組織中,ACE2的表達水平在不同人種間都沒有顯著差異
?
是否可能東亞人中存在影響ACE2蛋白序列、翻譯、折疊或者亞細胞定位的獨特突變因而易感呢?
為了研究是否存在可以影響蛋白功能的東亞人特有遺傳多態性,我們檢測了人類群體中ACE2轉錄本區域的遺傳多態性。我們從1KGP中獲取了ACE2轉錄本區域的712個遺傳多態性位點(其分布下圖)。
ACE2轉錄本區域的遺傳多態性分布
?
我們計算了每個位點在東亞人群(包括北京漢族、南方漢族、西雙版納傣族、東京日本人、胡志明市越南人這五個類群)和全世界人群的等位基因頻率。影響氨基酸序列的22個多態性位點在所有人群中頻率都很低(下圖紅點,重合到了一起),因此不存在東亞人特異的ACE2蛋白序列。剩下的690個遺傳多態性絕大多數位于內含子,不影響氨基酸序列。即使考慮它們,亞洲人與全球人群的等位基因頻率差異也不大(下圖),因為大多數點分布在對角線周圍。
亞洲人與其他人種的ACE2的DNA多態性頻率
?
即使是差異最大的多態性位點之一(如上圖綠圈所示),且不說其是否有生物學功能,在東亞人群中的分布也遠談不上獨特性(如下圖所示)。
rs141554379在26個分布于全球的人群中的頻率
(Ref:參考基因組[-];Alt:單堿基插入[A],根據1KGP數據繪制)
結論
不論是ACE2在包括肺在內的多個組織中的表達水平還是ACE2的遺傳多態性數據都不支持亞洲人更易感新冠病毒的觀點。冠狀病毒及其宿主動物蝙蝠的高度多樣性(以及飲食文化)或許是對中國近二十年來兩次冠狀病毒爆發更好的解釋。我們警示任何使用種族來預測個體對新冠病毒易感性的行為,全球各國都需要同等水平的防護來抵御新冠病毒。
當然,我們的研究還存在一定的局限。首先,我們目前的研究集中在轉錄水平,ACE2蛋白水平在不同人種中是否存在差異以及這些ACE2蛋白是否都位于細胞膜上都還需要進一步研究。其次,ACE2可能只表達于部分肺細胞(例如2型肺泡細胞),而我們分析的是混合樣品的轉錄組(盡管我們認為無論增加表達ACE2的細胞數目還是增加ACE2的單細胞表達水平都會導致易感性的上升并且可以通過混合樣品的轉錄組檢測到)。第三,非典或新冠病毒是否存在其他受體也需要進一步的研究。另外,盡管非典或新冠病毒的侵染效率與ACE2有關,決定病毒細胞內繁殖效率的因素依然未知,有待未來進一步探索。
Reference
Chen, Y.; Shan, K.; Qian, W. Asians and Other Races Express Similar Levels of and Share the Same Genetic Polymorphisms of the SARS-CoV-2 Cell-Entry Receptor. Preprints 2020, 2020020258 (doi:?10.20944/preprints202002.0258.v1).
閱讀原文可以鏈接到文章:https://www.preprints.org/manuscript/202002.0258/v1