單細胞轉錄組探索頭頸癌癥的轉移癌和原位癌區別
文章發表于2017年12月,在CELL雜志:Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer 測序如下;
We profiled transcriptomes of ~6,000 single cells from 18 head and neck squamous cell carcinoma (HNSCC) patients, including five matched pairs of primary tumors and lymph node metastases.
同時也對這些病人測了whole-exome sequencing (WES) and targeted genotyping (SNaPshot) data,但是這些數據公布在 phs001474.v1.p1
,不是很方便下載。
單細胞轉錄組建庫用的Smart-seq2
方法,所有的數據公布在 GSE103322 , 僅僅是表達矩陣都有近100Mb了。
GSE103322_HNSCC_all_data.txt.gz | 86.0 Mb |
實驗驗證用的是細胞系 Oral cavity HNSCC cell lines (Cal-27, SCC9, SCC4, SCC25, and JHU-006; all derived from male patients) 做了RNA-seq 數據。
腫瘤內異質性是腫瘤學的主要挑戰。在新興的技術中,scRNA-seq有助于確定與腫瘤生物學,診斷和治療有關的發育等級,抗藥性程序和免疫滲透模式。在這里,研究者應用這種方法來表征原發性HNSCC腫瘤和匹配的LN轉移瘤。
名詞介紹
頭頸部鱗狀細胞癌(HNSCC)
淋巴結轉移(LN)
癌癥基因組圖譜(TCGA)
癌相關成纖維細胞(CAF)
細胞外基質(ECM)
循環腫瘤細胞(CTC)
單細胞RNA測序(scRNAseq)
腫瘤微環境(TME)
全外顯子組測序(WES)和靶向基因分型(SNaPshot)
Epithelial-to-mesenchymal transition (EMT)
PNI = perineural invasion; LVI = lymphovascular invasion; ECE = extracapsular extension
?
背景介紹
HNSCC 頭頸癌是最常見的十大癌癥之一,每年有50萬患者深受其害,其中,超過80%的患者為口腔鱗狀細胞癌(OSCC)。盡管目前有手術、化療、放療等治療手段,但5年存活率僅有50%,仍是存活率最低的癌癥之一,且近30年沒有改善。所以探尋新的治療方式抑制OSCC生長和轉移尤為重要。
頭頸部鱗狀細胞癌(HNSCC)是一種與酒精和煙草暴露密切相關的具有異質性的上皮腫瘤,患者往往在晚期出現的淋巴結轉移(LN)。
單細胞轉錄組數據分析CNV跟WES的對比
首先把所有病人的近6000個細胞根據表達模式區分成惡性與否,分成兩組進行CNV聚類,可以看到惡性細胞的CNV模式跟從WES數據分析得到的CNV模式比較類似,說明了單細胞轉錄組數據分析CNV是靠譜的。當然,本身該課題組前面的幾篇文章就提到了這個方法以及證實了其可靠性。
病人MEEI5的CNV情況
MEEI5 是一個69歲的女性,對來源于她的所有單細胞的轉錄組數據分析得到的CNV信息進行聚類可以看到比較清晰的patter,其中惡性與否比較容易區分,而且對于惡性細胞也可以看出原位癌和轉移癌的區別。
首先區分腫瘤細胞的惡性與否
用Smart-seq2
建庫方法得到的單細胞轉錄組數據經過QC后,留下了來自18名患者的5,902個細胞,首先可以分成2215個惡性細胞和3363個非惡性細胞。
首先,研究者根據跨染色體間隔的平均表達譜推斷每個單細胞中的大規模染色體拷貝數變異(CNV)。這些推斷的CNVs與WES一致,通過推斷的CNVs將惡性細胞從正常核型的非惡性細胞中分離出來。
其次,研究者通過其上皮來源鑒別惡性細胞,其不同于TME中的基質和免疫細胞。研究者發現在具有上皮標志物表達的細胞和具有異常核型的細胞之間具有顯著的一致性。
最后,研究者通過它們的全局表達模式將細胞劃分到初始類。基于CNV和上皮標志物分析,絕大多數細胞均被分到具有一致惡性或非惡性分類類中去。
非惡性細胞的聚類沒有個體差異
如果只對已經被區分出來的三千多個非惡性腫瘤細胞
進行聚類,采取SC3算法,效果如下圖,雖然有14個類別,但是根據已知標記基因的表達,可以注釋為B細胞,巨噬細胞,樹突狀細胞,肥大細胞,內皮細胞,成纖維細胞和肌細胞這八個值得探究的類別。
值得注意的是,每個類含有來自不同患者的細胞,表明TME(這三千多個非惡性細胞就是腫瘤微環境)中的細胞類型和表達狀態在HNSCC腫瘤中基本一致,并且沒有患者特異性亞群或批處理效應,盡管它們的比例是不同的。
而且由于研究者的數據集中T細胞和成纖維細胞,即數量相對較多,研究者通過更精確的聚類發現了T細胞和成纖維細胞的多樣性。如下:
單獨查看成纖維細胞CAF
rv1,500成纖維細胞分成兩個大類,一個小類別。
- 第一個類表達肌成纖維細胞的經典標記,包括α平滑肌肌動蛋白(ACTA2)和肌球蛋白輕鏈蛋白(MYLK,MYL9)。肌成纖維細胞是TME的成熟組分,并與傷口愈合和攣縮有關。
- 第二個類表達與癌相關成纖維細胞(CAF)相關的受體,配體和細胞外基質(ECM)基因,包括成纖維細胞活化蛋白(FAP),podoplanin(PDPN)和結締組織生長因子(CTGF)。
- 第三個類基本不包括肌成纖維細胞和CAF的標記物,并可能代表處于靜止狀態的成纖維細胞。
其中還可以把CAFs(第二個類)分為具有立即早期應答基因(例如JUN,FOS),間充質標志物(例如VIM,THY1),配體和受體(例如FGF7)差異表達的兩種類型(CAF1和CAF2),TGFBR2 / 3)和ECM蛋白質(例如MMP11,CAV1)。這種瘤內CAF異質性與TMF中涉及復雜結構和旁分泌相互作用的觀點一致。
單獨查看T細胞
主要T細胞類(rv1000個T細胞)可以分為四個亞群,研究者注釋為
- 調節性T細胞(Treg)
- 常規CD4 + T輔助細胞(CD4 + Tconv)
- 兩種細胞毒性CD8 + T細胞群(CD8 + T和CD8 + Texhausted)
細胞毒素亞型在共抑制性受體(例如PD1,CTLA4)和與T細胞功能障礙和衰竭相關的其他基因的表達方面不同,并由此定義HNSCC中推定的T細胞耗竭程序。耗竭CD8 + T細胞的部分在研究者的隊列患者中顯著變化。這些T細胞表達狀態可以為理解和預測檢查點免疫療法的反應提供幫助。
惡性細胞聚類完全取決于患者個體
與非惡性細胞相比,2215惡性細胞根據其起源的腫瘤聚類。超過2000個基因優先在個體腫瘤中表達。
差異表達的基因在腫瘤之間不同的CNV內富集。
最后,其他差異表達的基因與應激(例如JUNB,FOSL1)或免疫激活(例如IDO1,STAT1,TNF)有關,可能對不同的TME有反應。因此,腫瘤間惡性細胞表達異質性反映了研究者隊列中腫瘤之間遺傳學,亞型和TME的差異。
惡性細胞的基因特征
這里重點分析那些含有惡性細胞轉錄組最多數量的10對腫瘤樣本。比如下面的病人MEEI25,一個76歲的女性:
研究者使用非負矩陣分解來揭示在惡性細胞亞群中得到優先共同表達的一系列基因。例如,對于MEEI25惡性細胞,研究者定義了6個不同的基因特征。對10個腫瘤樣本中的每一個都應用該方法,共定義了60個基因特征。
接下來,研究者使用層次聚類來將這些60個特征提取成元特征,這些元特征反映了在多個腫瘤內變化的常見表達程序。來自不同腫瘤的特征之間的高一致性表明它們反映了腫瘤內表達異質性的共同模式。
LN轉移與原發性腫瘤比較
研究者將LN轉移與原發性腫瘤(只有5個病人是取了配對樣本)進行了比較。盡管WES和推測的CNV顯示了原發性和匹配的LN樣本之間的存在一些基因組差異,但是可能是由于所研究的個體數量較少,他們沒有鑒別出任何一致的區別。
LN中惡性細胞的表達譜也與相應的原發腫瘤大致匹配。在每個配對樣本中,都有較少的差異表達基因是顯著差異的,但是它們在整個群體(cohort)中不一致。
研究者還觀察到淋巴結和原發性腫瘤間質和免疫細胞的特征和表現的總體一致性,雖然有一些重要的區別!
EMT的部分狀態或p-EMT
EMT程序被廣泛認為是耐藥,侵襲和轉移的潛在驅動因素,是一個連續和變化的過程。因此,研究者仔細檢查了ECM計劃中EMT的特征。除ECM基因如基質金屬蛋白酶,層粘連蛋白和整聯蛋白外,該程序還包括EMT標志物波形蛋白(VIM)和整聯蛋白α-5(ITGA5)。此外,該方案中得分最高的基因之一是轉化生長因子(TGF)-b誘導(TGFBI),暗示經典的EMT調節劑TGF-b。
雖然該程序具有經典EMT的關鍵特征,但缺乏其他標志。
首先,雖然特征伴隨著某些上皮基因的表達降低,但是上皮標記物的總體表達還是明顯地保持下來。
其次,研究者沒有檢測到經典EMT TF,ZEB1 / 2,TWIST1 / 2和SNAIL1的表達。只有SNAIL2被檢測到(在70%的HNSCC細胞中),盡管其表達與腫瘤的程序相關,但與腫瘤內個體細胞的程序并不相關。最近的研究表明SNAIL2比其他EMT TFs早。 SNAIL2也涉及傷口愈合中的p-EMT應答。
因此,研究者建議這里確定的體內程序反映了一個EMT的部分狀態或p-EMT。
上圖的分析結果表明,這個p-EMT程序不同于源自細胞系和腫瘤模型的完整EMT程序,以及源自腫瘤的腫瘤譜間充質特征。
把TCGA的分類應用于scRNA-seq數據
TCGA研究分析了數百個HNSCC腫瘤的表達譜,并將它們分為四個亞型:基礎型,間充質型,經典型和非典型型。在TCGA的cohort里面各個類別的樣本比例是:atypical(24%),mesenchymal(27%),basal(31%)和classical(18%)。盡管TCGA分型是從大量腫瘤細胞中獲取的,但研究者推斷單個細胞組分的表達程序可能使研究者能夠提取更多的了解。具體而言,研究者從這些批量數據中定義的分子亞型判斷是否能夠反映惡性程序,惡性細胞組成和/或TME組成的差異。
研究者首先確定了自己研究計劃的十個HNSCC腫瘤病人的TCGA表達亞型。
研究者評估了每個腫瘤的惡性細胞與其亞型表達特征的對應關系。引人注目的是,每個腫瘤清楚地映射到三個亞型之一:基本型(n = 7),經典型(n = 2),或非典型(n = 1)。沒有一個惡性細胞映射到間充質亞型,即使它是口腔腫瘤中第二常見的亞型。然而,當研究者增大分析樣本數目,當樣本中包括基質和免疫細胞時,發現數百CAFs、肌成纖維細胞和肌細胞映射到間充質亞型。
這一發現提出了一種可能性,即TCGA間充質亞型反映大批量樣品中的高基質表現而不是獨特的惡性細胞程序。實際上,TCGA樣品的分析鑒定到間充質亞型腫瘤高度表達對CAF和肌細胞特異性的基因。此外,當研究者檢查TCGA的HNSCC腫瘤的組織學切片時,鑒定到間充質腫瘤的成纖維細胞比基礎型腫瘤多大約2.7倍(t檢驗,p <0.0001)。
外顯子數據分析somatic突變
因為外顯子測序數據是無法下載的,這里就不過多介紹了。
(文章轉自jimmy的2018年閱讀文獻筆記)
生信基礎知識大全系列:生信基礎知識100講
史上最強的生信自學環境準備課來啦!! 7次改版,11節課程,14K的講稿,30個夜晚打磨,100頁PPT的課程。
如果需要組裝自己的服務器;代辦生物信息學服務器
如果需要幫忙下載海外數據(GEO/TCGA/GTEx等等),點我?
如果需要線下輔導及培訓,看招學徒
如果需要個人電腦:個人計算機推薦
如果需要置辦生物信息學書籍,看:生信人必備書單
如果需要實習崗位:實習職位發布
如果需要售后:點我
如果需要入門資料大全:點我