文章信息
標題:Defining inflammatory cell states in rheumatoid arthritis joint synovial tissues by integrating single-cell transcriptomics and mass cytometry
期刊:NATURE IMMUNOLOGY
影響因子:23.53
日期:06 May 2019
通訊作者介紹
擔任數據科學中心(BWH,HMS)的主任,并被任命為Broad Institute的準會員。此外,他還活躍于臨床,并在布萊根婦女醫院關節炎中心看病人。在斯坦福大學獲得醫學博士學位之后,Raychaudhuri繼續從事內科臨床培訓,然后在布萊根婦女醫院接受了風濕病專科培訓。他同時與Mark Daly博士一起在Broad研究所完成了人類遺傳學的博士后培訓。自2010年加入哈佛醫學院以來,他為了解類風濕關節炎和其他免疫介導的疾病的遺傳基礎做出了貢獻。他還一直在設計統計和計算方法的最前沿,以將遺傳關聯信號定位到因果變體,并在功能信息的背景下解釋人類遺傳數據。他目前在結核病,I型糖尿病和類風濕性關節炎的人類遺傳學和功能基因組學方面擁有活躍的研究計劃,尤其專注于使用基因組策略來了解CD4 + T細胞生物學。
研究背景
類風濕性關節炎(RA)是一種自身免疫性疾病,在關節組織的滑膜中具有慢性炎癥。這種炎癥導致關節破壞,影響正常關節功能。但目前對關節滑膜組織中細胞類群狀態還是不夠明確的,利用單細胞測序技術可以在炎癥組織中尋找關鍵細胞亞群及其活化狀態這將為定義RA新治療靶標提供必要的數據理論支持。之前的研究已經發現CD4 + T細胞,B細胞,單核細胞和成纖維細胞已確定與RA發病機理相關。
樣本及測序簡介
樣本來源:滑膜組織,作者招募了36名RA患者,15名OA患者,并從超聲引導下的活檢中或關節置換獲得滑膜組織.
實驗手段包括質譜流式、Bulk RNA-seq、scRNA-seq
Bulk RNA-seq
1.對流式分選的細胞(T cells, B cells, monocytes, and synovial fibroblasts)進行轉錄組測序;工具:Illumina MiSeq ; 比對:Ensembl version 83 transcripts;
2.QC:(1)定義共同基因為在
95%
的樣品有至少一條reads支持;(2)共同基因占比少于99%
的樣本定義為低質量樣本在后續分析中將被剔除;3.共獲得
167
個高質量樣本,包括45
fibroblast samples, 46
monocyte samples, 47
T cell samples, and 29
B cell samples;scRNA-seq
1.方法:CEL-Seq2; 工具:HiSeq 2500;Reads 通過STAR2.5.2b比對到
hg19
;2.QC:作者發現由少量reads表示的分子更可能是來自其他細胞的污染物分子,所以開發了一種簡單的算法來設置每分子最小讀數的閾值。We used
2
marker genes expected to be exclusively expressed in each of the four cell types: PDGFRA and ISLR
for fibroblasts, CD2 and CD3D
for T cells, CD79A and RALGPS2
for B cells, and CD14 and C1QA
for monocytes. 然后計算這些基因在該表達的細胞類型中的高于閾值的表達定義為真陽性,在不該表達的細胞類型中的高于閾值的表達定義為假陽性。遍歷表達閾值分別為1-20
之間的數值,選取能夠最大化真陽性/假陽性比值的值為最終閾值。然后作者進行以下條件的篩選:(1)細胞檢測到的genes數>1000
;(2)線粒體相關基因的表達占比少于25%
;結合質譜流式,scRNA數據
1.作者收集6個富含白細胞、9個白細胞缺乏的RA和11個OA樣品用于質譜流式分析;
2.雙門控通道選定活細胞:B細胞(CD45 + CD3-CD14-CD19 +),成纖維細胞(CD45-PDPN +),單核細胞(CD45 + CD3-CD14 +)和T細胞(CD45 + CD3 + CD14-);
3.作者基于CCA分析整合轉錄組數據和單細胞數據,開發一種基于圖的無偏聚類pipeline對單個細胞進行分析;
下游數據分析策略
(1)細胞分群及數據整合;作者利用流式對細胞進行分群后,以bulk RNA-seq作為reference point,利用CCA找到大量RNA-seq樣品和scRNA-seq細胞的線性組合,以創建最大相關的基因表達譜。作者使用來自scRNA-seq的最佳標記基因與CCA結果關聯,以建立每個scRNA-seq簇與每個質量細胞計數簇之間的關系;
(2)流式定義一部分RA滑膜組織中富含白細胞;組織免疫細胞浸潤的變化反映了源關節中的局部疾病活動。作者計算了其它樣本與OA的馬氏距離(感謝微信公眾號生信寶典對馬氏距離的解釋:馬氏距離 (Mahalanobis distance)是由印度統計學家馬哈拉諾比斯 (P. C. Mahalanobis)提出的,表示數據的協方差距離。它是一種有效的計算兩個未知樣本集的相似度的方法。與歐氏距離不同的是,它考慮到各種特性之間的聯系,并且是尺度無關的(scale-invariant),即獨立于測量尺度。),引入最大OA距離作為滑膜中富含白細胞的閾值(> 4.5);為了驗證炎癥分類的有效性,作者評估了組織學的炎癥狀態,并且通過Krenn inflammation score (一種炎癥評價指標) 對切片上的炎癥狀態進行評估;
(3)單細胞分析揭示不同細胞亞型;在5,265個細胞中發現1,142 B cells, 1,844 fibroblasts, 750 monocytes and 1529 T cells (作者在這里說明傳統基于PCA的分類batch effect較為明顯,所以作者采用CCA-based clustering), 作者共分出來18 cell clusters; 成纖維細胞中,鑒定了四個亞群:CD34 +亞細胞成纖維細胞,HLA-DRAhi成纖維細胞,DKK3 +成纖維細胞和CD55 +lining成纖維細胞; 在單核細胞中, 作者鑒定了IL1B +促炎單核細胞,NUPR1 +單核細胞,C1QA +單核細胞和干擾素(IFN)活化的單核細胞;在T細胞中,鑒定了三個CD4 +簇:CCR7 + T細胞,FOXP3 +調節性T細胞(Treg細胞)和PDCD1 + TPH和TFH細胞;三個CD8 +簇:GZMK + T細胞,GNLY + GZMB +細胞毒性淋巴細胞(CTL)和GZMK + GZMB + T細胞。在B細胞內,鑒定了四個細胞簇,包括幼稚IGHD + CD27-和IGHG3 + CD27 +記憶B細胞,具有高表達ITGAX(也稱為CD11c)的自身免疫相關B細胞(ABC)簇和具有高免疫球蛋白基因表達和XBP1的漿母細胞簇;(作者的細胞分型是比較符合免疫分型的,大家也可以采用以上marker對免疫細胞進行亞分型,不建議完全參照某一篇文章定義所有細胞分型)
(4)由細胞因子激活和MHC II表達定義不同的滑膜成纖維細胞;在Bulk seq中,與OA相比,leukocyte-rich RA中HLA-DRAhi細胞 HLA,IL6的表達情況更為明顯,且在GO富集中,與MHC classII提呈和干擾素信號通路有關;然后作者通過scRNA seq 驗證了該觀點。
(5)激活狀態定義了滑膜單核細胞的異質性;在來自患有白細胞豐富的RA和OA的個體的大量RNA-seq單核細胞樣品中,作者發現與IL1B +單核細胞相關的基因,包括NR4A2,HBEGF,PLAUR和IFN激活的基因IFITM3顯著在富含白細胞的RA樣品中上調。相反,與富含白細胞的RA相比,與NUPR1 +單核細胞(SC-M2)相關的標記基因下調。作者取每個單核細胞scRNA-seq子集的top標記基因(AUC> 0.7),并在bulk seq中測試gene在RA與OA RNA-seq數據中的差異表達。
作者發現富含白細胞的RA滑膜與OA相比具有更大的IL1B +單核細胞和IFN激活的單細胞豐度,但更低NUPR1 +單核細胞的豐度。這些數據表明細胞因子激活驅動活動性RA滑膜中獨特單核細胞群的擴增。利用基因組富集分析(GSEA),作者測試了MSigDB(分子特征數據庫)免疫基因組,發現IL1B +單核細胞(SC-M1)脂多糖反應相關基因的表達水平相對較高;(一句話,單核細胞異質性較強)
(6)滑膜CD4和CD8T細胞的異質性;作者在scRNA-seq數據中發現了三個CD4 +和三個CD8 + T細胞亞群(其實作者分出的亞群CD4比較好分,CD8多為exhausted T cell耗竭性基因的表達)鑒定了三個CD4+簇:CCR7 + T細胞,FOXP3 +調節性T細胞(Treg細胞)和PDCD1 + TPH和TFH細胞; 三個CD8 +簇:GZMK + T細胞,GNLY + GZMB +細胞毒性淋巴細胞(CTL)和GZMK + GZMB + T細胞。與OA相比,CXCL13在富含白細胞的OA的TPH細胞中上調表達; 作者通過質譜流式,鑒定出9個T cell clusters, 并通過結合bulk seq發現CXCL13, TIGIT and CTLA4在CD4+PD-1ICOS+cluster中富集;
(7)通過單細胞RNA-seq發現在RA滑膜中自身免疫相關B細胞增加;細胞分型為幼稚B細胞(SC-B1),記憶B細胞(SC-B2),ITGAX + ABC細胞(SC-B3)和漿母細胞(SC-B4);SC-B3細胞表達高水平的ITGAX和TBX21(T-bet),它們是自身免疫相關B細胞的標志物,AICDA的高表達與最近報道的來自系統性紅斑狼瘡(SLE)樣品的外周血的CD11c + B細胞的轉錄組學分析一致。干擾素刺激的基因(GBP1和ISG15)也在ABCs(SC-B3)中表達并在富含白細胞的RA中上調。質譜流式分型劃分10個細胞clusters,進一步分型發現CD11c +細胞內的三個亞組:IgM-IgD-HLA-DR ++ CD20 + CD11c +,CD38 + HLA-DR ++ CD20-CD11c +和IgM + IgD + CD11c +。
(8)通過單細胞分析揭示炎癥途徑和效應模塊; 為了確定與富含白細胞的RA相關的途徑,作者使用GO分析鑒定了I型干擾素反應和炎癥反應(單核細胞和成纖維細胞),Fc受體信號傳導(單核細胞),NF-κB信號傳導 (成纖維細胞)和干擾素γ(T細胞)。富含白細胞的RA樣本在成纖維細胞和單核細胞中具有顯著更高的基因表達:炎癥反應基因(PTGS2,PTGER3和ICAM1),干擾素應答基因(IFIT2,RSAD2,STAT1和XAF1),以及趨化因子或細胞因子基因(CCL2和CXCL9),與干擾素激活的協同趨化反應一致。 T細胞具有干擾素調節因子(IRF)的上調,包括IRF7和IRF9,并且單核細胞具有IRF7,IRF8和IRF9的上調。Toll樣受體信號通路富含白細胞豐富的RA組織中的B細胞和單核細胞。
在單細胞水平,TLR10僅由活化的B細胞表達,表明TLR10在B細胞譜系中具有功能性作用。相反,TLR8在所有RA單核細胞亞群中升高。造血細胞特異性轉錄因子IRF8在顯著部分的單核細胞和B細胞中表達,其協同調節RA滑膜中單核細胞和活化B細胞的分化。 SLAMF7由促炎單核細胞(SC-M1),IFN激活的單核細胞(SC-M4),CD8 + T細胞和漿母細胞(SC-B4)高度表達。
臨床意義及借鑒點
(1)該篇文章強調可以將sublining fibroblast作為治療RA的潛在靶點;(a major source of proinflammatory cytokines)
(2)第一次在富含白細胞的RA中發現自身免疫相關性B細胞;
(3)多維度的數據進行整合分析,開發基于CCA算法的流程,對每個細胞分群更為詳細。
(4)對其他免疫系統疾病可以采取類似的實驗設計方案,本篇文章具有重要借鑒意義。
(5)代碼工具:https://github.com/immunogenomics/amp_phase1_ ra