? ? ? ? 本期,我們一起來分析一下2018年發(fā)表在Cancer Research(2019年該雜志最新影響因子為8.378)上的一篇由瑞典皇家理工學院發(fā)表的關于皮膚惡性黑色素瘤的文章。
文章題目:Spatially Resolved Transcriptomics Enables Dissection of Genetic Heterogeneity in Stage III Cutaneous Malignant Melanoma
空間分辨轉錄組學有助于分析Ⅲ期皮膚惡性黑色素瘤的遺傳異質性
? ? ? ? 首先我們簡單說一下背景,皮膚惡性黑色素瘤存在廣泛的瘤內和瘤間異質性,是所有癌癥中突變負荷最高的癌癥之一。同時也是一種高免疫原性的癌癥,能夠誘導原位癌和轉移癌中的與免疫細胞浸潤相關的免疫反應。
? ? ? ? 材料選擇為III期皮膚惡性黑色素瘤淋巴結轉移瘤的活檢樣本。并且記錄了不同存活時間,共四個病人樣本,其中一個是長存活期的病人樣本(>60個月),每個樣本兩份組織切片樣本。這些病人組織樣本切片都通過了H&E染色和有經驗的病理學家對組織區(qū)域進行劃定,圈出腫瘤區(qū)域、基質和淋巴組織區(qū)域。然后利用空間轉錄組測序芯片進行后續(xù)處理,由于前幾期我們已經介紹過了原理,這里不再贅述。我們主要看下他做了哪些工作和思路是什么。
? ? ? ? 最終一共分析了2200多個spot的數據,并且每個樣本的數據都測到近飽和的程度,平均每個spot 300個轉錄本。首先它將八個樣本的每個樣本轉錄組數據進行人為的混合,形成bulk轉錄組數據,然后對這八個樣本進行PCA分析,可以看到同一個病人腫瘤組織間的變異程度不大,每個病人的樣本聚到一起,并和其他病人樣本明顯分開。利用分層聚類的方法對50個基因的表達進行分析,進一步證明了這個結果。
? ? ? ? 進一步對這2200多個spot數據進行特定基因的分析和t-sne的分析,可以看到,腫瘤組織間具有非常大的基因表達的變異。這里結合起來看圖A和圖B,圖中兩種不同形狀的切片來自兩個不同的病人。上面活檢樣本1,病理學家圈出來的黑色素瘤區(qū)域和B中上面基因表達數據是能夠明顯對應上的,并且B中基因表達區(qū)域的邊界非常清晰。我們再看圖中下面的活檢樣本2,盡管病理學家圈出來的邊界是比較清晰的,但是我們看B中下面對應基因表達的數據,卻呈現出明顯變化程度很高的表達模式,說明腫瘤異質性很高。從病人存活期看,活檢樣本1的病人是存活周期長的病人,而活檢樣本2則是存活期的病人。我們再來看腫瘤因子的活性情況,C圖中Melanoma-A和-B分別用來標識不同的激活因子表達情況,其中-A標識CD63和 PMEL,-B標識S100B和FTH1。最右邊是淋巴組織區(qū)域。-A與病理學家注釋的區(qū)域是對應的,-B和-A在這兩個因子表達上則是有重疊的。淋巴組織是對應的。D是-A和-B中分別表達前五位的基因,可以看到是存在明顯差別的。E圖是淋巴組織和腫瘤組織切片放大圖的比較,同樣能看出兩個樣本的顯著差別。
? ? ? ? 接下來該文章對腫瘤微環(huán)境的基因表達情況進行了分析。活檢組織1中的淋巴組織在空間上距離腫瘤組織較近,但是還保持的明顯的距離,比較適合分析腫瘤微環(huán)境的互作,因此被選為后續(xù)分析樣本。首先鑒定了一些高表達的基因?FTL, B2M, APOE, 和 HLA相關基因 (HLA A-C)。然后對該樣本的280多個spot數據進行PCA分析,聚類得到4個clusters,這4個clusters與病理學家注釋的區(qū)域完全對應,看圖A和圖B。這些基因表達的情況會受到淋巴組織與腫瘤細胞距離的影響。然后看E圖是標注了對分群有顯著作用的基因,其中PMEL主要在腫瘤組織中表達。SPP1表達覆蓋的區(qū)域更大,不只是腫瘤組織,還包括與腫瘤組織比較近的淋巴組織。CD74主要在遠離腫瘤組織的淋巴組織區(qū)域表達。而IGLL5則是在距腫瘤組織更近的淋巴區(qū)域表達。
? ? ? ? 這篇文章的內容就是這些,其實總體來看內容非常簡單,就是分析腫瘤異質性情況,拿一些marker基因進行說明,并不是去講一個完整的story出來。
? ? ? ? 按照這個文章的思路,我們可以總結幾點利用空間轉錄組做腫瘤異質性需要考慮的地方:
1. 選擇感興趣的癌癥樣本的活檢樣本,可以考慮要做同一個病人的原位癌和轉移癌的異質性,也可以考慮做不同病人間的原位癌或者轉移癌的異質性,當然,同時做也是可以的。每個樣本可以考慮做2個重復,避免出現實驗層面的影響,目前10x Genomics的芯片是4個捕獲區(qū)域,做兩種樣本是完全合適的。
2. 組織切片需要有經驗的病理學家進行注釋,這一點很關鍵,一般的病理室大夫可能只能注釋出來腫瘤區(qū)域,但是其他區(qū)域并不一定能夠清晰注釋出來,這會對后續(xù)對應的基因表達分析造成麻煩。
3. 數據量,我們不能說多少就能滿足分析,目前10x Genomics建議的是0.05M/spot,但是這只是個推薦的數據量,不能說對所有的樣本都適用,本文是測到接近飽和了,不過才3000個基因每個spot著實不多,可能也跟捕獲區(qū)域本身的探針數量有關系,現在10x的增加了,基因數應該還會再提高,有經濟能力的建議盡可能測飽和,避免漏掉豐度較低的基因轉錄本。可以先按0.05M/spot去做,分析下飽和度,不行再對文庫進行加測,能達到80%以上應該是能夠滿足分析要求了。
4. 提前查文獻,找一些marker基因,一方面看異質性,另一方面與病理學家注釋區(qū)域去比較一下,證明我們的方法是沒有問題的,然后還可以通過不同區(qū)域差異表達基因的比較去尋找新的marker基因,甚至是治療靶點。
5. 空間轉錄組做腫瘤還有一個重大意義,就是早診,基因表達數據結合病理學家注釋的結果一起去看,能夠避免很早起的癌癥,難以通過病理注釋出來的問題,一些不明顯的早期發(fā)生的腫瘤區(qū)域,在marker基因表達數據上會比較顯著,可以協助醫(yī)生判斷癌癥發(fā)展階段,及時采取對應的治療措施(這或許才是該技術長期發(fā)展最大的價值)。
6. 空間轉錄組技術還是起步階段,從文章發(fā)表的角度來講,本文這樣一個工作能發(fā)表在cancer research上著實很劃算。目前可以說,還是在利用新穎的技術作為亮點發(fā)表文章,所以對文章的故事性要求較低,換不同的癌種,采用類似的思路來做是極有可能發(fā)表不錯的文章的,有興趣的可要抓緊了,過了新技術應用的一兩年的發(fā)展熱潮,再發(fā)表高水平文章就比較困難了。
「2019年11月09日 ·北京」