擬時序分析

簡要內容
--擬時序分析的定義
--結果解讀
--------做出結果(cluster、state)
--------確定起始點
--------做start····end的圖(并且映射到tsne中又一個圖)
--------熱圖和感興趣的-單個基因的動力學變化趨勢圖
--做擬時序分析的適合的情況
--------細胞圖譜
--------case control的特征轉變
--------重編程或轉變軌跡
--文章實例
--------little tips(遇到三叉口的擬時序分析兩種方法)


首先做細胞注釋(在project中有了,不再贅述)

一、擬時序分析是什么

通過構建細胞間變化軌跡預測細胞隨時間的變化
模擬時間的細胞序列的分析
時序中細胞發生的變化
也不一定非要設置不同的時間段去做實驗
細胞本身存在擬時序變化,細胞是有變化的,才可以做擬時序分析

二、結果解讀

image.png

主成分一和二,根據高可變基因進行排序,
每個點是一個細胞
左圖按cluster排序,線就是進化軌跡
交點1、2,是有節點的(說明基因有表達量的差異)
右上按state排序,每個分叉一個state,一個表達模式
cluster:得到擬時序分析結果,將cluster映射到結果中
state:根據結果把每個分叉點做命名(表達模式不同),如下

image.png

計算機沒法判斷起始點,要通過生物學意義(基因表達和功能)去確定起始點,
法一:比如一個case,一個control(對照組),一部分枝杈上case的細胞數多(control少),一部分的枝杈上control的細胞數多(case少),那么起點就是control,細胞由control向case轉化


image.png

法二:判斷每個state或cluster中什么功能的細胞多,比如乃鸚鵡的到激活型的,,,,某個state中乃鸚鵡的細胞數目多,而另一個state中激活型的細胞數目多,則乃鸚鵡的那個state為起始點

判斷起始點后,做下面這張圖

image.png

這圖與上面的那個cluster映射的圖一樣的形狀,但是下面這個圖時根據外面認為的確定一個起始點,顏色越黑的是起始點,越黃,隨時間越靠后,然后將這個時間順序映射到tsne中去,黑色的細胞不斷往淺色的細胞轉換,

image.png

時間順序得到之后,接下來可以做熱圖和動力學變化趨勢圖

熱圖


image.png

image.png

熱圖最左邊到最右邊就是從起始點到后面的這個動力變化過程中基因的表達量(基因變化趨勢)變化(最右邊那一列是基因名),左邊那一列是將所有的基因分為了三塊(三種表達模式),綠色、澄色、藍色,比如綠色的表達模式,那些高可變基因的表達量逐漸減少(表達量多少的圖是右邊的那個標簽,紅色最多,藍色最少),澄色的部分的表達量也是隨著時間的流逝,細胞轉化過程中,逐漸減少。藍色的部分是逐漸增多。
還可以針對感興趣的某個基因做單個基因在里面的變化趨勢


image.png

這個圖中縱坐標代表表達量,圖中每個點代表每個細胞,基因在這些細胞中的表達量
image.png

左上的基因趨勢不變后來升高,

右上的基因先降低后升高(代表橙色部分)
左下基因一直下降(代表綠色部分)
右下基因一直升高(有可能對應熱圖中的藍色部分)


image.png

三、文章中如何應用

1做細胞圖譜(無組別)

比如細胞有兩個亞型A 和 B,兩者之間存在一個轉變關系,那我們就去做一個擬時序分析,


image.png

2、control組的細胞往case組細胞特征轉變

兩個組別,研究藥物處理或其他處理,導致表達譜發生了變化,一種細胞類型去做擬時序分析,否則無意義

3、某一個細胞類型下面的重編程或轉變軌跡

比如T細胞的CD4的乃鸚鵡的細胞往TH的轉變
比如CD8的乃鸚鵡T細胞往CTL毒性方面的轉變
或者干細胞的重編程,人為的特定指定干細胞往哪個方向轉變

這些方面都比較適合做擬時序分析

四、例子文章

1、文章一

腫瘤的

首先看以下這個圖


image.png

這個圖中都是導管細胞,做完擬時序分析后,左邊的為正常的導管細胞,惡化的導管都是右邊的,所以人為的指定左邊的正常導管細胞為起始點,判斷從左往后的腫瘤變化軌跡,然后得到了熱圖


image.png

左邊正常,右邊惡化,分為P5和P6兩種模式,P5的基因表達量都升高,P6的基因先升高后面有點降低
image.png

這兩個圖是一個圖

得到了逐漸升高的基因,就可以去做這些基因的功能分析了(可以挑一些基因去做,也可以差異基因去做)

2、文章二

類似于重編程


image.png

image.png

分為早期、中邊、晚期
最右下角的那個圖是單個基因的動態變化趨勢,看逐漸升高還是降低,

3、文章三

細胞圖譜的


image.png

image.png

A中顏色深的是起始點,淺的是終點
為什么下面不是終點,上面是終點?因為上面的線段長(時間長)


image.png

image.png

c中表示從start到end的基因的變化趨勢

遇到這種三角的圖(三岔口的擬時序分析)有兩種處理方式


image.png

1、直接描繪start---end的變化趨勢,像本文中的c

2、因為分支比較明顯,可以研究這兩者之間的差異


image.png

image.png

紅黃這兩種變化之間的差異

比如這篇重編程的文章


image.png

image.png

下面這條是sucessful 代表干細胞的重編程功能是成功的,得到成功的成纖維,上面那條是重編程失敗的細胞的變化趨勢,然后繪制熱圖


image.png

這種圖是以中間為開始,左邊為失敗的,右邊為成功的,
上面的幾個基因就是在失敗的模式中表達量很高的,下面的基因在成功的模式中表達量是很高的
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。