筆記:rmats繪圖結果怎么看

rmats是一款比較好的分析可變剪切的分析軟件,將rmats分析的結果,利用rmats2sashimiplot繪畫出的圖也是比較漂亮的,

可變剪切事件:

可變剪切事件可以分為:


image.png

我們就講一下外顯子跳躍事件,


image.png

如下圖所示:
image.png

上面的那個屬于Exon lnclusion isoform的情況。
下面那個屬于Exon Skipping isoform的情況
外顯子跳躍后,中間的外顯子就沒有了,兩邊的連到一起

那么,測序的reads是如何捕捉到的轉錄本怎么和可變剪切事件的呢?


上圖中左邊為inclusion isofrom, 右邊為skipping isoform, 比對上inclusion isoform的reads 有兩種,分別為紅色和紫色,其中紅色reads只比對到了1號和3號exons上,無法區分這部分reads是來自inclusion isofrom還是skipping reads, 而紫色的reads 比對到了exon2以及exon2與其他exon的連接處,這部分reads可以明確來自inclusion isoform. 所以在統計inclusion isofrom count時,只會計數這部分reads(紫色reads), 同理,統計skipping isoform的reads數時,只會統計綠色部分的reads。

結果解讀:

那么結果該如何解讀呢?


image.png

其中RPKM衡量表達量情況,lnclevel是什么呢?

文獻中給的定義是:
1.lncLevel1 : inclusion level for SAMPLE_1 replicates (comma separated) calculated from normalized counts(對于sample1)
2.IncLevel2 : inclusion level for SAMPLE_2 replicates (comma separated) calculated from normalized counts(對于sample2)
3.IncLevelDifference : average(IncLevel1) - average(IncLevel2)

回到剛才,那么
lnclevel是exon inclusion level,是Exon Inclusion Isoform在總(Exon Inclusion Isoform + Exon Skipping Isoform)所占比例

lnclevel的計算公式如下:
ψ = (I/lI)/[(S/lS) + (I/II)]

其中:

  1. I是指mapping到exon inclusion isoform的reads數
  2. S指mapping到exon skipping isoform的reads數
  3. II指exon inclusion isoform的有效長度
  4. IS 指exon skipping isoform的有效長度

那么有效長度的定義又是什么呢???

image.png


剛才我們介紹了rMATS只會記錄連接處(紫色和綠色)的reads
以exon skipping為例,每一個連接處都會有8bp左右的anchor,作者默認為8bp,因此有效比對到兩邊exon的長度為 r-2a+1(加 1 是為了防止0值)

因此可以定義出 junction length :the overall junction region covered by reads across junctions, affected by read length, anchor length (by default 8 bps in both upstream and downstream exons) and exon length
junction length is calcualted as (read length - anchor)*2
假設 read length = 150np;anchor = 8bp,則 junction length = 284bp,skipping的有效長度為135bp

rMATs是根據Likelihood-ratio test來比較兩組樣本可變剪切是否有差異


image.png

所以,我們根據這個就可以看兩個樣品是否有可便剪切上的差異了
那么,當Exon inclusion isoform數量較高時,lnclevel1較高;當Exon skipping isoform數量較高時,lnclevel2較高。
如果Exon inclusion isoform數量低的離譜,Exon skipping isoform有一定數量且保持不變那么lnclevel1會接近于0;反之,Exon skipping isoform也一樣。

但是,我們在利用miso或rmats分析可變剪切的時候,往往用sashimiplot進行可視化,其中基于兩款軟件畫圖的reads可能會不一樣,那么:

對于rmats2sashimiplot產生的圖片,我們不需要太過于糾結reads數目和rmats對應不上,只需要看reads分布的大體趨勢即可,重點是關注不同樣本中IncLevel的差異。

這是因為sashimiplot的input是miso的輸出文件,而rmats的output會被sashimiplot轉換成miso的output,才可以繼續作圖
在轉換的過程中由于rmats和miso判斷可變剪切的原理不一樣,所以會造成一定誤差

判斷差異可變剪切的統計學模型

由上面的敘述我們知道判斷某個基因是否存在差異可變剪切是通過 | Ψi1-Ψi2 | ≤ c,其中 i 表示第 i 個基因;Ψ 即為 lnclevel
首先rmats先計算全部基因的 | Ψi1-Ψi2 | ,并以此擬合出一個分布:


上面這張圖的橫坐標表示 | Ψi1-Ψi2 | ,縱坐標表示頻率(頻數)分布直方圖,也就是表示當 | Ψi1-Ψi2 | 為某值是,對應一共有多少個基因滿足這個條件
那么rmats里面有一個參數是 --cstat,默認為0.01%,也就是說在全部的基因中,存在差異可變剪切的只占0.01%。因此統計全部基因的 | Ψi1-Ψi2 | 值,選擇差異最大的那0.01%,并定義為存在差異可變剪切的基因,那么p_val即為上圖陰影部分的面積

如何理解rMAT結果


前幾列代表的是基因的基本信息:

  1. chr: 代表染色體
  2. strand: 代表鏈的信息

而 exonStart_0base ,exonEnd,upstreamES,upstreamEE,downstreamES,downstreamEE代表的是可變剪切的isoform的位置信息:


exonStart_0base ,exonEnd代表skip的外顯子

而:



前面兩列代表顯著性,而lncLevels1和lncLevels2分別對應這不同處理中各個生物學重復的lncLevels值,而lncLevelDifference代表lncLevels1與lncLevels2的差值,若差值很大并且顯著則判斷為差異可變剪切

參考:https://cloud.tencent.com/developer/article/1366294
參考:https://www.biostars.org/p/256949/
參考:http://www.lxweimin.com/p/d2f00c1c9067

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,606評論 6 533
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,582評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,540評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,028評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,801評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,223評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,294評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,442評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,976評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,800評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,996評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,543評論 5 360
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,233評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,662評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,926評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,702評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,991評論 2 374

推薦閱讀更多精彩內容