国产成人无码精品久久久,午夜av旡码国产高清蜜月,三年片大全电影

一、基本介紹

rMATS是一款對RNA-Seq數據進行差異可變剪切分析的軟件。其通過rMATS統計模型對不同樣本（有生物學重復的）進行可變剪切事件的表達定量，然后以likelihood-ratio test計算P value來表示兩組樣品在IncLevel（Inclusion Level）水平上的差異，并利用Benjamini Hochberg算法對p value進行校正得FDR值。（lncLevel是Exon Inclusion Isoform在總Isoform（Exon Inclusion Isoform + Exon Skipping Isoform）中所占比例。）

rMATS可識別的可變剪切事件有5種，分別是外顯子跳躍（skipped exon, SE），選擇性5’剪接位點（alternative 5' splice site, A5SS），選擇性3’剪接位點（alternative 3' splice site, A3SS），外顯子互斥（mutually exclusive exons, MXE）和內含子保留（retained intron, RI）。

官方文檔：
https://github.com/Xinglab/rmats-turbo/blob/v4.1.2/README.md

二、使用方法

(1) 輸入

rMATS支持兩種格式文件的輸入。

第一種是fastq格式，那么在安裝的時候還需要安裝STAR比對軟件以及提供比對的索引文件（STAR的索引文件異常的大），所以rMATS其實是建議使用第二種方式；
第二種是bam格式，rMATS支持其他比對軟件比對后的結果bam文件作為輸入，比如tophat/ hisat2等，這樣也能減少rMATS的運行時間。

(2) 方法

目前rMATS 4.1版不受限于單雙端測序，reads長度不一，是否存在生物學重復，是否有比較組，是否需要檢測新轉錄本，是否鏈特異性等條件，并且其可以進行分步，分機器計算，功能完善，主要可變剪切事件檢測完整的一款軟件。

$ conda create -n bioinf3
$ conda activate bioinf3  #python 3.9
$ conda install -c bioconda rmats=4.1.2
$ conda install -c bioconda rmats2sashimiplot
$ rmats.py –version
$ rmats2sashimiplot --help

構建索引：

$ for i in `ls ./04_bam/*.bam` ; do (samtools index $i -@ 4) ; done  &

運行rmats.py：

$ rmats.py  --b1 ./06_rmats/LF.txt --b2 ./06_rmats/CF.txt  --gtf ./annotation/genome/Drosophila_melanogaster.BDGP6.32.105.gtf  --od ./06_rmats/  -t paired  --readLength 150  --cstat 0.0001  --nthread 4  --libType fr-firststrand  --tmp ./06_rmats/tmp/  &

(3) 參數

--b1 b1.txt：輸入sample1的txt格式的文件，文件內以逗號分隔重復樣本的bam文件名（/path/to/1_1.bam,/path/to/1_2.bam）
--b2 b2.txt：輸入sample2的txt格式的文件，文件內以逗號分隔重復樣本的bam文件名（/path/to/2_1.bam,/path/to/2_2.bam）
-t {paired,single}：雙端測序則readType為paired，單端測序則為single
--readLength：測序reads的長度
--gtf gtfFile：需要輸入的gtf文件
--od outDir：所有輸出文件的路徑（文件夾）
--nthread：設置線程數
--cstat：The cutoff splicing difference. The cutoff used in the null hypothesis test for differential splicing. The default is 0.0001 for 0.01% difference. Valid: 0 ≤ cutoff < 1. Does not apply to the paired stats model. 代表的是兩個樣本中inclusion level的差值
--libType {fr-unstranded,fr-firststrand,fr-secondstrand}：Library type. Default is unstranded (fr-unstranded). Use fr-firststrand or fr-secondstrand for strand-specific data.
--bi STARIndexFolder：The folder name of the STAR binary indexes (i.e., the name of the folder that contains SA file). For example, use ~/STAR_index/hg19 for hg19. (Only if using fastq)
--paired-stats：使用配對統計模型
--variable-read-length：Allow reads with lengths that differ from –readLength to be processed. --readLength will still be used to determine IncFormLen and SkipFormLen
--tmp TMP：The directory for intermediate output such as ".rmats" files from the prep step

(4) 結果

AS_Event.MATS.JC.txt 僅用跨剪接點的reads來計算剪接
AS_Event.MATS.JCEC.txt 使用跨剪接點的reads和在條紋區域的reads來計算剪接
fromGTF.AS_Event.txt 所有來源于GTF和RNA的可能的選擇性剪接(AS)事件
JC.raw.input.AS_Event.txt 事件計數包括僅跨越由rMATS定義的剪接點的reads
JCEC.raw.input.AS_Event.txt 事件計數包括跨越由rMATS定義的剪接點的reads和不跨越外顯子邊界的reads

其中JC和JCEC的區別在于前者考慮跨越剪切位點的reads，而后者不僅考慮前者的reads還考慮到只比對到第一張圖中條紋的區域（也就是說沒有跨越剪切位點的reads），但是我們一般使用JC的結果就夠了（如果只是單純的比較兩組樣品間可變剪切的差異的話）。

以SE.MATS.JC.txt為例：

1）ID
2）GeneID
3）geneSymbol
4）chr
5）strand

外顯子的位置信息：

6）exonStart_0base
7）exonEnd
8）upstreamES
9）upstreamEE
10）downstreamES
11）downstreamEE
12）ID

13-16列展示兩組樣品在inclusion junction counts（IJC）和skipping junction counts（SJC）的count數，重復樣本的結果以逗號分隔；列名分別為IJC_SAMPLE_1，SJC_SAMPLE_1，IJC_SAMPLE_2，SJC_SAMPLE_2。

下面幾列為：

17）lncFormLen：length of inclusion form, used for normalization（inclusion形式的有效長度）
18）SkipFormLen：length of skipping form, used for normalization（skipping形式的有效長度）
19）P-Value：Significance of splicing difference between two sample groups（兩組樣品選擇性剪接差異的顯著性）
20）FDR：False Discovery Rate calculated from p-value
21）lncLevel1：inclusion level for SAMPLE_1 replicates (comma separated) calculated from normalized counts（從歸一化計數計算的SAMPLE_1重復的inclusion水平，逗號分隔）
22）IncLevel2：inclusion level for SAMPLE_2 replicates (comma separated) calculated from normalized counts（從歸一化計數計算的SAMPLE_2重復的inclusion水平，逗號分隔）
23）IncLevelDifference：average(IncLevel1) - average(IncLevel2)（兩組樣本IncLevel均值的差異）

其中：

lncLevel = Exon Inclusion Isoform / (Exon Inclusion Isoform + Exon Skipping Isoform)
lncLevel = (IJC_SAMPLE / lncFormLen) / (SJC_SAMPLE / SkipFormLen)
effective length = segment length / read length + 1

在輸出的結果文件中還有一個summary文本文檔，在該文件中統計了上述各個文件中的可變剪接事件數，其中SignificantEventsJC默認為JC文件中滿足FDR值小于等于0.05的事件數。

(5) 可視化

rmats2sashimiplot是專門用來對rMATS分析結果做可視化的軟件。可以預先用samtools對bam文件建立索引，不然rmats2sashimiplot會先建索引，比較慢。rMATS的結果文件中，如SE.MATS.JC.txt中染色體都是默認加上chr的，而bam文件中的染色體根據基因組注釋文件來源不同不一定有chr，需要使兩者一致。

方法：

$ rmats2sashimiplot  --b1  ./04_bam/LF1.bam,./04_bam/LF2.bam,./04_bam/LF3.bam  --b2 ./04_bam/CF1.bam,./04_bam/CF2.bam,./04_bam/CF3.bam  -t SE  -e ./06_rmats/plot/SE.MATS.JC_top5.txt  --l1 LF  --l2 CF  --exon_s 1  --intron_s 1  -o ./06_rmats/plot/  &

參數：
--b1 B1：sample_1 in bam format (s1_rep1.bam[,s1_rep2.bam])
--b2 B2：sample_2 in bam format (s2_rep1.bam[,s2_rep2.bam])
-t：rMATS結果中產生的可變剪切類型 {SE,A5SS,A3SS,MXE,RI}
-e EVENTS_FILE：The rMATS output event file (Only if using rMATS format result as event file) 在*.MATS.JC.txt文件里把需要畫圖的基因信息提取出來
-c：需要畫圖展示的基因的位置信息，基因組區域的坐標和注釋，gff3文件，-c {chromosome}:{strand}:{start}:{end}:{/path/to/gff3}
--l1 L1：The label for first sample
--l2 L2：The label for second sample
-o OUT_DIR：The output directory
--exon_s 1：縮小外顯子的大小。默認值為1
--intron_s 1：縮小內含子的大小。例如，如果--intron_s為5，表示內含子的大小為5:1（如果內含子的實際大小是5，那么就將縮小為1）。默認值為1。
--group-info：如果用戶想要將樣本分組，可以使用* .gf文件指定此參數
--color：可以使用自定義繪圖的顏色序列。顏色的數量應該與bam_files對應
--font-size：更改字體大小，默認等于8
--no-text-background：透明文本背景
--hide-number：隱藏連接數
--min-counts 0：用于指定展示的最小count數，如果實際的counts數小于該閾值，則不會在圖中顯示。

結果：

圖上方標題為：可變剪接事件3個外顯子所在的基因組坐標及正負鏈信息。
跨外顯子比對的 reads 使用連接外顯子 junction 邊界的弧線表示。弧線的粗細和比對到 junction 上的 reads 數成正比，同時弧線上的數字指出了 junction reads 的數目。
右上方標注了各個樣本可變剪接事件所在的基因及IncLevel（最終會用這2個值做組間的差異AS分析）。
最下方為根據gtf推斷出的選擇性剪接異構體。

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

軟件13 —— rMATS

軟件13 —— rMATS

一、基本介紹

二、使用方法

(1) 輸入

(2) 方法

(3) 參數

(4) 結果

(5) 可視化

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

軟件13 —— rMATS

一、 基本介紹

二、 使用方法

(1) 輸入

(2) 方法

(3) 參數

(4) 結果

(5) 可視化

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

一、基本介紹

二、使用方法