轉(zhuǎn)載自 微信公眾號:茶與生信
依據(jù)RNA-seq數(shù)據(jù)進行可變剪切分析的新軟件:McSplicer
下面對其使用步驟做一介紹:
(1) 需要準備的文件Files
GTF 文件:基因組自帶的,或者是stringtie等軟件生成的皆可
BAM文件:已排序,已建好索引(可以用samtools建索引)
(2) 操作步驟Steps
1‘ 運行exonRefine將外顯子集精煉為不重疊的連續(xù)子外顯子區(qū)域,
./bin/exonRefine <annotation.gtf> --prefix OUTPUT_PREFIX
2’ 對上一步中生成的注釋和輸入的BAM文件運行SigCount
./bin/sigcount <alignments.bam> <annotation_refined.gtf> <outfile-prefix>
3' 運行McSplucer以獲取剪切位點情況估計
python2 ./python_code/McSplicer.py \
--gtf REFINED_GTF \
--count_file SIGNATURE_COUNT_FILE \
--out_dir OUTPUT_DIRECTORY\
--bootstraps NUM_OF_BOOSTRAPS\
--read_len READ_LENGTH\
--prefix OUT_FILE_PREFIX
(3) 結(jié)果輸出Outputs
輸出的csv文件包含bootstrap step,剪接位點索引,基因鏈,染色體,剪接位點基因組位置和McSplicer剪接位點使用估計。
依賴Dependencies
McSplicer 在 python 2上運行(最好是python 2.7),另外需要:
- numpy>=1.13.1
- pandas>=0.20.3
軟件背景Reference
文章目前發(fā)表在bioRxiv
題目為:McSplicer: a probabilistic model for estimating splice site usage from RNA-seq data
軟件使用說明和下載地址:https://github.com/canzarlab/McSplicer
單位:德國慕尼黑大學