新的可變剪切分析軟件:McSplicer

轉(zhuǎn)載自 微信公眾號:茶與生信
依據(jù)RNA-seq數(shù)據(jù)進行可變剪切分析的新軟件:McSplicer
下面對其使用步驟做一介紹:

(1) 需要準備的文件Files

GTF 文件:基因組自帶的,或者是stringtie等軟件生成的皆可

BAM文件:已排序,已建好索引(可以用samtools建索引)

(2) 操作步驟Steps

1‘ 運行exonRefine將外顯子集精煉為不重疊的連續(xù)子外顯子區(qū)域,

./bin/exonRefine  <annotation.gtf> --prefix OUTPUT_PREFIX

2’ 對上一步中生成的注釋和輸入的BAM文件運行SigCount

./bin/sigcount <alignments.bam> <annotation_refined.gtf> <outfile-prefix>

3' 運行McSplucer以獲取剪切位點情況估計

python2 ./python_code/McSplicer.py \
        --gtf REFINED_GTF \
        --count_file SIGNATURE_COUNT_FILE \
        --out_dir OUTPUT_DIRECTORY\
        --bootstraps NUM_OF_BOOSTRAPS\
        --read_len READ_LENGTH\
        --prefix OUT_FILE_PREFIX

(3) 結(jié)果輸出Outputs

輸出的csv文件包含bootstrap step,剪接位點索引,基因鏈,染色體,剪接位點基因組位置和McSplicer剪接位點使用估計。

依賴Dependencies

McSplicer 在 python 2上運行(最好是python 2.7),另外需要:

  • numpy>=1.13.1
  • pandas>=0.20.3

軟件背景Reference

文章目前發(fā)表在bioRxiv

題目為:McSplicer: a probabilistic model for estimating splice site usage from RNA-seq data

軟件使用說明和下載地址:https://github.com/canzarlab/McSplicer

單位:德國慕尼黑大學

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。