1. KNIFE
根據circRNA分析軟件benchmark文獻推薦,KNIFE準確度最高,circRNA分析優先推薦使用KNIFE工具。
1. 下載修新版KNIFE軟件
從release中選擇v1.4穩定版本下載,不建議使用git clone下載,開發版還有一些bug未解決。
cd ~/biosoft/
wget https://github.com/lindaszabo/KNIFE/archive/v1.4.tar.gz
tar zxvf v1.4.tar.gz && cd KNIFE-v1.4
cd circularRNApipeline_Standalone/analysis
# 添加執行權限,否則運行過程中會由于部分軟件無執行權限報錯。
sudo chmod a+x *
2. 確保所有R、python、和shell腳本可以執行
如果無法運行./completeRun.sh,需要將sh默認執行程序設置為非dash
sudo dpkg-reconfigure dash
3. 安裝下面軟件,并添加至環境路徑
- Bowtie2 2.2.1+ (tested with 2.2.1)
- Bowtie 0.12.7+ (tested with 0.12.7)
- perl
- python 2.7.3+ (tested with 2.7.5) and the numpy and scipy libraries
- R 3.0.2+ (tested with 3.0.2) and the data.table package
- samtools 1.2+ if you want alignment files output as bam instead of sam files
4. 下載bowtie索引文件
a. 創建索引文件夾
創建以下兩個文件夾,分別用于存放bowtie和bowtie2索引文件。
circularRNApipeline_***/index和 circularRNApipeline_***/denovo_scripts/index
b. 下載bowtie索引文件并解壓到相應文件夾
Human (hg19), Mouse (mm10), Rat (rn5) and Drosophila (dm3)有可用的junction索引文件下載。
作者同時打包了所有的轉錄組、基因組和核糖體RNA索引、fasta文件和gtf文件。
需要將bowtie1索引文件解壓至以下文件夾:
cd /path/to/circularRNApipeline_*/denovo_scripts/index
tar zxvf genomeId_BT1index.tar.gz
將bowtie2索引文件解壓至以下文件夾:
cd /path/to/circularRNApipeline_*/index
tar zxvf genomeId_BT2index.tar.gz
gtf文件需要下載并解壓縮至以下文件夾:
cd /path/to/circularRNApipeline_*/denovo_scripts
gunzip genomeId_genes.gtf.gz
KNIFE提供的hg19參考基因組和索引文件可以通過下面鏈接下載: https://mega.nz/#F!RtsCHCQb!fyxYNWjoCef5Ie361vUxiA
如果內存夠大,也可以用機器構建索引。
5. 按照testOutput/README指導進行測試
(1)下載release1.1中提供的兩個fastq.gz文件
cd /path/to/KNIFE/testData
nohup wget -c https://github.com/lindaszabo/KNIFE/releases/download/v1.1/SRR1027187_1.fq.gz &
nohup wget -c https://github.com/lindaszabo/KNIFE/releases/download/v1.1/SRR1027187_2.fq.gz &
(2) 測試KNIFE是否安裝好(單機運算)
sh completeRun.sh /home/jshi/biosoft/KNIFE/testData/ complete /home/jshi/biosoft/KNIFE/new testData 8 phred64 circReads 40 1 2>&1
可以將輸出文件和github中給出的結果進行比較,看是否完成了環狀RNA分析。