獻給初學(xué)者:手把手教你在線預(yù)測蛋白質(zhì)結(jié)構(gòu)
I TASSER算是比較好的華人教授開發(fā)的一個預(yù)測軟件,在線可以直接分析。但是需要等待挺長時間并且一次只能run一個。所幸我們HPC上有這個軟件所以我就直接run起來代碼如下。
先將RNA序列用CPC2預(yù)測下氨基酸序列,當(dāng)然也可以下已知的氨基酸序列,存儲為fasta格式,我上批量運行的所以直接就批量遞交了,大家參考即可。
這里要注意的是他們會默認序列名字為seq.fasta所以要將該序列放在工作目錄里面
#!/bin/bash
#SBATCH --time=1:00:00
#SBATCH --cpus-per-task=2
#SBATCH --mem=2g
data_dir=/I_TASSER
fa_dir=${data_dir}/fasta_files
job_dir=${data_dir}/job
log_dir=${data_dir}/log
mkdir -p ${log_dir}
mkdir -p ${job_dir}
thread=14
cd ${fa_dir}
for i in $(ls $pwd *.fa);do
job_file="${job_dir}/${i%.fa*}.job"
echo "#!/bin/bash
#SBATCH --job-name=${i%.fa*}.I-TASSER.job
#SBATCH --output=$log_dir/${i%.fa*}.I-TASSER.out
#SBATCH --time=40:00:00
#SBATCH --cpus-per-task=${thread}
#SBATCH --mem=30g
module load I-TASSER
out_dir=${fa_dir}/${i%.fa*}
mkdir -p \${out_dir}
cp ${fa_dir}/${i} \${out_dir}/seq.fasta
runI-TASSER.pl -runstyle gnuparallel \
-LBS true -EC true -GO true -seqname ${i%.fa*} \
-datadir \${out_dir} -light true \
-outdir \${out_dir} && file2html.py \${out_dir}
" > $job_file
sbatch $job_file
done
image.png
結(jié)果看起來還可以,pdb文件用PyMol再美化下就好