最近在搞基因組,前面contig的組裝難度不大,用wtdbg2、raven、mecat2、flye等組裝就可以了。
組裝完畢后,contig掛載成染色體,可以采用高密度遺傳連鎖圖、bionano光學(xué)圖譜等進(jìn)行掛載,但是現(xiàn)在大多數(shù)文章采用的是HI-C數(shù)據(jù)進(jìn)行掛載。
目前最經(jīng)典的HI-C掛載流程應(yīng)當(dāng)是juicer-3D DNA-Juicerbox流程了。其中3D-DNA和juicerbox沒啥好說的,juicer中間有點(diǎn)坑,最近搞了幾天時(shí)間。
整個(gè)歷程大體可以參考該文章 利用3D-DNA掛載基因組。但是由于Juicer更新一下,引入了一些bug,所以需要做一些修改。
我的機(jī)器的ubuntu的系統(tǒng),單機(jī)160核心。通過git clone而得到的juicer是2.0版本,采用的/CPU文件夾下的腳本,但是Juicer2.0中CPU下的文件目錄不對(duì),以及腳本本身有點(diǎn)小問題,導(dǎo)致運(yùn)行出錯(cuò),需要做幾個(gè)修改:
1 juicer/cpu文件夾下新建scripts文件
mkdir scripts
2 將common文件夾整體復(fù)制到scripts下
cp /juicer/CPU/common /juicer/CPU/scripts/
3 下載Juicer_tools.jar 文件,并放入??/juicer/CPU/scripts/文件夾下
cd?/juicer/CPU/scripts/
wget?https://github.com/aidenlab/Juicebox/releases/download/v.2.13.07/juicer_tools.jar?
這是個(gè)很神奇的設(shè)定,juicer軟件,無論你是git clone還是直接下載包,里面都是不包含最重要的juicer_tools.jar的,不明白作者的腦洞在哪里。
/gpfs03/home/jingjing/software/juicer-master/scripts/juicer.sh -t 30 -g RT -z reference/genome.fa -y restriction_sites/genome_DpnII.txt -p restriction_sites/genome.chrom.sizes -d /xxxxx/xxxxx -D /gpfs03/home/jingjing/software/juicer-master/CPU -s DpnII --assembly
主意 -D參數(shù) 指定工作文件夾 用tab補(bǔ)齊最后一定會(huì)有/ 也就是 /juicer-master/CPU/ 這是不行的,不能有斜杠,運(yùn)行會(huì)出錯(cuò)。
-d /xxxxx/xxxxx? ? 也是一樣 不能有斜杠。