利用3D-DNA流程基于Hi-C提升基因組組裝

本文可在http://xuzhougeng.top/免費閱讀原文

使用二代數據或三代數據得到contig后,下一步就是將contig提升到染色體水平。有很多策略可以做到這一點,比如說遺傳圖譜,BioNano(看運氣), HiC, 參考近源物種。

如果利用HiC進行準染色體水平,那么目前常見的組裝軟件有下面幾個

  • HiRise: 2015年后的GitHub就不再更新
  • LACHESIS: 發表在NBT,2017年后不再更新
  • SALSA: 發表在BMC genomics, 仍在更新中
  • 3D-DNA: 發表在science,仍在更新中
  • ALLHiC: 發表在Nature Plants, 用于解決植物多倍體組裝問題

對于二倍體物種而言,目前3D-DNA應該是組裝效果最好的一個軟件。

工作流程

使用3D-DNA做基因組組裝的整體流程如下圖,分別為組裝,Juicer分析Hi-C數據,3D-DNA進行scaffolding,使用JBAT對組裝結果進行手工糾正,最終得到準染色體水平的基因組。

總體流程

基因組組裝可以是二代測序方法,也可以是三代測序組裝方法,總之會得到contig。

Juicer的工作流程見下圖,輸入原始的fastq文件,處理得到中間文件.hic, 之后對.hic文件用于下游分析,包括

  • Arrowhead: 尋找存在關聯的區域
  • HiCCUPS: 分析局部富集peaks
  • MotifFinder: 用于錨定peaks
  • Persons: 計算觀測/期望的皮爾森相關系數矩陣
  • Eigenvector: 確定分隔
juicer工作流程

之后Juicer的輸出結果給3D-DNA,分析流程見下圖。3D-DNA先根據Hi-C數據分析contig中的misjoin,對其進行糾錯。之后通過四步,分別是Polish, Split, Seal和Merge, 得到最終的基因組序列

3d-dna流程

軟件安裝

在安裝之前,確保服務器上有了下面這些依賴軟件工具

  • LastZ(僅在雜合基因組的二倍體模式下使用)
  • Java >= 1.7
  • GNU Awk >= 4.02
  • GNU coreutils sort > 8.11
  • Python >= 2.7
  • scipy, numpy, matplotlib
  • GNU Parallel >=20150322 (不必要,但是強力推薦)
  • bwa

我們需要安裝兩個軟件,一個是3D-DNA,另一個是juicer。

CPU版本的juicer安裝

mkdir -p ~/opt/biosoft/
cd ~/opt/biosoft
git clone https://github.com/theaidenlab/juicer.git
cd juicer
ln -s CPU scripts
cd scripts/common
wget https://hicfiles.tc4ga.com/public/juicer/juicer_tools.1.9.9_jcuda.0.8.jar
ln -s juicer_tools.1.9.9_jcuda.0.8.jar  juicer_tools.jar

然后用~/opt/biosoft/juicer/scripts/juicer.sh -h檢查是否有幫助信息輸出

3D-DNA安裝也很容易,只需要從Github上將內容克隆到本地即可

cd ~/opt/biosoft
git clone https://github.com/theaidenlab/3d-dna.git

sh ~/opt/biosoft/3d-dna/run-asm-pipeline.sh -h查看是否有幫助文檔輸出。

參數詳解

以CPU版本的為例,juicer.sh的參數如下

Usage: juicer.sh [-g genomeID] [-d topDir] [-s site] [-a about] [-R end]
                 [-S stage] [-p chrom.sizes path] [-y restriction site file]
                 [-z reference genome file] [-D Juicer scripts directory]
                 [-b ligation] [-t threads] [-r] [-h] [-f] [-j] 

參數說明

還有 58% 的精彩內容
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
支付 ¥10.00 繼續閱讀
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,936評論 6 535
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,744評論 3 421
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,879評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,181評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,935評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,325評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,384評論 3 443
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,534評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,084評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,892評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,067評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,623評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,322評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,735評論 0 27
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,990評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,800評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,084評論 2 375