GenomicsDBImport 不應(yīng)該劃分過多的intervals,因?yàn)槊糠治鲆粋€(gè)interval,就會(huì)將所有的GVCF文件打開,檢索一遍,在interval過多的時(shí)候,這個(gè)打開GVCF文件的過程會(huì)占用大部分時(shí)間。這個(gè)問題在GATK論壇上也有討論。所以我覺得應(yīng)該按染色體分intervals,對(duì)于組裝不好,Scaffolds過多的基因組,最好舍棄一部分Scaffold或?qū)⑿〉腟caffold連在一起作為一個(gè)interval。
GATK4 多個(gè)樣本GenotypeGVCFs前用 CombineGVCFs還是GenomicsDBImport我們知道,GATK 4 多個(gè)樣本joint genotyping用模塊GenotypeGVCFs, 目前GenotypeGVCFs只支持以下三種形式的輸入文件:1)a sin...