之前講了太多的很細的數據分析和過濾,在實戰中,一般可以把命令寫在一起。
total
這張圖片對比了數據summary和數據過濾的命令之間的差異。
對于我們自然群體,沒有家系結構,所以主要是
--mind N 刪個體(基于缺失率)
--geno N 刪snp(基于缺失率)
--maf N 刪snp (基于最小等位基因頻率)
--hwe N 刪snp (基于A和a不符合哈德溫伯格平衡)
--LD(這個一般不做雙基因互作的話不考慮,詳見我上一篇)
plink --bfile core_v0.7 --mind 0.1 --maf 0.05 --geno 0.1 --hwe 0.01 --make-bed --out clean
這樣可以生成過濾好的文件,進行下一步分析
生成的新文件
clean