基因型分型(genotyping)
基因型分型用于遺傳學,確定一條染色體上一些基因,DNA序列或遺傳標記的連鎖組合。實際上就是確定一條染色體上某個區(qū)段的單體型(haplotype)。
單體型(haplotype)
單體型(haplotype)也稱單倍型,位于染色體上某一區(qū)域的一組相關聯的SNP等位位點被稱作單體型(haplotype)。
簡單說,就是一條染色體緊密相連的兩個或兩個以上基因座上一組等位基因的基因型,通常作為一個單位遺傳。如一條染色體上HLA各位點的基因組合。HLA有多個基因座,每個基因座上有多個等位基因,一些基因座上的特定等位基因經常連鎖在一起共同通過減數分裂傳遞給下一代,這樣一套共同遺傳的多態(tài)性連鎖的等位基因就稱為單體型。
Phased And Unphased Genotypes
phase即分型,在genetic領域特指分出haplotype,雙倍體
Phased data are ordered along one chromosome and so from thesedata you know the haplotype. Unphased data are simply the genotypes withoutregard to which one of the pair of chromosomes holds that allele.
A biallelic genotype comes from two chromosomes. Phased means Iknow not only the genotypes but which chromosome each genotype call came from.This lets you interpret which sets of genotypes are being inherited together
連鎖不平衡(LD)
當位于某一座位的特定等位基因與另一座位的某一等位基因同時出現的概率大于群體中因隨機分布的兩個等位基因同時出現的概率時,就稱這兩個座位處于連鎖不平衡狀態(tài)(linkage
disequilibrium)。
簡單地說,只要兩個基因不是完全獨立地遺傳,就會表現出某種程度的連鎖。這種情況就叫連鎖不平衡。連鎖不平衡可以是同一條染色體上的不同區(qū)域,也可以是不同染色體上的。
IBD血緣同源簡介
IBD全稱Identity By Descent, 又叫做血緣同源,指的是兩個個體中共有的等位基因來源于共同祖先;
IBS全稱Identity By State, 又叫做狀態(tài)同源,指的是兩個個體中共有的等位基因序列相同。
對于某個等位基因,IBS state只要求allel的個數相同即可,而IBD state則進一步要求相同的allele來自于共同祖先。
利用IBD可以描述兩個樣本間的親緣關系。
遺傳距離
① 遺傳距離指不同的種群或種之間的基因差異的程度,并且以某種數值進行度量。通常由基因頻率的某個函數所確定。常用遺傳系統(tǒng)樹加以表達。
② 位于同一條染色體上兩個基因座間發(fā)生交換和重組的機會,兩個基因座距離越近,發(fā)生重組的機會愈低,反之,重組率愈大,最大值為0.5。單位為分摩(10%的重組率)或厘摩(1%的重組率)。
1910年,Morgen TH提出假設:假定沿染色體長度上交換的發(fā)生具有同等的幾率,那么兩個基因位點間的距離可以決定減數分裂過程中發(fā)生重組染色體的發(fā)生率,即重組分數。重組分數的數值將隨著兩位點間距離的增大而增大。它是構建物理遺傳圖譜的基礎,也是利用連鎖分析將基因序列從染色體上搜尋出來的位置克隆法的基礎。人們規(guī)定同一染色體上兩個位點間在一百次減數分裂發(fā)生一次重組的機會時,即Q=1/100時定義兩位點間的相對距離為一個cM(centimorgan)。人類基因組平均遺傳長度為3300cM,而DNA的平均的物理長度為30億對。 染色體上各基因之間的交換率,即發(fā)生交換的百分比,是不同的?;蛑g的距離不同,兩個基因靠的越近,其間染色體交叉的機會就越少,因而基因的交換率越小,反之,交換率就越大?;虻慕粨Q率反映了兩基因之間的相對距離。根據基因在染色體上有直線排列的規(guī)律,把每條染色體上的基因排列順序(連鎖群)制成圖稱為遺傳學圖(genetic map),亦稱基因連鎖圖(gene-linkagemap)。
遺傳距離、重組率、交換值的關系:
簡單來說:重組率等同于交換值,遺傳圖距是交換值去了百分號后的數值。
重組率(recombination value)
重組型的配子百分數稱為重組率。
交換值(crossing -over value)
基因之間交換的百分率,通常用重組率代表交換率。
遺傳距離
用交換值表示兩個基因在同一染色體的相對距離,這種相對距離稱為遺傳距離。
遺傳距離的數量單位稱為圖距。
1cM=1%的交換值去掉其百分率的數值