在分析高通量測(cè)序數(shù)據(jù)的時(shí)候,我們會(huì)對(duì)Q20/Q30不陌生。那么Q20/Q30是什么意思呢?又是怎么來的呢?
Q20,Q30它們代表的是某一堿基質(zhì)量值占全部堿基數(shù)的百分比,就類似于產(chǎn)品合格率,不同的質(zhì)量標(biāo)準(zhǔn)會(huì)產(chǎn)生不同的合格率,標(biāo)準(zhǔn)越高,質(zhì)量越好,達(dá)標(biāo)的就越少;合格率越高,那么達(dá)標(biāo)的數(shù)據(jù)就越多。一般而言,當(dāng)Q30>85%的時(shí)候,就說明數(shù)據(jù)質(zhì)量合格。還有一個(gè)是GC含量,一般在50%——60%之間。
一個(gè)給定堿基的測(cè)序質(zhì)量分值Q定義為下面的等式:
Q = -10log10(e)
其中,e為預(yù)計(jì)堿基檢出不正確的概率。
Q分值較高表示出錯(cuò)的概率較小。
Q分值較低可能會(huì)導(dǎo)致相當(dāng)大一部分的片段不可用,還可能導(dǎo)致假陽性的變異檢出增加,以致得出不準(zhǔn)確的結(jié)論。
測(cè)量分值與堿基檢出精度的關(guān)系如下:
表1
好吧,這一期我們就先講到這,下期再見。