我在做BreakPoint Motif分析時,提取每個read在參考基因上的比對位置,一開始我認為read的比對位置不可能有比對到染色體的第一個堿基的,因為染色體結構的復雜性,染色體的兩端有高度螺旋化的端粒結構,染色體的開始一串基本都是NNNNNNNN。
image-20231108153552957.png
然后發現我錯了啊啊啊啊啊:
444f52a891099f059a3c256cfc0df7f.png
看了所有的染色體,好像只有17號染色體的第一個堿基開始都被測序出來了,那它有什么特殊的嗎?
簡單搜了一下:
ref:https://zhuanlan.zhihu.com/p/635612574
image-20231108154039314.png
ref:https://www.nsfc.gov.cn/publish/portal0/tab440/info59391.htm
image-20231108154203731.png
當然,我用的參考基因組版本為hg19~