默認情況下,IGV單獨顯示 paired-end reads 的每一個reads,因為它們可以更緊湊地排列。按住Ctrl鍵單擊其中一個reads(在MacOS上按住Cmd鍵單擊),可以以相同的顏色成對的突出顯示 paired-end reads。顏色是任意的,但對于每一對 paired-end reads而言是相同的。重復點擊其中一個reads會清除顏色。或者,從軌跡的彈出菜單中選擇“Clear selections”可以清除軌跡中所有比對的突出顯示顏色。
當以配對形式查看時,點擊一個比對(如果彈出文本行為已設置為懸停,則懸停在其上)將顯示該比對及其配對reads的讀取詳細信息。
分屏視圖
可以通過在 paired-end reads軌跡上右鍵單擊來動態調用分屏視圖。右鍵單擊比對并從彈出菜單中選擇“View mate region in split screen”。如果比對沒有映射的配對,則此選項將變灰。兩個比對將以顏色突出顯示,以便更容易在第二個面板中看到配對。
您可以再次選擇此選項以獲取其他比對并并排查看多個面板。有關如何控制視圖的多個區域的詳細信息,請參見有關查看多個區域的部分。
檢測結構變異
paired-end reads測序可以提供插入、重復、易位和倒置等結構變異的證據。IGV可以檢測到與paired-end reads比對中發現的異常,這可能表征潛在的結構變異。特別是,一對比對的兩個比對讀取之間的預期距離以及它們的相對方向是已知的。當實際值與預期值不同時,使用顏色標識異常。這是比對的默認顏色模式,但可以通過右鍵彈出菜單選擇按許多不同屬性對比對進行著色。
如果看到許多以相同方式著色的比對,這可能是結構變異的證據。僅看到少量以不規律模式著色的比對,較不太可能表明存在變異。
1.插入大小
預期(或推斷)的插入大小值可以根據加載的文件中找到的大小分布即時計算(默認),也可以將其指定為以堿基對為單位的特定大小范圍。可以在“View > Preferences”的“Alignments”和“RNA”選項卡中更改默認插入大小選項。要更改一個軌跡的選項,請從軌跡的右鍵彈出菜單中選擇“Set insert size options”。
插入大小的顏色方案是:
大于預期插入大小:兩個讀取都為紅色插入大小可用于檢測缺失、插入和染色體間重排。
2. 缺失
在缺失中,與參考基因組相比,當前基因組中缺少一段DNA。
當paired-end reads的一個跨越缺失的DNA段與參考基因組比對時,推斷的插入大小將大于預期值。這是由于當前基因組中不存在的基因組缺失部分。可以用下面的示例圖示化這一點,其中深藍色箭頭對表示一對配對讀取。
當推斷的插入大小大于預期時,該對讀取的兩個讀取都會以紅色著色,如下例所示,其中顯示了缺失兩端的分屏視圖。
3.插入
在插入的情況下,主體基因組中存在一段在參考基因組中未表示的DNA。
與缺失的情況相比,配對讀取之間的距離的效果相反;推斷的插入大小小于預期。
當推斷的插入大小小于預期時,該對讀取的兩個讀取都會以藍色著色。
插入大小異常檢測能夠檢測的插入的最大大小受測序片段的大小限制。它們必須足夠長,以跨越插入并包括兩端映射到參考的序列。因此,第三代長讀取測序能夠檢測比短片段配對末端測序更長的插入。
4. 染色體內融合
在染色體內融合的情況下,主體基因組上的一條染色體上的DNA段與另一條染色體上的DNA段融合。下面的圖解以染色體1和染色體6為例。
當從主體基因組的跨越融合的DNA片段的測序對與參考基因組比對時,每個讀取都將映射到不同的染色體。
在這種情況下,每個讀取都將按其配對的染色體進行著色(請參見上述顏色方案)。
下面的示例顯示了兩個比對軌跡的分屏視圖,一個是腫瘤樣本,另一個是匹配的正常樣本。左面板顯示了染色體1的一個區域,右面板顯示了染色體6的一個區域。在腫瘤樣本軌跡中,染色體1上的大量讀取都著色為棕色(染色體6的顏色),因為它們的配對比對到了染色體6。類似地,它們在染色體6上的配對也被著色為藍色(染色體1的顏色)。請注意,正常樣本中的讀取是灰色的,這意味著這種重排僅在腫瘤中發現。
5. 配對方向
paired-end reads的方向可用于檢測同一染色體上的倒置、重復和易位。
方向是以讀取鏈為基礎定義的:左鏈與右鏈,以及一對中的第一個讀取與第二個讀取。
(圖由Bob Handsaker提供)
以下部分的示意圖假定采用Illumina paired-end reads測序約定。
6. 倒置
倒置是指與參考基因組相比,在當前基因組中反轉的大片段DNA。
當倒置出現在paired-end reads中時,這些reads與參考基因組明顯不同。
在IGV中,它顯示如下。
7.倒置重復
當一段大片段的DNA被復制并以與原始序列相反的配置插入到基因組中時,這被稱為倒置重復。
將會有重疊的左鏈和右鏈,還可能會有改變的覆蓋深度/拷貝數。
這在IGV中顯示如下。
8.串聯重復
當一段大片段的DNA被復制并插入到基因組中,并且插入位置靠近原始序列位置時,這被稱為串聯重復。
這些reads不僅會被復制,而且會被排列如下。
IGV將顯示此重新排列,如下所示。
同一染色體上的易位
當從一處刪除DNA的大片段并插入到另一處時,這被稱為易位。
可以通過顏色編碼來檢測同一染色體上的易位方向,而在兩個染色體之間的易位則可以通過按插入大小著色來檢測。