AnnotSV輸出結果列名

AnnotSV地址:https://lbgi.fr/AnnotSV/
版本:3.0.5


AnnotSV輸出結果部分列名解釋

1、AnnotSV_ID:AnnotSV ID
2、SV_chrom:染色體名稱
3、SV_start:SV在染色體中的起始位置
4、SV_end:SV在染色體中的終止位置
5、SV_length:SV的長度(bp)(缺失為負值)
6、SV_type:SV類型(缺失DEL、重復DUP等)
7、Samples_ID:調用SV的樣本ID列表(根據SV輸入文件)
8、ID:突變位點ID(僅從VCF輸入文件中提取)
9、REF:參考基因組中的核苷酸序列(僅從VCF輸入文件中提取)
10、ALT:突變后核苷酸序列(僅從VCF輸入文件中提取)
11、QUAL:突變質量值(僅從VCF輸入文件中提取)
12、FILTER:過濾結果(僅從VCF輸入文件中提取)
13、INFO:位點信息(僅從VCF輸入文件中提取)
14、FORMAT:vcf文件的FORMAT列信息
15、“SAMPLE_NAME”:vcf文件中的樣本名, 對應信息該樣本的基因型
16、Annotation_mode:表示生成的注釋行類型: 1. 對SV全長的注釋(“full”),2. 每個被SV重疊的基因的注釋(“split”)
17、Gene_name:基因Symbol
18、Gene_count:與SV重疊的基因數
19、Tx:轉錄本Symbol
20、Tx_start:轉錄本起始位點
21、Tx_end:轉錄本終止位點
22、Overlapped_tx_length:轉錄本與SV重疊的長度(bp)
23、Overlapped_CDS_length:編碼序列與SV重疊的長度(CDS) (bp)
24、Overlapped_CDS_percent:編碼序列(CDS)與SV重疊的百分比(bp)
25、Frameshift:表示CDS長度是否能被3整除(yes或no)
26、Exon_count:轉錄本中外顯子數
27、Location:SV在基因中的定位,取值txStart, txEnd, exon’i’, intron’i
28、Location2:SV在基因編碼區的定位,取值UTR(基因中無CDS)、5'UTR (CDS開始前)、3'UTR (CDS結束后)、CDS (CDS開始到CDS結束之間,可以是外顯子,也可以是內含子)。
29、Dist_nearest_SS:考慮外顯子和內含子SV斷點后,到最近剪接位點的絕對距離
30、Nearest_SS_type:最近的剪接位點類型:5'(供體)或3'(受體)
31、Intersect_start:SV和轉錄本之間交集的起始位置
32、Intersect_end:SV和轉錄本之間的交叉點的結束位置
33、RE_gene:受調節元件調節的基因名稱與SV重疊以進行注釋。如果可以,相關單倍不全(HI),三倍敏感性(TS), Exomiser (EX)評分,OMIM和候選基因的詳細調控基因名稱。(關于過濾輸出,請參見-REselect1和-REselect2選項)
34、P_gain_phen:完全重疊于SV的致病gain基因組區域的坐標來注釋
35、P_gain_hpo:描述致病增益基因組區域的HPO術語與SV完全重疊來注釋
36、P_gain_source:致病增益基因組區域的起源與SV完全重疊以注釋:dbVarNR (dbVar), ClinVar (CLN), ClinGen (TS3)
37、P_gain_coord:致病增益基因組區域的坐標與SV完全重疊以注釋
38、P_loss_phen:致病損失基因組的表型區域與SV完全重疊注釋
39、P_loss_hpo:描述致病損失基因組區域的HPO術語與SV完全重疊來注釋
40、P_loss_source:致病損失基因組區域的起源與SV完全重疊注釋:dbVarNR (dbVar), ClinVar (CLN), ClinGen (HI3), morbid(病變部位)
41、P_loss_coord:致病性缺失基因組區域的坐標與SV完全重疊以注釋
42、P_ins_phen:致病基因插入基因組區域的表型與SV完全重疊來注釋
43、P_ins_hpo:描述致病插入基因組區域的HPO術語與SV完全重疊來注釋
44、P_ins_source:致病插入基因組區域的起源與SV完全重疊以注釋:dbVarNR (dbVar), ClinVar (CLN)
45、P_ins_coord:致病性插入基因組區域的坐標與SV完全重疊以注釋
46、P_snvindel_nb:公共數據庫中致病snv/indel的數量與SV完全重疊以進行注釋
47、P_snvindel_phen:公共數據庫中致病snv/indel的表型與SV完全重疊來注釋
48、B_gain_source:良性gain基因組區起源完全重疊SV注釋: gnomAD, ClinVar (CLN), ClinGen (TS40), DGV (DGV, nsv或esv), DDD, 1000個基因組(1000g), Ira M. Hall’s實驗室(IMH),兒童慈善研究所(CMRI)
49、B_gain_coord:完全重疊于SV的良性gain基因組區域的坐標來注釋
50、B_loss_source:良性loss基因組區域的起源完全重疊SV注釋: gnomAD, ClinVar (CLN), ClinGen (HI40), DGV (DGV, nsv或esv), DDD, 1000個基因組(1000g), Ira M. Hall’s實驗室(IMH),兒童慈善研究所(CMRI)
51、B_loss_coord:完全重疊于SV的良性loss基因組區域的坐標來注釋
52、B_ins_source:良性insert基因組區域的起源完全重疊SV注釋:gnomAD, ClinVar (CLN), 1000個基因組(1000g), Ira M. Hall’s實驗室(IMH),兒童慈善研究所(CMRI)
53、B_ins_coord:完全重疊于SV的良性insert基因組區域的坐標來注釋
54、B_inv_source:良性inversion基因組區域的起源完全重疊SV注釋:gnomAD, ClinVar (CLN), 1000個基因組(1000g), Ira M. Hall’s實驗室(IMH),兒童慈善研究所(CMRI)
55、B_inv_coord:完全重疊于SV的良性inversion基因組區域的坐標來注釋
56、TAD_coordinate:邊界與標注的SV重疊的TAD坐標(坐標中包含的邊界)
57、ENCODE_experiment:ENCODE實驗用來定義TAD
58、GC_content_left:左側SV斷點附近GC含量(+/- 100bp)
59、GC_content_right:右側SV斷點附近GC含量(+/- 100bp)
60、Repeat_coord_left:重復左SV斷點周圍的坐標(+/- 100bp)
61、Repeat_type_left:在左SV斷點附近重復輸入(+/- 100bp),例如AluSp, L2b, L1PA2, LTR12C, SVA_D,...
62、Repeat_coord_right:重復右SV斷點周圍的坐標(+/- 100bp)
63、Repeat_type_right:在右SV斷點(+/- 100bp)周圍重復鍵入,例如AluSp, L2b, L1PA2, LTR12C, SVA_D,...
64、Gap_left:左SV斷點周圍間隙區域坐標(+/- 100bp)
65、Gap_right:右SV斷點周圍間隙區域坐標(+/- 100bp)
66、SegDup_left:分段復制區域坐標圍繞左SV斷點(+/- 100bp)
67、SegDup_right:分段復制區域坐標圍繞右SV斷點(+/- 100bp)
68、ENCODE_blacklist_left:編碼黑名單區域坐標圍繞左SV斷點(+/- 100bp)
69、ENCODE_blacklist_characteristics_left:左SV斷點附近ENCODE黑名單區域特征(+/- 100bp)
70、ENCODE_blacklist_right:編碼黑名單區域坐標圍繞右SV斷點(+/- 100bp)
71、ENCODE_blacklist_characteristics_right:右SV斷點附近ENCODE黑名單區域特征(+/- 100bp)
72、ACMG:ACMG基因
73、HI:ClinGen單倍體不全(Haploinsufficiency)得分
注:Haploinsufficiency得分。當評估單倍不全(HI)時,先證者必須具備以下任一條件: 1. 被評估基因中預測或證實為無效,2. 功能缺失(LoF)變異。
74、TS:ClinGen Triplosensitivity得分
75、DDD_HI_percent:DDD排序的單倍體不足
76、DDD_status:DDD狀態:如已確認,可能
77、DDD_mode:DDD等位基因要求:例如雙等位基因,半合子…
78、DDD_consequence:DDD等位基因要求:例如雙等位基因,半合子…
79、DDD_disease:DDD疾病名稱:例如。“OCULOAURICULAR綜合癥”
80、DDD_pmid:DDD Pubmed ID
81、ExAC_delZ:ExAC陽性的delZ_ExAC (Z score)表明該基因不耐受缺失
82、ExAC_dupZ:dupZ_ExAC (Z score)陽性來自ExAC,表明該基因不耐受復制
83、ExAC_cnvZ:ExAC陽性的cnvZ_ExAC (Z score)表明該基因對CNV不耐受
84、ExAC_synZ:synZ_ExAC (Z score)從ExAC陽性表明該基因不耐受同義變異
85、ExAC_misZ:從ExAC陽性的misZ_ExAC (Z score)表明該基因不耐受錯義變異
86、OMIM_ID:OMIM唯一的六位標識符
87、OMIM_phenotype:例如疾病腓骨肌萎縮
88、OMIM_inheritance:例如AD(=“常染色體顯性遺傳”)
89、OMIM_morbid:如果SV與OMIM的致病基因重疊,則設置為“yes”
90、OMIM_morbid_candidate:如果SV與OMIM候選疾病基因重疊,則設置為“yes”
91、LOEUF_bin:給定基因轉錄本的最小“LOEUF的十分位數箱”(值越低表示約束越強),值= integer [0-9]
92、GnomAD_pLI:由gnomAD計算的得分,表明基因不耐受功能變異的概率(無意義,SNV/indel導致的剪接受體/供體變異)。
93、ExAC_pLI:ExAC計算的得分,表明基因不耐受功能變異的概率(無意義,SNV/indel導致的剪接受體/供體變異)。ExAC認為pLI>=0.9是一個極LoF不耐基因
94、AnnotSV_ranking_score:根據ACMG和克林根2019年的聯合共識推薦,SV排名得分。評分:致病性≥0.99,可能致病性[0.90;0.98],差異不確定[0.89;-0.89],可能良性[-0.90;-0.98],良性≤-0.99。
95、AnnotSV_ranking_criteria:解釋AnnotSV排名得分的決定標準
96、ACMG_class:SV等級為5級中的1級:1級(良性),2級(可能良性),3級(變異的意義未知),4級(可能致病),5級(致病)


參考:https://lbgi.fr/AnnotSV/Documentation/README.AnnotSV_latest.pdf

AnnotSV結果
AnnotSV output
AnnotSV解釋


end

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容