查詢(xún)某一基因啟動(dòng)子區(qū)域的CpG島,一般有兩種方法:一種是查文獻(xiàn),看您關(guān)注的基因,別人做的CpG島是哪些,這個(gè)對(duì)自己選擇位點(diǎn)有指導(dǎo)作用;另一種是UCSC數(shù)據(jù)庫(kù)中查找,這種方法可以直接將該基因啟動(dòng)子區(qū)域的CpG島信息都獲取下來(lái)。
我們建議兩種方法結(jié)合起來(lái),用UCSC查詢(xún)出某基因啟動(dòng)子區(qū)域所有的CpG島,參考別人的研究,最終確定自己想要研究的甲基化位點(diǎn)。
以EPB41L1為例,為大家展示一下獲取基因啟動(dòng)子區(qū)域CpG島信息的操作流程。
1. 打開(kāi)UCSC(http://genome.ucsc.edu/),點(diǎn)擊Human GRChg38/hg38,如下圖:
2. 在空白框內(nèi)輸入“EPB41L1”,同時(shí)下拉箭頭到 “regulation” 那一行,在下面 CpG Island的選擇框中選擇“show”,然后點(diǎn)擊go;
**3. **接著,得到如下界面,在UCSC 上可以,看到EPB41L1這個(gè)基因內(nèi)部和基因附近有4個(gè)CpG 島,分別用紅色框出來(lái)了。
EPB41L1在基因組中的坐標(biāo)為:chr20:36091504-36232799
CpG 85 在基因組中的坐標(biāo)為:chr20:36064533-36065578,其位于基因上游25926 bp 處;
CpG 178 在基因組中的坐標(biāo)為:chr20:36092082-36093626,其位于基因起始處;
CpG 45 在基因組中的坐標(biāo)為:chr20:36154402-36154787,其位于基因內(nèi)部;
CpG 29 在基因組中的坐標(biāo)為:chr20:36236366-36236700,位于基因下游6569 bp 處。
我們綜合看一下這四個(gè)CpG島:
CpG 85 雖然位于基因上游,但是距離基因較遠(yuǎn),因此我們認(rèn)為它不調(diào)控EPB41L1 這個(gè)基因的表達(dá)。
CpG 29雖然距離基因較近,但是它在基因下游,目前一般研究CpG 島的多位于基因上游和基因內(nèi)部。因此我們也認(rèn)為他不調(diào)控基因的表達(dá)。
綜合以上,分析部認(rèn)為EPB41L1 值得研究的CpG島有兩個(gè),CpG178和CpG45。這時(shí)可以查閱文獻(xiàn),看別人做的哪一個(gè),作為自己選擇的參考。
**4. **下面小編以CpG178為例,進(jìn)一步看一下如何獲取具體核酸序列,點(diǎn)擊綠色的CpG178,
然后得到以下界面,再點(diǎn)擊“View DNA for this feature”,
得到如下界面,選擇Reverse complement,然后點(diǎn)擊“get DNA”,
最后, CpG178的核酸序列如下: