轉座子是一類在細菌染色體、質?;蚴删w之間自行移動的遺傳成分,是基因組中一段特異的具有轉位特性的獨立的DNA序列。最簡單的轉座子除專座相關的轉座酶外不含有其他功能,稱為插入序列(IS),它們是細菌染色體或質粒DNA的正常組成部分。復合型的轉座因子稱為轉座子(transposon,Tn)。這種轉座子除轉座相關的基因外還攜帶其他功能基因,如抗藥性基因,它的兩端就是IS,構成了“左臂”和“右臂”。兩端的重復序列可以作為Tn的一部分隨同Tn轉座,也可以單獨作為IS轉座。Tn兩端的IS有的是完全相同的,有的則有差別。當兩端的IS完全相同時,每一個IS都可使轉座子轉座;當兩端是不同的IS時,則轉座子的轉座取決于其中的一個IS。Tn有抗生素的抗性基因,而Tn很容易從細菌染色體轉座到噬菌體基因組或是接合型的質粒上。因此,Tn可以很快地傳播到其他細菌細胞,這是自然界中細菌產生抗藥性的重要來源。
Q2:為什么要進行CAZy分析?
A2:碳水化合物是廣泛分布在自然界中,可作為碳儲備,也可調節(jié)多種生理功能或者作為內部識別和細胞間的截至作用于生物體和生物體之間。
Q3:CAZy數據庫將碳水化合物活性酶分為哪幾個家族?
A3:CAZy數據庫目前包括六大類家族,分別是:
1. Glycoside Hydrolases (GHs) 糖苷水解酶
2. Glycosyl Transferases (GTs)糖基轉移酶
3. Polysaccharide Lyases (PLs) 多糖裂合酶
4. Carbohydrate Esterases (CEs) 碳水化合物酯酶
5. Auxiliary Activities (AAs) 輔助氧化還原酶
Carbohydrate-Binding Modules (CBMs)碳水化合物結合模塊。
Q4:CAZy數據庫有哪些功能?
A4:
a. 反應碳水化合物酶的結構特征,序列注釋。
b. 揭示酶與酶之間的進化關系,家族分類。
c. 提供序列功能信息。
Q5:簡述基因注釋?
A5:基因注釋包括DNA結構注釋和功能注釋,DNA結構注釋,包括基因預測、重復序列和非編碼RNA預測等,功能注釋即通過各個功能數據庫預測基因的功能,例如GO注釋等。
Q6:細菌基因組注釋常用的數據庫有哪些?
A6:常用以下5個數據庫進行注釋:Nr、Swiss-prot、COG、GO、KEGG。
Q7:COG 的注釋和統(tǒng)計有什么意義?
A7:COG是Clusters of Orthologous Groups of proteins的縮寫(http://www.ncbi.nlm.nih.gov/COG/)。COG是在對已完成基因組測序的物種的蛋白質序列進行相互比較的基礎上構建的,COG數據庫選取的物種包括各個主要的系統(tǒng)進化譜系。每個COG家族至少由來自3個系統(tǒng)進化譜系的物種的蛋白所組成,所以一個COG對應于一個古老的保守結構域。構成每個COG的蛋白被假定來自于同一個祖先蛋白。進行COG數據庫比對可以對預測蛋白進行功能注釋、歸類以及蛋白進化分析。
通過與string數據庫進行blastp比對,可以獲得基因所對應的COG 注釋結果,并根據COG 注釋結果對蛋白進行功能歸類。
Q8:GO 數據庫是什么?做GO注釋有什么意義?
A8:GO是基因本體論Gene Ontology的縮寫(詳情請見:http://www.geneontology.org/)。由于不同物種、不同數據庫中的關于基因和基因產物等生物學術語的描述存在差異,當查詢某個研究領域的相關信息時,生物學家需要花費大量的時間和精力去分析生物學術語之間的聯(lián)系,而Gene Ontology項目的目的就是為了標準化這些生物學術語,方便生物學家之間的相互交流。GO注釋包括3個方面的內容:
Cellular component:the parts of a cell or its extracellular environment;
Molecular function:the elemental activities of a gene product at the molecular level, such as binding or catalysis;
Biological process:operations or sets of molecular events with a defined beginning and end, pertinent to the functioning of integrated living units: cells, tissues, organs, and organisms.
因此GO注釋更加便于我們理解基因背后所代表的生物學意義。
Q9:KEGG 數據庫是什么,注釋有什么意義?
A9:KEGG(Kyoto Encyclopedia of Genes and Genomes,?http://www.genome.jp/kegg/)是基因組研究方面的公共數據庫。KEGG將從NCBI等數據庫中獲得的包括完整和部分測序的基因組序列及其基因序列存儲于KEGG genes數據庫中;將各種生物學通路信息存儲在PATHWAY數據庫中,包括各種代謝通路、合成通路、膜轉運、信號傳遞、細胞周期以及疾病相關通路等??梢赃\用BLAST算法將所獲得的預測基因與KEGG的基因數據庫(GENES)進行比對,尋找代謝通路,以此更加便于我們理解基因背后所代表的生物學意義。
Q10:KEGG數據庫序列來源是哪里?通過什么進行KO分配(基因注釋)?
A10:KEGG GENES是從公共可用資源(主要是NCBI RefSeq和GenBank)生成的所有完整基因組的基因目錄的集合。metagenomes是通過 GhostKOALA來對metagenomes數據進行KO分配的,其他動植物微生物等是通過 KOALA工具進行SSDB計算和KO分配(基因注釋)。
更多案例解答:
微生物基因組重測序得到的SNP、indel、sv等分析結果如何進行后續(xù)的實驗驗證?mp.weixin.qq.com對于含有質粒的細菌基因組項目,如何進行分析比較好?mp.weixin.qq.com有2株大腸桿菌(細菌),如何通過測序的方法知道二者的差異?mp.weixin.qq.comSNP分析得到的SNP位點與預期不符,是什么原因?mp.weixin.qq.com