生物與計算機的結(jié)合讓生物進入大數(shù)據(jù)時代,為方便管理各種生物數(shù)據(jù),科學家們開發(fā)了各式各樣的生物數(shù)據(jù)庫。了解與自己研究領(lǐng)域相關(guān)的數(shù)據(jù)庫,并加以利用可能會使研究工作得到事半功倍的效果。在此將常用數(shù)據(jù)庫按照以下分類方式大致整理了一下,也方便檢索。
1. Meta databases
元數(shù)據(jù)庫,合并不同來源的相關(guān)數(shù)據(jù)以更新的或更加方便的形式提供新的數(shù)據(jù),通俗的講就是數(shù)據(jù)庫的數(shù)據(jù)庫,代表性的數(shù)據(jù)庫主要有以下幾個:
ConsensusPathDB 網(wǎng)址:http://consensuspathdb.org/ 描述:分子功能互作數(shù)據(jù)庫,基于32個公共數(shù)據(jù)庫,整合了人類蛋白質(zhì)相互作用,遺傳相互作用信號,代謝,基因調(diào)控和藥物 - 靶標相互作用的信息。
Entrez 網(wǎng)址:https://www.ncbi.nlm.nih.gov/Class/MLACourse/Modules/Entrez/complex_boolean.html 描述:Entrez跨數(shù)據(jù)庫全局查詢搜索系統(tǒng)是一個聯(lián)合搜索引擎或門戶網(wǎng)站,允許用戶在NCBI網(wǎng)站上搜索許多離散的健康科學數(shù)據(jù)庫。
Neuroscience Information Framework 網(wǎng)址:https://neuinfo.org// 描述:整合了數(shù)百種神經(jīng)科學相關(guān)資源,包括實驗,臨床和轉(zhuǎn)化神經(jīng)科學數(shù)據(jù)庫,知識庫,地圖集和遺傳/基因組資源等。
GeneCard 網(wǎng)址:https://www.genecards.org/ 描述:自動整合125個數(shù)據(jù)庫,包含基因組、轉(zhuǎn)錄組、蛋白組、遺傳、臨床和功能信息的龐大人基因組數(shù)據(jù)庫。
-
Ensembl Genomes 網(wǎng)址:http://ensemblgenomes.org/ 描述:該項目由EMBL運營,提供細菌、原生生物、真菌、植物和無脊椎動物后生動物的基因組數(shù)據(jù)。
-
UCSC Genome 網(wǎng)址: http://genome.ucsc.edu 描述:主要是動物基因組信息,基因組注釋,基因組保守性和基因組共線性數(shù)據(jù)。
-
Human protein atlas 網(wǎng)址:http://www.proteinatlas.org/ 描述:人體蛋白在細胞、組織、病理條件下的表達
2. Model organism databases
模式生物數(shù)據(jù)庫,為深入研究模式生物提供生物數(shù)據(jù),如:
Personal Genome Project 網(wǎng)址:https://www.personalgenomes.org/ 描述:來自世界各地的100,00名志愿者的人類基因組計劃。
Mouse Genome Database(MGD) 網(wǎng)址:http://www.informatics.jax.org/ 描述:MGD數(shù)據(jù)庫是整合了國際上實驗室小鼠生物數(shù)據(jù)的資源庫,提供小鼠相關(guān)的基因組、綜合遺傳等信息。
Rat Genome Database (RGD): 網(wǎng)址:https://rgd.mcw.edu/ 描述:大鼠基因組數(shù)據(jù)庫。
PomBase 網(wǎng)址:https://www.pombase.org/ 描述:裂殖酵母Schizosaccharomyces pombe的知識庫。
Saccharomyces Genome Database (SGD): 網(wǎng)址:https://www.yeastgenome.org/ 描述:酵母模型生物的基因組數(shù)據(jù)庫
TAIR 網(wǎng)址 https://www.arabidopsis.org/ 描述:最全的擬南芥資源數(shù)據(jù)庫。政府為我們付費購買了使用權(quán),以至于不少人沒感覺到TAIR已經(jīng)收費了。
Legume Information System (LIS) 網(wǎng)址:https://legumeinfo.org/ 描述:豆科植物的基因組數(shù)據(jù)庫。
Wormbase: 網(wǎng)址:https://wormbase.org/#012-34-5 描述:關(guān)于線蟲模式生物秀麗隱桿線蟲的生物學和基因組在線生物數(shù)據(jù)庫,還包含其他相關(guān)線蟲的信息。
Xenbase: 網(wǎng)址:http://www.xenbase.org/entry/ 描述:模式生物非洲爪蟾(Xenopus tropicalis)和非洲爪蟾(Xenopus laevis)的基因組數(shù)據(jù)庫。
Zebrafish Information Network: 網(wǎng)址:http://zfin.org/ 描述:斑馬魚的基因組數(shù)據(jù)庫。
FlyBase: 網(wǎng)址:http://flybase.org/ 描述:模式生物果蠅的基因組數(shù)據(jù)庫。
UCSC Malaria Genome Browser: 網(wǎng)址:http://enacademic.com/dic.nsf/enwiki/7907997 描述:UCSC瘧疾基因組瀏覽器是研究瘧疾(如惡性瘧原蟲等)基因組的生物信息學研究工具。
3. Nucleic acid databases
3.1 DNA databases
核酸數(shù)據(jù)庫分為一級數(shù)據(jù)庫(Primary databases)和二級數(shù)據(jù)庫(Secondary databases)
3.1.1 一級核酸數(shù)據(jù)庫
下面三個數(shù)據(jù)庫是核酸的主數(shù)據(jù)庫,存儲來自所有生物的核酸序列,接受用戶提交核酸序列,每天交換更新數(shù)據(jù)以實現(xiàn)他們之間的最佳同步。
- DNA Data Bank of Japan 網(wǎng)址:https://www.ddbj.nig.ac.jp/index-e.html
- EMBL (European Bioinformatics Institute) 網(wǎng)址:https://www.embl.org/
- NCBI (National Center for Biotechnology Information) 網(wǎng)址:https://www.ncbi.nlm.nih.gov/
3.1.2 二級核酸數(shù)據(jù)庫
數(shù)目很多,先列出一些,歡迎補充:
23andMe's database 網(wǎng)址:https://www.23andme.com/en-int/ 描述:23andMe是一家私營的個人基因組學生物技術(shù)公司 ,主要業(yè)務(wù)是基于唾液對消費者進行基因檢測,并向客戶提供基因檢測報告。
OMIM (Online Mendelian Inheritance in Man): 網(wǎng)址:https://omim.org/ 描述:一個管理人類基因和人類遺傳疾病特征的數(shù)據(jù)庫。
RefSeq 網(wǎng)址:https://www.ncbi.nlm.nih.gov/refseq/ 描述:參考序列數(shù)據(jù)庫收集了從病毒、細菌到真核生物等主要生物的核酸序列(DNA、RNA)及其蛋白質(zhì)常產(chǎn)物。
1000 Genomes Project: 網(wǎng)址:http://www.internationalgenome.org/ 描述:2008年1月啟動的項目,對來自不同種族群體的一千多名匿名參與者的基因組進行了分析,并將數(shù)據(jù)公布于眾。
SNP / Disease Databases 網(wǎng)址:https://www.snpedia.com/ 描述:人SNP位點對表型的影響和貢獻度數(shù)據(jù)庫
3.2 Gene expression databases
這些數(shù)據(jù)庫收集基因組序列,注釋并分析他們,以提供公共訪問。主要包括:
ArrayExpress 網(wǎng)址:https://www.ebi.ac.uk/arrayexpress/ 描述:功能基因組數(shù)據(jù)存檔;存儲來自EMBL的高通量功能基因組學實驗的數(shù)據(jù);展示方式很炫酷。
Bioinformatic Harvester 網(wǎng)址:Ensembl: http://asia.ensembl.org/index.html 描述:為人類,小鼠,其他脊椎動物和真核生物基因組提供自動注釋的數(shù)據(jù)庫
BioGPS 網(wǎng)址:http://biogps.org/#goto=welcome 描述:強大的基因和蛋白表達注釋平臺
-
Gene Disease Database 基因疾病數(shù)據(jù)庫,通過整理表型-基因型關(guān)系和基因-疾病機制,以及多種復(fù)合相互作用來理解復(fù)雜疾病的潛在機制。主要數(shù)據(jù)庫如下:
5.1 The Comparative Toxicogenomics Database (CTD) 網(wǎng)址:http://ctdbase.org/ 5.2 The Universal Protein Resource (UNIPROT) 網(wǎng)址:https://www.uniprot.org 5.3 The Online Mendelian Inheritance in Man 網(wǎng)址:https://www.ncbi.nlm.nih.gov/omim 5.5 The Ensembl genome database project 網(wǎng)址:http://www.ensembl.org/ 5.6 The Gene Disease Associations Database DisGeNET 網(wǎng)址:http://www.disgenet.org/
-
Gene Expression Omnibus (GEO): 網(wǎng)址:https://www.ncbi.nlm.nih.gov/geo/ 描述:來自美國國家癌癥研究所(NCI)的公共功能基因組數(shù)據(jù)庫,它支持基于陣列和序列的數(shù)據(jù),并提供了用于查詢和下載基因表達譜的工具。
3.3 Phenotype databases
PHI-base: 網(wǎng)址:http://www.phi-base.org/ 描述:病原體 - 宿主相互作用數(shù)據(jù)庫。
細胞表型數(shù)據(jù)庫 網(wǎng)址:https://www.ebi.ac.uk/fg/sym 描述:基于RNAi的細胞表型收集
dbGAP 網(wǎng)址:https://www.ncbi.nlm.nih.gov/gap 描述:基因型-表型數(shù)據(jù)庫,來源于GWAS、醫(yī)學測序、分子診斷等
The Human Phenotype Ontology 網(wǎng)址:https://hpo.jax.org/app/ 描述:人類疾病表型描述的標準化術(shù)語,類比于Gene Ontology. 現(xiàn)有13000個條目和156,000關(guān)于遺傳病的注釋。
GWAS central 網(wǎng)址: https://www.gwascentral.org 描述:包含2,974,967個SNP與829個MeSH疾病、表型之間的69,986,326個關(guān)聯(lián)。
European genome-phenome archive 網(wǎng)址:https://ega-archive.org 描述:生物醫(yī)學研究中涉及的遺傳和表型數(shù)據(jù)關(guān)聯(lián)庫
Monarch 網(wǎng)址:https://monarchinitiative.org 描述:基因型-表型數(shù)據(jù)庫,表型相似性度量
Cellular Phenotype Database 網(wǎng)址:http://www.ebi.ac.uk/fg/sym 描述:存儲來自高通量表型研究的數(shù)據(jù),可以搜索感興趣的表型并檢索相關(guān)靶基因和RNAi
GenomeRNAi 網(wǎng)址:http://www.genomernai.org/ 描述:包含來自果蠅和人RNA干擾篩選的表型數(shù)據(jù)庫
Genomics of Drug Sensitivity in Cancer 網(wǎng)址:http://www.cancerrxgene.org/ 描述:篩選了多種抗癌療法人類癌細胞系,通過與基因組數(shù)據(jù)關(guān)聯(lián)以識別藥物靶標,同時為臨床應(yīng)用提供信息
GenomeCRISPR 網(wǎng)址:http://genomecrispr.dkfz.de/ 描述:用于高通量CRISPR / Cas9篩選實驗的數(shù)據(jù)庫
Cellular Microscopy Phenotype Ontology (CMPO) 網(wǎng)址:www.ebi.ac.uk/cmpo/ 描述:CMPO為描述與整個細胞、細胞成分、細胞過程和細胞群體有關(guān)的表型特性提供了一種物種中立的詞匯。
Human Phenotype Ontology (HPO) 網(wǎng)址:https://hpo.jax.org/app/ 描述:提供了人類疾病中表型異常的標準化詞匯
3.4 RNA databases
miRBase 網(wǎng)址:http://www.mirbase.org/ 描述:存儲microRNA序列和注釋的數(shù)據(jù)庫。
Rfam: 網(wǎng)址:http://rfam.org/ 描述:一個包含非編碼RNA(ncRNA)家族和其他類型RNA信息的數(shù)據(jù)庫。
RNAcentral 網(wǎng)址:https://rnacentral.org/ 描述:非編碼RNA序列數(shù)據(jù)庫。
4. Amino acid / protein databases
4.1 Protein sequence databases
Swiss-Prot/Uniprot 網(wǎng)址:https://www.uniprot.org/ 描述:結(jié)合了從文獻中提取的信息和生物鑒定者評估的計算分析,是一個手動注釋的非冗余蛋白質(zhì)序列數(shù)據(jù)庫。
Database of Interacting Proteins (Univ. of California) 網(wǎng)址:https://dip.doe-mbi.ucla.edu/dip/Main.cgi 描述:記錄了實驗確定的蛋白質(zhì)之間的相互作用。
-
DisProt:(打不開了) 網(wǎng)址:http://www.disprot.org/ 描述:用于注釋文獻中的蛋白固有無序區(qū)域(IDRs)
InterPro: 網(wǎng)址:https://www.ebi.ac.uk/interpro/ 描述:通過整合多個蛋白相關(guān)數(shù)據(jù)庫,提供了一個方便的對蛋白序列進行功能注釋的平臺,包括對蛋白質(zhì)家族、結(jié)構(gòu)域、功能位點的預(yù)測。
MobiDB: 網(wǎng)址:http://mobidb.bio.unipd.it/ 描述:內(nèi)在蛋白質(zhì)紊亂注釋數(shù)據(jù)庫。
neXtProt: 網(wǎng)址:https://www.nextprot.org/ 描述:人類蛋白質(zhì)數(shù)據(jù)庫。
Pfam: 網(wǎng)址:http://pfam.xfam.org/ 描述:Pfam是蛋白質(zhì)家族的數(shù)據(jù)庫,包括使用隱馬爾可夫模型生成的注釋和多序列比對。
PRINTS 網(wǎng)址:http://130.88.97.239/PRINTS/index.php 描述:蛋白質(zhì)序列指紋圖譜數(shù)據(jù)庫,所謂蛋白質(zhì)的指紋是指一組保守的序列基序,用于刻畫蛋白質(zhì)家族的特征。
PROSITE: 網(wǎng)址:https://prosite.expasy.org/ 描述:收集了有顯著生物學意義的蛋白質(zhì)位點和序列模式,并能根據(jù)這些位點和模式快速并可靠地鑒別一個未知功能的蛋白質(zhì)序列應(yīng)該屬于哪一個蛋白質(zhì)家族。
Protein Information Resource 網(wǎng)址:https://pir.georgetown.edu/ 描述:是一個全面的、經(jīng)過注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫。可幫助研究者鑒別和解釋蛋白質(zhì)序列信息,研究分子進化、功能基因組,進行生物信息學分析。
SUPERFAMILY: 網(wǎng)址:http://supfam.org/SUPERFAMILY/ 描述:一個包含所有蛋白質(zhì)和基因組結(jié)構(gòu)和功能注釋的數(shù)據(jù)庫。
4.2 Protein structure databases
Protein Data Bank (PDB) 網(wǎng)址:http://www.rcsb.org 描述:一個專門收錄蛋白質(zhì)及核酸的三維結(jié)構(gòu)資料的數(shù)據(jù)庫,以下為PDB成員網(wǎng)站 1.1 Protein DataBank in Europe (PDBe):https://www.ebi.ac.uk/pdbe/ 1.2 ProteinDatabank in Japan (PDBj):https://pdbj.org 1.3 Research Collaboratory for Structural Bioinformatics (RCSB):https://www.rcsb.org 1.4 Worldwide Protein Data Bank:http://www.wwpdb.org/
The Protein Protein Interaction Inhibition Database (2PI2db): 網(wǎng)址:http://2p2idb.cnrs-mrs.fr 描述:收集了已通過X射線晶體學或核磁共振表征的蛋白質(zhì)-蛋白質(zhì)、蛋白質(zhì)-調(diào)節(jié)劑復(fù)合物結(jié)構(gòu)。
4.3 Protein model databases
ModBase: 網(wǎng)址:https://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi 描述:一個注釋比較飯白紙結(jié)構(gòu)模型的數(shù)據(jù)庫。
Protein Model Portal (PMP): 網(wǎng)址:https://www.proteinmodelportal.org 描述:結(jié)合了數(shù)個蛋白質(zhì)結(jié)構(gòu)模型數(shù)據(jù)庫的元數(shù)據(jù)庫,提供模型構(gòu)建和質(zhì)量評估等多種交互式服務(wù)。
Similarity Matrix of Proteins (SIMAP): 網(wǎng)址:http://cube.univie.ac.at/resources/simap 描述:基于FASTA序列計算的蛋白質(zhì)相似性數(shù)據(jù)庫。
Swiss-model: 網(wǎng)址:https://swissmodel.expasy.org 描述:致力于同源蛋白質(zhì)的3D結(jié)構(gòu)建模。
4.4 Protein-protein and other molecular interactions
BioGRID 網(wǎng)址:https://thebiogrid.org 描述:蛋白質(zhì)與遺傳相互作用數(shù)據(jù)庫。
string 網(wǎng)址:http://string-db.org/cgi/help.pl?subpage=api 描述:用于檢索相互作用基因/蛋白質(zhì)的搜索工具
IntAct 網(wǎng)址:https://www.ebi.ac.uk/intact/ 描述:為分子交互研究提供免費的開源數(shù)據(jù)庫系統(tǒng)和分析工具。
5. Signal transduction pathway databases
NCI-Nature Pathway Interaction Database 網(wǎng)址:http://biogps.org/plugin/259/nci-nature-pathway-interaction-database/描述:http://www.ndexbio.org/#/ (原來的PID遷移到此新數(shù)據(jù)庫)。 NDEx提供了一個開源框架,科學家和機構(gòu)可以共享、存儲、操作和發(fā)布生物網(wǎng)絡(luò)知識。
Netpath 網(wǎng)址:http://www.netpath.org/ 描述:人類信號轉(zhuǎn)導通路數(shù)據(jù)庫,擁有45個信號通路,包括在免疫系統(tǒng)調(diào)節(jié)和癌癥調(diào)節(jié)中起主要作用的通路。
-
Reactome 網(wǎng)址:https://reactome.org/ 描述:該庫覆蓋了19個物種的通路研究,包括經(jīng)典的代謝通路、信號轉(zhuǎn)導、基因轉(zhuǎn)錄調(diào)控、細胞凋亡與疾病。
reactome相關(guān)推文:
WikiPathways 網(wǎng)址:https://www.wikipathways.org/index.php/WikiPathways 描述:該數(shù)據(jù)庫收錄了超過20個物種的通路,其中人類的通路就包含了800多個通路,涵蓋了約7500種基因。此外,它還包含了超過1000個代謝產(chǎn)物的通路。
6. Metabolic pathway and protein function databases
代謝途徑和蛋白質(zhì)功能數(shù)據(jù)庫
BiGG Models 網(wǎng)址:http://bigg.ucsd.edu 描述:該數(shù)據(jù)庫將70多種已發(fā)表的基因組規(guī)模的代謝網(wǎng)絡(luò)整合到了一起,并且有一組標準化的BiGG ID。
BioCyc Database Collection: 網(wǎng)址:https://biocyc.org 描述:收集了14558個通路/基因組數(shù)據(jù)庫,每一個數(shù)據(jù)庫描述了單個有機體的基因組和代謝通路,同時提供多種用于組學數(shù)據(jù)導航和可視化的分析工具。
BRENDA: 網(wǎng)址:http://www.brenda-enzymes.org 描述:酶數(shù)據(jù)庫,提供酶的分類、命名法、生化反應(yīng)、專一性、結(jié)構(gòu)、細胞定位、提取方法、文獻、應(yīng)用與改造及相關(guān)疾病的數(shù)據(jù)。
HMDB 網(wǎng)址:http://www.hmdb.ca 描述:人類代謝組數(shù)據(jù)庫,包含有關(guān)人體中發(fā)現(xiàn)的小分子代謝物的詳細信息。
KEGG PATHWAY Database 網(wǎng)址:https://www.kegg.jp 描述:KEGG是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫。把從已經(jīng)完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來是KEGG數(shù)據(jù)庫的特色之一。
Reactome(同上)
WikiPathways(同上)
7. Additional databases
7.1 Exosomal databases
外泌體是一類可以由多種細胞類型分泌的胞外囊泡,與其他胞外囊泡如核外顆粒體和凋亡小體不同,外泌體是內(nèi)吞起源的。外泌體在疫苗、藥物遞送、細胞間通信的作用以及其作為生物標志物的一種可能來源以及引起了研究人員的極大興趣,導致外泌體相關(guān)研究呈現(xiàn)井噴趨勢。相關(guān)數(shù)據(jù)庫如下:
ExoCarta 網(wǎng)址:http://www.exocarta.org 描述:是一個關(guān)于外泌體蛋白、RNA、脂質(zhì)體的手工數(shù)據(jù)庫。
exoRBase 網(wǎng)址:http://www.exorbase.org 描述:將不同疾病血來源外泌體中的circRNA, lncRNA和mRNA進行整理的數(shù)據(jù)庫。
7.2 Mathematical model databases
- Biomodels Database 網(wǎng)址:http://biomodels.caltech.edu 描述:生物模型在線數(shù)據(jù)庫,主要存儲數(shù)量型生物化學模型。
7.3 Taxonomic databases
BacDive 網(wǎng)址:https://bacdive.dsmz.de 描述:提供有關(guān)細菌和古細菌生物多樣性的菌株相關(guān)信息。
EzTaxon-e 網(wǎng)址:https://www.ezbiocloud.net 描述:基于16S核糖體RNA基因序列鑒定原核生物的數(shù)據(jù)庫。
7.4 Radiologic databases
The Cancer Imaging Archive (TCIA) 網(wǎng)址:http://www.cancerimagingarchive.net 描述:包含常見腫瘤(肺癌、前列腺癌等)醫(yī)學圖像(MRI、CT等)及相應(yīng)臨床信息(治療方案細節(jié)、基因、病理等)的大規(guī)模公用數(shù)據(jù)庫。
Neuroimaging Informatics Tools and Resources Clearinghouse 網(wǎng)址:https://www.nitrc.org 描述:神經(jīng)影像信息學工具和資源交換中心。
8. Wiki-style databases
- Gene Wiki 網(wǎng)址:https://en.wikipedia.org/wiki/Wikipedia:Gene_Wiki 描述:一個基于wiki的基因信息數(shù)據(jù)庫
9. Specialized databases
Barcode of Life Data Systems 網(wǎng)址:http://www.boldsystems.org 描述:DNA條形碼數(shù)據(jù)庫(即生物體內(nèi)能夠代表該物種的、標準的、有足夠變異的、易擴增且相對較短的DNA片段),并提供一個分析DNA序列的在線平臺。
The Cancer Genome Atlas (TCGA) 網(wǎng)址:https://cancergenome.nih.gov 描述:提供使用高通量技術(shù)獲得的癌癥樣本數(shù)據(jù),包括基因表達譜、拷貝數(shù)變異、SNP基因分型、全基因組DNA甲基化等。
Cellosaurus 網(wǎng)址:https://web.expasy.org/cellosaurus/ 描述:細胞系的在線資源庫。
Comparative Toxicogenomics Database (CTD) 網(wǎng)址:http://ctdbase.org 描述:CTD(比較毒物遺傳數(shù)據(jù)庫),為研究人員提供了集中、綜合的各種不同類型分子以及來自各種生物體的毒理學數(shù)據(jù)。
DiProDB 網(wǎng)址:http://diprodb.fli-leibniz.de 描述:收集和分析熱力學,結(jié)構(gòu)和其他二核苷酸特性的數(shù)據(jù)庫。
Dryad 網(wǎng)址:http://datadryad.org 描述:存放優(yōu)質(zhì)數(shù)據(jù)資源的場所,使科學出版物背后的數(shù)據(jù)可被發(fā)現(xiàn)、可重復(fù)使用、可引用。
Edinburgh Mouse Atlas 網(wǎng)址:http://www.emouseatlas.org/emap/home.html 描述:小鼠胚胎原位基因表達數(shù)據(jù)庫。
EPD Eukaryotic Promoter Database 網(wǎng)址:https://epd.vital-it.ch/index.php 描述:真核基因啟動子數(shù)據(jù)庫,提供從EMBL中得到的真核基因的啟動子序列,幫助實驗研究人員、生物信息學研究人員分析真核基因的轉(zhuǎn)錄信號。
FINDbase (the Frequency of INherited Disorders database) 網(wǎng)址:http://www.findbase.org 描述:是一個全球治病遺傳變異頻率的數(shù)據(jù)庫。
HGNC (HUGO Gene Nomenclature Committee): 網(wǎng)址:https://www.genenames.org 描述:負責對人類基因組包括蛋白編碼基因, ncRNA基因,甲基因和其他基因在內(nèi)的所有基因提供一個唯一的、標準的、可以廣泛傳播的symbol
International Human Epigenome Consortium 網(wǎng)址:http://ihec-epigenomes.org 描述:國際人類表觀基因組學會,致力于全球表觀基因組學領(lǐng)域的發(fā)展。
MethBase 網(wǎng)址:http://smithlabresearch.org/software/methbase/ 描述:在UCSC Genome Browser上可視化的DNA甲基化數(shù)據(jù)庫。
Minimotif Miner 網(wǎng)址:http://minimotifminer.org/ 描述:短連續(xù)功能性肽基序的數(shù)據(jù)庫。
NCI-dbGaP 網(wǎng)址:https://www.ncbi.nlm.nih.gov/gap 描述:人類基因型和表型相互作用的數(shù)據(jù)庫。
PubMed 網(wǎng)址: https://www.ncbi.nlm.nih.gov/pmc/ 描述:生命科學和生物醫(yī)學領(lǐng)域的參考和摘要。
Oncogenomic databases 網(wǎng)址:https://oglandscapes.irbbarcelona.org 描述:用于癌癥研究的數(shù)據(jù)庫匯編。
RIKEN integrated database of mammals 網(wǎng)址:http://metadb.riken.jp/metadb/download/SciNetS_ria254i 描述:Riken研究所推廣的多個大型項目的綜合數(shù)據(jù)庫。
TDR Targets 網(wǎng)址:http://tdrtargets.org 描述:專注于熱帶疾病藥物發(fā)現(xiàn)的化學基因組學數(shù)據(jù)庫。
LNCipedia 網(wǎng)址:http://www.lncipedia.org/ 描述:人類長鏈非編碼RNA的整合庫
NONCODE 網(wǎng)址: http://www.noncode.org/ 描述:存儲17類(人類,小鼠,牛,大鼠,雞,果蠅,斑馬魚,小腸,酵母,擬南芥,黑猩猩,大猩猩,猩猩,恒河猴,負鼠和豬)物種非編碼RNA(不包括tRNA和rRNA)的數(shù)據(jù)庫
Oncomine 網(wǎng)址:https://www.oncomine.org/resource/login.html 描述:腫瘤相關(guān)基因研究的數(shù)據(jù)庫,整合了GEO、TCGA和已發(fā)表的文獻等來源的RNA和DNA-seq數(shù)據(jù)
GeneVestigator(GV) 網(wǎng)址:https://genevestigator.com/
描述:一個基因表達的搜索引擎,集成了上萬的人工精選、注釋的公共芯片實驗結(jié)果immuneXpresso 網(wǎng)址:http://immuneexpresso.org/immport-immunexpresso/public/immunexpresso/search
描述:immuneXpresso搜索引擎可自動從PubMed摘要中提取高分辨率細胞 - 細胞因子相互作用網(wǎng)絡(luò)。