奮斗在人類組學數據分析的一線,要隨時跟上最新的研究進展。大型的研究項目會有全面的數據集和可視化工具,也有專門從各個數據源收集數據整合而成的數據庫。手頭備幾個,方便查閱。
Genetic和Epigenetic數據查詢與下載
GeneCards (http://www.genecards.org/) 使用125個數據源對人類基因組基因進行詳細注釋
ENCODE data portal (https://www.encodeproject.org/)
- ENCODE Phase 3和ENCODE Phase 4的數據庫
- 常用細胞系和組織的各類組學數據
ENCODE Downloads (http://genome.ucsc.edu/encode/downloads.html)
- ENCODE phase 2數據下載頁面
ICGC Data Portal (https://dcc.icgc.org/) 最全的癌癥項目數據庫,包含TCGA的數據
COSMIC (http://cancer.sanger.ac.uk/cosmic) 人工注釋癌癥樣本中的Somantic Mutation大全
BioMart (https://www.ensembl.org/biomart/martview/1fbe827446e53d1a0f34002043ac4dfa) 在線注釋基因組信息(R中有biomaRt包實現同樣功能)
Firebrowse (http://firebrowse.org/) TCGA數據分析展示的工具
非編碼基因組(noncoding genome)的相關數據庫
- 隨著ENCODE計劃從Phase 2到Phase 4不斷推進,大家發現基因組絕大部分是不編碼的,再加上基因編輯技術更新換代,這些nocoding genome的功能研究一直如火如荼。從短的(miRNA,siRNA等)到長的(lncRNA),再到成環的(circRNA),無所不能...
Noncode (http://www.noncode.org/) 陳潤生院士課題組開發的,網站功能全面
Lncipeda (https://lncipedia.org/) 數據來源十分廣泛
Lncrnadb (http://lncrnadb.com/) 完全手動收集,每一個條目有對應文獻
GWAS Catalog (https://www.ebi.ac.uk/gwas/) 完全手動收集的GWAS SNP,每一個有對應文獻
基因組瀏覽器
UCSC genome browser (https://genome.ucsc.edu/)
- 人類基因組計劃時代開發的browser,頁面較簡陋,但數據仍在不斷更新
WashU Browser (http://epigenomegateway.wustl.edu/)
- 云端有ENCODE項目和Roadmap項目的全部數據
- 可以上傳自己的數據,也有截圖功能產生矢量圖片
- 支持三維基因組學數據的可視化(比如Hi-C和ChIAPET)
IGV (http://www.igv.org/) 包括桌面瀏覽器和javascript兩個版本
- 桌面瀏覽器本地運行,適合可視化大文件(如bam文件),也可以加載來自ENCODE, TCGA,1000 Genomics的云端數據
- javascript版本IGV.js可以直接嵌入其他web應用里
HiGlass (http://higlass.io/) 4D Nucleome項目官方瀏覽器
- 不僅能可視化組學數據(比如ChIP-Seq和RNA-Seq),還支持Hi-C交互矩陣的可視化
常用軟件
OMICTools (https://omictools.com/) 生物信息學軟件收集
Bioconductor (https://www.bioconductor.org/) 生物信息學R package大本營
問答社區
Biostars (https://www.biostars.org/) 軟件報錯的時候
SEQanswers(http://seqanswers.com/) 軟件報錯的時候
Stackoverflow (https://stackoverflow.com/) 代碼報錯的時候
在線課程
Bioinformatics Specialization UCSD開設的計算生物學課程,從算法角度解決生物學問題
Data Analysis for Life Sciences 哈佛開設的統計分析課程,針對生命科學背景的研究人員
暫時想到的就是這么多,以后再更新...