不管實驗室產(chǎn)不產(chǎn)生數(shù)據(jù),我們總有機會下載已發(fā)表的數(shù)據(jù)來分析,記錄一下不同數(shù)據(jù)庫下載數(shù)據(jù)的方式。
隨便看一套數(shù)據(jù)吧
(1)NCBI-GEO DataSets:
選擇想要的數(shù)據(jù)進入SRA Run Selector? 勾選需要的SRA數(shù)據(jù)(SRRXXX)--- Selected ---Accession List --- 生成txt文件
對于這樣一個txt文件怎么下載里面的數(shù)據(jù)呢?
nohup prefetch --option-file? SRR_Acc_List.txt & ?? #nohup 和&組合是為了在后臺運行
這樣數(shù)據(jù)下載到哪里呢?
可以自定義:1.which perfetch ???2.cd perfetch所在目錄 ??3. ? ./vdb-config -i (可更改路徑)
(2)EBI :https://www.ebi.ac.uk/ena/browser/home
搜索需要的數(shù)據(jù)并進入下載頁面(點擊study)
下載Download report 中的TSV(里面包含fastq和sra兩種數(shù)據(jù)類型的ftp等一些信息)
下載TSV后直接保留fastq_ftp 或者?sra_ftp 列? 記:ftp.txt
下載數(shù)據(jù):
for i in $(cat ftp.txt)
do
? ? wget $i
done