EnsemblePlants植物基因組數(shù)據(jù)庫有直接的FTP服務(wù)器
本教程教你如何使用著名的lftp包下載這一大型數(shù)據(jù)庫
第一步,安裝lftp相關(guān)包
sudo apt-get install lftp #安裝lftp
第二步,運(yùn)行l(wèi)ftp
sudo lftp #運(yùn)行l(wèi)ftp
第三步,設(shè)置本地目錄
lcd /home/bohan/ensembleplantsgenome #設(shè)置本地目錄
第四步,登錄服務(wù)器
lftp ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ #通過匿名方式登錄服務(wù)器
第五步,將服務(wù)器目錄鏡像下載至本地
mirror -c -e -n --parallel=20 ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ /home/bohan/ensembleplantsgenome #同時(shí)使用20個(gè)線程同步下載相應(yīng)目錄至本地
運(yùn)行成功后,可以通過jobs命令查看當(dāng)前運(yùn)行的下載任務(wù)
jobs -v #查看目前進(jìn)行任務(wù)
也可以直接按ctrl+c退出轉(zhuǎn)入nohup模式繼續(xù)
也可以在退出后當(dāng)前終端linux控制臺(tái)
使用jobs和bg命令將當(dāng)前進(jìn)程轉(zhuǎn)入后臺(tái)
jobs #顯示當(dāng)前終端運(yùn)行的任務(wù)
[1] mirror -c -e -n --parallel=20 ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ /home/bohan/ensembleplantsgenome
bg %1 #將jobs命令顯示出的1號(hào)任務(wù)轉(zhuǎn)為后臺(tái)
mirror 命令參數(shù)
-c, --continue 支持?jǐn)帱c(diǎn)續(xù)傳if possible
-e, --delete 如果遠(yuǎn)程目錄下已經(jīng)沒有某個(gè)文件,而本地有,則刪除這個(gè)文件。
--delete-first 在下載新文件之前先刪除舊的文件
-s, --allow-suid 保留遠(yuǎn)程目錄中設(shè)定的用戶及組權(quán)限
--allow-chown 設(shè)置下載文件的所有者和所屬組
--ignore-time 屏蔽時(shí)間判定,這樣mirror只通過大小來判斷文件,同步速度可以加快。
-n, --only-newer 只下載新的文件,mirror的判定新文件是通過文件大小和修改時(shí)間來判定的(這時(shí)候-c不能使用)
-r, --no-recursion 不下載子目錄中的文件,即沒有遞歸的功能
-p, --no-perms 不設(shè)置下載后文件的訪問權(quán)限
--no-umask don't apply umask to file modes #這個(gè)不知道怎么翻譯
-R, --reverse 上傳到FTP
-L, --dereference download symbolic links as files #這個(gè)不知道怎么翻譯
-N, --newer-than=SPEC 只下載某個(gè)特定時(shí)間以后更新過的文件
-P, --parallel[=N] 同時(shí)下載N個(gè)文件
-i RX, --include RX 下載時(shí)包含的文件名稱,RX表示正則表達(dá)式
-x RX, --exclude RX 下載時(shí)不包含的文件名稱,RX表示正則表達(dá)式
-v, --verbose[=N] 關(guān)于操作的詳細(xì)輸出。
--log=FILE 將已經(jīng)執(zhí)行過的lftp命令寫入文件
--script=FILE 將lftp命令寫入文件,但不執(zhí)行