第一性原理計算的相關(guān)軟件的編譯對于新手來說真的很麻煩,但這一問題不應(yīng)該成為這個方向剛?cè)腴T的學(xué)習(xí)者或是研究者的門檻。
作為一個交叉學(xué)科的學(xué)生,去年第一次接觸到這種第一性原理計算的軟件,當(dāng)時有一個大師兄帶我入門,VASP
和LAMMPS
的編譯也是師兄做的,沒我啥事兒,也沒覺得這事兒有多麻煩。
這次編譯CP2K是因為它的4.1版本實現(xiàn)了一個跟課題比較相關(guān)的功能,需要跑一些例子,但是師兄自己也沒編譯過這款軟件,最初我們試圖按照官網(wǎng)的預(yù)編譯版本來試著安裝,沒有成功。后來找到一篇關(guān)于用Gfortran編譯cp2k4.1的博客,在自己本地機上的安裝基本遵從了這篇博客的指導(dǎo),成功了。先說一下PC的配置吧,i5的64位處理器,4G內(nèi)存,系統(tǒng)是Ubuntu14.。
但是試著跑了CP2K官網(wǎng)的幾個例子,在水的幾何結(jié)構(gòu)優(yōu)化那兒就跑不動了,報的是內(nèi)存錯誤,應(yīng)該是PC帶不動了,那接下來必須得試著在服務(wù)器上安裝了。我們這邊服務(wù)器的類型是
這邊順帶插一句,就是關(guān)于在Linux系統(tǒng)下安裝軟件的問題。除了不同發(fā)行版自帶的包管理工具外,我們可以嘗試著從源碼安裝。因為在服務(wù)器上我們是沒有root權(quán)限的,這種情況下就必須放棄包管理工具。但是這對沒在Linux下安裝過軟件的初學(xué)者來說也是一項很艱巨的任務(wù)。這里有一篇參考博客關(guān)于Linux下軟件的安裝,初學(xué)者可以一看。
在服務(wù)器上,首先還是試著用那篇博客給出的方式來安裝。CP2K之所以難裝,一方面就在于其依賴很多跟數(shù)學(xué)和物理相關(guān)的包,譬如BLAS
,LAPACK
,FFTW
等,可能有一個版本不合適,就會報出一堆的錯誤。而且,CP2K的官網(wǎng)說的很明白,對GCC
的版本有要求,可憐我們服務(wù)器上默認(rèn)的版本太低,還得自己去裝,希望暑假過后新?lián)Q的機器上軟件版本能跟得上。
故事到這里并不是一個童話里的歡喜結(jié)局,這也是我寫這篇的目的所在。在我們的服務(wù)器上按照步驟來安裝老是報錯,具體什么錯誤也沒有留照保存,我們看的不是很懂,但估計是GCC
編譯器的問題。
接下來偶然間在一個類似于計算化學(xué)公社的地方看到一篇帖子,大意是說目前為了方便安裝CP2K,其4.1版本已自帶能一鍵安裝的腳本,腳本的位置比較隱蔽,反正我是找了挺久才在官網(wǎng)找到其位置,在目錄cp2k-4.1/tools/toolchain
下有一個腳本install_cp2k_toolchain.sh
,如圖:
下面介紹下這個腳本的功能,大致就是調(diào)用上圖中的scripts
目錄下的各種包的安裝腳本,
如果包安裝都已完成,腳本再引導(dǎo)你做接下來幾步就能完成全部安裝過程,最終會在cp2k-4.1/exe
下生成一個local
目錄,內(nèi)容是串行和并行版的cp2k.*
可執(zhí)行程序。
我在PC上測試了下這個腳本是否是可用的,大概一兩個小時后,發(fā)現(xiàn)確實編譯成功了并生成了各個版本的可執(zhí)行文件。但是在服務(wù)器上這個方法又出現(xiàn)了些小問題,譬如很多次出現(xiàn)了域名沒有辦法解析。
我們開始根據(jù)錯誤指示的位置一步步去檢查scripts
下的安裝腳本,這些安裝腳本的工作機制是一樣的,首先檢查 cp2k-4.1/tools/toolchain/build
下是否有所需要的安裝包,下圖里展示的是install_fftw.sh
的內(nèi)容。
如果在服務(wù)器上已經(jīng)安裝了fftw,我們還可以通過在運行腳本時指定命令行參數(shù)來指定安裝的fftw的lib目錄的位置,像這樣 ./install_cp2k_toolchain.sh --with-fftw=[fftw_lib_dir]
(這里假定在 toolchain 目錄下)。如果腳本能在該目錄下找到需要的庫文件,就會直接輸出該包已經(jīng)安裝好的信息,并且開始下一個包的安裝。如果在 build 目錄下沒有需要的安裝包,就會聯(lián)網(wǎng)下載,很多問題就是出在這一步。
于是我們接下來就將之前在PC上通過這個腳本安裝的cp2k-4.1下面的 build 目錄里面的所有壓縮包(這個腳本寫的就是這樣,這些安裝包沒有刪除)發(fā)送到服務(wù)器的cp2k-4.1下面的 build 目錄,那么腳本就不會啟動聯(lián)網(wǎng)下載,而是直接開始安裝每個包了。這里需要提一下的是 MKL 庫,這個庫可以選擇安裝,因為它實現(xiàn)的功能基本就由 BLAS 和 LAPACK 共同實現(xiàn)了,可以通過命令行選項--with-mkl=no
來取消對 MKL 的檢查。
安裝各種包的過程也不是一帆風(fēng)順的,一些數(shù)學(xué)和物理的包沒有問題,像是BLAS
,LAPACK
,LIBINT
,LIBXC
等等,最難裝的還是GCC
,我們的服務(wù)器上的GCC版本不夠,個人分配的空間也不大,就沒有試著在那邊裝了。后來是換到了天河二號上安裝,在那邊沒有重新安裝GCC,基本上是一次成功了。
這里還有個小插曲,在安裝成功各個包去到makefile
下make的時候,死活編譯不過去,并提示是 cp2k 源碼的錯誤。當(dāng)時的心情真是跟坐過山車一樣刺激,師兄跟我繃不住了,最終師兄決定去請教一個專門搞軟件開發(fā)的合作者。到了第二天,師兄喊我去繼續(xù)安裝,說是那個合作者一眼瞅了輸出信息就大致知道了是 BLAS 還是 LAPACK 安裝時出的問題,可能是鏈接的庫給錯了,也可能是安裝的時候 make 出來的靜態(tài)庫不對。反正最后是重新編譯了一下 BLAS 還是 LAPACK 結(jié)果一路綠燈安裝成功。這里是可執(zhí)行文件:
這幾天在天河二號上跑了一下水的幾何結(jié)構(gòu)優(yōu)化和尿素溶于水的QMMM算法的例子,都跑出來了,沒有問題。對于編譯過很多類似軟件的老司機來說,這些問題可能都不是問題,但是對于剛?cè)腴T的初學(xué)者來說,走這些彎路很耗費精力,考驗?zāi)托摹?/p>
我寫的這一篇并不是手把手地指導(dǎo)入門者去怎么樣怎么樣安裝,但這是所有初學(xué)者最渴望的事情,有一篇萬能的一步一步的指導(dǎo)手冊,躺著鍵入一些代碼就行。但是考慮到各個機器的型號和性能,以及系統(tǒng)和所安裝軟件的版本也不盡相同,可能還不能有一些萬能的安裝模板。
安裝這個軟件大概消耗了我小兩周的時間,如果讓我總結(jié)一些一般性的指導(dǎo)原則,大概就是:
- 安裝那些依賴的數(shù)學(xué)庫和物理庫的時候要格外小心,要生成正確的靜態(tài)庫,并在后續(xù)安裝時要給出正確的靜態(tài)庫的位置。
- 如果提示有源碼錯誤,那估計是安裝的依賴庫有問題。
- GCC 和其他一些庫的版本很重要,一定要根據(jù)官網(wǎng)的指示來。