終于趕在2017年結束前,點亮了我的深度學習工作站。
配置表
配件 | 型號 | 價格 | 數量 | 合計 |
---|---|---|---|---|
GPU | 微星 GTX 1080 Ti AERO 11GB | 5999 | 2 | 11998 |
CPU | 英特爾 i7 6850K | 3799 | 1 | 3799 |
主板 | X99-E WS/USB 3.1 | 4298 | 1 | 4298 |
內存 | 海盜船復仇者16G/3000 | 1749 | 2 | 3498 |
SSD | 浦科特 PX-512M8SeG M.2 | 1899 | 1 | 1899 |
電源 | 長城 額定1250W 巨龍GW-EPS1250DA | 1099 | 1 | 1099 |
散熱器 | 追風者 TC14PE雙塔旗艦版 | 399 | 1 | 399 |
機械硬盤 | 希捷酷魚系列 2TB 7200轉64M SATA3 | 399 | 1 | 399 |
機箱 | 美商海盜船 780T 黑色 全塔機箱 | 1259 | 1 | 1259 |
總計 | 28648 |
工作站的選型和系統安裝主要借鑒了以下兩篇簡書文章,都相當靠譜:
由于這兩篇已經寫的非常詳細了,所以相同的部分就沒必要再贅述,下面只記錄下我填的坑。
順便說一句,內存較2017年年中價格翻翻了,所以半年來深度學習工作站總價并未有明顯下降。
坑1:顯卡尺寸!顯卡尺寸!顯卡尺寸!
重要的事情說3遍。
作為工作站平臺的x99 E WS/USB3.1已經是這個級別為數不多、能插滿4張GTX1080ti的主板了,但是顯卡的厚度務必以35mm為限。也就是說,基本上帶兩個大風扇甚至更多風扇的1080ti們,都不可以拿來組多卡。
我不僅買了MSI紅龍1080ti,而且還在京東買的——不支持7天無理由退換貨。結果連電都沒上,直降500大洋掛在閑魚上。已經出了一張,還剩一張。
MSI Aero 1080ti是OK的,35mm厚,剛剛好。
坑2:X99 E WS/USB3.1供電
X99 E WS/USB3.1供電位置(接電源),有4處,但是只有其中兩處是必要的:24pin的主板供電和8pin的CPU供電。前者沒有接錯可能,后者我接錯了。
兩個8pin的CPU供電如下圖。其實沒必要兩個都接滿,我最終只接了左側的8pin。
我的問題在于,我用了6pin+2pin組合,結果當滿心歡喜首次按下開關時,只聽到電源發出兩聲“嗒嗒”的金屬片聲音,風扇都紋絲不動。懵逼了數十分鐘。現在看應該是斷電保護在起作用。
錯誤的6+2:
對于8pin的CPU供電,務必使用下面的接口:
坑3:U盤安裝Ubuntu出現nouveau SCHED_ERROR
由于x99 E WS/USB3.1連個集成顯卡也沒有,所以在Ubuntu下會有這個狀況。按照下面這篇文章的方案即可解決:
安裝ubuntu 提示nouveau SCHED_ERROR 08錯誤解決方案
坑4:Ubuntu啟動紫屏卡住
Ubuntu安裝好后重啟,無需再從U盤啟動,所以坑3的方案已經無用了,可此時顯卡驅動還沒裝,就會出現紫屏的問題。本質上和坑3是一回事。
參考這篇即可順利進入系統,等把顯卡驅動裝好后就不會再出現了。
雙系統共享HDD
我裝的雙系統Win10+Ubuntu16.04,兩者2/3開瓜分了512G的SSD,還有一塊2T的HDD作為存儲盤。為了實現雙系統可以共享這個HDD,只需要做2件事:
- 可先在Windows下對HDD進行GPT分區操作,使用NTFS文件系統;
- 再Ubuntu下進行掛載設置,見下圖;