【手記】點亮深度學習工作站

終于趕在2017年結束前,點亮了我的深度學習工作站。

小核武.jpg

配置表

配件 型號 價格 數量 合計
GPU 微星 GTX 1080 Ti AERO 11GB 5999 2 11998
CPU 英特爾 i7 6850K 3799 1 3799
主板 X99-E WS/USB 3.1 4298 1 4298
內存 海盜船復仇者16G/3000 1749 2 3498
SSD 浦科特 PX-512M8SeG M.2 1899 1 1899
電源 長城 額定1250W 巨龍GW-EPS1250DA 1099 1 1099
散熱器 追風者 TC14PE雙塔旗艦版 399 1 399
機械硬盤 希捷酷魚系列 2TB 7200轉64M SATA3 399 1 399
機箱 美商海盜船 780T 黑色 全塔機箱 1259 1 1259
總計 28648

工作站的選型和系統安裝主要借鑒了以下兩篇簡書文章,都相當靠譜:

由于這兩篇已經寫的非常詳細了,所以相同的部分就沒必要再贅述,下面只記錄下我填的坑。

順便說一句,內存較2017年年中價格翻翻了,所以半年來深度學習工作站總價并未有明顯下降。

坑1:顯卡尺寸!顯卡尺寸!顯卡尺寸!

重要的事情說3遍。

作為工作站平臺的x99 E WS/USB3.1已經是這個級別為數不多、能插滿4張GTX1080ti的主板了,但是顯卡的厚度務必以35mm為限。也就是說,基本上帶兩個大風扇甚至更多風扇的1080ti們,都不可以拿來組多卡。

我不僅買了MSI紅龍1080ti,而且還在京東買的——不支持7天無理由退換貨。結果連電都沒上,直降500大洋掛在閑魚上。已經出了一張,還剩一張。

MSI Aero 1080ti是OK的,35mm厚,剛剛好。

坑2:X99 E WS/USB3.1供電

X99 E WS/USB3.1供電位置(接電源),有4處,但是只有其中兩處是必要的:24pin的主板供電和8pin的CPU供電。前者沒有接錯可能,后者我接錯了。

兩個8pin的CPU供電如下圖。其實沒必要兩個都接滿,我最終只接了左側的8pin。

我的問題在于,我用了6pin+2pin組合,結果當滿心歡喜首次按下開關時,只聽到電源發出兩聲“嗒嗒”的金屬片聲音,風扇都紋絲不動。懵逼了數十分鐘。現在看應該是斷電保護在起作用。

CPU供電.jpg

錯誤的6+2:

錯誤:6pin+2pin

對于8pin的CPU供電,務必使用下面的接口:

正確

坑3:U盤安裝Ubuntu出現nouveau SCHED_ERROR

由于x99 E WS/USB3.1連個集成顯卡也沒有,所以在Ubuntu下會有這個狀況。按照下面這篇文章的方案即可解決:

安裝ubuntu 提示nouveau SCHED_ERROR 08錯誤解決方案

坑4:Ubuntu啟動紫屏卡住

Ubuntu安裝好后重啟,無需再從U盤啟動,所以坑3的方案已經無用了,可此時顯卡驅動還沒裝,就會出現紫屏的問題。本質上和坑3是一回事。

參考這篇即可順利進入系統,等把顯卡驅動裝好后就不會再出現了。

添加nomodeset

雙系統共享HDD

我裝的雙系統Win10+Ubuntu16.04,兩者2/3開瓜分了512G的SSD,還有一塊2T的HDD作為存儲盤。為了實現雙系統可以共享這個HDD,只需要做2件事:

  • 可先在Windows下對HDD進行GPT分區操作,使用NTFS文件系統;
  • 再Ubuntu下進行掛載設置,見下圖;
GUI HDD掛載設置
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容