【Spark】配置Spark源碼閱讀環境

Scala構建工具(SBT)的使用

SBT介紹

SBT是Simple Build Tool的簡稱,如果讀者使用過Maven,那么可以簡單將SBT看做是Scala世界的Maven,雖然二者各有優劣,但完成的工作基本是類似的。
雖然Maven同樣可以管理Scala項目的依賴并進行構建,但SBT的某些特性卻讓人如此著迷,比如:

  • 使用Scala作為DSL來定義build文件(one language rules them all);
  • 通過觸發執行(trigger execution)特性支持持續的編譯與測試;
  • 增量編譯:SBT的增量編譯支持因為如此優秀,已經剝離為Zinc,可被Eclipse, Maven,Gradle等使用
  • 可以混合構建Java和Scala項目;
  • 并行的任務執行;
  • 可以重用Maven或者ivy的repository進行依賴管理等等

工程結構

  • project – 工程定義文件
    project/build/.scala – 主要的工程定義文件
    project/build.properties – 工程,sbt以及scala版本定義
  • src/main – 你的應用代碼放在這里,不同的子目錄名稱表示不同的編程語言(例如,src/main/scala,src/main/java)
    src/main/resources – 你想添加到jar包里的靜態文件(例如日志配置文件)
  • lib_managed – 你的工程所依賴的jar文件。會在sbt更新的時候添加到該目錄
  • target – 最終生成的文件存放的目錄(例如,生成的thrift代碼,class文件,jar文件)

目錄結構

sbt 和 Maven 的默認的源文件的目錄結構是一樣的(所有的路徑都是相對于基礎目錄的):

src/
  main/
    resources/  目錄存放相應的資源文件
       <files to include in main jar here>
    scala/  目錄存放Scala源代碼文件
       <main Scala sources>
    java/   目錄存放Java源代碼文件 
       <main Java sources>
  test/
    resources   目錄存放測試起見使用到的資源文件
       <files to include in test jar here>
    scala/  目錄存放scala語言書寫的測試代碼文件
       <test Scala sources>
    java/   目錄存放Java語言書寫的測試代碼文件
       <test Java sources>

sbt 完全按照約定工作。sbt 將會自動找到以下內容:
項目根目錄下的源文件
src/main/scala 或 src/main/java 中的源文件
src/test/scala 或 src/test/java 中的測試文件
src/main/resources 或 src/test/resources 中的數據文件
lib 中的 jar 文件

SBT命令

  • 交互模式
    在你的項目目錄下運行 sbt 不跟任何參數:
    $ sbt
    執行 sbt 不跟任何命令行參數將會進入交互模式。交互模式有一個命令行(含有 tab 自動補全功能和歷史記錄)。
    例如,在 sbt 命令行里輸入 compile:
    > compile
    再次 compile,只需要按向上的方向鍵,然后回車。 輸入 run 來啟動程序。 輸入 exit 或者 Ctrl+D (Unix)或者 Ctrl+Z (Windows)可以退出交互模式。

  • 批處理模式
    你也可以用批處理模式來運行 sbt,可以以空格為分隔符指定參數。對于接受參數的 sbt 命令,將命令和參數用引號引起來一起傳給 sbt。例如:
    $ sbt clean compile "testOnly TestA TestB"
    在這個例子中,testOnly 有兩個參數 TestA 和 TestB。這個命令會按順序執行(clean, compile, 然后 testOnly)。

  • 持續構建和測試
    為了加快編輯-編譯-測試循環,你可以讓 sbt 在你保存源文件時自動重新編譯或者跑測試。 在命令前面加上前綴 ~ 后,每當有一個或多個源文件發生變化時就會自動運行該命令。例如,在交互模式下嘗試:
    > ~ compile
    按回車鍵停止監視變化。 你可以在交互模式或者批處理模式下使用 ~ 前綴。 參見 觸發執行 獲取詳細信息。

  • 常用命令
    下面是一些非常常用的的 sbt 命令。更加詳細的列表請參見 命令行參考。

clean 刪除所有生成的文件 (在 target 目錄下)。
compile 編譯源文件(在 src/main/scala 和 src/main/java 目錄下)。
test 編譯和運行所有測試。
console 進入到一個包含所有編譯的文件和所有依賴的 classpath 的 Scala 解析器。輸入 :quit, Ctrl+D (Unix),或者 Ctrl+Z (Windows) 返回到 sbt。
run <參數>* 在和 sbt 所處的同一個虛擬機上執行項目的 main class。
package 將 src/main/resources 下的文件和 src/main/scala 以及 src/main/java 中編譯出來的 class 文件打包成一個 jar 文件。
help <命令> 顯示指定的命令的詳細幫助信息。如果沒有指定命令,會顯示所有命令的簡介。
reload 重新加載構建定義(build.sbt, project/*.scala, project/*.sbt 這些文件中定義的內容)。在修改了構建定義文件之后需要重新加載。

導入Spark工程

首先下載Spark源碼并解壓到本地。
打開IDEA,在菜單欄中選擇File下的New,選擇Project from Existing Sources,找到解壓后的Spark工程文件夾。
選擇Import project from external model中的SBT project。
下一步選擇Project SDK為JDK,最好勾上Use auto-import,然后點擊完成。這時,IDEA會自動下載安裝SBT所需的各種包,沒有裝Git可能會報錯。

因為Spark是一個比較大的工程,所需的包也很多,這個過程也會特別慢,請耐心等待。
導入完成后,自動打開工程,要等一段時間,等待sbt對這個工程進行編譯。

安裝IntelliJ IDEA的編輯器主題配色

可以從IDEA的主題網站下載想要的主題,格式jar文件。
在IDEA的File-->Import Settings-->選擇jar包,完成導入。
最后在Settings-->Editor-->Colors & Fonts中選擇就可以了。

參考資料

轉載請注明作者Jason Ding及其出處
GitCafe博客主頁(http://jasonding1354.gitcafe.io/)
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.lxweimin.com/users/2bd9b48f6ea8/latest_articles)
百度搜索jasonding1354進入我的博客主頁

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容