[譯]27個Jupyter Notebook小提示與技巧

圖片鏈接已失效,歡迎前往我的博客查看最新版本

Jupyter Notebook

Jupyter notebook, 前身是IPython notebook, 它是一個非常靈活的工具,有助于幫助你構建很多可讀的分析,你可以在里面同時保留代碼,圖片,評論,公式和繪制的圖像。

screenshot
screenshot

Jupyter具有非常強的可擴展性,支持很多編程語言,并且易于部署到你的個人電腦和幾乎所有的服務器上 -- 你只需要使用ssh或http接入即可。最重要的是,它完全免費。

Jupyter默認設置使用Python kernel,正因此以前叫做IPython notebook. Jupyter notebook源自于Jupyter項目, Jupyter這個名字是它被設計所支持三個核心編程語言的縮寫詞:JUlia,PYThon, 和 R, 啟發自木星這個詞:Jupiter.

接下來的內容將向你展示27個讓Jupyter用的更加舒心的建議與技巧。

1. Keyboard Shortcuts

每一個進階用戶都知道,鍵盤快捷鍵將會為我們節省許多時間。Jupyter在頂部的菜單里保留了許多快捷鍵:Help > keyboard Shortcuts. 每次更新Jupyter時,都值得再次進行查看,因為新的快捷鍵總是不斷被添加進來。

另一個查看快捷鍵的方式是使用命令面板:Cmd + Shift + P(或者Linux和Windows上 Ctrl + Shift + P)。這個對話框將會幫助你通過名稱運行任何命令 -- 這非常有用,尤其當你不知道一個命令的快捷鍵或者你想要執行的命令沒有快捷鍵時。這個功能非常類似與Mac上的Spotlight搜索,一旦你開始使用這個功能,你就會發現沒有它的日子該怎么辦!

命令面板
命令面板

這里是一些我喜歡的快捷鍵:

  • Esc + F查找和替換你的代碼,但不包括代碼的輸出內容。

  • Esc + o打開代碼塊輸出。

  • 選擇多個cell。
    Shift + JShift + Down向下選中下一個cell. 你可以通過Shift + KShift + Up向上選中cell。

    • 一旦cell被選中,接著你可以進行批量刪除/復制/剪切/粘貼.當你需要移動一部分notebook時,這非常有用。
    • 你也可以執行Shift + M對多個cell進行合并。
    interface
    interface

2. Pretty Display of Varibles

這部分內容可能很多人都知道。如果對帶有一個變量或是未復制語句的cell執行操作,Jupyter將會打印該變量而無需一個輸出語句。這非常有用,尤其是使用Pandas DataFrames進行處理時,因為輸出將會被整齊地格式化為一個表格。

接下來的內容可能沒那么人知道:你可以選擇修改ast_note_iteractivelykernal選項來使得Jupyter為每一行的變量或語句執行這個操作,以便你可以立即看到多條語句一起輸出。

多條語句同時輸出
多條語句同時輸出

如果你想要所有的Jupyter實例(Notebook和Console)都設置該選項,只需創建~/.ipython/profile_default/ipython_config.py文件并寫入一下內容:

c = get_config()
# Run all nodes interactively
c.InteractiveShell.ast_node_interactivity = "all"

3. Easy links to documentation

Help菜單你可以找到一些常用庫文檔的連接,包括NumPy, Pandas, SciPy 和 Matplotlib.

同時別忘了在一個庫,方法或變量前加上?,你可以獲得一個快速的語法說明。

快捷語法查看
快捷語法查看

4. Plotting in notebooks

在notebook中生成繪圖有許多選項:

  • matplotlib, 使用%matplotlib inline進行激活。
  • %matplotlib notebook提供了一些交互性,不過可能會有點慢,因為渲染由服務器端完成。
  • mpld3為matplotlib代碼提供了另一個渲染器(使用d3)。非常漂亮,不過尚未完整。
  • bokeh是構建交互性繪圖的一個更好的選擇。
  • plot.ly也可以生成漂亮的繪圖,不過是付費服務。
交互式圖表
交互式圖表

5. Jupyter Magic Commands

上面的%matplotlib inline就是一個所謂的Jupyter Magic(Jupyter魔法)命令。

magic命令
magic命令

推薦閱讀the documentation for all Jupyter magic commands,你會發現這非常有用。下面是一些我所喜愛的魔法命令:

6. Jupyter Magic - %env:Set Environment Variables

你可以管理notebook的環境變量而無需重啟jupyter server. 一些庫(比如theano)使用環境變量來控制行為,%env是最方便的一個途徑。

%env環境變量
%env環境變量

7. Jupyter Magic - %run:Excute python code

%run可以從.py文件執行Python代碼. 更少的人知道的是它也可以執行其他的Jupyter notebook,這也非常有用。

%run運行python或jupyter notebook

注意使用%run并不等同于導入一個Python模塊.

8. Jupyter Magic - %load:Insert the code from an external script

這將會使用外部腳本來代替cell的內容。你可以使用本地機器上的文件也可以使用一個URL.

%load加載外部腳本

9. Jupyter Magic - %store:Pass variables between notebooks

%store命令可以讓你在兩個不同的notebook間傳遞變量。

10. Jupyter Magic - %who:List all variables of global scope.

不帶參數的%who命令將會列出全局范圍內存在的所有變量。如果傳入參數,比如str,將會列出指定類型的所有變量。

%who查看全局變量

11. Jupyter Magic - Timing

對于計時有兩個十分有用的魔法命令:%%time%timeit. 如果你有些代碼運行地十分緩慢,而你想確定是否問題出在這里,這兩個命令將會非常方便。

  • %%time將會給出cell的代碼運行一次所花費的時間。
%time
  • %timeit使用Python的timeit模塊,它將會執行一個語句100,000次(默認情況下),然后給出運行最快3次的平均值。
%timeit

12. Jupyter Magic - %%writefile and %pycat:Export the contents of a cell/Show the contents of an external script

使用%%writefile魔法保存cell的內容到一個外部文件。%pycat則剛好相反,并且會向你展示高亮后的外部文件。

%writefile & %pycat

13. Jupyter Magic - %prun:Show how much time your program spent in each function

使用%prun statement_name將會產生一個有序表格來展示在該語句中所調用的每個內部函數調用的次數,每次調用的時間與該函數累計運行的時間。

%prun

14. Jupyter Magic - Debugging with %pdb

Jupyter有一個自己的python調試器接口(pdb),這使得我們能夠進入函數內部看看到底發生了什么。

你可以在這里查看pdb的命令列表

15. Suppress the output of a final function

有時候你可能會想要抑制最后一行函數的輸出,比如當我們繪制圖像的時候。為此,你只需加上一個分號即可。

取消輸出
取消輸出

16. Executing Shell Commands

在notebook中執行shell命令非常容易,你可以像下面這樣列出當前目錄下的文件:

!ls
shell命令
shell命令

或是檢查或管理包.

17. Using LaTeX for formulas

當你在markdown cell中書寫LaTeX時,它會被MathJax渲染成一個公式。

$$ P(A \mid B) = \frac{P(B \mid A) \, P(A)}{P(B)} $$

會被渲染成為:

$$ P(A \mid B) = \frac{P(B \mid A) , P(A)}{P(B)} $$

markdown是notebook中十分重要的一部分,別忘了使用它來傳達你的想法!

18. Run code from a different kernel in a notebooks

如果想要的話,你可以將多個kernel的代碼組合到一個notebook中。

在每個cell的開頭使用相關的魔法命令來聲明你想使用的kernel:

  • %%bash
  • %%HTML
  • %%python2
  • %%python3
  • %%ruby
  • %%perl
運行多種類型的kernel
運行多種類型的kernel

19. Install other kernels for Jupyter

Jupyter其中的一個重要特色就是能夠運行不同語言,你只需安裝相關的kernel即可。比如,下面的例子是如何安裝 R kernel.

  • 快捷選擇:使用anaconda安裝R kernel

如果你使用anaconda安裝你的環境,這會相當簡單。你只需要在terminal中運行下面的命令:

conda install -c r r-essentials
  • 不那么快捷的方式:手動安裝R kernel

如果你不是使用anaconda, 這個過程可能稍顯復雜。首先你需要從CRAN安裝R, 如果你還沒有安裝的話。

安裝R完畢后,打開R console并運行如下命令:

install.packages(c('repr', 'IRdisplay', 'crayon', 'pbdZMQ', 'devtools'))
devtools::install_github('IRkernel/IRkernel')
IRkernel::installspec()  # to register the kernel in the current R installation

20. Running R and Python in the same notebook

對于此最好的解決方案是安裝rpy2(需要一個可以工作的R版本), 通過pip可以很容易安裝:

pip install rpy2

你可以同時使用這兩種語言,甚至在它們之間傳遞變量:

一個很好的示例Revolutions Blog

21. Writing functions in other languages

有時候numpy的速度仍舊不夠快,我們需要自己寫一些更快的代碼。

原則上,你可以以動態鏈接庫的方式編譯函數,然后用python進行包裝。

不過如果有人能夠幫你完成這部分煩人的工作是不是非常棒呢?

你可以用cython或fortran寫函數并直接從Python代碼進行調用。

首先你需要安裝:

!pip install cython fortran-magic

個人來說我更喜歡使用fortran, 我發現它對數值統計函數十分方便。更多用法上的細節可以在這里找到.

也有一些其他方式可以加速你的Python代碼。更多示例可以在這里找到/

22. Multicursor support

Jupyter支持多光標操作,與Sublime Text類似。按住Alt進行點擊和拖拽鼠標即可。

23. Jupyter-contrib extensions

Jupyter-contrib extensions 是一系列能夠給Jupyter帶來許多功能的擴展,比如jupyter spell-checkercode-formatter.

插件擴展
插件擴展

24. Create a presentation from a Jupyter notebook

Damian Avila的 RISE允許你從已有的一個notebook創建一個powerpoint風格的報告。

你可以通過conda安裝RISE:

conda install -c damianavila82 rise

或通過pip:

pip install RISE

然后執行下面的代碼安裝并啟用擴展:

jupyter-nbextension install rise --py --sys-prefix
jupyter-nbextension enable rise --py --sys-prefix

25. The Jupyter output system

notebook以HTML的方式進行展示,cell的輸出也可以是HTML,所以事實上你可以返回任何東西:視頻/音頻/圖像。

下面的例子我掃描了

26. 'Big data' analysis

對于大規模數據樣本的查詢/處理也有一些解決方案:

27. Sharing notebooks

分享notebook最簡單的方式是直接使用notebook文件(.ipynb).不過對于那些不使用Jupyter的人來說,你也可以這么做:

  • 使用菜單項File > Download as > HTML將notebook轉換成HTML。

  • 使用gist或github分享notebook,它們都會對notebook進行渲染展示。

    • 如果你上傳notebook到一個github倉庫,你可以使用十分便利的mybinder服務來允許第三者半小時的交互性身份接入你的倉庫。

[譯者]
useful links: https://github.com/dunovank/jupyter-themes
原文地址:27 Jupyter Notebook tips, tricks and shortcuts

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容