練習(xí) 35:解釋器
譯者:飛龍
協(xié)議:CC BY-NC-SA 4.0
自豪地采用谷歌翻譯
解析中的最后一個練習(xí)應(yīng)該既具有挑戰(zhàn)性又有趣。你終于可以看到,你的微型 Python 腳本運行并做了一些事情。難以理解這個章節(jié)和解析的概念很正常。如果你發(fā)現(xiàn)你已經(jīng)到達(dá)了這里,而且你不太明白發(fā)生了什么,請退后一步,再考慮在這一部分做一些練習(xí)。在繼續(xù)之前,重復(fù)幾次這個章節(jié),這可以幫助你在最后兩個練習(xí)中制作自己的小語言。
我故意不會在本練習(xí)中包含任何代碼,以便你必須根據(jù)解釋器工作方式的描述來嘗試。你已經(jīng)有了 Python 作為參考,我們的微型 Python 示例應(yīng)該如何操作這些小語句。你知道如何用訪問者模式來遍歷你的解析樹。剩下的就是讓你編寫一個解釋器,它可以將它們結(jié)合在一起,并使你的小腳本運行。
解釋器和編譯器
在編程語言的世界里,存在解釋語言和編譯語言。編譯語言接受你的輸入的源碼,并進(jìn)行掃描,解析和分析階段。然后,編譯器基于這個分析產(chǎn)生機器碼,通過遍歷它并編寫真正的(或假的)計算機所需的字節(jié),來使 CPU 運行。一些編譯器增加了一個額外的步驟,將輸入的源碼翻譯成通用的“中間語言”,然后將其編譯為機器的字節(jié)。編譯器通常是確定的,因為你通常不能僅僅運行編譯器,而是首先必須通過編譯器運行源代碼,然后執(zhí)行結(jié)果。C 是一個經(jīng)典的編譯器,你可以這樣運行 C 程序:
$ cc ex1.c -o ex1
$ ./ex1
cc
命令是“C 編譯器”的意思,也就是說,你選取了文件ex1.c
,掃描,解析,并進(jìn)行分析,然后輸出可執(zhí)行字節(jié)到文件ex1
。一旦你完成了,你就可以像其他任何程序一樣運行它。
解釋器不會生成你運行的編譯后字節(jié)碼,而是直接運行并分析結(jié)果。它“解釋”輸入語言,就像我把我的漢語轉(zhuǎn)換為我朋友的泰語。它加載源文件,然后像編譯器那樣進(jìn)行掃描,解析和分析。之后,它只是使用解釋器的自己的語言(在這里是 Python),來根據(jù)分析來運行它。
如果我們要在 Python 中實現(xiàn) JavaScript 解釋器,我們會“使用 Python 解釋 JavaScript”。JavaScript 是我的漢語,一個解釋器正在為我將其憑空解釋為 Python(泰語)。如果我想用 Python 解釋 JavaScript 的1 + 2
,我可能會這樣做:
掃描
1 + 2
并產(chǎn)生記號INT(1) PLUS INT(2)
。將其解析為表達(dá)式
AddExpr(IntExpr(1), IntExpr(2))
分析它,將文本
1
和2
轉(zhuǎn)換為實際的 Python 整數(shù)。使用 Python 代碼
result = 1 + 2
解釋它,我可以將其轉(zhuǎn)給剩余的解析樹。
與之相比,編譯器會做 1~3 的任何事情。但是在第四步它會編寫字節(jié)碼(機器碼)到另一個文件,我可以將其運行在 CPU 上。
Python 兩者都是
Python 更現(xiàn)代化,通過幾乎完成編譯和解釋,利用更快的計算機。它將像解釋器一樣工作,所以你不必經(jīng)歷編譯階段。但是,解釋器出奇地慢,所以 Python 有一個內(nèi)部的虛擬機。當(dāng)你運行腳本時,例如python ex1.py
,Python 實際上會運行它并將其編譯到__pycache__
目錄中的ex1.cpython -36.pyc
文件。該文件是字節(jié)碼,Python 程序知道如何加載和運行,它的工作原理就像假的機器代碼。
譯者注:但是沒有 JIT 的情況下還是很慢。
你的解釋器永遠(yuǎn)不會,也不應(yīng)該是這樣的。你的解釋器應(yīng)該只是掃描,解析,分析和解釋微型 Python 腳本。
如何編寫解釋器
當(dāng)你編寫解釋器時,你將需要工作在所有三個階段之間,來修復(fù)你錯過或做錯的東西。我建議你先添加數(shù)字,然后再處理更復(fù)雜的表達(dá)式,直到你的腳本能夠運行。我會像這樣完成它:
- 將你的第一個
interpret
方法添加到AddExpr
類,并讓它打印出一條消息。 - 讓你的解釋器能夠可靠地訪問這個類,并傳入它需要的
PunyPyWorld
。 - 一旦你完成了,你可以調(diào)用
AddExpr.interpret
來計算它的兩個表達(dá)式的和,并返回結(jié)果。 - 之后,你必須弄清楚,這個
interpret
步驟的結(jié)果應(yīng)該到哪里去。為了保持簡單,讓我們假設(shè)微型 Python 是一種基于表達(dá)式的語言,所以一切都返回一個值。在這種情況下,對一個解釋器的調(diào)用總是具有返回值,父調(diào)用可以使用它。 - 最后,由于微型 Python 基于表達(dá)式,你可以讓你的
Interpreter
打印出其interpret
調(diào)用的最終結(jié)果。 - 如果你這樣做,你將會獲得解釋器的基礎(chǔ)知識,你可以開始執(zhí)行所有其他的
interpret
方法,使其運行。
挑戰(zhàn)練習(xí)
編寫微型 Python 的解釋器,應(yīng)該只涉及編寫另一個訪問者模式,它遍歷分析后的解析樹,并完成解析樹讓它做的任何事情。你唯一的目標(biāo)就是讓這個很小的(甚至是微型的)腳本運行。這似乎是愚蠢的,因為這只是三行代碼,但它涵蓋編程語言中的各種主題:變量,加法,表達(dá)式,函數(shù)定義和函數(shù)調(diào)用。如果你實現(xiàn)了if
語句,你幾乎可以有一個可工作的編程語言。
你的任務(wù)是編寫一個PunyPyInterpreter
類,它接受PunyPyWorld
和PunyPyAnalyzer
的運行結(jié)果來執(zhí)行腳本。你必須實現(xiàn)print
,僅僅用于打印其變量,但其余的代碼,應(yīng)該在你遍歷每個產(chǎn)生式類的時候運行。
研究性學(xué)習(xí)
- 一旦你擁有了
PunyPyInterpreter
,你應(yīng)該實現(xiàn)if
語句和布爾表達(dá)式,然后擴展你的語言測試集,來確保這是有效的。盡可能為這個小型 Python 解釋器增加功能。 - 如何使微型 Python 也擁有語句?
深入學(xué)習(xí)
你應(yīng)該能夠?qū)W習(xí)盡可能多的語言的語法和規(guī)范。繼續(xù)尋找一些語言并學(xué)習(xí)它們,但是使用該語言的源代碼來完成。你還應(yīng)該完整學(xué)習(xí) https://tools.ietf.org/html/rfc5234 上面的 IETF ABNF 規(guī)范,來為自己準(zhǔn)備接下來的兩項練習(xí)。