語言及語法定義
布爾表達式包含:邏輯表達式 and or not,關系表達式 >, >=, ==, <=, <
源碼位置:https://github.com/wangdxh/eopl3-in-python ? let 文件夾下面 pyand.py
簡單的布爾表達式如下:
我們使用“let ?變量定義 ?in ?布爾表達式 ” 這樣的語句來引入變量的定義,可以在布爾表達式中引用定義的變量,實例如下:
在《Oreilly-Getting-Started-with-Pyparsing》一書中,49頁有一個邏輯表達式的BNF定義,如下:
在這個定義中,定義了邏輯表達式的優先級 not > ?and > or 并且是一個遞歸的定義,Term的定義包含 可選的 not,然后是 單個單詞,字符串(quotedString),或者括號括起來的另一個表達式。這里and or not 兩邊并不是關系表達式,而是單詞,字符串,是書中的一個例子,后面我們會將其修改為關系表達式。
And表達式的定義為 Term 跟著 可選的 多個and Term。布爾表達式定義為 And 表達式加上 可選的 多個or And表達式。這樣解析的時候,a && b || c 出現||的時候,左右兩邊被解析為and表達式,&&的兩邊被解析為term表達式,優先級比較明確。
下圖是使用pyparsing語法定義的 表達式:
解析的時候,term 中包含的子表達式被包含在一個列表內,多個并列的and語句包含在一個列表內。
and or not 邏輯表達式有優先級,和一元二元區分,and和or是二元,not是一元,pyparsing提供了一個簡單的操作符優先級的語法定義:如下
將Term修改為只有 單詞和字符串的定義,
多個操作符定義為列表,第一個元素為定義的邏輯符號,第二個元素說明是一元還是二元,第三個元素是說明操作符是left- or right-associative。使用操作符優先級定義比較簡潔,效果等同于上一段的pyparsing定義。省略了遞歸定義,和()操作符的定義。
下面是我們定義的關系表達式的語法,關系表達式中可以使用變量,數值,字符串,支持>,== <,>=, <=.(少了一個!=)
每個關系表達式封裝在一個子列表內。BoolTerm 可以是任何一個關系表達式。使用操作符優先級進行定義:
定義let表達式:原來 in 后面跟著的body,修改為boolexpr。變量定義中變量的值只能賦值為item,上面item定義為變量,數值,字符串,所以在擴展環境中的變量的值的時候,直接擴展,不需要對item進行解析計算了。
解釋執行
let的語句執行時,對于變量定義列表,varvalue的值都是直接的值,直接擴展到環境中去,然后返回boolexp的解析結果
布爾表達式,首先是以and 和 or 分割的list,not 或者 關系表達式都被封裝在更深一層的list內部,所以頂級有&& 或者 || 出現的時候,總是 一個或者多個 && || 組成的列表,在列表的1,3,5奇數位上總是 &&或||,0,2,4是 關系表達式,或者子布爾表達式。同一級的表達式如果出現多個||,則計算每一個的值,碰到第一個為真,就返回,表達式都執行沒有返回,就返回假。 多個&&時,碰到第一個為假就返回,多個表達式計算完成沒有返回,就返回真。
如果是not表達式,則exp的第一個字符是not !,直接返回 第二個元素的反值。not表達式解析為一個獨立的list,所以元素為2,后面跟著not的對象。
剩余的就是計算關系表達式的值了:關系表達式都是有3個元素的,所以解析出來的list結果,每一個list都是至少有2個元素的,所以下面直接通過索引判斷list的取值,并不會越界。
關系表達式的解釋:關系表達式都是二元的,所以取值的時候只要取出0,2,的值即可,1號位的元素肯定是字符串的關系符號。0和2號位,如果不是以“開頭的字符串說明它是一個變量,這里有個注意的地方,pyparsing解析出來的字符串,如果不設置setParseAction時,removeQuotes解析出來的結果是帶引號的,這里我們通過引號來區分其實字符串類型還是變量類型。變量和字符串的類型區分,后續會用其他方法進行區分。
真正解釋關系表達式的時候,是將每個關系表達式轉換成字符串,然后調用eval直接當成python語言進行計算。如果關系表達式中包含變量的時候,提前將其的值從環境中查找出來 apply_env。然后再組成字符串。
遺留問題:只通過解析出來的list元素值,不太好區分 變量 和 字符串 的定義。可以通過設置setResultsName別名來區分,但是效果不是很好。