|
日拱一卒,功不唐捐 |
20161219 重要: 本篇文章有個錯誤, 感謝 fb Jensen Holder 指出, 我放在最後補充。
變數就是字面上的意思, 寫程式的都知道, 但知道 interpreter 怎麼把這功能做出來的程式員可能就不多了。
list 1 L2 怎麼把 x, 1 做個對應的呢? 就是靠《環境》, 他不是什麼神祕的東西, 用 c++ 來說明什麼是環境的話就是:
然後把 env["x"]=1 就完成 x=1 這個運算式。
不管你用什麼資料結構, 反正就是把 x 和 1 的關係存起來就對了。感覺很簡單, 但真實世界上可沒這麼簡單, 不過教學就是要化繁為簡, 先知道這樣就夠了。
再來的 list 1 L2 在 x+5 要做 eval 時, eval 5 就回傳 5 ASTNode 本身, x 就到 env 去把他對應的數字找出來, 也就是 1, 所以傳回 1 的 ASTNode, 然後 + 就可以把 1, 5 作相加的運算, 6 就這麼算出來了。
那《環境》困難在哪裡呢? 在 function call。
如果像 p1 這樣, 掃描到 L1 時, 把 x 加入 global_env (table 1), 在 call main 時, 要產生 main_env (table 2), main_env 的上層 up_env 要指到 global_env, 當掃描到 L 14 時, 把 x:0 加入到 main_env, 而掃描到 L 16 時, 把 5 的值至換到 z (table 3), 在 call f2(z) 時 (L 18), 又要產生 f2_env (table 4), 再把 up_env 指到 main_env, 並把 z/i 的對應存到 f2_env, cc 的對應也要存到 f2_env, 疑, cc 沒對應的值阿, 隨便塞一個就好了, 這不就是 c 語言 auto 變數的行為嗎? 而上層 env 要指到 main_env, 這樣層層下去, 讓整個環境建立起所有的變數名稱/變數值的對應關係。大概像 env class 那樣。
table 1. global_env
up_env | 0 |
x | 0 |
table 2. main_env
up_env | global_env |
z | 0 |
table 3 main_env
up_env | global_env |
z | 5 |
table 4. f2_env
up_env | main_env |
i | z |
cc | 0 |
所以在 f2() 裡頭用到 cc, i 時, 就去查 f2_env, 把對應的值找出來, 就可以知道這個變數的值, 而在這層找不到, 就要去 up_env 找, 都找不到就發出錯誤訊息。
觀念很簡單, 但實作還是會困難一點, 可參考以下範例程式碼。以下程式碼只有實作最簡單的環境,
我還沒完成 function call 那複雜的環境。目前的版本我已經完成了 function call 和 return, 真是有種覺得自己很不簡單的感覺呢! 你一定也很想要有這種成就感吧! 加油。
source code:
https://github.com/descent/simple_compiler
commit: 0452c23b770dad99b1d503e0f417cae45879ce72
除了加入變數, 函式的定義也一樣要加入環境, 當呼叫一個函式時, 就到環境來找這個函式, 找到後把 parameter, argument 配對後, 就去執行該函式了。
至於函式的傳回值, 那又是另外一件事情了。
因為使用了「環境」來處理「變數」, 這便是「環境變數」名稱的由來。
打通整個 interpreter 流程並不容易, 當我滿懷好奇心將所有疑問抽絲剝繭, 最後接觸到本質的那一刻, 我知道這些努力與堅持是值得的, 縱使我無法因為這樣而在工作上有立即的幫助, 但滿足自己的好奇心就是驅使我這麼做的最大動力。
html table from:
http://htmleditor.i2yes.com/
沒有留言:
張貼留言
使用 google 的 reCAPTCHA 驗證碼, 總算可以輕鬆留言了。
我實在受不了 spam 了, 又不想讓大家的眼睛花掉, 只好放棄匿名留言。這是沒辦法中的辦法了。留言的朋友需要有 google 帳號。