【中文版】以太坊白皮書
翻譯:少平、 Seven
當中本聰在 2009 年 1 月啟動比特幣區塊鏈時,他同時向世界引入了兩種未經測試的革命性的新概念。第一種就是比特幣(bitcoin),一種去中心化的點對點的網上貨幣,在沒有任何資產擔保、內在價值或者中心發行者的情況下維持著價值。到目前為止,比特幣已經吸引了大量的公眾注意力,就政治方面而言它是一種沒有中央銀行的貨幣并且有著劇烈的價格波動。然而,中本聰的偉大試驗還有與比特幣同等重要的一部分:基于工作量證明的區塊鏈概念使得人們可以就交易順序達成共識。作為應用的比特幣可以被描述為一個先申請(first-to-file)系統:如果某人有 50BTC 并且同時向 A 和 B 發送這 50BTC,只有被首先被確認的交易才會生效。沒有固有方法可以決定兩筆交易哪一筆先到,這個問題阻礙了去中心化數字貨幣的發展許多年。中本聰的區塊鏈是第一個可靠的去中心化解決辦法。現在,開發者們的注意力開始迅速地轉向比特幣技術的第二部分,區塊鏈怎樣應用于貨幣以外的領域。
常被提及的應用包括使用鏈上數字資產來代表定制貨幣和金融工具(彩色幣),某種基礎物理設備的所有權(智能資產),如域名一樣的沒有可替代性的資產(域名幣)以及如去中心化交易所,金融衍生品,點到點賭博和鏈上身份和信譽系統等更高級的應用。另一個常被問詢的重要領域是 “智能合約”- 根據事先任意制訂的規則來自動轉移數字資產的系統。例如,一個人可能有一個存儲合約,形式為 “A 可以每天最多提現 X 個幣,B 每天最多 Y 個,A 和 B 一起可以隨意提取,A 可以停掉 B 的提現權”。這種合約的符合邏輯的擴展就是去中心化自治組織(DAOs)- 長期的包含一個組織的資產并把組織的規則編碼的智能合約。以太坊的目標就是提供一個帶有內置的成熟的圖靈完備語言的區塊鏈,用這種語言可以創建合約來編碼任意狀態轉換功能,用戶只要簡單地用幾行代碼來實現邏輯,就能夠創建以上提及的所有系統以及許多我們還想象不到的的其它系統。
總之,我們相信這樣的設計是邁向“加密貨幣 2.0”的 堅實一步;我們希望以太坊的出現之于加密貨幣生態系統的標志性意義,正如 1995 年前后 Web2.0 之于互聯網。
歷史
去中心化的數字貨幣概念,正如財產登記這樣的替代應用一樣,早在幾十年以前就被提出來了。1980 和 1990 年代的匿名電子現金協議,大部分是以喬姆盲簽技術(Chaumian blinding)為基礎的。這些電子現金協議提供具有高度隱私性的貨幣,但是這些協議都沒有流行起來,因為它們都依賴于一個中心化的中介機構。1998 年,戴偉(Wei Dai)的 b-money 首次引入了通過解決計算難題和去中心化共識創造貨幣的思想,但是該建議并未給出如何實現去中心化共識的具體方法。2005 年,芬尼(Hal Finney)引入了 “可重復使用的工作量證明機制”(reusable proofs of work)概念,它同時使用 b-money 的思想和 Adam Back 提出的計算困難的哈希現金(Hashcash)難題來創造密碼學貨幣。但是,這種概念再次迷失于理想化,因為它依賴于可信任的計算作為后端。
因為貨幣是一個先申請應用,交易的順序至關重要,所以去中心化的貨幣需要找到實現去中心化共識的方法。比特幣以前的所有電子貨幣協議所遇到的主要障礙是,盡管對如何創建安全的拜占庭問題容錯(Byzantine-fault-tolerant)多方共識系統的研究已經歷時多年,但是上述協議只解決了問題的一半。這些協議假設系統的所有參與者是已知的,并產生如 “如果有 N 方參與到系統中,那么系統可以容忍 N/4 的惡意參與者” 這樣形式的安全邊界。然而這個假設的問題在于,在匿名的情況下,系統設置的安全邊界容易遭受女巫攻擊,因為一個攻擊者可以在一臺服務器或者僵尸網絡上創建數以千計的節點,從而單方面確保擁有多數份額。
中本聰的創新是引入這樣一個理念:將一個非常簡單的基于節點的去中心化共識協議與工作量證明機制結合在一起。節點通過工作量證明機制獲得參與到系統的權利,每十分鐘將交易打包到 “區塊” 中,從而創建出不斷增長的區塊鏈。擁有大量算力的節點有更大的影響力,但獲得比整個網絡更多的算力比創建一百萬個節點困難得多。盡管比特幣區塊鏈模型非常簡陋,但是實踐證明它已經足夠好用了,在未來五年,它將成為全世界兩百個以上的貨幣和協議的基石。
作為狀態轉換系統的比特幣
從技術角度講,比特幣賬本可以被認為是一個狀態轉換系統,該系統包括所有現存的比特幣所有權狀態和 “狀態轉換函數”。狀態轉換函數以當前狀態和交易為輸入,輸出新的狀態。例如,在標準的銀行系統中,狀態就是一個資產負債表,一個從 A 賬戶向 B 賬戶轉賬 X 美元的請求是一筆交易,狀態轉換函數將從 A 賬戶中減去 X 美元,向 B 賬戶增加 X 美元。如果 A 賬戶的余額小于 X 美元,狀態轉換函數就會返回錯誤提示。所以我們可以如下定義狀態轉換函數:
APPLY(S,TX) -> S' or ERROR
在上面提到的銀行系統中,狀態轉換函數如下:
APPLY({ Alice: $50, Bob: $50 },"send $20 from Alice to Bob") = { Alice: $30,Bob: $70 }
但是:
APPLY({ Alice: $50, Bob: $50 },"send $70 from Alice to Bob") = ERROR
比特幣系統的 “狀態” 是所有已經被挖出的、沒有花費的比特幣(技術上稱為 “未花費的交易輸出,unspent transaction outputs 或 UTXO”)的集合。每個 UTXO 都有一個面值和所有者(由 20 個字節的本質上是密碼學公鑰的地址所定義 [1])。一筆交易包括一個或多個輸入和一個或多個輸出。每個輸入包含一個對現有 UTXO 的引用和由與所有者地址相對應的私鑰創建的密碼學簽名。每個輸出包含一個新的加入到狀態中的 UTXO。
在比特幣系統中,狀態轉換函數APPLY(S,TX)->S’大體上可以如下定義:
- 交易的每個輸入:
如果引用的 UTXO 不存在于現在的狀態中(S),返回錯誤提示
如果簽名與 UTXO 所有者的簽名不一致,返回錯誤提示
如果所有的 UTXO 輸入面值總額小于所有的 UTXO 輸出面值總額,返回錯誤提示
返回新狀態S’, 新狀態S中移除了所有的輸入 UTXO,增加了所有的輸出 UTXO。
第一步的第一部分防止交易的發送者花費不存在的比特幣,第二部分防止交易的發送者花費其他人的比特幣。第二步確保價值守恒。比特幣的支付協議如下。假設 Alice 想給 Bob 發送 11.7BTC。事實上,Alice 不可能正好有 11.7BTC。假設,她能得到的最小數額比特幣的方式是:6+4+2=12。所以,她可以創建一筆有 3 個輸入,2 個輸出的交易。第一個輸出的面值是 11.7BTC,所有者是 Bob(Bob 的比特幣地址),第二個輸出的面值是 0.3BTC,所有者是 Alice 自己,也就是找零。
挖礦
如果我們擁有可信任的中心化服務機構,狀態轉換系統可以很容易地實現,可以簡單地將上述功能準確編碼。然而,我們想把比特幣系統建成為去中心化的貨幣系統,為了確保每個人都同意交易的順序,我們需要將狀態轉換系統與一個共識系統結合起來。比特幣的去中心化共識進程要求網絡中的節點不斷嘗試將交易打包成 “區塊”。網絡被設計為大約每十分鐘產生一個區塊,每個區塊包含一個時間戳、一個隨機數、一個對上一個區塊的引用(即哈希)和上一區塊生成以來發生的所有交易列表。這樣隨著時間流逝就創建出了一個持續增長的區塊鏈,它不斷地更新,從而能夠代表比特幣賬本的最新狀態。
依照這個范式,檢查一個區塊是否有效的算法如下:
檢查區塊引用的上一個區塊是否存在且有效。
檢查區塊的時間戳是否晚于以前的區塊的時間戳,而且早于未來 2 小時 [2]。
檢查區塊的工作量證明是否有效。
將上一個區塊的最終狀態賦于S[0]。
假設 TX 是區塊的交易列表,包含 n 筆交易。對于屬于 0……n-1 的所有 i, 進行狀態轉換S[i+1] = APPLY(S[i],TX[i])。如果任何一筆交易 i 在狀態轉換中出錯,退出程序,返回錯誤。
返回正確,狀態S[n]是這一區塊的最終狀態。
本質上,區塊中的每筆交易必須提供一個正確的狀態轉換,要注意的是,“狀態” 并不是編碼到區塊的。它純粹只是被校驗節點記住的抽象概念,對于任意區塊都可以從創世狀態開始,按順序加上每一個區塊的每一筆交易,(妥妥地)計算出當前的狀態。另外,需要注意礦工將交易收錄進區塊的順序。如果一個區塊中有 A、B 兩筆交易,B 花費的是 A 創建的 UTXO,如果 A 在 B 以前,這個區塊是有效的,否則,這個區塊是無效的。
區塊驗證算法的有趣部分是 “工作量證明” 概念:對每個區塊進行 SHA256 哈希處理,將得到的哈希視為長度為 256 比特的數值,該數值必須小于不斷動態調整的目標數值,本書寫作時目標數值大約是 2^190。工作量證明的目的是使區塊的創建變得困難,從而阻止女巫攻擊者惡意重新生成區塊鏈。因為 SHA256 是完全不可預測的偽隨機函數,創建有效區塊的唯一方法就是簡單地不斷試錯,不斷地增加隨機數的數值,查看新的哈希數值是否小于目標數值。如果當前的目標數值是 2^192,就意味著平均需要嘗試 2^64 次才能生成有效的區塊。一般而言,比特幣網絡每隔 2016 個區塊重新設定目標數值,保證平均每十分鐘生成一個區塊。為了對礦工的計算工作進行獎勵,每一個成功生成區塊的礦工有權在區塊中包含一筆憑空發給他們自己 25BTC 的交易。另外,如果交易的輸入大于輸出,差額部分就作為 “交易費用” 付給礦工。順便提一下,對礦工的獎勵是比特幣發行的唯一機制,創世狀態中并沒有比特幣。
為了更好地理解挖礦的目的,讓我們分析比特幣網絡出現惡意攻擊者時會發生什么。因為比特幣的密碼學基礎是非常安全的,所以攻擊者會選擇攻擊沒有被密碼學直接保護的部分:交易順序。攻擊者的策略非常簡單:
向賣家發送 100BTC 購買商品(尤其是無需郵寄的電子商品)。
等待直至商品發出。
創建另一筆交易,將相同的 100BTC 發送給自己的賬戶。
使比特幣網絡相信發送給自己賬戶的交易是最先發出的。
一旦步驟(1)發生,幾分鐘后礦工將把這筆交易打包到區塊,假設是第 270000 個區塊。大約一個小時以后,在此區塊后面將會有五個區塊,每個區塊間接地指向這筆交易,從而確認這筆交易。這時賣家收到貨款,并向買家發貨。因為我們假設這是數字商品,攻擊者可以即時收到貨。現在,攻擊者創建另一筆交易,將相同的 100BTC 發送到自己的賬戶。如果攻擊者只是向全網廣播這一消息,這一筆交易不會被處理。礦工會運行狀態轉換函數APPLY(S,TX),發現這筆交易將花費已經不在狀態中的 UTXO。所以,攻擊者會對區塊鏈進行分叉,將第 269999 個區塊作為父區塊重新生成第 270000 個區塊,在此區塊中用新的交易取代舊的交易。因為區塊數據是不同的,這要求重新進行工作量證明。另外,因為攻擊者生成的新的第 270000 個區塊有不同的哈希,所以原來的第 270001 到第 270005 的區塊不指向它,因此原有的區塊鏈和攻擊者的新區塊是完全分離的。在發生區塊鏈分叉時,區塊鏈長的分支被認為是誠實的區塊鏈,合法的的礦工將會沿著原有的第 270005 區塊后挖礦,只有攻擊者一人在新的第 270000 區塊后挖礦。攻擊者為了使得他的區塊鏈最長,他需要擁有比除了他以外的全網更多的算力來追趕(即 51% 攻擊)。
默克爾樹
圖 1:僅提供默克爾樹(Merkle tree)上的少量節點已經足夠給出分支的合法證明。
圖 2:任何對于默克爾樹的任何部分進行改變的嘗試都會最終導致鏈上某處的不一致。
比特幣系統的一個重要的可擴展特性是:它的區塊存儲在多層次的數據結構中。一個區塊的哈希實際上只是區塊頭的哈希,區塊頭是包含時間戳、隨機數、上個區塊哈希和存儲了所有的區塊交易的默克爾樹的根哈希的長度大約為 200 字節的一段數據。
默克爾樹是一種二叉樹,由一組葉節點、一組中間節點和一個根節點構成。最下面的大量的葉節點包含基礎數據,每個中間節點是它的兩個子節點的哈希,根節點也是由它的兩個子節點的哈希,代表了默克爾樹的頂部。默克爾樹的目的是允許區塊的數據可以零散地傳送:節點可以從一個源下載區塊頭,從另外的源下載與其有關的樹的其它部分,而依然能夠確認所有的數據都是正確的。之所以如此是因為哈希向上的擴散:如果一個惡意用戶嘗試在樹的下部加入一個偽造的交易,所引起的改動將導致樹的上層節點的改動,以及更上層節點的改動,最終導致根節點的改動以及區塊哈希的改動,這樣協議就會將其記錄為一個完全不同的區塊(幾乎可以肯定是帶著不正確的工作量證明的)。
默克爾樹協議對比特幣的長期持續性可以說是至關重要的。在 2014 年 4 月,比特幣網絡中的一個全節點 - 存儲和處理所有區塊的全部數據的節點 - 需要占用 15GB 的內存空間,而且還以每個月超過 1GB 的速度增長。目前,這一存儲空間對臺式計算機來說尚可接受,但是手機已經負載不了如此巨大的數據了。未來只有商業機構和愛好者才會充當完整節點。簡化支付確認(SPV) 協議允許另一種節點存在,這樣的節點被成為 “輕節點”,它下載區塊頭,使用區塊頭確認工作量證明,然后只下載與其交易相關的默克爾樹 “分支”。這使得輕節點只要下載整個區塊鏈的一小部分就可以安全地確定任何一筆比特幣交易的狀態和賬戶的當前余額。
其它的區塊鏈應用
將區塊鏈的思想應用到其它領域的想法早就出現了。在 2005 年,尼克薩博提出了 “用所有權為財產冠名” 的概念,文中描述了復制數據庫技術的發展如何使基于區塊鏈的系統可以應用于登記土地所有權,創建包括例如房產權、違法侵占和喬治亞州土地稅等概念的詳細框架。然而,不幸的是在那時還沒有實用的復制數據庫系統,所以這個協議被沒有被付諸實踐。不過,自 2009 年比特幣系統的去中心化共識開發成功以來,許多區塊鏈的其它應用開始快速出現。
域名幣(namecoin)- 創建于 2010 年,被稱為去中心化的名稱注冊數據庫。像 Tor、Bitcoin 和 BitMessage 這樣的去中心化協議,需要一些確認賬戶的方法,這樣其他人才能夠與用戶進行交互。但是,在所有的現存的解決方案中僅有的可用的身份標識是象1LW79wp5ZBqaHW1jL5TciBCrhQYtHagUWy這樣的偽隨機哈希。理想的情況下,人們希望擁有一個帶有象 “george” 這樣的名稱的賬戶。然而,問題是如果有人可以創建 “george” 賬戶,那么其他人同樣也可以創建 “george” 賬戶來假扮。唯一的解決方法是先申請原則(first-to-file),只有第一個注冊者可以成功注冊,第二個不能再次注冊同一個賬戶。這一問題就可以利用比特幣的共識協議。域名幣是利用區塊鏈實現名稱注冊系統的最早的、最成功的系統。
彩色幣(Colored coins)- 彩色幣的目的是為人們在比特幣區塊鏈上創建自己的數字貨幣,或者,在更重要的一般意義上的貨幣 – 數字令牌提供服務。依照彩色幣協議,人們可以通過為某一特別的比特幣 UTXO 指定顏色,發行新的貨幣。該協議遞歸地將其它 UTXO 定義為與交易輸入 UTXO 相同的顏色。這就允許用戶保持只包含某一特定顏色的 UTXO,發送這些 UTXO 就像發送普通的比特幣一樣,通過回溯全部的區塊鏈判斷收到的 UTXO 顏色。
元幣(Metacoins)- 元幣的理念是在比特幣區塊鏈上創建新的協議,利用比特幣的交易保存元幣的交易,但是采用了不同的狀態轉換函數 APPLY’。因為元幣協議不能阻止比特幣區塊鏈上的無效的元幣交易,所以增加一個規則如果 APPLY'(S,TX) 返回錯誤,這一協議將默認 APPLY'(S,TX) = S。這為創建任意的、先進的不能在比特幣系統中實現的密碼學貨幣協議提供了一個簡單的解決方法,而且開發成本非常低,因為挖礦和網絡的問題已經由比特幣協議處理好了。
因此,一般而言,建立共識協議有兩種方法:建立一個獨立的網絡和在比特幣網絡上建立協議。雖然像域名幣這樣的應用使用第一種方法已經獲得了成功,但是該方法的實施非常困難,因為每一個應用需要創建獨立的區塊鏈和建立、測試所有狀態轉換和網絡代碼。另外,我們預測去中心化共識技術的應用將會服從冪律分布,大多數的應用太小不足以保證自由區塊鏈的安全,我們還注意到大量的去中心化應用,尤其是去中心化自治組織,需要進行應用之間的交互。
另一方面,基于比特幣的方法存在缺點,它沒有繼承比特幣可以進行簡化確認支付(SPV) 的特性。比特幣可以實現簡化確認支付,因為比特幣可以將區塊鏈深度作為有效性確認代理。在某一點上,一旦一筆交易的祖先們距離現在足夠遠時,就可以認為它們是合法狀態的一部分。與之相反,基于比特幣區塊鏈的元幣協議不能強迫區塊鏈不包括不符合元幣協議的交易。因此,安全的元幣協議的簡化支付確認需要后向掃描所有的區塊,直到區塊鏈的初始點,以確認某一交易是否有效。目前,所有基于比特幣的元幣協議的 “輕” 實施都依賴可信任的服務器提供數據,這對主要目的之一是消除信任需要的密碼學貨幣而言,只是一個相當次優的結果。
腳本
即使不對比特幣協議進行擴展,它也能在一定程度上實現” 智能合約”。比特幣的 UTXO 可以被不只被一個公鑰擁有,也可以被用基于堆棧的編程語言所編寫的更加復雜的腳本所擁有。在這一模式下,花費這樣的 UTXO,必須提供滿足腳本的數據。事實上,基本的公鑰所有權機制也是通過腳本實現的:腳本將橢圓曲線簽名作為輸入,驗證交易和擁有這一 UTXO 的地址,如果驗證成功,返回 1,否則返回 0。更加復雜的腳本用于其它不同的應用情況。例如,人們可以創建要求集齊三把私鑰中的兩把才能進行交易確認的腳本(多重簽名),對公司賬戶、儲蓄賬戶和某些商業代理來說,這種腳本是非常有用的。腳本也能用來對解決計算問題的用戶發送獎勵。人們甚至可以創建這樣的腳本 “如果你能夠提供你已經發送一定數額的的狗幣給我的簡化確認支付證明,這一比特幣 UTXO 就是你的了”,本質上,比特幣系統允許不同的密碼學貨幣進行去中心化的兌換。
然而,比特幣系統的腳本語言存在一些嚴重的限制:
缺少圖靈完備性 – 這就是說,盡管比特幣腳本語言可以支持多種計算,但是它不能支持所有的計算。最主要的缺失是循環語句。不支持循環語句的目的是避免交易確認時出現無限循環。理論上,對于腳本程序員來說,這是可以克服的障礙,因為任何循環都可以用多次重復 if 語句的方式來模擬,但是這樣做會導致腳本空間利用上的低效率,例如,實施一個替代的橢圓曲線簽名算法可能將需要 256 次重復的乘法,而每次都需要單獨編碼。
價值盲(Value-blindness)。UTXO 腳本不能為賬戶的取款額度提供精細的的控制。例如,預言機合約(oracle contract)的一個強大應用是對沖合約,A 和 B 各自向對沖合約中發送價值 1000 美元的比特幣,30 天以后,腳本向 A 發送價值 1000 美元的比特幣,向 B 發送剩余的比特幣。雖然實現對沖合約需要一個預言機(oracle)決定一比特幣值多少美元,但是與現在完全中心化的解決方案相比,這一機制已經在減少信任和基礎設施方面有了巨大的進步。然而,因為 UTXO 是不可分割的,為實現此合約,唯一的方法是非常低效地采用許多有不同面值的 UTXO(例如對應于最大為 30 的每個 k,有一個 2^k 的 UTXO) 并使預言機挑出正確的 UTXO 發送給 A 和 B。
缺少狀態 – UTXO 只能是已花費或者未花費狀態,這就沒有給需要任何其它內部狀態的多階段合約或者腳本留出生存空間。這使得實現多階段期權合約、去中心化的交換要約或者兩階段加密承諾協議(對確保計算獎勵非常必要)非常困難。這也意味著 UTXO 只能用于建立簡單的、一次性的合約,而不是例如去中心化組織這樣的有著更加復雜的狀態的合約,使得元協議難以實現。二元狀態與價值盲結合在一起意味著另一個重要的應用 - 取款限額 - 是不可能實現的。
區塊鏈盲(Blockchain-blindness)- UTXO 看不到區塊鏈的數據,例如隨機數和上一個區塊的哈希。這一缺陷剝奪了腳本語言所擁有的基于隨機性的潛在價值,嚴重地限制了博彩等其它領域應用。
我們已經考察了在密碼學貨幣上建立高級應用的三種方法:建立一個新的區塊鏈,在比特幣區塊鏈上使用腳本,在比特幣區塊鏈上建立元幣協議。建立新區塊鏈的方法可以自由地實現任意的特性,成本是開發時間和培育努力。使用腳本的方法非常容易實現和標準化,但是它的能力有限。元幣協議盡管非常容易實現,但是存在擴展性差的缺陷。在以太坊系統中,我們的目的是建立一個能夠同時具有這三種模式的所有優勢的通用框架。
以太坊
以太坊的目的是基于腳本、競爭幣和鏈上元協議(on-chain meta-protocol)概念進行整合和提高,使得開發者能夠創建任意的基于共識的、可擴展的、標準化的、特性完備的、易于開發的和協同的應用。以太坊通過建立終極的抽象的基礎層 - 內置有圖靈完備編程語言的區塊鏈 - 使得任何人都能夠創建合約和去中心化應用并在其中設立他們自由定義的所有權規則、交易方式和狀態轉換函數。域名幣的主體框架只需要兩行代碼就可以實現,諸如貨幣和信譽系統等其它協議只需要不到二十行代碼就可以實現。智能合約 - 包含價值而且只有滿足某些條件才能打開的加密箱子 - 也能在我們的平臺上創建,并且因為圖靈完備性、價值知曉(value-awareness)、區塊鏈知曉(blockchain-awareness)和多狀態所增加的力量而比比特幣腳本所能提供的智能合約強大得多。
以太坊賬戶
在以太坊系統中,狀態是由被稱為 “賬戶”(每個賬戶由一個 20 字節的地址)的對象和在兩個賬戶之間轉移價值和信息的狀態轉換構成的。以太坊的賬戶包含四個部分:
隨機數,用于確定每筆交易只能被處理一次的計數器
賬戶目前的以太幣余額
賬戶的合約代碼,如果有的話
賬戶的存儲(默認為空)
以太幣(Ether)是以太坊內部的主要加密燃料,用于支付交易費用。一般而言,以太坊有兩種類型的賬戶:外部所有的賬戶(由私鑰控制的)和合約賬戶(由合約代碼控制)。外部所有的賬戶沒有代碼,人們可以通過創建和簽名一筆交易從一個外部賬戶發送消息。每當合約賬戶收到一條消息,合約內部的代碼就會被激活,允許它對內部存儲進行讀取和寫入,和發送其它消息或者創建合約。
消息和交易
以太坊的消息在某種程度上類似于比特幣的交易,但是兩者之間存在三點重要的不同。第一,以太坊的消息可以由外部實體或者合約創建,然而比特幣的交易只能從外部創建。第二,以太坊消息可以選擇包含數據。第三,如果以太坊消息的接受者是合約賬戶,可以選擇進行回應,這意味著以太坊消息也包含函數概念。
以太坊中 “交易” 是指存儲從外部賬戶發出的消息的簽名數據包。交易包含消息的接收者、用于確認發送者的簽名、以太幣賬戶余額、要發送的數據和兩個被稱為 STARTGAS 和 GASPRICE 的數值。為了防止代碼的指數型爆炸和無限循環,每筆交易需要對執行代碼所引發的計算步驟 - 包括初始消息和所有執行中引發的消息 - 做出限制。STARTGAS 就是限制,GASPRICE 是每一計算步驟需要支付礦工的費用。如果執行交易的過程中,“用完了瓦斯”,所有的狀態改變恢復原狀態,但是已經支付的交易費用不可收回了。如果執行交易中止時還剩余瓦斯,那么這些瓦斯將退還給發送者。創建合約有單獨的交易類型和相應的消息類型;合約的地址是基于賬號隨機數和交易數據的哈希計算出來的。
消息機制的一個重要后果是以太坊的 “頭等公民” 財產 - 合約與外部賬戶擁有同樣權利,包括發送消息和創建其它合約的權利。這使得合約可以同時充當多個不同的角色,例如,用戶可以使去中心化組織(一個合約)的一個成員成為一個中介賬戶(另一個合約),為一個偏執的使用定制的基于量子證明的蘭波特簽名(第三個合約)的個人和一個自身使用由五個私鑰保證安全的賬戶(第四個合約)的共同簽名實體提供居間服務。以太坊平臺的強大之處在于去中心化的組織和代理合約不需要關心合約的每一參與方是什么類型的賬戶。
以太坊狀態轉換函數
以太坊的狀態轉換函數:APPLY(S,TX) -> S',可以定義如下:
檢查交易的格式是否正確(即有正確數值)、簽名是否有效和隨機數是否與發送者賬戶的隨機數匹配。如否,返回錯誤。
計算交易費用:fee=STARTGAS * GASPRICE,并從簽名中確定發送者的地址。從發送者的賬戶中減去交易費用和增加發送者的隨機數。如果賬戶余額不足,返回錯誤。
設定初值GAS = STARTGAS,并根據交易中的字節數減去一定量的瓦斯值。
從發送者的賬戶轉移價值到接收者賬戶。如果接收賬戶還不存在,創建此賬戶。如果接收賬戶是一個合約,運行合約的代碼,直到代碼運行結束或者瓦斯用完。
如果因為發送者賬戶沒有足夠的錢或者代碼執行耗盡瓦斯導致價值轉移失敗,恢復原來的狀態,但是還需要支付交易費用,交易費用加至礦工賬戶。
否則,將所有剩余的瓦斯歸還給發送者,消耗掉的瓦斯作為交易費用發送給礦工。 例如,假設合約的代碼如下:
if !self.storage[calldataload(0)]: self.storage[calldataload(0)] = calldataload(32)
需要注意的是,在現實中合約代碼是用底層以太坊虛擬機(EVM)代碼寫成的。上面的合約是用我們的高級語言 Serpent 語言寫成的,它可以被編譯成 EVM 代碼。假設合約存儲器開始時是空的,一個值為 10 以太,瓦斯為 2000,瓦斯價格為 0.001 以太并且 64 字節數據,第一個三十二字節的快代表號碼 2 和第二個代表詞CHARLIE。的交易發送后,狀態轉換函數的處理過程如下:
檢查交易是否有效、格式是否正確。
檢查交易發送者至少有 2000*0.001=2 個以太幣。如果有,從發送者賬戶中減去 2 個以太幣。
初始設定 gas=2000, 假設交易長為 170 字節,每字節的費用是 5,減去 850,所以還剩 1150。
從發送者賬戶減去 10 個以太幣,為合約賬戶增加 10 個以太幣。
運行代碼。在這個合約中,運行代碼很簡單:它檢查合約存儲器索引為 2 處是否已使用,注意到它未被使用,然后將其值置為 CHARLIE。假設這消耗了 187 單位的瓦斯,于是剩余的瓦斯為 1150 - 187 = 963。 6. 向發送者的賬戶增加 963*0.001=0.963 個以太幣,返回最終狀態。 如果沒有合約接收交易,那么所有的交易費用就等于 GASPRICE 乘以交易的字節長度,交易的數據就與交易費用無關了。另外,需要注意的是,合約發起的消息可以對它們產生的計算分配瓦斯限額,如果子計算的瓦斯用完了,它只恢復到消息發出時的狀態。因此,就像交易一樣,合約也可以通過對它產生的子計算設置嚴格的限制,保護它們的計算資源。
代碼執行
以太坊合約的代碼使用低級的基于堆棧的字節碼的語言寫成的,被稱為 “以太坊虛擬機代碼” 或者 “EVM 代碼”。代碼由一系列字節構成,每一個字節代表一種操作。一般而言,代碼執行是無限循環,程序計數器每增加一(初始值為零)就執行一次操作,直到代碼執行完畢或者遇到錯誤,STOP或者RETURN指令。操作可以訪問三種存儲數據的空間:
堆棧,一種后進先出的數據存儲,32 字節的數值可以入棧,出棧。
內存,可無限擴展的字節隊列。
合約的長期存儲,一個秘鑰 / 數值的存儲,其中秘鑰和數值都是 32 字節大小,與計算結束即重置的堆棧和內存不同,存儲內容將長期保持。
代碼可以象訪問區塊頭數據一樣訪問數值,發送者和接受到的消息中的數據,代碼還可以返回數據的字節隊列作為輸出。
EVM 代碼的正式執行模型令人驚訝地簡單。當以太坊虛擬機運行時,它的完整的計算狀態可以由元組(block_state, transaction, message, code, memory, stack, pc, gas)來定義,這里block_state是包含所有賬戶余額和存儲的全局狀態。每輪執行時,通過調出代碼的第pc(程序計數器)個字節,當前指令被找到,每個指令都有定義自己如何影響元組。例如,ADD將兩個元素出棧并將它們的和入棧,將gas(瓦斯)減一并將pc加一,SSTORE將頂部的兩個元素出棧并將第二個元素插入到由第一個元素定義的合約存儲位置,同樣減少最多 200 的 gas 值并將pc加一,雖然有許多方法通過即時編譯去優化以太坊,但以太坊的基礎性的實施可以用幾百行代碼實現。
區塊鏈和挖礦
雖然有一些不同,但以太坊的區塊鏈在很多方面類似于比特幣區塊鏈。它們的區塊鏈架構的不同在于,以太坊區塊不僅包含交易記錄和最近的狀態,還包含區塊序號和難度值。以太坊中的區塊確認算法如下:
檢查區塊引用的上一個區塊是否存在和有效。
檢查區塊的時間戳是否比引用的上一個區塊大,而且小于 15 分鐘。
檢查區塊序號、難度值、 交易根,叔根和瓦斯限額(許多以太坊特有的底層概念)是否有效。
檢查區塊的工作量證明是否有效。
將S[0]賦值為上一個區塊的STATE_ROOT。
將TX賦值為區塊的交易列表,一共有n筆交易。對于屬于0……n-1的i,進行狀態轉換S[i+1] = APPLY(S[i],TX[i])。如果任何一個轉換發生錯誤,或者程序執行到此處所花費的瓦斯(gas)超過了GASLIMIT,返回錯誤。
用S[n]給S_FINAL賦值, 向礦工支付區塊獎勵。 8 檢查S-FINAL是否與STATE_ROOT相同。如果相同,區塊是有效的。否則,區塊是無效的。
這一確認方法乍看起來似乎效率很低,因為它需要存儲每個區塊的所有狀態,但是事實上以太坊的確認效率可以與比特幣相提并論。原因是狀態存儲在樹結構中(tree structure),每增加一個區塊只需要改變樹結構的一小部分。因此,一般而言,兩個相鄰的區塊的樹結構的大部分應該是相同的,因此存儲一次數據,可以利用指針(即子樹哈希)引用兩次。一種被稱為 “帕特里夏樹”(“Patricia Tree”)的樹結構可以實現這一點,其中包括了對默克爾樹概念的修改,不僅允許改變節點,而且還可以插入和刪除節點。另外,因為所有的狀態信息是最后一個區塊的一部分,所以沒有必要存儲全部的區塊歷史 - 這一方法如果能夠可以應用到比特幣系統中,經計算可以對存儲空間有 10-20 倍的節省。
應用
一般來講,以太坊之上有三種應用。第一類是金融應用,為用戶提供更強大的用他們的錢管理和參與合約的方法。包括子貨幣,金融衍生品,對沖合約,儲蓄錢包,遺囑,甚至一些種類的全面的雇傭合約。第二類是半金融應用,這里有錢的存在但也有很重的非金錢的方面,一個完美的例子是為解決計算問題而設的自我強制懸賞。最后,還有在線投票和去中心化治理這樣的完全的非金融應用。
令牌系統
鏈上令牌系統有很多應用,從代表如美元或黃金等資產的子貨幣到公司股票,單獨的令牌代表智能資產,安全的不可偽造的優惠券,甚至與傳統價值完全沒有聯系的用來進行積分獎勵的令牌系統。在以太坊中實施令牌系統容易得讓人吃驚。關鍵的一點是理解,所有的貨幣或者令牌系統,從根本上來說是一個帶有如下操作的數據庫:從 A 中減去 X 單位并把 X 單位加到 B 上,前提條件是 (1)A 在交易之前有至少 X 單位以及 (2) 交易被 A 批準。實施一個令牌系統就是把這樣一個邏輯實施到一個合約中去。
用 Serpent 語言實施一個令牌系統的基本代碼如下:
def send(to, value): if self.storage[from] >= value: self.storage[from] = self.storage[from] - value self.storage[to] = self.storage[to] + value
這從本質上來說是本文將要進一步描述的 “銀行系統” 狀態轉變功能的一個最小化實施。需要增加一些額外的代碼以提供在初始和其它一些邊緣情況下分發貨幣的功能,理想情況下會增加一個函數讓其它合約來查詢一個地址的余額。就足夠了。理論上,基于以太坊的充當子貨幣的令牌系統可能包括一個基于比特幣的鏈上元幣所缺乏的重要功能:直接用這種貨幣支付交易費的能力。實現這種能力的方法是在合約里維護一個以太幣賬戶以用來為發送者支付交易費,通過收集被用來充當交易費用的內部貨幣并把它們在一個不斷運行的拍賣中拍賣掉,合約不斷為該以太幣賬戶注資。這樣用戶需要用以太幣 “激活” 他們的賬戶,但一旦賬戶中有以太幣它將會被重復使用因為每次合約都會為其充值。
金融衍生品和價值穩定的貨幣
金融衍生品是 “智能合約” 的最普遍的應用,也是最易于用代碼實現的之一。實現金融合約的主要挑戰是它們中的大部分需要參照一個外部的價格發布器;例如,一個需求非常大的應用是一個用來對沖以太幣(或其它密碼學貨幣)相對美元價格波動的智能合約,但該合約需要知道以太幣相對美元的價格。最簡單地方法是通過由某特定機構(例如納斯達克)維護的 “數據提供 “合約進行,該合約的設計使得該機構能夠根據需要更新合約,并提供一個接口使得其它合約能夠通過發送一個消息給該合約以獲取包含價格信息的回復。
當這些關鍵要素都齊備,對沖合約看起來會是下面的樣子:
等待 A 輸入 1000 以太幣。.
等待 B 輸入 1000 以太幣。
通過查詢數據提供合約,將 1000 以太幣的美元價值,例如,x 美元,記錄至存儲器。
30 天后,允許 A 或 B“重新激活 “合約以發送價值 x 美元的以太幣(重新查詢數據提供合約以獲取新價格并計算)給 A 并將剩余的以太幣發送給 B。 這樣的合約在密碼學商務中有非同尋常的潛力。密碼學貨幣經常被詬病的一個問題就是其價格的波動性;雖然大量的用戶和商家可能需要密碼學資產所帶來的安全和便利,可他們不太會樂意面對一天中資產跌去 23% 價值的情形。直到現在,最為常見的推薦方案是發行者背書資產;思想是發行者創建一種子貨幣,對此種子貨幣他們有權發行和贖回,給予(線下)提供給他們一個單位特定相關資產(例如黃金,美元)的人一個單位子貨幣。發行者承諾當任何人送還一個單位密碼學資產時。發還一個單位的相關資產。這種機制能夠使任何非密碼學資產被 “升級 “為密碼學資產,如果發行者值得信任的話。 然而實踐中發行者并非總是值得信任的,并且一些情況下銀行體系太脆弱,或者不夠誠實守信從而使這樣的服務無法存在。金融衍生品提供了一種替代方案。這里將不再有提供儲備以支撐一種資產的單獨的發行者,取而代之的是一個由賭一種密碼學資產的價格會上升的投機者構成的去中心化市場。與發行者不同,投機者一方沒有討價還價的權利,因為對沖合約把他們的儲備凍結在了契約中。注意這種方法并非是完全去中心化的,因為依然需要一個可信任的提供價格信息的數據源,盡管依然有爭議這依然是在降低基礎設施需求(與發行者不同,一個價格發布器不需要牌照并且似乎可歸為自由言論一類)和降低潛在欺詐風險方面的一個巨大的進步。
身份和信譽系統
最早的替代幣,域名幣,嘗試使用一個類比特幣塊鏈來提供一個名稱注冊系統,在那里用戶可以將他們的名稱和其它數據一起在一個公共數據庫注冊。最常用的應用案例把象 “bitcoin.org“(或者再域名幣中,”bitcoin.bit“)一樣的域名與一個 IP 地址對應的域名系統。其它的應用案例包括電子郵件驗證系統和潛在的更先進的信譽系統。這里是以太坊中提供與域名幣類似的的名稱注冊系統的基礎合約:
def register(name, value): if !self.storage[name]: self.storage[name] = value
合約非常簡單;就是一個以太坊網絡中的可以被添加但不能被修改或移除的數據庫。任何人都可以把一個名稱注冊為一個值并永遠不變。一個更復雜的名稱注冊合約將包含允許其他合約查詢的 “功能條款 “,以及一個讓一個名稱的” 擁有者 “(即第一個注冊者)修改數據或者轉讓所有權的機制。甚至可以在其上添加信譽和信任網絡功能。
去中心化存儲
在過去的幾年里出現了一些大眾化的在線文件存儲初創公司,最突出的是 Dropbox,它尋求允許用戶上傳他們的硬盤備份,提供備份存儲服務并允許用戶訪問從而按月向用戶收取費用。然而,在這一點上這個文件存儲市場有時相對低效;對現存服務的粗略觀察表明,特別地在 “神秘谷 “20-200GB 這一既沒有免費空間也沒有企業級用戶折扣的水平上,主流文件存儲成本每月的價格意味著支付在一個月里支付整個硬盤的成本。以太坊合約允許去中心化存儲生態的開發,這樣用戶通過將他們自己的硬盤或未用的網絡空間租出去以獲得少量收益,從而降低了文件存儲的成本。
這樣的設施的基礎性構件就是我們所謂的 “去中心化 Dropbox 合約 “。這個合約工作原理如下。首先,某人將需要上傳的數據分成快,對每一塊數據加密以保護隱私,并且以此構建一個默克爾樹。然后創建一個含以下規則的合約,每 N 個塊,合約將從默克爾樹中抽取一個隨機索引(使用能夠被合約代碼訪問的上一個塊的哈希來提供隨機性), 然后給第一個實體 X 以太以支撐一個帶有類似簡化驗證支付(SPV)的在樹中特定索引處的塊的所有權證明。當一個用戶想重新下載他的文件,他可以使用微支付通道協議(例如每 32k 字節支付 1 薩博)恢復文件;從費用上講最高效的方法是支付者不到最后不發布交易,而是用一個略微更合算的帶有同樣隨機數的交易在每 32k 字節之后來代替原交易。
這個協議的一個重要特征是,雖然看起來象是一個人信任許多不準備丟失文件的隨機節點,但是他可以通過秘密分享把文件分成許多小塊,然后通過監視合同得知每個小塊都還被某個節點的保存著。如果一個合約依然在付款,那么就提供了某個人依然在保存文件的證據。
去中心化自治組織
通常意義上 “去中心化自治組織(DAO, decentralized autonomous organization)” 的概念指的是一個擁有一定數量成員或股東的虛擬實體,依靠比如 67% 多數來決定花錢以及修改代碼。成員會集體決定組織如何分配資金。分配資金的方法可能是懸賞,工資或者更有吸引力的機制比如用內部貨幣獎勵工作。這僅僅使用密碼學塊鏈技術就從根本上復制了傳統公司或者非營利組織的法律意義以實現強制執行。至此許多圍繞 DAO 的討論都是圍繞一個帶有接受分紅的股東和可交易的股份的 “去中心化自治公司(DAC,decentralized autonomous corporation)” 的 “資本家” 模式;作為替代者,一個被描述為 “去中心化自治社區(decentralized autonomous community)” 的實體將使所有成員都在決策上擁有同等的權利并且在增減成員時要求 67% 多數同意。每個人都只能擁有一個成員資格這一規則需要被群體強制實施。
下面是一個如何用代碼實現 DO 的綱要。最簡單地設計就是一段如果三分之二成員同意就可以自我修改的代碼。雖然理論上代碼是不可更改的,然而通過把代碼主干放在一個單獨的合約內并且把合約調用的地址指向一個可更改的存儲依然可以容易地繞開障礙而使代碼變得可修改,在一個這樣的 DAO 合約的簡單實現中有三種交易類型,由交易提供的數據區分:
[0,i,K,V] 注冊索引為 i 的對存儲地址索引為 K 至 v 的內容的更改建議。
[0,i] 注冊對建議 i 的投票。
[2,i] 如有足夠投票則確認建議 i。
然后合約對每一項都有具體的條款。它將維護一個所有開放存儲的更改記錄以及一個誰投票表決的表。還有一個所有成員的表。當任何存儲內容的更改獲得了三分之二多數同意,一個最終的交易將執行這項更改。一個更加復雜的框架會增加內置的選舉功能以實現如發送交易,增減成員,甚至提供委任制民主一類的投票代表(即任何人都可以委托另外一個人來代表自己投票,而且這種委托關系是可以傳遞的,所以如果 A 委托了 B 然后 B 委托了 C 那么 C 將決定 A 的投票)。這種設計將使 DAO 作為一個去中心化社區有機地成長, 使人們最終能夠把挑選合適人選的任務交給專家,與當前系統不同,隨著社區成員不斷改變他們的站隊假以時日專家會容易地出現和消失。 一個替代的模式是去中心化公司,那里任何賬戶可以擁有 0 到更多的股份,決策需要三分之二多數的股份同意。一個完整的框架將包括資產管理功能 - 可以提交買賣股份的訂單以及接受這種訂單的功能(前提是合約里有訂單匹配機制)。代表依然以委任制民主的方式存在,產生了 “董事會” 的概念。
更先進的組織治理機制可能會在將來實現;現在一個去中心化組織(DO)可以從去中心化自治組織(DAO)開始描述。DO 和 DAO 的區別是模糊的,一個大致的分割線是治理是否可以通過一個類似政治的過程或者一個 “自動” 過程實現,一個不錯的直覺測試是 “無通用語言” 標準:如果兩個成員不說同樣的語言組織還能正常運行嗎?顯然,一個簡單的傳統的持股式公司會失敗,而象比特幣協議這樣的卻很可能成功,羅賓 · 漢森的 “futarchy”,一個通過預測市場實現組織化治理的機制是一個真正的說明 “自治” 式治理可能是什么樣子的好例子。注意一個人無需假設所有 DAO 比所有 DO 優越;自治只是一個在一些特定場景下有很大優勢的,但在其它地方未必可行的范式,許多半 DAO 可能存在。
進一步的應用
儲蓄錢包。 假設 Alice 想確保她的資金安全,但她擔心丟失或者被黑客盜走私鑰。她把以太幣放到和 Bob 簽訂的一個合約里,如下所示,這合同是一個銀行:
Alice 單獨每天最多可提取 1% 的資金。
Bob 單獨每天最多可提取 1% 的資金,但 Alice 可以用她的私鑰創建一個交易取消 Bob 的提現權限。
Alice 和 Bob 一起可以任意提取資金。 一般來講,每天 1% 對 Alice 足夠了,如果 Alice 想提現更多她可以聯系 Bob 尋求幫助。如果 Alice 的私鑰被盜,她可以立即找到 Bob 把她的資金轉移到一個新合同里。如果她弄丟了她的私鑰,Bob 可以慢慢地把錢提出。如果 Bob 表現出了惡意,她可以關掉他的提現權限。
作物保險。一個人可以很容易地以天氣情況而不是任何價格指數作為數據輸入來創建一個金融衍生品合約。如果一個愛荷華的農民購買了一個基于愛荷華的降雨情況進行反向賠付的金融衍生品,那么如果遇到干旱,該農民將自動地收到賠付資金而如果有足量的降雨他會很開心因為他的作物收成會很好。
一個去中心化的數據發布器。 對于基于差異的金融合約,事實上通過過 “謝林點” 協議將數據發布器去中心化是可能的。謝林點的工作原理如下:N 方為某個指定的數據提供輸入值到系統(例如 ETH/USD 價格),所有的值被排序,每個提供 25% 到 75% 之間的值的節點都會獲得獎勵,每個人都有激勵去提供他人將提供的答案,大量玩家可以真正同意的答案明顯默認就是正確答案,這構造了一個可以在理論上提供很多數值,包括 ETH/USD 價格,柏林的溫度甚至某個特別困難的計算的結果的去中心化協議。
云計算。EVM 技術還可被用來創建一個可驗證的計算環境,允許用戶邀請他人進行計算然后選擇性地要求提供在一定的隨機選擇的檢查點上計算被正確完成的證據。這使得創建一個任何用戶都可以用他們的臺式機,筆記本電腦或者專用服務器參與的云計算市場成為可能,現場檢查和安全保證金可以被用來確保系統是值得信任的(即沒有節點可以因欺騙獲利)。雖然這樣一個系統可能并不適用所有任務;例如,需要高級進程間通信的任務就不易在一個大的節點云上完成。然而一些其它的任務就很容易實現并行;SETI@home, folding@home 和基因算法這樣的項目就很容易在這樣的平臺上進行。
點對點賭博。任意數量的點對點賭博協議都可以搬到以太坊的區塊鏈上,例如 Frank Stajano 和 Richard Clayton 的 Cyberdice。 最簡單的賭博協議事實上是這樣一個簡單的合約,它用來賭下一個區塊的哈稀值與猜測值之間的差額, 據此可以創建更復雜的賭博協議,以實現近乎零費用和無欺騙的賭博服務。
預測市場。 不管是有神諭還是有謝林幣,預測市場都會很容易實現,帶有謝林幣的預測市場可能會被證明是第一個主流的作為去中心化組織管理協議的 “futarchy” 應用。
鏈上去中心化市場,以身份和信譽系統為基礎。
雜項和關注
改進版幽靈協議的實施
“幽靈 “協議("Greedy Heaviest Observed Subtree" (GHOST) protocol)是由 Yonatan Sompolinsky 和 Aviv Zohar 在 2013 年 12 月引入的創新。幽靈協議提出的動機是當前快速確認的塊鏈因為區塊的高作廢率而受到低安全性困擾;因為區塊需要花一定時間(設為 t)擴散至全網,如果礦工 A 挖出了一個區塊然后礦工 B 碰巧在 A 的區塊擴散至 B 之前挖出了另外一個區塊,礦工 B 的區塊就會作廢并且沒有對網絡安全作出貢獻。此外,這里還有中心化問題:如果 A 是一個擁有全網 30% 算力的礦池而 B 擁有 10% 的算力,A 將面臨 70% 的時間都在產生作廢區塊的風險而 B 在 90% 的時間里都在產生作廢區塊。因此,如果作廢率高,A 將簡單地因為更高的算力份額而更有效率,綜合這兩個因素,區塊產生速度快的塊鏈很可能導致一個礦池擁有實際上能夠控制挖礦過程的算力份額。
正如 Sompolinsky 和 Zohar 所描述的,通過在計算哪條鏈 “最長” 的時候把廢區塊也包含進來,幽靈協議解決了降低網絡安全性的第一個問題;這就是說,不僅一個區塊的父區塊和更早的祖先塊,祖先塊的作廢的后代區塊(以太坊術語中稱之為 “叔區塊”)也被加進來以計算哪一個區塊擁有支持其的最大工作量證明。我們超越了 Sompolinsky 和 Zohar 所描述的協議以解決第二個問題 – 中心化傾向,以太坊付給以 “叔區塊” 身份為新塊確認作出貢獻的廢區塊 87.5% 的獎勵,把它們納入計算的 “侄子區塊” 將獲得獎勵的 12.5%,不過,交易費用不獎勵給叔區塊。 以太坊實施了一個只下探到第五層的簡化版本的幽靈協議。其特點是,廢區塊只能以叔區塊的身份被其父母的第二代至第五代后輩區塊,而不是更遠關系的后輩區塊(例如父母區塊的第六代后輩區塊,或祖父區塊的第三代后輩區塊)納入計算。這樣做有幾個原因。首先,無條件的幽靈協議將給計算給定區塊的哪一個叔區塊合法帶來過多的復雜性。其次,帶有以太坊所使用的補償的無條件的幽靈協議剝奪了礦工在主鏈而不是一個公開攻擊者的鏈上挖礦的激勵。最后,計算表明帶有激勵的五層幽靈協議即使在出塊時間為 15s 的情況下也實現了了 95% 以上的效率,而擁有 25% 算力的礦工從中心化得到的益處小于 3%。
費用
因為每個發布的到區塊鏈的交易都占用了下載和驗證的成本,需要有一個包括交易費的規范機制來防范濫發交易。比特幣使用的默認方法是純自愿的交易費用,依靠礦工擔當守門人并設定動態的最低費用。因為這種方法是 “基于市場的”,使得礦工和交易發送者能夠按供需來決定價格,所以這種方法在比特幣社區被很順利地接受了。然而,這個邏輯的問題在于,交易處理并非一個市場;雖然根據直覺把交易處理解釋成礦工給發送者提供的服務是很有吸引力的,但事實上一個礦工收錄的交易是需要網絡中每個節點處理的,所以交易處理中最大部分的成本是由第三方而不是決定是否收錄交易的礦工承擔的。于是,非常有可能發生公地悲劇。
然而,當給出一個特殊的不夠精確的簡化假設時,這個基于市場的機制的漏洞很神奇地消除了自己的影響。論證如下。假設:
一個交易帶來 k 步操作, 提供獎勵 kR 給任何收錄該交易的礦工,這里 R 由交易發布者設定, k 和 R 對于礦工都是事先(大致上)可見的。
每個節點處理每步操作的成本都是 C (即所有節點的效率一致)。
有 N 個挖礦節點,每個算力一致 (即全網算力的 1/N)。
沒有不挖礦的全節點。
當預期獎勵大于成本時,礦工愿意挖礦。這樣,因為礦工有 1/N 的機會處理下一個區塊,所以預期的收益是 kR/N , 礦工的處理成本簡單為 kC. 這樣當 kR/N > kC, 即 R > NC 時。礦工愿意收錄交易。注意 R 是由交易發送者提供的每步費用,是礦工從處理交易中獲益的下限。 NC 是全網處理一個操作的成本。所以,礦工僅有動機去收錄那些收益大于成本的交易。 然而,這些假設與實際情況有幾點重要的偏離:
因為額外的驗證時間延遲了塊的廣播因而增加了塊成為廢塊的機會,處理交易的礦工比其它的驗證節點付出了更高的成本。
不挖礦的全節點是存在的。
實踐中算力分布可能最后是極端不平均的。
以破壞網絡為己任的投機者,政敵和瘋子確實存在,并且他們能夠聰明地設置合同使得他們的成本比其它驗證節點低得多。 上面第 1 點驅使礦工收錄更少的交易,第 2 點增加了 NC; 因此這兩點的影響至少部分互相抵消了. 第 3 點和第 4 點是主要問題;作為解決方案我們簡單地建立了一個浮動的上限:沒有區塊能夠包含比 BLK_LIMIT_FACTOR 倍長期指數移動平均值更多的操作數。具體地:
blk.oplimit = floor((blk.parent.oplimit * (EMAFACTOR - 1) + floor(parent.opcount * BLK_LIMIT_FACTOR)) /EMA_FACTOR)
BLK_LIMIT_FACTOR 和 EMA_FACTOR 是暫且被設為 65536 和 1.5 的常數,但可能會在更深入的分析后調整。 回復
計算和圖靈完備
需要強調的是以太坊虛擬機是圖靈完備的; 這意味著 EVM 代碼可以實現任何可以想象的計算,包括無限循環。EVM 代碼有兩種方式實現循環。首先, JUMP 指令可以讓程序跳回至代碼前面某處,還有允許如 while x < 27: x = x * 2 一樣的條件語句的 JUMPI 指令實現條件跳轉。其次,合約可以調用其它合約,有通過遞歸實現循環的潛力。這很自然地導致了一個問題:惡意用戶能夠通過迫使礦工和全節點進入無限循環而不得不關機嗎? 這問題出現是因為計算機科學中一個叫停機問題的問題:一般意義上沒有辦法知道,一個給定的程序是否能在有限的時間內結束運行。
正如在狀態轉換章節所述,我們的方案通過為每一個交易設定運行執行的最大計算步數來解決問題,如果超過則計算被恢復原狀但依然要支付費用。消息以同樣的方式工作。為顯示這一方案背后的動機,請考慮下面的例子:
一個攻擊者創建了一個運行無限循環的合約,然后發送了一個激活循環的交易給礦工,礦工將處理交易,運行無限循環直到瓦斯耗盡。即使瓦斯耗盡交易半途停止,交易依然正確(回到原處)并且礦工依然從攻擊者哪里掙到了每一步計算的費用。
一個攻擊者創建一個非常長的無限循環意圖迫使礦工長時間內一直計算致使在計算結束前若干區塊已經產生于是礦工無法收錄交易以賺取費 用。然而,攻擊者需要發布一個 STARTGAS 值以限制可執行步數,因而礦工將提前知道計算將耗費過多的步數。
一個攻擊者看到一個包含諸如 send(A,self.storage); self.storage = 0 格式的合約然后發送帶有只夠執行第一步的費用的而不夠執行第二步的交易(即提現但不減少賬戶余額)。合約作者無需擔心防衛類似攻擊,因為如果執行中途停止則所有變更都被回復。
一個金融合約靠提取九個專用數據發布器的中值來工作以最小化風險,一個攻擊者接管了其中一個數據提供器,然后把這個按 DAO 章節所述的可變地址調用機制設計成可更改的數據提供器轉為運行一個無限循環,以求嘗試逼迫任何從此金融合約索要資金的嘗試都會因瓦斯耗盡而中止。然而,該金融合約可以在消息里設置瓦斯限制以防范此類問題。 圖靈完備的替代是圖靈不完備,這里 JUMP 和 JUMPI 指令不存在并且在某個給定時間每個合約只允許有一個拷貝存在于調用堆棧內。在這樣的系統里,上述的費用系統和圍繞我們的方案的效率的不確定性可能都是不需要的,因為執行一個合約的成本將被它的大小決定。此外,圖靈不完備甚至不是一個大的限制,在我們內部設想的所有合約例子中,至今只有一個需要循環,而且即使這循環也可以被 26 個單行代碼段的重復所代替。考慮到圖靈完備帶來的嚴重的麻煩和有限的益處,為什么不簡單地使用一種圖靈不完備語言呢?事實上圖靈不完備遠非一個簡潔的解決方案。為什么?請考慮下面的合約:
C0: call(C1)? call(C1)?
C1: call(C2)? call(C2)?
C2: call(C3)? call(C3)?...C49: call(C50)? call(C50)?
C50: (作一個圖靈機的步計算和記錄結果在合約的長期存儲)
現在,發送一個這樣的交易給 A,這樣,在 51 個交易中,我們有了一個需要花費 2^50 步計算的合約,礦工可能嘗試通過為每一個合約維護一個最高可執行步數并且對于遞歸調用其它合約的合約計算可能執行步數從而預先檢測這樣的邏輯炸彈,但是這會使礦工禁止創建其它合約的合約(因為上面 26 個合約的創建和執行可以很容易地放入一個單獨合約內)。另外一個問題點是一個消息的地址字段是一個變量,所以通常來講可能甚至無法預先知道一個合約將要調用的另外一個合約是哪一個。于是,最終我們有了一個驚人的結論:圖靈完備的管理驚人地容易,而在缺乏同樣的控制時圖靈不完備的管理驚人地困難 - 那為什么不讓協議圖靈完備呢?
貨幣和發行
以太坊網絡包含自身的內置貨幣以太幣,以太幣扮演雙重角色,為各種數字資產交易提供主要的流動性,更重要的是提供了了支付交易費用的一種機制。為便利及避免將來的爭議期間(參見當前的 mBTC/uBTC / 聰的爭論),不同面值的名稱將被提前設置:
1: 偉
10^12: 薩博
10^15: 芬尼
10^18: 以太
這應該被當作是 “元” 和 “分” 或者 “比特幣” 和 “聰” 的概念的擴展版,在不遠的將來,我們期望 “以太” 被用作普通交易,“芬尼” 用來進行微交易,“薩博” 和 “偉” 用來進行關于費用和協議實施的討論。
發行模式如下:
通過發售活動,以太幣將以每 BTC 1337-2000 以太的價格發售,一個旨在為以太坊組織籌資并且為開發者支付報酬的機制已經在其它一些密碼學貨幣平臺上成功使用。早期購買者會享受較大的折扣,發售所得的 BTC 將完全用來支付開發者和研究者的工資和懸賞,以及投入密碼學貨幣生態系統的項目。
0.099x (x 為發售總量)將被分配給 BTC 融資或其它的確定性融資成功之前參與開發的早期貢獻者,另外一個 0.099x 將分配給長期研究項目。
自上線時起每年都將有 0.26x(x 為發售總量)被礦工挖出。
發行分解
永久線性增長模型降低了在比特幣中出現的財富過于集中的風險,并且給予了活在當下和將來的人公平的機會去獲取貨幣,同時保持了對獲取和持有以太幣的激勵,因為長期來看 “貨幣供應增長率” 是趨于零的。我們還推斷,隨著時間流逝總會發生因為粗心和死亡等原因帶來的幣的遺失,假設幣的遺失是每年貨幣供應量的一個固定比例,則最終總的流通中的貨幣供應量會穩定在一個等于年貨幣發行量除以遺失率的值上(例如,當遺失率為 1% 時,當供應量達到 30x 時,每年有 0.3x 被挖出同時有 0.3x 丟失,達到一個均衡)。
除了線性的發行方式外,和比特幣一樣以太幣的的供應量增長率長期來看也趨于零。
挖礦的中心化
比特幣挖礦算法基本上是讓礦工千萬次地輕微改動區塊頭,直到最終某個節點的改動版本的哈希小于目標值(目前是大約 2190)。然而,這種挖礦算法容易被兩種形式的中心化攻擊。第一種,挖礦生態系統被專門設計的因而在比特幣挖礦這一特殊任務上效率提高上千倍的 ASICs(專用集成電路)和電腦芯片控制。這意味著比特幣挖礦不再是高度去中心化的和追求平等主義的,而是需要巨額資本的有效參與。第二種,大部分比特幣礦工事實上不再在本地完成區塊驗證;而是依賴中心化的礦池提供區塊頭。這個問題可以說很嚴重:在本文寫作時,最大的兩個礦池間接地控制了大約全網 50% 的算力,雖然當一個礦池或聯合體嘗試 51% 攻擊時礦工可以轉換到其它礦池這一事實減輕了問題的嚴重性。
以太坊現在的目的是使用一個基于為每 1000 個隨機數隨機產生唯一哈希的函數的挖礦算法,用足夠寬的計算域,去除專用硬件的優勢。這樣的策略當然不會使中心化的收益減少為零,但是也不需要。注意每單個用戶使用他們的私人筆記本電腦或臺式機就可以幾乎免費地完成一定量的挖礦活動,但當到了 100% 的 CPU 使用率之后更多地挖礦就會需要他們支付電力和硬件成本。ASIC 挖礦公司需要從第一個哈希開始就為電力和硬件支付成本。所以,如果中心化收益能夠保持在 (E + H) /E 以下,那么即使 ASICs 被制造出來普通礦工依然有生存空間。另外,我們計劃將挖礦算法設計成挖礦需要訪問整個區塊鏈,迫使礦工存儲完成的區塊鏈或者至少能夠驗證每筆交易。這去除了對中心化礦池的需要;雖然礦池依然可以扮演平滑收益分配的隨機性的角色,但這功能可以被沒有中心化控制的 P2P 礦池完成地同樣好。這樣即使大部分普通用戶依然傾向選擇輕客戶端,通過增加網絡中的全節點數量也有助于抵御中心化。
擴展性
擴展性問題是以太坊常被關注的地方,與比特幣一樣,以太坊也遭受著每個交易都需要網絡中的每個節點處理這一困境的折磨。比特幣的當前區塊鏈大小約為 20GB,以每小時 1MB 的速度增長。如果比特幣網絡處理 Visa 級的 2000tps 的交易,它將以每三秒 1MB 的速度增長(1GB 每小時,8TB 每年)。以太坊可能也會經歷相似的甚至更糟的增長模式,因為在以太坊區塊鏈之上還有很多應用,而不是像比特幣只是簡單的貨幣,但以太坊全節點只需存儲狀態而不是完整的區塊鏈歷史這一事實讓情況得到了改善。
大區塊鏈的問題是中心化風險。如果塊鏈大小增加至比如 100TB,可能的場景將是只有非常小數目的大商家會運行全節點,而常規用戶使用輕的 SPV 節點。這會增加對全節點合伙欺詐牟利(例如更改區塊獎勵,給他們自己 BTC)的風險的擔憂。輕節點將沒有辦法立刻檢測到這種欺詐。當然,至少可能存在一個誠實的全節點,并且幾個小時之后有關詐騙的信息會通過 Reddit 這樣的渠道泄露,但這時已經太晚:任憑普通用戶做出怎樣的努力去廢除已經產生的區塊,他們都會遇到與發動一次成功的 51% 攻擊同等規模的巨大的不可行的協調問題。在比特幣這里,現在這是一個問題,但 Peter Todd 建議的一個改動可以緩解這個問題。
近期,以太坊會使用兩個附加的策略以應對此問題。首先,因為基于區塊鏈的挖礦算法,至少每個礦工會被迫成為一個全節點,這保證了一定數量的全節點。其次,更重要的是,處理完每筆交易后,我們會把一個中間狀態樹的根包含進區塊鏈。即使區塊驗證是中心化的,只要有一個誠實的驗證節點存在,中心化的問題就可以通過一個驗證協議避免。如果一個礦工發布了一個不正確的區塊,這區塊要么是格式錯,要么狀態 S[n] 是錯的。因為 S[0] 是正確的,必然有第一個錯誤狀態 S[i] 但 S[i-1] 是正確的,驗證節點將提供索引 i,一起提供的還有處理 APPLY(S[i-1],TX[i]) -> S[i] 所需的帕特里夏樹節點的子集。這些節點將受命進行這部分計算,看產生的 S[i] 與先前提供的值是否一致。
另外,更復雜的是惡意礦工發布不完整區塊進行攻擊,造成沒有足夠的信息去確定區塊是否正確。解決方案是質疑 - 回應協議:驗證節點對目標交易索引發起質疑,接受到質疑信息的輕節點會對相應的區塊取消信任,直到另外一個礦工或者驗證者提供一個帕特里夏節點子集作為正確的證據。
綜述:去中心化應用
上述合約機制使得任何一個人能夠在一個虛擬機上建立通過全網共識來運行命令行應用(從根本上來說是),它能夠更改一個全網可訪問的狀態作為它的 “硬盤”。然而,對于多數人來說,用作交易發送機制的命令行接口缺乏足夠的用戶友好使得去中心化成為有吸引力的替代方案。最后,一個完整的 “去中心化應用” 應該包括底層的商業邏輯組件【無論是否在以太坊完整實施,使用以太坊和其它系統組合(如一個 P2P 消息層,其中一個正在計劃放入以太坊客戶端)或者僅有其它系統的方式】和上層的圖形用戶接口組件。以太坊客戶端被設計成一個網絡瀏覽器,但包括對 “eth” Javascript API 對象的支持,可被客戶端里看到的特定的網頁用來與以太坊區塊鏈交互。從 “傳統” 網頁的角度看來,這些網頁是完全靜態的內容,因為區塊鏈和其它去中心化協議將完全代替服務器來處理用戶發起的請求。最后,去中心化協議有希望自己利用某種方式使用以太坊來存儲網頁。
結論
以太坊協議最初是作為一個通過高度通用的語言提供如鏈上契約,提現限制和金融合約,賭博市場等高級功能的升級版密碼學貨幣來構思的。以太坊協議將不直接 “支持” 任何應用,但圖靈完備編程語言的存在意味著理論上任意的合約都可以為任何交易類型和應用創建出來。然而關于以太坊更有趣的是,以太坊協議比單純的貨幣走得更遠,圍繞去中心化存儲,去中心化計算和去中心化預測市場以及數十個類似概念建立的協議和去中心化應用,有潛力從根本上提升計算行業的效率,并通過首次添加經濟層為其它的 P2P 協議提供有力支撐,最終,同樣會有大批與金錢毫無關系的應用出現。
以太坊協議實現的任意狀態轉換概念提供了一個具有獨特潛力的平臺;與封閉式的,為諸如數據存儲,賭博或金融等單一目的設計的協議不同,以太坊從設計上是開放式的,并且我們相信它極其適合作為基礎層服務于在將來的年份里出現的極其大量的金融和非金融協議。
注解與進階閱讀
注解
一個有經驗的讀者會注意到事實上比特幣地址是橢圓曲線公鑰的哈希,而非公鑰本身,然而事實上從密碼學術語角度把公鑰哈希稱為公鑰完全合理。這是因為比特幣密碼學可以被認為是一個定制的數字簽名算法,公鑰由橢圓曲線公鑰的哈希組成,簽名由橢圓曲線簽名連接的橢圓曲線公鑰組成,而驗證算法包括用作為公鑰提供的橢圓曲線公鑰哈希來檢查橢圓曲線公鑰,以及之后的用橢圓曲線公鑰來驗證橢圓曲線簽名。
技術上來說,前 11 個區塊的中值。
在內部,2 和 “CHARLIE” 都是數字,后一個有巨大的 base256 編碼格式,數字可以從 0 到 2^256-1。
進階閱讀
Intrinsic value: https://tinyurl.com/BitcoinMag-IntrinsicValue
Smart property: https://en.bitcoin.it/wiki/Smart_Property
Smart contracts: https://en.bitcoin.it/wiki/Contracts
B-money: http://www.weidai.com/bmoney.txt
Reusable proofs of work: http://www.finney.org/~hal/rpow/
Secure property titles with owner authority: http://szabo.best.vwh.net/securetitle.html
Bitcoin whitepaper: http://bitcoin.org/bitcoin.pdf
Namecoin: https://namecoin.org/
Zooko’s triangle: http://en.wikipedia.org/wiki/Zooko’s_triangle
Colored coins whitepaper: https://tinyurl.com/coloredcoin-whitepaper
Mastercoin whitepaper: https://github.com/mastercoin-MSC/spec
Decentralized autonomous corporations, Bitcoin Magazine: https://tinyurl.com/Bootstrapping-DACs
Simplified payment verification:https://en.bitcoin.it/wiki/Scalability#Simplifiedpaymentverification
Merkle trees: http://en.wikipedia.org/wiki/Merkle_tree
Patricia trees: http://en.wikipedia.org/wiki/Patricia_tree
GHOST: http://www.cs.huji.ac.il/~avivz/pubs/13/btc_scalability_full.pdf
StorJ and Autonomous Agents, Jeff Garzik: https://tinyurl.com/storj-agents
Mike Hearn on Smart Property at Turing Festival: http://www.youtube.com/watch?v=Pu4PAMFPo5Y
Ethereum RLP: https://github.com/ethereum/wiki/wiki/%5BEnglish%5D-RLP
Ethereum Merkle Patricia trees: https://github.com/ethereum/wiki/wiki/%5BEnglish%5D-Patricia-Tree
Peter Todd on Merkle sum trees:http://sourceforge.net/p/bitcoin/mailman/message/31709140/