買以太坊 買以太坊
Ctrl+D 買以太坊
ads
首頁 > 火幣APP > Info

STA:觀點 | 無狀態以太坊:二進制狀態樹實驗_HexHash

Author:

Time:1900/1/1 0:00:00

作者:?IgorMandrigin

翻譯:?阿劍

來源:以太坊愛好者

什么是“無狀態以太坊”?

如果您已經了解什么是“無狀態以太坊”以及“區塊見證數據”,可以跳過這一段。

為執行交易及驗證區塊,以太坊網絡的節點需要了解整條區塊鏈的當前狀態——也就是所有賬戶和合約的余額和存儲數據。這些數據一般來說是存儲在DB里面的,在需要用于驗證時才會加載到一棵默克爾樹中。

無狀態以太坊客戶端的工作思路則稍有區別。顧名思義,無狀態客戶端就是不使用硬盤DB來執行區塊。相反,無狀態客戶端依賴于“區塊見證數據”——就是一段特殊的數據,它會跟相應的區塊一起傳播;擁有了這段數據,客戶端就可以重建出一個默克爾子樹,該分支足可用于執行該區塊中的所有交易。

你可以在這篇文章中讀到關于無狀態客戶端的更深入的描述:https://blog.ethereum.org/2019/12/30/eth1x-files-state-of-stateless-ethereum/

當然咯,需要傳播區塊見證數據就意味著無狀態客戶端的網絡要求要比普通節點更高。

-見證數據大小折線圖-

現在人們已經提出了很多降低見證數據規模的思路:使用有效性/計算完整性證明、加入更多的壓縮手段,等等。其中一種辦法是將以太坊的默克爾樹從十六進制轉為二進制。

這就是本文想要探討的問題。

觀點:Web3需要無縫的用戶體驗和基礎設施來推動采用:金色財經報道,Blockdaemon預測,Web3的未來將建立在無縫用戶體驗的基礎上:無縫使用、無縫貨幣化和無縫治理。任何Web3項目的成功都取決于其向所有用戶(包括區塊鏈行業內的開發人員和企業)提供這種無縫體驗的能力。

我們相信基于區塊鏈的解決方案是數字基礎設施的未來。然而,為了讓它們起飛,我們需要確保高質量的用戶體驗。這意味著用戶和開發人員都需要一種簡單的方法來訪問Web3基礎架構和構建在其之上的應用程序。[2022/12/18 21:51:42]

為什么要使用二進制樹

默克爾樹的一大優良特性是,驗證樹根值正確與否并不要求你具有整棵樹所有的數據。只需把所有省略的非空路徑替代為相應的哈希值就可以可。

那么使用十六進制默克爾樹有什么不好呢?

設想整棵樹都已填滿數據。要驗證一個區塊,我們只需要一小部分默克爾樹節點的數據。那么,我們只需把其他路徑的數據替代為哈希值就可以了。

但是,每多加入一條哈希值,區塊見證數據就會大一些。

如果我們轉變為二進制默克爾樹,這個問題就可以得到緩解——因為默克爾樹上的每個節點都只有兩個子節點,所以至多只有一個字節點需要被替換為哈希值。

這樣做也許能大幅降低見證數據的規模。

我們再舉例說明一下。

假設執行某個區塊只會影響一個賬戶:3B路徑下的Acc1。整棵樹是全滿的。

美聯儲理事沃勒:周五的就業報告可能不會改變美聯儲應該100%專注于降低通脹的觀點:10月7日消息,美聯儲理事沃勒表示,我們還沒有在通貨膨脹問題上取得有意義的進展。預計明年年初還會加息。周五的就業報告可能不會改變美聯儲應該100%專注于降低通脹的觀點。市場預期實際利率將為正,并在明年繼續上升。[2022/10/7 18:41:19]

-二進制狀態樹與十六進制狀態樹的比較-

如果說二進制狀態樹看起來有點嚇人,那只是因為二進制樹我畫全了,但沒有把十六進制樹的所有代之以哈希值的節點都畫出來。

來數個數:

為創建出一棵二進制狀態樹,見證數據需要包含8個哈希值,7個分支節點和1個賬戶節點。也就是見證數據中有16個元素。

為創建出一棵十六進制狀態樹,我們只需1個分支節點,1個賬戶節點,但需要30個哈希值。也就是有32個元素。

所以,假設哈希值和分支節點在區塊見證數據中的所占的空間是一樣大的,在我們的例子中,使用二進制樹所需的見證數據大小只有十六進制下的一半。看起來不錯。

那么,理論上就是這樣。

我們來看看實際情況是如何。我們直接拿以太坊主網的數據來看看吧。

開始實驗

先說最緊要的:我們怎么知道自己構建出來的區塊見證數據是有用的呢?

測試方法如下:我們使用區塊見證數據來生成一棵默克爾子樹,在這棵樹上運行相應區塊中的所有交易,然后校驗結果是否與我們所知的一致。只要交易都能成功執行,等等),我們就可以斷定這個見證是足夠充分的。

觀點:加密貨幣可能會導致下一次金融危機:貴金屬公司Metalla Royalty&Streaming首席執行官布Brett Heath認為,加密貨幣“可能會導致下一次金融危機”。他在接受采訪時表示:“回顧過去的幾十年,看看所發生的所有金融危機,它們都有很多共同點。其中之一就是對一種不太了解的新金融產品或新技術的大規模采用。”Brett Heath接著說,加密貨幣已經成為“私營部門印鈔的許可證”。盡管自2020年1月以來美元的流通量已大幅增加,但加密貨幣的市值已經“超過十倍”。他還表示,比特幣有限的2100萬枚的供應量并不能真正保證它的“安全港”質量,因為還有其他“目前存在的10000種加密貨幣、相關代幣”。Brett Heath說,與比特幣相比,許多加密貨幣也有無數優勢。隨著它們的誕生,整個加密市場將增加數十億美元和額外的風險。盡管一些加密貨幣將會盛行,但絕大多數數字資產仍可能崩潰。(Decrypt)[2021/5/28 22:53:17]

-測試方法:1.執行區塊;2.從狀態樹中抽取出見證數據;3.使用見證數據構造出一棵子樹;4.禁用DB訪問、使用子樹來執行區塊(具體可見

github)-

其次,我們需要一些基準數據。因此,我們也使用500萬到850萬高度的區塊、在十六進制默克爾樹模式下生成了見證數據,并將見證數據大小的統計數據存在一個超級大的csv文件中。

我們嘗試的第一步是執行完一個區塊后就組裝出一棵十六進制樹,然后將它轉為二進制樹,再從這棵二進制樹中提取出見證數據。

觀點:新一輪礦場出海潮或將到來:據21世紀經濟報道消息,5月21日,國務院金融穩定發展委員會召開第五十一次會議,會議指出,強化平臺企業金融活動監管,打擊比特幣挖礦和交易行為,堅決防范個體風險向社會領域傳遞。某幣圈資深人士對21世紀經濟報道記者表示,解讀金融委會議提出的表述,公司化運作的比特幣礦場大概率是會被禁止的,但應該不會直接叫停,具體操作應該會給礦場一定的清退期限。該人士進一步表示,未來具體出臺的細則文件,或將導致比特幣礦業集體出海,運作實體搬家,結果是北美礦場紅利。從記者采訪中獲悉,不少頭部礦場近年加緊了海外礦場布局,中亞和北美是主要布局方向。但受疫情影響,布局速度受限,但政策出臺或將加速其海外布局。[2021/5/22 22:31:47]

這種方法有幾個好處:易于實現,而且驗證十六進制-二進制的轉換也很簡單。

不過,我們遇到了兩個問題,而且其中一個還不小。

第一個,正如我們上面證明的那樣,比起二進制樹,十六進制樹包含更多的賬戶節點,如果我們先生成十六進制樹再轉換,得到的結果就跟在二進制樹模式下直接生成所得到的見證數據不一樣。

為什么呢?

因為十六進制樹數據總是以1/2字節的速度增長,而二進制樹總是以1比特的速度增長,因此鍵的長度可以是奇數位。

實際上,見證數據中還包含一些額外的擴展節點,它們還要稍微大一點。不過即便對內容較多的區塊,體現在見證數據大小上的差別也非常之小。

關鍵的是性能。隨著樹的規模增長,轉換的速度會越來越慢。

用更具體的數字來說明一下:在我們的GoogleComputeEngine虛擬機上,處理速度約為每秒0.16個區塊,也就是每分鐘處理小于10個區塊,處理100萬個區塊要超過3個月!

觀點:CME比特幣期貨持倉數量猛增 機構投資者興趣正在上升:芝加哥商品交易所(CME)的比特幣期貨持倉數量猛增,已成為按未平倉合約數量計算的第三大比特幣期貨交易所。截至周四,CME未平倉頭寸為8億美元,較7月份3.65億美元的低點上漲了近120%。CME周四在全球52.2億美元未平倉頭寸中占15%,在主要衍生品交易所中排名第三。業內專家表示,CME活動的增加表明,機構投資者對這種加密貨幣的興趣正在上升。(Coindesk)[2020/8/14]

所以,我們決定采取更復雜的辦法,開發出一個原生使用二進制默克爾樹的實驗性分支。也就是說,我們要把turbo-geth代碼庫例地所有十六進制狀態樹全部替換為二進制樹,然后區塊就是基于二進制樹來執行的了。

這種辦法的不利之處在于,部分哈希值的校驗只能被忽略掉。

但主要的驗證機制還是一樣的:我們需要能夠使用二進制樹來執行區塊、從見證數據中創建出默克爾子樹。

再來談談key。

為簡化起見,我們對key的編碼方式是非常低效的:1bytepernibble;一個key的每一比特就要占用1字節。這樣做大大簡化了代碼層面的改變,但區塊見證數據中的”key“部分會是我們使用bitset時候的8倍大。

因此,在進一步分析中,我會假設key的編碼方式是最優的。

Hexvs.Bin:結果

我的分析分為兩段,總共分析了以太坊主網上的200萬個區塊。

區塊高度500萬到650萬

我在這個github庫里面提供了使用python腳本來重復這一實驗的命令行:

https://github.com/mandrigin/ethereum-mainnet-bin-tries-data

首先我們來分析一下數據集。

pythonpercentile.pyhex-witness-raw.csvbin-stats-5m-6.5m.csv50000006500000adjust

-

一個箱型圖,箱體顯示上四分位到下四分位之間的數據,左右延伸出去的線條顯示上1%到下1%之間的數據

-百分比分析-

現在我們可以生成一些很酷的圖表了!

pythonxy-scatter-plot.pyhex-witness-raw.csvbin-stats-5m-6.5m.csv50000006500000adjust

-XY散點圖(橫軸為Hex下見證數據大小,縱軸為Bin下見證數據大小)-

可以看出,二進制見證數據的大小總是優于十六進制樹下的見證數據。

我們再加入另一個參數,用二進制見證數據大小除以十六進制見證數據大小,看看我們得到了怎樣的提升。

pythonsize-improvements-plot.pyhex-witness-raw.csvbin-stats-5m-6.5m.csv50000006500000adjust

-二進制見證數據的大小/十六進制見證數據的大小-

為更好地理解這張圖標,我們也輸出了平均值和百分位值。

平均值=0.51

P95=0.58

P99=0.61

在實際場景中這意味著什么?

對于99%的區塊,見證數據的大小可以降低至少39%。

對于95%的區塊,見證數據的大小可以降低至少42%。

平均來說,見證數據可節省49%。

我們也要考慮見證數據大小的絕對值。為使數據變得可讀,我們每1024個區塊取滑動平均值。

pythonabsolute-values-plot.pyhex-witness-raw.csvbin-stats-5m-6.5m.csv50000006500000adjust

-依時間順序繪制的見證數據大小折線圖,縱軸單位為MB-

再來看看最新區塊的情況。

區塊高度800萬到850萬

pythonpercentile.pyhex-witness-raw.csvbin-stats-8m-9m.csv80000008500000adjust

-箱型圖,箱表示上下四分位以內的數據,線表示上下1%以內的數據-

-800萬號到850萬號區塊的百分位分析-

還有XY散點圖。

pythonxy-scatter-plot.pyhex-witness-raw.csvbin-stats-8m-9m.csv80000008500000adjust

還有規模上的節約。

pythonsize-improvements-plot.pyhex-witness-raw.csvbin-stats-8m-9m.csv80000008500000adjust

-XY散點圖(橫軸為Hex下見證數據大小,縱軸為Bin下見證數據大小)-

平均值=0.53

P95=0.61

P99=0.66

最后,再來看看見證數據的絕對大小。

pythonabsolute-values-plot.pyhex-witness-raw.csvbin-stats-8m-9m.csv80000008500000adjust

-依時間順序繪制的見證數據大小折線圖,縱軸單位為MB-

結論

在使用以太坊主網數據做過測試以后,我們可以看到,切換為二進制樹模式可以大幅提升生成見證數據的效率。

另一個結論是,這種提升并沒有理論上那么顯著。原因可能在于主網區塊的實際數據。

也許,通過分析一些例外情況,我們可以知道更多優化見證數據規模的辦法。

試著使用別的原始數據來跑跑GitHub中的腳本吧:https://github.com/mandrigin/ethereum-mainnet-bin-tries-data

Tags:BINHEXSTASTATBinamonHexHashASTAKE幣STATE

火幣APP
ASI:區塊鏈第一股傳奇故事:張楠賡的虛擬戰爭與抉擇_比特幣

來源:騰訊新聞《潛望》 作者:劉鵬 和很多新興產業發展軌跡一樣,區塊鏈從來不缺乏造富神話,也充滿起朱樓又塌了的喜怒哀樂;而每一個成功的創業故事里,平凡和毀滅、誘惑和瘋狂也一直是最主要的沖突.

1900/1/1 0:00:00
RAM:一周回顧 | 美伊局勢推漲加密市場,歐盟新規掀起監管風暴_gram幣最新行情

過去一周,美國和伊朗之間的局勢仍然對加密市場產生影響,而1月10日生效的歐盟第五條反洗錢指令也對歐洲的加密企業帶來了重要影響.

1900/1/1 0:00:00
比特幣:BitMEX年度“爆倉成績單”發布,多單占比超六成金額近130億美元_SAFEORBIT

來源:小蔥區塊鏈 不同于2018年長達一整年的熊市,比特幣在剛剛結束的2019年上半年走出了強有力的上漲表現,自4000美元下方一度沖高至13000美元以上,即使是在經歷了下半年的漲幅回吐后.

1900/1/1 0:00:00
USDT:BTC鏈上數據周報:鏈上數據反彈后迅速回落,萎靡態勢尚難走出_btcz幣在哪里交易

在過去一周,從主要鏈上數據來看,各項數據與前一周相比,特別在交易額上有明顯上漲,但是在交易數,特別大額交易數上漲幅有限.

1900/1/1 0:00:00
BTC:2020年即將迎來減半的八大幣種_ATMCASH

作者:王也 來源:星球日報 今年最值得期待、也是結果最不確定的事件將是比特幣的第三次減半。減半的全稱為“區塊獎勵減半”。從代碼層面,中本聰的設計是每出21萬個塊,獎勵就會減半.

1900/1/1 0:00:00
AND:區塊鏈上車?能做的事情不多_區塊鏈存證證件

作者:程瀟熠 來源:未來汽車日報 林霖在區塊鏈一行里工作了3年,但依然覺得,在現在的出行領域,“區塊鏈沒用”。這不是因為區塊鏈技術本身的不成熟,也不是因為車企對區塊鏈不感冒.

1900/1/1 0:00:00
ads