作者:Celer
過去幾個月,我們投入了大量時間和精力,開發了利用zk-SNARK簡潔證明構建的前沿基礎設施。這個下一代創新平臺使開發者能夠構建前所未有的區塊鏈應用新范例。
在開發工作中,我們測試并使用了多種零知識證明(ZKP)開發框架。雖然這段旅程收獲頗豐,但我們也確實意識到,當新的開發者試圖找到最適合其特定用例和性能要求的框架時,多種多樣的ZKP框架通常會給他們帶來挑戰。
考慮到這一痛點,我們認為需要一個能夠提供全面性能測試結果的社區評估平臺,這將極大地促進這些新應用的開發。
為了滿足這一需求,我們推出了零知識證明開發框架評測平臺「萬神殿Pantheon」?這一公益社區倡議。倡議的第一步將鼓勵社區分享各種ZKP框架的可復現性能測試結果。我們的最終目標是共同協作創建并維護一個廣受認可的測試平臺,評估低級電路開發框架、高級zkVM和編譯器,甚至硬件加速提供商。
我們希望這一舉措能夠讓開發者們在選用框架時能有更多性能比較的參考,從而加快ZKP的推廣。同時,我們希望通過提供一組普遍可參考的性能測試結果,促進ZKP框架本身的升級和迭代。我們將大力投入這項計劃,并邀請所有志同道合的社區成員加入我們,共同為這項工作做出貢獻!
第一步:使用SHA-256對電路框架進行性能測試
在這篇文章中,我們邁出了構建ZKPPantheon的第一步,在一系列低級電路開發框架中使用SHA-256提供一組可復現的性能測試結果。雖然我們承認其他性能測試粒度和原語或許也是可行的,但我們選擇SHA-256是因為它適用于廣泛的ZKP用例,包括區塊鏈系統、數字簽名、zkDID等。
另外值得一提的是,我們在自己的系統中也使用了SHA-256,所以這對我們來說也很方便!?
Celsius關聯地址間發生約11萬美元的穩定幣轉賬:金色財經報道,PeckShield監測數據顯示,標記為Celsius的0xef22開頭地址向標記為Celsius的0x64f6開頭地址轉移約11萬美元的穩定幣,包括7.9萬枚ZUSD、3萬枚aUSD、265枚EURT。[2023/1/31 11:37:53]
我們的性能測試評估了SHA-256在各種zk-SNARK和zk-STARK電路開發框架上的性能。通過比較,我們力求為開發者提供關于每個框架的效率和實用性的見解。我們的目標是,希望本次性能測試結果能夠為開發者在選擇最佳框架時提供參考,使之做出明智的決定。
證明系統
近年來,我們觀察到零知識證明系統激增。跟上該領域所有激動人心的進步是具有挑戰性的,我們根據成熟度和開發者采用情況精心挑選了以下證明系統作為測試對象。我們的目標是提供不同前端/后端組合的代表性樣本。
Circom?+?snarkjs?/?rapidsnark:Circom是一種流行的DSL,用于編寫電路和生成R1CS約束,而snarkjs能夠為Circom生成Groth16或Plonk證明。Rapidsnark也是Circom的證明器,它生成Groth16證明,并且由于使用了ADX擴展,它通常比snarkjs快得多,并盡可能并行化證明生成。
gnark:gnark是來自Consensys的綜合Golang框架,支持Groth16、Plonk和許多更高級的功能。
Arkworks:Arkworks是一個用于zk-SNARKs的綜合Rust框架。
Halo2(KZG):Halo2是Zcash與Plonk的zk-SNARK實現。它配備了高度靈活的Plonkish算術,支持許多有用的原語,例如自定義網關和查找表。我們使用具有以太坊基金會和Scroll支持的KZG的Halo2分叉。
Celsius通過抵押4.03億美元資產從FTX獲得約1億貸款:7月15日消息,英國金融時報記者kadhim發推文稱,Celsius在其自愿重組申請文件中表示,Celsius通過抵押4.03億美元的數字資產從FTX獲得1.08億美元的貸款。這說明FTX貸款給Celsius的前提是他必須償還貸款的四倍。
此外,Celsius有一大筆客戶資金缺乏流動性,Celsius將其4.67億美元的以太坊鎖定在尚未推出的新以太坊網絡中。[2022/7/15 2:15:20]
Plonky2:?Plonky2是基于來自PolygonZero的PLONK和FRI技術的SNARK實現。?Plonky2使用小的Goldilocks字段并支持高效的遞歸。在我們的性能測試中,我們以?100位推測的安全性為目標,并使用為性能測試工作產生最佳證明時間的參數。具體來說,我們使用了28Merkle查詢、8的放大系數和?16位工作量證明挑戰。此外,我們設置num_of_wires=60和num_routed_wires=60。
Starky:Starky是PolygonZero的高性能STARK框架。在我們的性能測試中,我們以?100位推測的安全性為目標,并使用產生最佳證明時間的參數。具體來說,我們使用了90Merkle查詢、2倍放大系數和10位工作量證明挑戰。
下表總結了上述框架以及我們性能測試中使用的相關配置。這個列表絕不是詳盡的,我們還將在未來研究許多最先進的框架/技術。
請注意,這些性能測試結果僅適用于電路開發框架。我們計劃在未來發布一篇單獨的文章,對不同的zkVM和IR編譯器框架進行性能測試。
疑似Celsius地址抵押近1.8萬枚比特幣,在22,584美元或面臨超4億美元清算風險:6月13日消息,據加密KOL在社交媒體披露,疑似為Celsius的地址(0x87a67e7dc32fdc79853d780c6f516312b4a503b5)在Maker協議中通過抵押17,919.37枚WBTC,借出278,490,418.9枚DAI,該頭寸在BTC達到22,584美元時或將面臨超4億美元清算風險。[2022/6/13 4:23:19]
性能評測方法論
為了對這些不同的證明系統進行性能測試,我們計算了N字節數據的SHA-256哈希值,其中我們對N=64、128、...、64K進行了實驗。可以在此存儲庫中找到性能代碼和SHA-256電路配置。
此外,我們使用以下性能指標對每個系統進行了性能測試:
證明生成時間
證明生成期間的內存使用峰值
證明生成期間的平均CPU使用率百分比。
請注意,我們正在對證明大小和證明驗證成本做一些“隨意”的假設,因為這些方面可以通過在上鏈之前與Groth16或KZG組合來減輕。
機器
我們在兩臺不同的機器上進行了性能測試:
Linux服務器:20核@2.3GHz,384GB內存
MacbookM1Pro:10核@3.2Ghz,16GB內存
Linux服務器用于模擬CPU核數多、內存充裕的場景。而通常用于研發的MacbookM1Pro擁有更強大的CPU,但內核較少。
我們啟用了可選的多線程,但我們沒有在此性能測試中使用GPU加速。我們計劃在未來進行GPU性能測試。
性能評測結果
Celsius CEO:僅迎合1%的高凈值用戶并非所愿,希望幫助1億人進入加密領域:四月末,加密貸款公司Celsius宣布其平臺存入的BTC數量已超過5萬個。在談及上述數據時,Celsius首席執行官Alex Mashinsky表示,這是“一件好事,也是一件壞事”。具體而言,Mashinsky解釋稱:“好事是,Celsius的用戶資產規模已超出計劃,這意味著我們有足夠的錢來讓一家成功的企業盈利。但壞消息是,我們最終只迎合了那1%的用戶,我們的平均賬戶在18000美元左右——這不是我們的計劃。盡管我們取得了一定成功,但我們還沒有實現讓1億人進入加密領域的使命。”(Cointelegraph)[2020/5/19]
約束數量
在我們繼續討論詳細的性能測試結果之前,首先通過查看每個證明系統中的約束數量來了解SHA-256的復雜性是很有用的。重要的是要注意不能直接比較不同算術方案中的約束數量。
下面的結果對應64KB的原像尺寸。雖然結果可能因其他原像尺寸而異,但它們可以粗略地線性縮放。
Circom、gnark、Arkworks都使用相同的R1CS算法,計算64KBSHA-256的R1CS約束數量大致在30M到45M之間。Circom、gnark和Arkworks之間的差異可能是由于配置差異造成的。
Halo2和Plonky2都使用Plonkish算術,其中行數范圍從2^22到2^23。由于使用查找表,Halo2的SHA-256實現效率比Plonky2的高得多。
Starky使用AIR算法,其中執行跟蹤表需要2^16個轉換步驟。
動態 | ETC Labs Accelerate正式公布Cohort II名單 7家企業入圍:據ETC Labs官方Medium消息,ETC Labs Accelerate正式宣布入圍Cohort II的7家企業,包括ChainSafe、O-S City、Pulse Agent、Saldo.mx、Scaling Ventures、Second State和W3 Engineers。這些企業均專注于互操作性,開發人員工具,基礎架構和可擴展的用例。[2019/8/14]
證明生成時間
使用Linux服務器測試了SHA-256的每個框架在各種原圖像尺寸上的證明生成時間。我們可以得到以下發現:
對于SHA-256,Groth16框架生成證明的速度比Plonk框架快。這是因為SHA-256主要由位運算組成,其中線值為0或1。對于Groth16,這減少了從橢圓曲線標量乘法到橢圓曲線點加法的大部分計算。但是,連線值并不直接用于Plonk的計算,因此SHA-256中的特殊連線結構不會減少Plonk框架中所需的計算量。
在所有Groth16框架中,gnark和rapidsnark比Arkworks和snarkjs快5到10倍。這要歸功于它們利用多個內核并行化生成證明的卓越能力。Gnark比rapidsnark快25%。
對于Plonk框架,當使用>=4KB的較大原像尺寸時,Plonky2的SHA-256比Halo2的慢50%。這是因為Halo2的實現主要使用查找表來加速按位運算,導致行數比Plonky2少2倍。但是,如果我們比較具有相同行數的Plonky2和Halo2,Plonky2比Halo2快50%。如果我們在Plonky2中使用查找表實現SHA-256,我們應該期望Plonky2比Halo2更快,盡管Plonky2的證明尺寸更大。
另一方面,當輸入原像尺寸較小時,由于查找表的固定設置成本占大部分約束,Halo2比Plonky2慢。然而,隨著原像的增加,Halo2的性能變得更具競爭力,對于高達2KB的原像大小,其證明生成時間保持不變,如圖所示,其幾乎呈線性擴展。
正如預期的那樣,Starky的證明生成時間比任何SNARK框架都短得多(5倍-50倍),但這是以更大的證明大小為代價的。
另外需要注意的是,即使電路大小與原像大小成線性關系,由于O(nlogn)FFT,對于SNARKs的證明生成也是呈超線性增長的。
我們還在MacbookM1Pro上進行了證明生成時間性能測試,如所示。但是,需要注意的是,由于缺乏對arm64架構的支持,rapidsnark未包含在該性能測試中。為了在arm64上使用snarkjs,我們必須使用webassembly生成見證,這比Linux服務器上使用的C++見證生成要慢。
在MacbookM1Pro上運行性能測試時還有幾個額外的觀察結果:
除了Starky之外,所有SNARK框架在原像尺寸變大時都會遇到內存不足(OOM)錯誤或使用交換內存現象。具體來說,Groth16框架在原像尺寸>=8KB時就開始使用交換內存,而gnark在原像尺寸>=64KB時出現內存不足。當原像尺寸>=32KB時,Halo2遇到了內存限制。當原像尺寸>=8KB時,Plonky2開始使用交換內存。
基于FRI的框架在MacbookM1Pro上比在Linux服務器上快大約60%,而其他框架在兩臺機器上面的證明時間相似。因此即使在Plonky2中沒有使用查找表,它在MacbookM1Pro上實現了與Halo2幾乎相同的證明時間。主要原因是MacbookM1Pro擁有更強大的CPU,但內核更少。FRI主要進行哈希運算,對CPU時鐘周期比較敏感,但并行性不如KZG或Groth16。
內存使用峰值
和分別顯示了在LinuxServer和MacbookM1Pro上生成證明期間的內存使用峰值。根據這些性能測試結果可以得出以下觀察結果:
在所有SNARK框架中,rapidsnark是內存效率最高的。我們還看到,由于查找表的固定設置成本,當原像尺寸較小時,Halo2使用更多內存,但當原像尺寸較大時,整體消耗的內存較少。
Starky的內存效率比SNARK框架高10倍以上。部分原因是它使用了更少的行。
應該注意的是,由于使用交換內存,原像尺寸變大,因此MacbookM1Pro上的內存使用量峰值保持相對平穩。
CPU利用率
我們通過測量SHA-256在4KB原像輸入的證明生成期間的平均CPU利用率來評估每個證明系統的并行化程度。下表顯示了LinuxServer和MacbookM1Pro上的平均CPU利用率(括號中為每個內核的平均利用率)。
主要觀察結果如下:
Gnark和rapidsnark在Linux服務器上表現出最高的CPU利用率,表明它們能夠有效地使用多核且并行化生成證明。Halo2也展現了良好的并行化性能。
大多數框架在Linux服務器上的CPU利用率是在MacbookProM1的2倍,只有snarkjs例外。
盡管最初預計基于FRI的框架可能難以有效地使用多核,但它們在我們的性能測試中的表現并不比某些Groth16或KZG框架差。在具有更多內核的機器上,CPU利用率是否會有差異還有待觀察。?
結論及未來研究
這篇文章比較全面說明了SHA-256在各種zk-SNARK和zk-STARK開發框架上的性能測試結果。通過比較,我們深入了解了每種框架的效率和實用性,以期可以幫助需要為SHA-256操作生成簡潔證明的開發者。
我們發現?Groth16框架在生成證明方面比Plonk框架更快。Plonkish算術化中的查找表在使用較大的原像尺寸時顯著減少了SHA-256的約束和證明時間。此外,gnark和rapidsnark展示了利用多核以并行化運作的出色能力。另一方面,Starky的證明生成時間要短得多,但代價是證明大小要大得多。在內存效率方面,rapidsnark和Starky優于其他框架。
作為構建零知識證明評測平臺「萬神殿Patheon」的第一步,我們承認本次性能測試結果遠不足以成為最終我們希望構建的一個綜合測試平臺。我們歡迎并樂于接受反饋和批評,并邀請所有人為這項倡議做出貢獻,以便開發者更容易、低門檻地使用零知識證明。我們也愿意為個人獨立貢獻者提供資助,以支付大規模性能測試的計算資源成本。我們希望可以共同提高ZKP的效率和實用性,更為廣泛地造福社區。
最后,我們要感謝PolygonZero團隊、Consensys的gnark團隊、PadoLabs以及DelphinusLab團隊,感謝他們對性能測試結果的寶貴審查和反饋。
文章來源:AndréBeganski,Decrypt編譯:Moni,Odaily星球日報3月2日.
1900/1/1 0:00:00作者|特約研究員William,吳說2023?年?2?月?20?日,香港證監會就加密貨幣交易發布了《咨詢文件》,標志著港府在放開加密貨幣交易領域邁出了重要一步.
1900/1/1 0:00:00作者:@yyy Coinbase宣布入場做了一條基于OPStack的L2——@BuildOnBase,一時間「BullishonOptimism」的情緒又再度被點燃.
1900/1/1 0:00:00作者:霧海,PANews全網翹首以盼的Blur空投終于在北京時間2023年2月15日凌晨落下帷幕,3.6億枚Blur代幣回饋給NFT社區和Blur用戶.
1900/1/1 0:00:00區塊鏈游戲開發商Curio宣布完成290萬美元種子輪融資,本輪融資由BainCapitalCrypto領投.
1900/1/1 0:00:00作者:?FlashDAO,軟件技術沉思錄 ETHShanghaiUpgrade?CelebrationEvents!2023.03.13-04.09以太坊進入2.0時代后,生態發展進入全新階段.
1900/1/1 0:00:00