買以太坊 買以太坊
Ctrl+D 買以太坊
ads

PIP:零知識處理單元(ZPU)設計方案介紹—— 多功能及可編程的ZK硬件加速器_ISA

Author:

Time:1900/1/1 0:00:00

作者:Ingonyama,Medium;編譯:Kate, Marsbit

TL;DR:

在本博客中,我們提出了零知識處理單元(ZPU),這是一種通用的可編程硬件加速器,旨在解決零知識處理的新需求。

我們將介紹ZPU架構和設計注意事項。我們解釋了ZPU生態系統不同部分背后的設計選擇:ISA,數據流,內存和處理元件(PE)內部結構。最后,我們將 ZK 和全同態加密 (FHE) 與最先進的 ASIC 架構進行比較。

介紹

數據驅動的應用程序的快速增長和對隱私的日益增長的需求導致了對保護敏感信息的加密協議的興趣激增。在這些協議中,零知識證明(ZKP)作為確保計算完整性和隱私性的強大工具脫穎而出。ZKP使一方能夠在不泄露任何額外信息的情況下向另一方證明聲明的有效性。這一特性導致ZKP在各種以隱私為重點的應用中得到廣泛采用,包括區塊鏈技術、安全云計算解決方案和可驗證的外包服務。

然而,在實際應用程序中采用ZKP面臨著一個重大挑戰:與證明生成相關的性能開銷。ZKP算法通常涉及對非常大的整數的復雜數學運算,例如橢圓曲線上的大型多項式計算和多標量乘法。此外,密碼算法在不斷發展,新的和更有效的方案正在快速發展。因此,現有的硬件加速器很難跟上各種各樣的加密原語和不斷變化的加密算法。

SKALE即將發布去中心化零知識證明解決方案Levitation Protocol:6月2日消息,以太坊側鏈 SKALE 開發人員宣布了一項 SKALE 改進提案,即,去中心化零知識證明解決方案 Levitation Protocol,旨在通過使全套 ZK 解決方案無縫連接到 SKALE 架構,并將 Rollup 連接到以太坊主網。該提案包括進一步的生態系統升級,增加了一個新的「Layer 1 Megachain」,稱為 SKALE G(G 代表木衛三,太陽系中最大的衛星)。

SKALE 開發人員計劃在未來幾個月內開始發布 Levitation Protocol 源代碼,之后將啟動公共測試網。Levitation Protocol 主網計劃于 2023 年第四季度推出。[2023/6/2 11:53:31]

在這篇博客中,我們提出了零知識處理單元(ZPU),這是一種新穎的多功能硬件加速器,旨在解決零知識處理的新需求。ZPU建立在指令集架構(ISA)上,支持可編程性,使其能夠適應快速發展的加密算法。ZPU 具有處理元件 (PE) 的互連網絡,具有對大字模塊化算法的本地支持。PE的核心結構受到乘法累加(MAC)引擎的啟發,該引擎是數字信號處理(DSP)和其他計算系統中的基本處理元素。PE的運算符使用模塊化算法,其核心組件專門用于支持ZK算法中的常見運算,例如NTT蝴蝶運算和用于多標量乘法的橢圓曲線點加法。

a16z:零知識證明保護去中心化和隱私,將取得一系列進展:4月15日消息,a16z發文《去中心化的速度:零知識證明的進步》表示,隨著區塊鏈吸引了數以百萬計的用戶,并且它們所承載的應用程序的復雜性不斷提高,圍繞隱私和可擴展性的兩個關鍵需求已經出現。需要識別的一個關鍵趨勢是,雖然正在為其中許多應用開發專用硬件,但也有一項運動正在優化消費者級硬件的算法,以保護去中心化和隱私。這一趨勢的一個特別好的例子是零知識證明。

我們目前正處于一個非常早期的時刻,零知識證明計劃將取得一系列進展。我們已經從零知識領域中極少數面向消費者的應用程序,發展到在很短的時間內為隱私和可擴展性提供應用程序和區塊鏈的整個生態系統。像這樣的新技術最令人興奮的一點是,很難預測另一面到底是什么樣子。[2022/4/15 14:27:35]

指令集架構

ZPU架構的特點是一個由指令集架構(ISA)定義的處理元件(PE)的互連網絡,如下圖1所示。我們選擇這種架構是為了適應零知識協議不斷變化的環境。

ISA 方法使 ZPU 能夠保持靈活性,適應ZK算法的變化,并支持廣泛的加密原語。此外,使用ISA而不是固定的硬件可以在制造后持續改進軟件,確保即使在該領域出現新的進展,ZPU也能保持相關性和效率。

ISA是處理器可以執行的一組指令。它作為硬件和軟件之間的接口,定義了軟件與硬件交互的方式。通過定制ISA來設計ZPU,我們可以針對ZK處理任務的特定要求對其進行優化,例如大字模算術運算、橢圓曲線加密和其他復雜的密碼運算。

門羅幣開始審核零知識證明系統Bulletproofs+代碼:1月19日消息,門羅幣官方宣布,已正式開始對零知識證明系統Bulletproofs+代碼進行審核,將于30天內發布報告。此前消息,零知識證明系統Bulletproofs+代碼獲準可在門羅幣協議中使用。隨后官方計劃籌集90.3 XMR以進行零知識證明系統Bulletproofs+審計。[2021/1/19 16:29:47]

圖1:PE網絡結構

PE核心部件

每個PE都設計了一個內核,其中包括模乘法器、加法器和減法器,如圖2所示。這些核心組件的靈感來自數字信號處理(DSP)和其他計算系統的基本處理元件,乘法累加(MAC)引擎。MAC引擎有效地執行乘法累加運算,包括將兩個數字相乘并將乘積加到累加器中。

PE的核心結構是為ZK中常見的運算量身定制的,例如用于多標量乘法的橢圓曲線點加法和用于數論變換(NTT)的NTT蝴蝶運算。蝴蝶運算包括加法、減法和乘法,都是在模運算下進行的。該操作的名稱來源于其計算流程圖的蝴蝶外觀,它非常適合PE的核心硬件組件,因為它們通過專用的蝴蝶指令實現原生蝴蝶計算。

此外,每個PE包含幾個專用內存單元,包括:

金色沙龍 | 燕麗:零知識證明對于協調區塊鏈底層擴容也有很大幫助:在今日舉行的《隱私計算——區塊鏈信息安全守護者》為主題的金色沙龍中,算力智庫創始人燕麗表示,2020年1月1日,中國首部《中華人民共和國密碼法》將正式開始實施,而在這之前一直只有一部 2007年4月23日公布的《商用密碼產品使用管理規定》和《境外組織和個人在華使用密碼產品管理辦法》。很多人把這次《密碼法》和2019年“1024”中央把區塊鏈技術作為國家戰略聯系在一起。區塊鏈技術是完全基于密碼學技術,所以按照這個邏輯,如果政府要完全掌控未來區塊鏈技術的發展,首先就要完全掌控密碼學技術,而這個其中的核心是國家主權范圍之間在所有的通信安全和商業行為之間軍備競賽的升級。區塊鏈有大量擴容壓力,而為了達到這個操作,必然要犧牲系統處理效能和部分隱私。但矛盾的是,區塊鏈前期的應用場景如虛擬貨幣,數字金融等,都需要有更好的隱私保護和不容易被惡意攻擊的防護。所以若想讓區塊鏈技術落地生根,那么提高區塊鏈底層技術來滿足對于高安全性(含高完整性和高保密性)、高性能、高廣義效率的要求,也許是個穩妥做法。所以隱私計算中的零知識證明等對于協調區塊鏈底層擴容也有很大幫助。[2020/4/15]

1.到達休息室:用于存儲到達PE的數據的存儲器。

2.出發休息室:用于存儲從PE出發的數據的存儲器。

3.操作數A、B和C的暫存存儲器:三個單獨的存儲器用于存儲中間結果。

聲音 | ALabs負責人王增新:改進后的零知識證明是解決數據可用性問題的可行方案:今日,在日本東京舉辦的SmartBlock2018國際學術會議上,區塊鏈研究院ALabs負責人王增新做了關于區塊鏈安全隱私及擴展性的學術分享,他認為數據可用性問題是區塊鏈廣泛應用的瓶頸,改進后的零知識證明是解決數據可用性問題的可行方案,即將共識的復雜程度降低到對數級別,提高數據的交換與驗證效率。ALabs將圍繞這個方向進行探索,推動區塊鏈行業應用發展。 SmartBlock2018國際學術峰會由Springer、早稻田大學、哥倫比亞大學、北京理工大學、伯明翰城市大學等頂尖學術院校聯合主辦,會議圍繞前沿科技趨勢進行探討,包括人工智能、大數據、區塊鏈等前沿技術,數百名學術大拿及企業高管出席活動。[2018/12/11]

4.內存擴展器:用于處理各種算法需求的多用途內存,例如用于多標量乘法(MSM)的桶聚合。

5.程序存儲器:用于存儲指令隊列的存儲器。

圖2:PE核心組件

PE位寬

PE本機支持大字模塊算術運算(最多256位字)。PE中高位寬本機支持和低位寬本機支持之間的權衡源于需要平衡不同操作數大小的效率。

當PE具有高位寬本機支持時,它會針對處理大操作數大小進行優化,而不需要將它們分解成更小的塊。然而,這種優化的代價是較小位寬操作的效率降低,因為PE未得到充分利用。另一方面,當PE具有低位寬本機支持時,它被優化為更有效地處理小操作數大小。然而,當處理較大位寬的操作時,這種優化會導致效率低下,因為PE需要將較大的操作數分解成較小的塊,并依次處理這些塊。

挑戰在于找到高低位寬本機支持之間的適當平衡,以確保在廣泛的操作數大小范圍內進行有效處理。這種平衡應該考慮目標應用程序領域(即ZK協議)中普遍存在的常見位寬度,并權衡每種設計選擇的優缺點。在ZPU架構的情況下,選擇256位字長作為一個很好的平衡。

PE的連接

所有PE之間采用環形連接,每個PE直接與相鄰的兩個PE相連,形成一個環形網絡。這種環形連接允許控制數據在不同PE之間有效地傳播。PE也通過互連組件連接,這是一種類似于桶形移位器的機制,可以隨著時間的推移在不同的PE之間實現直接連接。這種設置允許PE發送和接收來自所有其他PE的信息。

周邊組件

該架構還集成了片外高帶寬內存(HBM),以支持高內存容量和高內存帶寬。將多個PE聚在一起組成一個PE集群,每個PE集群與一個HBM bank或信道相連。此外,還包括一個基于ARM的片上CPU子系統來管理整個系統操作。

績效評估

為了評估ZPU的性能,我們考慮了我們旨在加速的算法的關鍵操作。我們主要研究的是NTT蝴蝶運算和橢圓曲線(EC)點加法運算。為了評估MSM和NTT操作的總計算時間,我們計算了它們所需的計算指令的總量,并將它們除以時鐘頻率和PE的數量。

NTT 蝶形運算在每個時鐘周期執行。對于多標量乘法(MSM)中的關鍵元素橢圓曲線點加法運算,我們將其解構為可以在單個PE上執行的基本機器級指令。我們隨后計算完成此操作所需的時鐘周期數。通過分析,我們確定每個橢圓曲線點相加運算可以每18個時鐘周期執行一次。

這些假設為我們的性能評估提供了基礎,并且可以根據需要進行調整,以反映不同的算法要求或硬件功能。

根據我們的計算,在GPU的1.305 GHz頻率上運行72個PE的配置足以匹配Zprize的MSM操作中GPU類別獲勝者的性能。Yrrid Software和Matter Labs都實現了這一壯舉,使用A40 NVIDIA GPU每4次MSM計算達到2.52秒的結果。該比較基于固定基點 MSM 計算,涉及從 BLS 12-377 標量場中隨機選擇的 22? 標量,以及來自 BLS 12-377 G1 曲線的一組固定橢圓曲線點和有限的隨機采樣輸入向量來自標量場的場元素。

根據我們對PE的面積估計,使用8nm工藝的ASIC,與A40 GPU中采用的工藝技術相同,可以在與A40 GPU相同的628 mm2面積內容納大約925個PE。這意味著我們實現了比A40 GPU高約13倍的效率。

PipeZK是一種高效的流水線加速器,旨在提高零知識證明(ZKP)生成的性能,具有專用的MSM和NTT內核,分別優化了多標量乘法和大型多項式計算的處理。

與 PipeZK 相比,我們發現僅 17 個以 PipeZK 頻率 300 MHz 運行的 PE 的配置就足以匹配 PipeZK 的 MSM 操作性能。PipeZK在BN128曲線中的22?長度的MSM上以 300 MHz 執行 MSM 操作,耗時0.061秒完成。此外,為了匹配PipeZK的NTT操作性能,在300MHz下運行256位元素的22?元素NTT,耗時0.011秒,我們需要大約 4 個以相同頻率運行的 PE。總的來說,為了匹配PipeZK同時運行MSM和NTT的性能,我們需要21個PE。

根據我們的面積估計,使用28nm工藝的ASIC(與PipeZK中采用的工藝技術相同)可以在與PipeZK芯片相同的50.75 mm2面積內容納大約16個PE。這意味著我們的效率略低于PipeZK的固定架構(效率低25%),同時仍然可以完全靈活地適應不同的橢圓曲線和ZK協議。

環處理單元(RPU)是最近的一項工作,旨在加速基于環的帶錯誤學習(RLWE)的計算,這是各種安全和隱私增強技術的基礎,如同態加密和后量子加密。

與RPU相比,我們的計算表明,當計算128位元素的64K NTT時,為了匹配RPU在最佳配置(128 bank和HPLEs)下的性能,我們將需要大約23個PE在RPU的1.68GHz頻率上運行。我們的分析表明,采用與RPU相同的12nm工藝技術的ASIC可以在RPU占用的20.5 mm2面積內容納大約19.65個PE。這意味著我們的效率略低于RPU(效率低15%),同時與NTT以外的原語兼容。

TREBUCHET是一個完全同態加密(FHE)加速器,它使用環處理單元(RPU)作為片上區塊。切片還通過將數據調度到接近計算元素的位置來促進內存管理。RPU在整個設備中被復制,使軟件能夠最大限度地減少數據移動并利用數據級并行性。

TREBUCHET和ZPU都基于ISA架構和大型算術單詞引擎,這些引擎在模塊化算法下支持非常長的單詞(128位或更高)。然而,與RPU或TREBUCHET SoC相比,ZPU的附加價值在于它擴大了該架構旨在解決的問題集。RPU和TREBUCHET主要關注NTT,而ZPU支持更多的原語,如多標量乘法(MSM)和面向算術的哈希函數。

總結

我們的性能評估表明,ZPU可以匹配甚至超過現有最先進的ASIC設計的性能,同時對ZK算法和加密原語的變化提供更大的適應性。雖然需要考慮權衡,例如PE 中高位寬和低位寬支持之間的平衡,但ZPU的設計經過精心優化,以確保在廣泛的操作數尺寸范圍內進行高效處理。對于那些有興趣了解更多關于ZPU或探索潛在合作的人,請隨時與我們聯系。我們期待與大家分享更多關于ZPU項目進展和未來發展的最新信息。

MarsBit

媒體專欄

閱讀更多

DAOrayaki

金色財經

Odaily星球日報

曼昆區塊鏈法律

PolkaWorld

金色早8點

Block unicorn

Tags:區塊鏈PIPISAPRO區塊鏈游戲幣拍賣HPIPSunisatwallet錢包Tachyon Protocol

火必下載
META:MetaMask Snaps:開創去中心化新生態系統 鞏固錢包龍頭地位_Feta Token

作者:Darren,Everest Ventures GroupMetaMask Snaps 是 MetaMask 錢包的一個新功能(插件),它旨在創建一個無需許可的生態系統.

1900/1/1 0:00:00
GNO:Gnosis Pay:連接加密貨幣與傳統經濟的Visa卡與硬件錢包_Gnosis

作者:Luyao 來源:推特,@levi0214Gnosis在EthCC發布了一個有趣的新產品,名為Gnosis Pay。它是一張Visa卡,同時也是一個硬件錢包.

1900/1/1 0:00:00
NAN:速覽 20 個有機會在下輪牛市沖擊一線的潛力項目_LAYER

近日,隨著美國聯邦法官裁定 XRP 在散戶銷售中不屬于證券,Ripple 迎來了與美 SEC 三年斗爭的短暫勝利,受此消息影響,加密市場中的諸多幣種價格出現了大幅上漲.

1900/1/1 0:00:00
NFT:解讀《數字資產托管現狀》:機構投資者面臨的機遇與挑戰_泰達幣和比特幣區別是什么意思

 作者:Aspen Digital數字資產托管的發展歷程經歷了明顯的3個階段,始于托管1.0階段的自托管解決方案,而后出現機構級解決方案.

1900/1/1 0:00:00
BSP:晚間必讀 | 淺談全球穩定幣監管_web3域名注冊

幾周前,DL News與一位名為Federico Jaime的20歲阿根廷人取得聯系,他聲稱自己是3月份2億美元的Euler Finance黑客攻擊事件的幕后人物.

1900/1/1 0:00:00
THE:觀點:為什么說美國國會應該制止加密貨幣_PPL

作者:Hilary Allen,FINANCIAL TIMES;編譯:松雪,金色財經在加密貨幣領域最大和最重要的市場美國,監管壓力正在增加.

1900/1/1 0:00:00
ads