注:原文作者 Joachim NeuJoachim-Neu 是 Paradigm 的研究實習生,他也是斯坦福大學的區塊鏈科學博士生,目前他的研究重點是可證明共識安全。
任何 L1 區塊鏈的核心職責是保證數據可用性。這種保證對于客戶端能夠解釋 L1 區塊鏈本身至關重要,并且它也是更高層應用(例如 rollup)的基礎。為此,一種經常被討論的技術會用于數據可用性驗證的隨機抽樣,正如 Mustafa Al-Bassam、Alberto Sonnino 以及 Vitalik Buterin 在 2018 年發表的一篇論文中所推廣的那樣。該技術是 Celestia 區塊鏈的核心,并被提出通過“Danksharding”包含在權益證明(PoS)以太坊中。
這篇博文的目的是解釋數據可用性采樣(DAS)的基礎、它所依賴的模型,以及在實踐中實施該技術時所面臨的挑戰與未解決的問題。我們希望這篇文章能夠吸引研究人員關注這個問題,并激發解決一些突出挑戰的新想法(參見以太坊基金會最近的提案 Request?)。
有人(例如 L1 區塊提議者或 L2 定序器)生成了一個數據區塊。他們聲稱已經向“公眾”提供了數據。你的目標是檢查可用性聲明,即,如果需要,你是否真的能夠獲得數據?
數據的可用性至關重要,基于欺詐證明的樂觀(Optimistic)系統,例如 Optimism,需要數據可用性進行驗證,甚至基于有效性證明的系統,例如 StarkNet 或 Aztec,它們也需要數據可用性以確保活躍性(例如,證明資產所有權以用于 rollup 的逃生艙口或強制交易包含機制)。
對于迄今為止的問題表述,有一個簡單的“幼稚”測試過程,這也是比特幣等早期系統隱式采用的:只需下載整個數據塊。如果你成功了,你就知道它是可用的,而如果你沒有成功,你就會認為它不可用。然而,現在我們希望測試數據的可用性,而不需要自己下載太多的數據,比如因為數據量超出了我們的處理能力,或者因為在我們實際上不感興趣的數據上花費大量帶寬來驗證其可用性似乎很浪費。在這一點上,我們需要一個模型來闡明僅下載或保留“部分數據”的“含義”。
計算機科學中的一種常見方法是首先在具有相當豐富設施的模型中描述一項新技術,并隨后解釋如何實現該模型。我們對 DAS 采用了類似的方法,但正如我們將看到的,當我們嘗試實例化模型時會彈出有趣的開放式研發問題。
在我們的模型中,在一個黑暗的房間里有一個公告板(見下面的漫畫)。首先,區塊生產者進入房間,并有機會在公告板上寫一些信息。當區塊生產者退出時,他可以給你(驗證者)一小段信息(大小與原始數據不成線性比例)。你帶著一個手電筒進入房間,手電筒的光束很窄,電池電量很低,所以你只能在公告板的幾個不同位置閱讀文字。你的目標是讓自己相信區塊生產者確實在公告板上留下了足夠的信息,這樣如果你打開燈并閱讀完整的公告板,你就可以恢復文件。
Paradigm將3000枚MKR轉移至場外交易錢包,或準備出售:金色財經報道,Arkham Intelligence的區塊鏈數據顯示,北京時間周四凌晨,Paradigm Capital將3000枚MakerDAO治理代幣MKR轉移到了一個被標記為OTC(場外交易)的錢包,價值350萬美元,可能準備出售。
金色財經曾報道,Paradigm在3月份將約2000萬美元的MKR發送到同一個錢包,然后將代幣轉移到加密貨幣交易所Coinbase。本周早些時候,Andressen Horowitz將700萬美元的MKR代幣存入Coinbase。[2023/7/27 16:01:16]
起初,這個問題似乎很棘手:我們可以要求區塊生產者在公告板上寫下完整的文件。現在考慮兩種可能性:要么區塊生產者誠實地寫下整個文件,要么區塊生產者行為不當,其漏掉了一小部分信息,使得整個文件不可用。通過僅在幾個位置檢查公告板,你無法可靠地區分出這兩種情況,因此,你無法準確地檢查數據可用性。我們需要一種新的方法!
這就是里德 - 所羅門(Reed-Solomon)糾刪碼發揮作用的地方。讓我們簡單回顧一下,簡單來說,糾刪碼的工作方式如下:k 個信息塊組成的向量被編碼成一個(更長的!)n 個編碼塊的向量。編碼的比率 R = k/n 衡量了編碼引入的冗余。隨后,從編碼塊的某些子集中,我們可以解碼原始信息塊。
如果編碼是最大距離可分(MDS)的,那么原始信息塊可以從編碼塊大小的任何子集中恢復,這是一個有用的效率和魯棒性保證。里德 - 所羅門(Reed-Solomon)碼是一種流行的 MDS 編碼家族,其工作原理如下。記住,在學校里,你可能知道兩點唯一地決定一條線:
這是因為一條線可以描述為具有兩個系數的 1 次多項式:y = a1x+a0(我們現在假設這些點具有不同的 x 坐標)。事實上,這一觀點可以推廣:任何次數的多項式 t-1,它對應于描述多項式
的一組系數
ParallelChain Lab獲GEM Digital 5000萬美元投資:金色財經報道,數字資產投資公司GEM Digital Limited 已向Layer-1協議開發項目ParallelChain Labs投資了5000萬美元,ParallelChain 是一個多合一的去中心化區塊鏈,可處理企業級和零售級用例,旗下有兩個可擴展Layer 1平臺,分別是公共主網和專用網絡。本次投資后,ParallelChain Lab將加速推動公共主網開發并部署權益證明共識機制,是一個跨公共區塊鏈應用程序的隱私、合規性和可擴展性需求解決方案,可以縮小 DeFi 和 CeFi 之間的差距。(bitcoinist)[2022/9/24 7:18:57]
,由多項式通過的任何 t 個點唯一確定(具有不同的 x 坐標)。換句話說:一旦知道多項式在不同位置的求值,就可以在任何其他位置獲得其求值(首先恢復多項式,然后求值)。
里德 - 所羅門(Reed-Solomon)碼就是基于這種洞察力構建的。對于編碼,我們從 k 個信息塊
開始,構造相關的多項式
,并在不同的 x 坐標上對其進行求值以獲得編碼塊。現在,由于上述見解,這些編碼塊中的任何 k 個都允許我們唯一地恢復 k-1 次多項式,并讀取系數以獲得原始信息塊。瞧!
回到我們的數據可用性問題:我們不再要求區塊生產者在公告板上寫下原始文件,而是要求他將文件分成 k 個塊,使用 Reed-Solomon 碼對它們進行編碼,例如,速率 R=1/2,并將 n = 2k 編碼塊寫入公告板。現在讓我們假設區塊生產者至少誠實地遵循編碼(我們稍后將看到如何解除這個假設)。再次考慮兩種情況:生產者行為誠實并寫下所有塊,或者生產者行為不端并希望保持文件不可用。回想一下,我們可以從 n = 2k 個編碼塊中的任何 k 個恢復原始文件。所以為了保持文件不可用,區塊生產者最多可以寫入 k-1 個塊。換句話說,現在至少有 k+1,超過 n=2k 個編碼塊的一半將丟失!
但是現在這兩種情況,一個寫滿的公告板和一個半空的公告板,很容易區分:你在少數 r 個隨機抽樣的位置檢查公告板,如果每個采樣位置都有其各自的塊,則認為該文件可用,如果任何采樣位置為空,則該文件不可用。請注意,如果文件不可用,因此(超過)一半的公告板是空的,你錯誤地認為文件可用的概率小于
加密對沖基金Paradigm資助比特幣核心開發人員:金色財經報道,加密對沖基金Paradigm已向澳大利亞比特幣核心開發者Anthony Towns提供了資助。據悉,Square Crypto、OKCoin和BitMEX等公司此前曾支持比特幣開發人員,后兩家公司最近合作向比特幣核心開發人員Amirit Uttarwar資助了15萬美元。[2020/7/14]
,即在 r 中呈指數級小。
給定的“暗室公告板”模型是非常簡單的。現在讓我們考慮一下模型:組件代表什么?我們可以在真實的計算機系統中實現它們嗎?如何實現?
事實上,為了幫助發現理論與實踐之間的差距,我們已經使用“奇怪的”“暗室中的公告板”模型解釋了問題和解決方案,其中的隱喻與真實的計算系統幾乎沒有相似之處。這是為了鼓勵你思考現實世界和模型世界的各個方面是如何對應的,以及它們是如何(無法)實現的。如果你的模型中有一些部分無法轉化為計算機/網絡/協議等價物,那么你知道還有一些事情要做,可能是你的理解還有問題,也可能是開放的研究問題!;)
這是一個非詳盡的挑戰集合,對于其中一些挑戰,社區多年來已經找到了合理的答案,而另一些仍然是開放的研究問題。
挑戰 A:如何確保公告板上的塊實際上是由提議者寫的?考慮采樣塊在網絡上以任何形式傳輸到采樣節點時的變化。這是一小段信息的來源,當生產者離開并且采樣節點進入暗室時,區塊生產者可以將其傳遞給采樣節點。在實踐中,這被實現為對寫入公告板的原始內容的綁定向量承諾(想想 Merkle 樹),并作為區塊頭的一部分進行共享。給出承諾后,區塊生產者可以在公告板上留下每個編碼塊的證明,以表明該塊確實是由區塊生產者編寫的。第三方無法在傳輸過程中更改塊,因為承諾方案不允許為修改的塊偽造有效證明。請注意,這本身并不排除區塊生產者在公告板上寫入無效/不一致的塊,我們接下來將討論這一點。
挑戰 B:確保區塊生成者糾刪碼正確。在上述方案中,我們假設區塊生產者正確地編碼信息塊,因此糾刪碼的保證成立,也就是說,從足夠的編碼塊中,實際上可以恢復信息塊。換句話說,區塊生產者所能做的就是保留塊,但不能將我們與無效塊混淆。在實踐中,有三種常見的排除無效編碼的方法:
欺詐證明。這種方法依賴于這樣一個事實,即一些采樣節點足夠強大,可以對如此多的塊進行采樣,以至于它們可以發現塊編碼中的不一致,并發布無效的編碼欺詐證明,以將所討論的文件標記為不可用。這方面的工作旨在最小化節點必須檢查的塊數量(并作為欺詐證明的一部分轉發)以檢測欺詐(參見原始的 Al-Bassam/Sonnino/Buterin 論文為此使用了 2 D 里德 - 所羅門碼?)。
聲音 | ETC社區資深人士:已完成Agharta硬分叉 目前社區主推MultiGeth和Parity節點:針對今日下午進行的ETC Agharta硬分叉,有ETC社區知情人士表示,Agharta硬分叉已完成,建議以按照算力計算而不是Geth客戶端數。因自亞特蘭蒂斯分叉開始,社區已陸續向友商們溝通,為更好匹配后續發展,建議友商更換客戶端。仍然計算classic geth節點數參考并不太準確,建議使用MultiGeth和Parity。[2020/1/12]
多項式承諾。該方法使用 KZG 多項式承諾?作為包含在區塊頭中的綁定向量承諾來解決挑戰 A。多項式承諾允許根據對未編碼信息塊的承諾直接驗證 Reed-Solomon 編碼塊,因此沒有無效編碼的空間。可以這樣想:向量承諾和 Reed-Solomon 編碼在多項式承諾中是不可分割的。
有效性證明。可以使用密碼學證明系統來證明向量承諾提交的編碼塊的正確糾刪碼。這種方法是一種很好的教學“心理模型”,并且對于所使用的糾刪碼來說是通用的,但在相當長的一段時間內可能效率不高。
挑戰 C:公告板是“什么”以及“在哪里”?提議者如何“寫”到上面?在我們討論公告板“是什么”和“在哪里”、提議者如何“寫入”它以及驗證者如何從中“讀取”/“采樣”之前,讓我們回顧一下兩種基本 P2P 網絡原語的眾所周知的缺點:
1、基于低量級泛洪的發布 - 訂閱 gossip 網絡,例如 GossipSub?,其中通信被組織成不同的“廣播組”(“主題”),參與者可以加入(“訂閱”)并向其發送消息(“發布”):
在任意(“拜占庭式”)對抗行為(例如,eclipse 攻擊、Sybil 攻擊、對等發現攻擊)下不安全;
常見的變體甚至不提供 Sybil 抵抗機制
通常無法保證參與者的組成員身份與其他參與者的隱私(事實上,組成員身份通常與對等方通信,以避免他們轉發不需要的主題網絡流量)
如果有大量主題且每個主題的訂閱者很少,則通信往往變得不可靠(因為訂閱特定主題的節點的子圖可能不再連接,因此泛洪可能會失敗)
2、分布式哈希表 (DHT),例如 Kademlia?,其中每個參與者存儲哈希表中存儲的全部數據的一部分,參與者可以快速確定到存儲特定信息的對等體的短路徑:
也不是拜占庭容錯(例如,誠實參與者請求的不適當路由,對網絡形成/維護的攻擊)
事實上,DHT 在對抗行為的恢復能力方面比 gossip 協議差得多:gossip 協議“僅”要求由誠實節點(以及誠實節點之間的邊)形成的子圖是連接的,這樣信息可以從任何誠實節點到達所有誠實節點。而在 DHT 中,信息是專門沿著路徑路由的,當查詢到達其路徑上的對手節點時,查詢可能會失敗。
動態 | Parity再次引發社區不滿:作為最大的以太坊客戶端之一,Parity一直受到社區的批評。最近,Ricardo Guilherme Schmidt在Gitter上發布聲明稱,考慮到Parity beta遇到問題,Parity不再是最好的以太坊客戶端。 作為對Schmidt的回應,Parity公司的Joshua Mir表示,該團隊希望他們的以太坊客戶端“盡可能地出色”。然而“社區中愿意(也有能力)從事這項工作的人要少得多”。他還表示,與Geth的Go編程語言相比,由以太坊客戶端部署的rust語言不那么受歡迎。并且一段時間以來,以太坊社區對Parity的情緒一直在下降。這激怒了以太坊社區成員,有人質疑以太坊基金會今年初是以什么理由向Parity Technologies授予了500萬美元。(ambcrypto)[2019/9/25]
也不提供 Sybil 抵抗機制
哪些參與者存儲或請求哪些信息(來自其他參與者好奇的眼睛)的隱私不受保障
考慮到這一點,我們可以回到關于如何實現公告板及其讀/寫操作的中心問題。編碼塊存儲在哪里?它們如何到達那里?社區正在考慮的三種主要方法是:
GOSSIP:使用一個 gossip 網絡分散編碼塊。例如,每個編碼塊可能有一個主題,負責存儲某個塊的節點可以訂閱相應的主題。
DHT:將編碼塊上傳到 DHT 中。然后,DHT 將“自動”為每個參與者分配他們應該存儲的塊。
REPLICATE: 來自附近副本的樣本。一些節點存儲數據的完整(或部分)副本,并將塊請求提供給采樣節點。
這些方法的挑戰是:
如何確保“公告板上有足夠的空間”開始(即,有足夠的參與者訂閱了 GOSSIP 中的每個主題,或者每個節點可以存儲它需要存儲在 DHT 下的所有塊),以及公告板的所有部分隨著時間的推移而保持在線?(理想情況下,為了確保可伸縮性,我們甚至希望高效地使用存儲,即誠實節點存儲的內容之間不應存在太多冗余。)在一個真正無許可的系統中,這將特別棘手(在該系統中,節點來來去去,并且可能沒有 Sybil 抵抗機制),因此大部分節點可能是對抗性的并且可能在瞬間消失。幸運的是,在區塊鏈環境中,通常存在一些 Sybil 抵抗機制(如 PoS),并可用于建立聲譽,甚至進行攻擊,但關于如何利用 Sybil 抵抗機制來保護對等網絡層,還有很多細節有待確定。
在前一點上進行擴展,因為網絡是共識的基礎,因此是所謂拜占庭容錯(BFT)系統的基礎,網絡層本身最好是 BFT——但如前所述,流行的 gossip 或 DHT 協議(如 GossipSub 或 Kademlia)并非如此。(即使是 REPLICATE 也可能面臨這一挑戰,因為 DHT 仍可能用于網絡堆棧的其他部分,例如用于對等節點發現;但此時,但在這一點上,DHT 的挑戰成為普遍的網絡層問題,而不是特定于數據可用性采樣。)
最后,一些人認為,從長遠來看,節點應該存儲或轉發不超過一個區塊的一小部分,否則可擴展性和支持相對“弱”參與者(參見去中心化)的可能性是有限的。這與 REPLICATE 是對立的。對于 GOSSIP,這需要大量的廣播組(“主題”),每個廣播組都有少量訂閱者,在這種情況下,gossip 協議往往變得不那么可靠。在任何情況下,上述方法都會帶來開銷,例如,代表其他節點轉發數據塊的帶寬不得超過單個節點的預算。
挑戰 D:我們“如何”實施隨機抽樣?這個問題有兩個方面:期望的塊如何在網絡中定位和傳輸(即如何從公告板上“讀取”),以及如何確保采樣相對于對手“保持隨機”,即,對抗性區塊生產者沒有(太多)機會根據誰查詢哪些塊來自適應地改變其策略。
當然,直接從區塊生成者那里進行采樣不是一個可行的選擇,因為這需要來自區塊生產者的高帶寬,并且如果每個人都知道區塊生產者的網絡地址,則會產生相關的拒絕服務向量。(可以通過 DHT 和 REPLICATE 的鏡頭查看一些涉及從區塊生產者拉取的混合結構)
另一種方法是在使用上述方法之一(GOSSIP 或 DHT)分散塊后從 swarm“群”中采樣。具體來說:
(1)在使用 GOSSIP 或 DHT 分散塊之后,DHT 可能會方便地路由采樣請求和隨機采樣塊,但這會帶來上面討論的挑戰,最明顯的是缺乏 BFT 和隱私。
(2)或者,在 GOSSIP 下,每個節點都可以訂閱與其想要采樣的塊相對應的主題——但存在上述挑戰:除了缺乏 BFT 和隱私之外,擁有大量主題而每個訂閱者都很少會導致不可靠的通信。
REPLICATE 可以在“來自區塊生產者的樣本”和“來自群體的樣本”之間進行折衷,其中從數據的完整副本中抽取塊,并在網絡對等方之間識別副本。
請注意,上面只解決了采樣(現在從公告板“閱讀”),而不是將來任何時候從公告板“閱讀”。具體來說,GOSSIP 本質上實現了一個臨時公告板(只能在其內容被寫入/分散時讀取/采樣),而 DHT 實現了一個永久公告板(也可以在很長時間之后讀取/采樣)。通常,我們需要的是一個永久性公告板(根據具體設計,永久性要求從“天”到“永遠”不等),為此,GOSSIP 必須輔以 DHT 來路由塊,這會帶來上述挑戰。而 REPLICATE 會立即實現永久公告板。
下表說明了不同 P2P 協議來實現模型的不同情況。具體地說,面向 gossip 的方法有兩種變體,一種使用 gossip 對塊進行采樣,另一種使用 DHT 對塊進行采樣。相比之下,面向 DHT 的方法完全依賴于 DHT 進行所有相關操作。在面向 replication 的方法中,每個節點使用請求/響應協議從附近的完整副本中讀取/采樣塊。它有效地使用 gossip 進行塊的初始傳播,盡管兩個對等方之間的 gossipping 在技術上可以通過請求/響應協議來實現。
此外,在上述所有技術中,“誰采樣了什么”被(至少部分)泄露給了攻擊者,因此攻擊者可以通過自己的行為自適應地削弱/促進某些節點采樣的塊傳播,從而欺騙某些節點相信該塊是(不)可用的。雖然早期的工作表明只有少數節點可以被欺騙,但這是不可取的。或者,早期的工作假設匿名網絡通信,這在實踐中至少會帶來相當大的性能損失,如果不是完全不切實際的話。
挑戰 E:如何“修復”公告板的內容?也就是說,如果編碼塊丟失(例如,因為存儲該塊的節點已經離線;這是如何檢測到的?),它是如何恢復的?簡單的修復涉及解碼和重新編碼,因此會帶來相當大的通信和計算負擔,特別是對于常見的 Reed-Solomon 糾刪碼。誰來承擔這個負擔?他們如何得到補償?如何避免惡意區塊生產者通過保留一些編碼塊,并迫使節點花費資源進行昂貴的修復來傷害采樣節點?分布式維修方案呢?修復所需的塊是如何檢索到的,這回到了上一點關于將來從公告板上“讀取”的問題。
挑戰 F:激勵。如果采樣是免費的,如何防止拒絕服務向量?如果抽樣需要付費(如何實施?),如何同時做到完全匿名?那些在對等網絡中存儲(部分)公告板、路由信息或執行諸如塊修復之類的維護任務的人如何獲得補償?
為了完整起見,我們簡要提及一個稍微不同的模型,DAS 實現了稍微不同的保證。即使沒有匿名和可靠的網絡,攻擊者也最多可欺騙一定數量的誠實節點,使其相信不可用的文件可用。否則,它將不得不釋放如此多的塊,以便從誠實節點獲得的所有塊的聯合中恢復文件。該模型的優點是,網絡所需的屬性更容易實現(特別是當對等網絡被對手破壞時)。缺點是對單個用戶沒有具體的保證(你可能就是少數被騙的人!),并且目前還不清楚如何收集誠實節點獲得的所有樣本并恢復文件(特別是當 P2P 網絡已被對手破壞時)。
根據這篇博文中提出的觀察和論點,我們認為以下將是未來關于數據可用性研究和開發的一些有趣方向:
顯然,為了保護網絡層,一些 Sybil 抵抗機制是必要的(目前,可以說,網絡協議通常隱含地依賴于 IP 地址的稀缺性,例如,參見 GossipSub v1.1 的對等評分)。方便的是,共識層正好提供了這一點,例如,以權益證明(PoS)的形式。因此,在網絡層上重用共識層的 Sybil 抵抗機制似乎是很自然的,例如從驗證器集中在 gossip 協議中采樣一個節點(從而“繼承”共識的誠實多數假設力量)。雖然這可能不會立即保護非積極共識參與者的節點的網絡,但它可以幫助在共識節點之間建立安全的“主干”(從而加強共識安全),并隨后可能成為為每個人提供更好安全的墊腳石。這條道路上合乎邏輯的下一步,將是仔細分析共識和網絡與這種共享的 Sybil 抵抗機制的相互作用(這是最近朝著這一方向邁出的第一步)。
改進的 gossip 和 DHT 協議:(參見本調查?)
(1)拜占庭容錯 (BFT),特別是使用共識層常見的 Sybil 抵抗機制
(2)效率(特別是對于 BFT 變體,迄今為止,它們具有相當大的開銷和/或較低的抵抗能力)
(3)隱私保證(改進的保證,更好的效率/更低的開銷)
修復機制:
(1)以分布式方式實施修復(具有局部性的糾刪碼?)
(2)研究和設計相關的激勵措施
致謝:特別感謝 Mustafa Al-Bassam、Danny Ryan、Dankrad Feist、Sreeram Kannan、Srivatsan Sridhar、Lei Yang、Dan Robinson、Georgios Konstantopoulos 以及 Dan Lee 對本文早期草稿提供的富有成果的討論和反饋,并感謝 Achal Srinivasan 提供了漂亮的插圖。
DeFi之道
個人專欄
閱讀更多
金色早8點
Bress
鏈捕手
財經法學
PANews
成都鏈安
Odaily星球日報
NFT 持有者的知識產權問題可能是“未來虛擬世界的一個巨大問題”。當你購買 NFT 時,你買的是什么?大多數人將購買 NFT 稱為“購買 jpeg”,即您在虛擬形象和 OpenSea 等市場中在.
1900/1/1 0:00:00原作:@ljin18, cofounder @VariantFund,@AtelierVentures 粉絲文化 Web3 目前最重要的趨勢之一就是對粉絲文化的重新構想.
1900/1/1 0:00:00DAO 通過激勵用戶參與活動,以促進其商業目標;同時它使個人能夠一起工作,最大限度地減少信任,并保持對審查和脅迫的抵抗。為了促進這一點,DAO 需要不同層次的復雜智能合約、組織結構和治理.
1900/1/1 0:00:001.DeFi代幣總市值:444.27億美元 DeFi總市值 數據來源:coingecko2.過去24小時去中心化交易所的交易量34.
1900/1/1 0:00:00恭喜8月18日我的免費課程《洞察市場》,逃頂成功!!!!!大家可以在APP【財富密碼】—【財富密碼榜—【保羅大帝?洞察市場】.
1900/1/1 0:00:00來源:首席人物觀微信公眾號 撰文:未未 我是 Web3 世界的小白。準確點,我是一個在移動互聯網世界還步履維艱的小白.
1900/1/1 0:00:00