作者:陳天
前言:為紀念中本聰發表比特幣白皮書10周年,ArcBlock研發副總裁陳天特撰此文闡述他對區塊鏈與數據庫的關系的獨特觀察和思考。
10月31日,陳天發朋友圈感慨自己投身區塊鏈創業“半年過去了,無數打了雞血的三點鐘群已經悄無聲息,一票在泡沫里仰泳的投機者消失了,而我,像鉆進了兔子洞的愛麗絲,徜徉在這個奇妙的世界里……”
如果說牛頓的經典物理是愛因斯坦相對論在低速環境下的一種體現的話,我們所熟知的數據庫技術,可以認為是區塊鏈技術在弱分布式環境下的一個特例。
「弱分布式」環境是我胡扯的一個詞,你可以將其理解為節點數量極其有限,運行環境高度可控的一種分布式環境。一個數據庫集群運行在同一數據中心,或者不同數據中心,只要是同一個管理者,那么這就是可控的運行環境。在可控的運行環境下,默認不存在「作惡」的節點,也就無所謂BFT,因此我們不需要復雜的共識算法,一般兩階段提交或者paxos/raft就能收斂共識,滿足需要。所以,數據庫的共識算法是區塊鏈共識算法的特例。
在區塊鏈的世界里,交易和交易產生的狀態是嚴格分離的。若干交易由被共識算法選擇出來的礦工驗證并打包成為區塊并廣播出去,然后網絡里其他參與者驗證區塊中每個交易的合法性,并寫入自己的statedb。在bitcoin里,statedb是UTXO,在ethereum里,則是其worldstate。
數據庫的世界里仿佛沒有類似于區塊鏈的交易記錄,但仔細想想,它的交易歷史其實就是WAL。從外界接收到的請求,數據庫會先將其寫入WAL,確保其進入持久化存儲,才會往它自己的“states”里面寫入。從這個角度,我們可以認為WAL里的每一個記錄,就對應區塊鏈里的一個交易,它是區塊鏈交易的特例。
Efficient Frontier完成千萬美元融資,Alameda Research等參投:12月3日消息,加密貨幣做市商Efficient Frontier宣布完成一輪千萬美元融資,Alameda Research、Animoca Brands、Kyber Ventures、ICON Foundation、Starkware、INX、Hillrise Ventures、BitMart和Cadenza Ventures等參投,具體融資金額暫未透露。[2021/12/3 12:48:10]
如果你再認真思考一下,WAL,blockchain,以及MartinFowler很早就提倡的CQRS在這個層面上其實都是「一中各表」:大家都強調「事件」和「狀態」的分離,通過前一個狀態+當前事件,可以推演出當前狀態。這樣,我們只要有一個初始的「狀態」,然后記錄系統發生過的所有的「事件」,就可以復原任意一個時刻的「狀態」。
我們回到交易和容納交易的「區塊」。你會發現,「區塊」是一個怪怪的存在,為什么數據庫不需要「區塊」這樣的概念作為容器裝載「交易」,而區塊鏈卻需要呢?我們知道,在區塊鏈的世界里,不確定性和確定性仿佛一對孿生兄弟,確定的是規則,不確定的是規則的執行者。所謂礦工輪流做,下回到我家,那怎么定義一個「回合」呢?為了回答這個問題,我們需要某種機制明確一個回合礦工地位的起止——這個起止就是一個「區塊」。不僅如此,在一個物理時鐘并不一致的分布式環境下,「區塊」還承載著全局時鐘的功能,滴答滴答將整個網絡往前推進。「區塊」的概念是如此重要,以至于它當仁不讓地成為共識算法的基礎——大家先得對下一個要出的區塊序號達成共識,否則這個游戲無法進行。反觀數據庫系統,在一個數據庫集群中,master是固定的,master令旗一揮,slave就迅速跟進,指哪打哪,不存在輪流坐莊,也就無所謂回合,所以其實每個「交易」就是一個「區塊」。所以在數據庫的世界里,邏輯上每個交易,或者說WAL的每個記錄,自成一個隱性的「區塊」。
Valour與Arcane Crypto簽署意向書計劃上市加密基金ETP:DeFi Technologies全資子公司Valour與加密基金Arcane Crypto全資子公司Arcane Assets AS簽署意向書,旨在探索基于加密基金Arcane Crypto的交易所交易產品(ETP)的發行和上市。ETP將是第一個將加密貨幣基金作為基礎資產的公司。Valour和Arcane Assets正在制定最終的合作協議和發行計劃,預計將在今年晚些時候完成。(NewsWire)[2021/6/16 23:41:59]
我們從另一個角度來探討這個結論。「區塊」的另一個重要的作用是crashrecovery。在一個區塊鏈網路中,某個節點無論是斷網還是崩潰,其狀態和網絡中達成共識的狀態必不一致,那么,如何從這種不一致的狀態恢復同步的狀態呢?答案是「區塊」,因為它是唯一明確的共識的產物。節點總是能夠找到最近的commit的和網絡中一致的區塊高度,然后從這個高度往后一個區塊一個區塊同步,依次運行區塊中包含的所有交易并更新本地的狀態,最終可以保證和網絡中的狀態達成一致。在這里,「區塊」就是檢測和達成狀態一致的最小單元。而在數據庫系統中,在崩潰發生后,系統會從其他節點同步最新的WAL,并從上次commit的WAL的位置往后一個記錄一個記錄執行命令,直到所有記錄運行完畢,這時數據庫狀態恢復到集群的當前狀態。在這里,WAL的記錄是檢測和達成一致的最小單元,所以我們稱其為隱性的「區塊」,沒毛病。
在區塊鏈的世界里,一筆交易需要被驗證。這里的驗證有兩重含義:1)身份驗證——交易是由其發起人正確簽名的;2)完整性驗證——交易對狀態的變更是合法的。身份驗證好理解,你用自己錢包的私鑰簽名給我轉1個ABT的交易,系統會驗證你的確是你;完整性驗證則是指在statesdb里,你的賬號下的確有超過1個ABT的token,才能發起這個交易。在數據庫的世界里,身份驗證直接赤果果用諸如RBAC的訪問控制系統解決了,而完整性驗證和區塊鏈類似。
Starcoin主網于5.18日12:15正式啟動:Starcoin主網已于Barnard網絡高度達310,000時正式啟動,即2021年5月18日(周二)北京時間12:15。此高度區塊的哈希已作為Starcoin主網創始塊的父哈希,并生成創世區塊。
Starcoin是按分層方式架構并為分布式金融而設計的區塊鏈項目,目標建立一套簡單的金融基礎設施,并使用了智能合約語言Move。[2021/5/18 22:14:20]
接下來我們看看確定性。所謂確定性,就是在同一個狀態Sn-1下,大家拿著同樣一筆交易,不依賴任何第三方信息獨立執行,執行的結果完全一致。這一點僅就純粹的從交易到statesdb的處理來說,區塊鏈和數據庫是完全一致的,大家都能保證確定性。然而,如果某個區塊鏈要支持交易中攜帶額外信息,這些信息觸發某些鏈上部署好的代碼的執行,那么,我們就得注意代碼本身需要具備確定性。所謂確定性,無非是:
代碼中不要使用不確定的隨機數生成器——比如使用計算機的時鐘作為種子生成隨機數,這就是不確定的。因為交易在被執行的那一刻,我們無法保證所有參與者的時鐘是精確同步的。
代碼避免使用多線程。多線程引發的racecondition具有不確定性。
不要使用系統時鐘。不解釋。
不要使用未初始化的內存。鬼知道上面是陳冠希還是諸子百家。
不要使用浮點數——這個很奇葩,因為不同的CPUarch,編譯器,甚至不同CPU型號間,由于支持的浮點數指令集不同,會導致結果不同。
Coinbase任命Marcus Hughes為歐洲區主管:金色財經報道,Coinbase正在重塑其歐洲業務高層,Marcus Hughes將接替Zeeshan Feroz擔任主管。Hughes本月初接管了Coinbase的國際法律團隊。Coinbase表示,他將監督Coinbase在歐洲的持續擴張。[2020/8/26]
不要使用編程語言的可能有隨機行為的數據結構。比如遍歷一個map
基本上避免了這些,代碼就具備了確定性,可以在區塊鏈上執行。那么,為什么數據庫中的存儲過程可以允許沒有確定性的代碼的執行?比如,一個存儲過程里可以使用當前時間插入一條記錄?我們如果再回歸本源,從「交易」的角度看待問題,可以發現,存儲過程類似于“off-chain”執行的代碼,它雖然植根于數據庫之中,但其實是「交易」的源頭,存儲過程的執行產生真正的交易,也就是WAL記錄,然后同步給其它節點。所以存儲過程可以non-deterministic,因為其產生的WAL記錄已經是deterministic的——添加一條帶當前時間的記錄這件事情,在master執行時,已經將取「當前時間」這個動作完成并得到一個確定的值,攜帶于WAL之中。這跟區塊鏈的smartcontract的概念有本質的區別,這也是為什么存儲過程可以不必具備確定性,而“on-chain”執行的smartcontract需要確定性。從這個角度來講,數據庫系統也是一個弱化的區塊鏈系統。
既然區塊鏈和數據庫存儲的對象都是數據,那么,提過了數據的完整性和確定性,接下來就是數據的一致性。區塊鏈顯然是最終一致性的典范——網絡越大,參與的節點越多,區塊的擴散就越慢,任何時刻在不同的節點上讀取狀態就很大幾率出現不一致的情況。然而,只要節點能同步到最新的區塊,整個網絡的狀態是收斂的,最終大家能夠得到一個一致的狀態數據。其實,按照這個道理,所有使用WAL,CQRS思想的分布式系統,其數據的狀態都是最終一致的——這似乎和我們對經典數據庫強一致性的印象不匹配。然而,如果我們把視角拉到數據庫內部,可以發現,強一致性只不過是最終一致性之上添加了一些條件,是個特例。如果我們假定一個區塊鏈滿足下面的條件:
聲音 | BitMEX Research:IEO“表現不佳”,使投資者損失高達98%:金色財經報道,BitMEX Research的最新統計數據顯示,于2019年推出的IEO已使投資者損失高達98%的資金。BitMEX Research確定了今年推出的十二種主要IEO。與其最初在交易所交易的價格相比,有11個現在幾乎一文不值。有四個IEO為投資者帶來了回報,其表現在7.9%至490%之間。該報告總結說,幾乎所有的代幣都下跌了80%以上。[2019/12/23]
任何節點收到新的區塊,必須在交易執行完成,寫入statesdb中之后,給礦工節點發送確認
礦工節點在收到所有確認之后廣播給網絡中所有節點這個區塊大家已經commit成功
在一個區塊沒有收到礦工節點的上述廣播之前,客戶端發送來的查詢進入隊列排隊
那么在外界看來,它也是強一致性。當然,第三點有些過于苛刻,一般的數據庫實現都會采用MVCC,讓每個client看到當前狀態的一個snapshot,因而存在一個很小的窗口,大家看到的數據是不一致的。如果較真,MVCC不算強一致性,當然沒人會這么認為。
通過上面的規則,數據庫可以通過犧牲一些性能來打造對外而言的強一致性。但有時候,為了一些崇(wo)高(chuo)的理想,數據庫系統也可以打破這些規則來號稱更高的性能。mongdb可以在cluster的環境下,寫操作不需要節點確認即可返回,于是有了美其名曰的,如薛定諤的貓一般的「弱一致性」。
一個區塊鏈網絡理論上可以通過上述規則把自己營造成對外強一致性的感覺,但這實際上沒有可操作性。能力越大,責任越大網絡越大,延遲越大,所以,實際可操作的強一致性只能發生在節點數量很少,且節點都在同一個datacenter的環境下。從數據一致性的角度來說,數據庫也是區塊鏈在特殊場景下的一個特例。
最后說說性能。性能這事,和網絡規模成反比。兩個主要原因:1)節點越多,達成共識的難度就越大。2)節點越多,「交易」在網絡中傳播所需的時間就越長。那想要達到宇宙無敵的TPS怎么辦?其實不難——既然數據庫是一個弱分布式環境下的特例,那么,咱就把區塊鏈往數據庫的方向退化就好。PoW說「王侯將相,寧有種乎」,讓全網參與鐵王座的競爭,PoS就讓「一小部分人先富起來」,DPoS再進一步,「讓領導先走」,也許不久的將來,有人會則憋出終極大招,全網就一個九五之尊,把數據庫里能用的招數,replicaSet,Sharding等等統統用上,再使用兵法中不戰而屈人之兵之術:「今治水軍八十萬眾,方與將軍會獵于吳」…于是,可以名正言順地搶下性能的桂冠。
只不過…就像非誠勿擾里車曉問葛優:那事兒,就那么有意思嗎?
ArcBlockTechnicalLearningSeries第七期
Tendermint:ConsensusMadeEasy
下周三,11月7日下周三上午8時,由ArcBlock研發副總裁陳天授課,介紹Tendermint及其架構,共識算法如何工作,以及如何復制應用程序數據。
主講
陳天
ArcBlock研發副總裁
●前舊金山創業公司TubiTV研發副總裁,比圖科技(TubiTV中國全資子公司)總經理,創建中國團隊,并領導TubiTV研發團隊在過去兩年半時間幫助業務成長數十倍
●前JuniperNetworksTechLead&Sr.StaffEngineer
●2011-2013曾在北京創立在線旅游創業公司途客圈,獲創新工場和金沙江投資,在結束途客圈的創業生涯后,將創業經歷撰寫成《途客圈創業記》一書,由人郵出版社出版。
●技術愛好者,涉獵網絡安全,云計算,分布式系統和區塊鏈。主力語言:elixir,nodejs和python。github:tyrchen。
●公眾號「程序人生」(programmer_life)作者,知乎專欄「迷思」作者。自2014年以來,撰寫技術文章近四百篇,很多文章被知乎日報推薦。
報名聽課,登錄官網注冊:
https://hack.arcblock.io/learning/
或登陸掘金注冊:
https://juejin.im/events/all
或掃描二維碼注冊:
ArcBlock課堂①|IntrotoGraphQLandAbsinthe
ArcBlock課堂②|IntrotoEthereumSmartContract
ArcBlock課堂③|IntrotoAWSDataPipelineServices
ArcBlock課堂④|IntrotoAWSAthena
ArcBlock課堂⑤|WhatisAWSKinesis
ArcBlock課堂⑥|多步驗證那些事
ArcBlock課堂⑦|IntrotoCQRSandCommanded
Tags:ARC區塊鏈BLOSTAHelper Search Token區塊鏈dapp游戲blockchain的域名價值NESTA
家庭智能終端產品 雙十一預售火熱進行中, 敬請關注! 據悉INTChain與中國電信聯合開發的天翼區塊鏈路由器,是一款集成了多個功能的家庭智能網關類產品.
1900/1/1 0:00:00對技術的渴求與探索是驅動NEO不斷進步的動力,隨著社區規模的擴大,越來越多的開發者涌入NEO社區,對于NEO一定有自己的技術見解.
1900/1/1 0:00:00CyberMiles主鏈于北京時間10月15日正式上線后,超級節點候選人蓄勢待發,19個創世節點陸續誕生,CMT全球社區生態的布局和建設進入全新升級階段,護航CyberMiles開啟電商新紀元.
1900/1/1 0:00:00親愛的用戶: DigiFinex將于2018年11月06日15:00(GMT8)上線Humanscape(HUM)并同步開啟充幣服務.
1900/1/1 0:00:00親愛的用戶: DigiFinex聯合HDN項目方將于2018年11月14日10:00(GMT8)開啟“邀您瓜分50萬HDN糖果獎勵”.
1900/1/1 0:00:00波場TRON|小課堂 在日常工作中,我們經常能夠收到來自社區用戶對關于項目、數字資產、區塊鏈的提問,波場TRON為了向大家更好的展示去區塊鏈去中心化的優勢,普及區塊鏈基礎知識.
1900/1/1 0:00:00