“roughtime”事件分析報告
作者:Terence、Raul、Preston狀態:等待決議。根本原因已找到,問題已緩解。網絡:Medalla總結:Cloudflare的roughtime服務器全都返回錯誤信息,而Prysm節點并沒有采取適當的應急措施。這個bug導致所有Prysm節點出現時鐘偏移。在時鐘偏移的影響下,驗證者為超前的slot提議區塊并生成見證消息。影響:由于roughtime響應錯誤以及出現時鐘偏移,驗證者計算slot錯誤,提議的區塊和生成的見證消息均無效。這個問題影響到了全局參與度。在北京時間凌晨1:30至2:45之間,所有Prysm節點都受到了影響。根本原因:來自Cloudflare服務器的roughtime響應出錯。具體來說,是因為“ticktock”報告了一個24小時之后的時間。這個時間戳,再經過所有6個服務器的數據取平均值,是的所有Prysm節點都產生了+4小時的時間調整。解決方案:在我們評估roughtime響應錯誤所引發的潛在問題時,先將roughtime時鐘同步設為可選項。發現:Terence最先發現了這個問題。他注意到一個本地信標鏈節點一直在拒絕超前的區塊和見證消息。幾分鐘之后,由于roughtime時鐘偏移量較高,產生了報警。同時,#general和#bug-report頻道的用戶開始報告本地節點拒絕超前區塊和見證信息的問題。
今日恐慌與貪婪指數為26,恐慌程度與昨日持平:金色財經報道,今日恐慌與貪婪指數為26(昨日為26),恐慌程度與昨日持平,等級仍為恐慌。
注:恐慌指數閾值為0-100,包含指標:波動性(25%)+市場交易量(25%)+社交媒體熱度(15%)+市場調查(15%)+比特幣在整個市場中的比例(10%)+谷歌熱詞分析(10%)。[2023/1/11 11:05:49]
經驗教訓
哪里出了問題我們誤以為,對于roughtime服務器故障的問題,我們有適當的應急方案。網絡中的每個Prysm節點同時受到影響,導致驗證者參與率大幅降低。PrysmaticLabs團隊原以為,NTP服務器本身較為分散,而且每個服務器都開放6個端口,不會出現全局故障的問題。萬幸的是一位貢獻者已經向我們提交了一個PullRequest,把roughtime時間校準設為可以選擇退出的功能。我們已經可以用命令行功能標簽立即選擇取消roughtime時鐘校準,這讓修復措施變得簡單,而且只需一次PullRequtest就能驗證。用戶在Discord上積極參與討論。當節點出現問題時,有大量用戶提供了詳細報告和重要指標。我們有一個持續不斷的重同步機制,當它發現時鐘偏移量超過2秒時,它會不斷更新節點本地的時間。我們一直在重新校準roughtime時鐘,以便更快解決這一問題。這可能讓這次事件提前了大約30分鐘至1小時結束。roughtime時鐘同步問題似乎在大約90分鐘后就解決了,而且在我們能夠緊急發布新版本前,這個事件就已經結束了。時間線2020/08/151:25AM:Terence發現他的本地節點由于一直拒絕超前區塊,收到了大量報警。這些區塊的slot都超前了4個多小時。1:28AM:Prometheus監控報警系統收到了roughtime偏移量高的報警。那時,距離網絡最后一次敲定區塊過去了10epoch。1:35AM:至少有30名用戶在Discord頻道表示他們開始收到下方報警:WARNroughtime:Roughtimereportsyourclockisoffbymorethan2secondsoffset=4h0m0.028854657s1:43AM:Terence在#war-room頻道群發了告警消息,稱這是一個PS0級別的事件,需要大家共渡難關。1:45AM:Discord頻道的用戶提出,重啟信標鏈節點和驗證者客戶端無法暫時解決這個問題。最可行的方案是將roughtime時鐘同步設為可選禁用的功能。1:51AM:問題上升到了多客戶端聊天室1:52AM:Ivan完成了https://github.com/prysmaticlabs/prysm/pull/68982:00AM:Terence與512位驗證者一起在本地測試了6898號PullRequest。2:20AM:據已捕獲的調試日志顯示,“ticktock”服務器有段時間一直在報告24小時之后的時間。
幣安將下架SRM、RAY杠桿及幣安理財相關產品:11月17日消息,據官方公告,幣安宣布將下架SRM、RAY杠桿及幣安理財相關產品,幣安將于11月23日11:00移除以下杠桿交易對并停止交易,包括SRM/BTC、SRM/BUSD、SRM/USDT、RAY/BUSD、RAY/USDT全倉杠桿交易對和逐倉杠桿交易對。
幣安賺幣將于11月23日11:00下架SRM活期產品, 以及RAY活期與定期產品。幣安流動性挖礦將于11月23日11:00下架RAY/USDT、RAY/BNB幣對池。用戶如于上述幣對池中持有資產,系統將于11月23日11:00自動將資產退還至用戶的現貨錢包。[2022/11/17 13:15:17]
2:27AM:Raul聯絡了Preston。Preston將在1小時內回來構建新版本。同時,我們將發布docker鏡像。2:40AM:Preston指出只靠緊急修復還不夠,我們需要取消將roughtime時鐘同步作為默認項。2:42AM:Raul開始調查Kibana,并使用fluentd中的filter分析來自roughtime的調試日志響應。2:43AM:Terence交叉檢查了信標鏈命名空間中所有pod的kubectl日志。正如預期的那樣,pod確實存在roughtime時鐘偏移問題。2:46AM:Raul向6898號PR提交了正確的修復程序。3:05AM:Raul確認該修復程序可以讓節點在本地工作。如果存在時鐘偏移,修復程序會產生告警日志,但是不會試圖基于roughtime服務器更新時間。3:08AM:Terence在我們的discord頻道向所有人宣布:“Prysm節點出現roughtime響應錯誤,應急措施沒有達到預期效果。我們已經找到了故障所在,很快就會進行緊急修復,并在1小時內上線新版本。在即將發布的新版本中,roughtime時鐘同步將不再是默認項。”3:18AM:Buildkite單元測試、規范測試、docker鏡像構建成功。e2e測試尚未完成。Preston準備啟動上線流程。3:22AM:新版本生成:https://github.com/。Terence確認這個方法可以修復其驗證者節點。Preston開始使用新的docker鏡像依次重啟我們的有狀態集合中的pod。集群驗證者會基于新的鏡像進行更新。3:34AM:Docker鏡像被標記成alpha21版本,穩定性好,二進制文件已經構建完成3:34AM:對有狀態集合中pod的健康狀態進行監控,確保滾動更新成功3:36AM:使用新的docker鏡像對我們的驗證者pod進行滾動啟動。4:29AM:在日志上查看返回的延時值。平均來看,這些值似乎都在0.1秒以下。延遲不是調查的關鍵指標。準確來說,“中點”才是需要研究的地方。注:下表時間是太平洋標準時間。https://kibana.prylabs.network/
中東加密貨幣交易所Rain Financial再次裁員:9月1日消息,中東加密貨幣交易所Rain Financial進行了一輪裁員,不過未披露具體裁員人數。Rain Financial表示,“我們不得不調整未來計劃,來確保我們能夠度過這次低迷。”(彭博社)
此前消息,6月份,Rain Financial因市場疲軟已裁員數十名員工。[2022/9/1 13:02:32]
-圖片來源:@prestonvanloon.eth-5:32AM:查看高于2秒的偏移量。從該數據中可以看出,在長達90分鐘的全局故障期間,Prylabs出塊節點的偏移量大約是14000秒。注:下表時間是太平洋標準時間。https://kibana.prylabs.network/
-圖片來源:@prestonvanloon.eth-4:41AM:通過Prometheus報警系統關于平均偏移量的數據,我們可以明顯看出在北京時間凌晨1:30至2:45之間確實存在時鐘偏移問題,之后偏移量開始下降并恢復正常。4:52AM:即時調查結束。這次時鐘偏移故障顯然已經結束,而且修復程序已經發布。已經更新的節點將立即恢復,還沒有更新的節點需要過段時間恢復。監控系統顯示,驗證者參與度在逐步回升。6:20AM:用戶報告說罰沒保護機制已經啟動。這是因為之前的時鐘偏移導致驗證者超前4小時提議區塊并生成見證消息。為了避免遭到罰沒,Prysm驗證者沒有繼續提議無效區塊。8:13AM:再次故障8:13AM:Nishant注意到6898號PR中存在嚴重缺陷。只有在roughtime功能標記開啟的情況下,用戶才能設置它的功能。8:16AM:Preston更新了“最新的”二進制文件,使其指向alpha20版本來實現臨時回滾,并建議用戶回滾至alpha20版本。我們現在正在等待合并7004號PR作為alpha22版本的候選。8:45AM:值班團隊正在評估是否擴大熱狀態緩存的大小,以便alpha22版本能夠更快讓網絡重新開始敲定區塊。當前默認的熱狀態緩存大小為8個epoch,但是Medalla測試網距離上一次敲定區塊已經過去了將近100個epoch。9:12AM:值班團隊決定將默認緩沖大小更新至64epoch,并使其可以通過功能標記來配置。經過初步測試,這有可能會使內存使用量增加1.5G。等網絡重新開始敲定區塊后,緩沖大小還可以調整。9:57AM:所有PrysmaticLabs驗證者節點都生成了會被罰沒的見證消息。緊急修復程序刪除了Prylabs驗證者節點的本地存儲。沒有任何外部的罰沒保護機制在運行。具體情形尚待確認……在1024名驗證者中,至少有800名驗證者已經或即將遭到罰沒。10:37AM:多名用戶報告稱無法同步區塊鏈。目前的問題是,網絡中有太多節點在同一時間進行同步。Alpha22版本被推遲,需要等待進一步通知。10:46AM:Prylabs團隊認為現在最好的辦法就是等待。用戶應該運行alpha20版本或最新的docker鏡像。2020/08/162:12AM:正在對同步難的問題進行調查。11:36AM:Nishant和Victor發布初始同步修復程序。參見PullRequest7012。2020/8/171:51AM:合并拉取7012號PR。一些用戶報告說同步成功。PrysmaticLabs開始將7012部署到出塊節點上。5:15AM:從commit0be1957c2897909b943b80fdd028f5346ae6cde6開始開發Alpha.22版本5:33AM:Alpha22版本發布。鏈接:https://github.com/5:40AM:通過Discord頻道宣布Alpha22版本上線。Prysmatic的值班團隊繼續監控同步情況,以便進行優化。與此同時,越來越多用戶同步至最新區塊。12:53AM:Alpha23版本上線,已在Discord頻道宣布該消息。Alpha23版本包含一些同步修復程序,有望解決Medalla測試網的問題。建議用戶在運行時開啟“--dev”標記,以便獲得更好的體驗。
歐漫《星際特工》Valerian NFT將于7月10日前發售:6月17日消息,歐漫《星際特工》Valerian NFT所有NFT特性組件和元數據都已更新為IPFS,將于7月10日前發售,同時將啟動Web3.0。此外,其生態第一個基于創造者經濟的Web 3.0社交網絡聚合器將于近期公布。
Valerian NFT是基于歐洲漫畫《星際特工》IP推出的系列NFT。據悉,Valerian NFT總量為9999個,將在Binance NFT、Valerian官網同步發行。[2022/6/17 4:35:23]
PeckShield:KnownOrigin 的 Discord 已被攻擊,用戶不要點擊任何私信或鏈接:6月14日消息,PeckShield預警顯示,NFT 發現和交易平臺 KnownOrigin 的 Discord 已被攻擊,knownoriginpass.io是釣魚網站,請用戶不要點擊任何 Discord 私信或鏈接。[2022/6/14 4:25:01]
火幣集團新組建的去中心化金融部門DeFi實驗室,今天宣布發起成立全球DeFi聯盟,由全球中心化和去中心化金融服務商及平臺共同促成.
1900/1/1 0:00:00編者按:本文來自頭等倉區塊鏈研究院,Odaily星球日報經授權轉載。在加密貨幣的圈子里,投資人面臨技術風險,即代幣儲存在錢包或者智能合約時,存在被駭客攻擊或者盜走的風險.
1900/1/1 0:00:00文|昕楠編輯|郝方舟出品|Odaily星球日報 從5G到區塊鏈,科技是中國突圍之路上最大的殺手锏。進入2020年,我國的經濟社會發展面對著新的要求.
1900/1/1 0:00:00編者按:本文來自知礦大學,Odaily星球日報經授權轉載。上周,礦礦在微博上分享了“虧了又虧,虧上加虧”是什么樣的體驗,講述用ETH兌換時下非常熱門的DeFi代幣AMPL后,遇上ETH上漲、AM.
1900/1/1 0:00:008月12日凌晨3點,DeFi項目YamFinance進行了首次代幣分配,并將200萬初始代幣平均分配給8個質押池,每個質押池為25萬枚,初始代幣分配將持續7天.
1900/1/1 0:00:00又是一期央行數字貨幣問與答專題,本期問與答主要從央行數字貨幣是否會完全取代現金?是否產生利息?以及發行央行數字貨幣和采取中心化管理模式的原因這四個問題來進行分析和闡述.
1900/1/1 0:00:00