買以太坊 買以太坊
Ctrl+D 買以太坊
ads

GPO:深挖 ASIC 芯片設計成本,我們問了 ProgPow 核心開發團隊九個問題_ROG

Author:

Time:1900/1/1 0:00:00

Odaily星球日報譯者|Moni

概述

只要與ProgPow和Ethash算法有關,市場上就會出現各種對礦機硬件設計和開發成本的推測,通常后面還會跟上一個權威聲明:請相信發表預測的作者,因為他/她在相關行業領域里擁有豐富經驗。這些推測有時會與加密貨幣ASIC芯片生產有關,還有些時候則是關于集成電路設計。對于那些更熟悉代碼、卻不太了解扇出和上升時間的讀者來說,本文可能會對他們深入了解ProgPow算法有所幫助。程序員總是會給人一種無所不能的感覺,從編寫腳本到開發iPhoneAPP,從嵌入式系統到Windows操作系統。但是,會寫代碼開發應用程序不代表你能成為APPStore應用商店后端的權威人士,能夠開發實時多任務操作系統也不代表你能成為擴展Windows操作系統成本權衡領域里的達人。當然,作為ProgPow算法核心開發團隊,IfDefElse在此并不是說Windows設計師不是“優秀的程序員”,但必須要說明的是,由于不同人的技術背景不同,很容易造成對不同領域的理解和假設偏差,特別是在討論規模經濟話題的時候。同樣地,一名硬件設計師可能也會涉獵不同的領域,比如為一款電動牙刷設計芯片,或是為網絡設備構建一個芯片架構。生產10萬個電動家牙刷芯片的工程師可能不會理解生產100萬個芯片的網絡工程師所考慮的可用規模經濟,同樣一個加密貨幣ASIC芯片設計師可能對GPU-ASIC芯片設計知之甚少——這些行業彼此之間的聯系并不是很多,有的甚至是國與國之間的差距。在概述中我們還要提的最后一點,就是編程和工程其實都是一種技巧,除非你每天都在編程寫代碼,否則很快就會落后、無法成為權威,因為這方面的知識更新迭代很快。或許這也是為什么新的加密貨幣ASIC制造商很難進入基于SHA-256算法的挖礦市場,畢竟一個新手程序員想要趕超已經研究SHA-256算法六年的工程師是不太可能的。另一方面,加密貨幣生態系統里其實并沒有太多文章介紹硬件知識。當然,加密貨幣本身就是一個以軟件為主導的行業,而且絕大多數硬件工程都是在一些私人公司內部“閉門”研究的。有些“硬件磚家”正在竭盡全力向軟件工程師保證他們能夠戰勝加密貨幣生態系統——我們已經在門羅幣、比特幣、以及ZCash等加密貨幣上看到了這種情況已經出現。但現實是,這種挑戰至今仍沒有發生,想想看,如果比特大陸或Innosilicon試圖制造CPU,你認為他們能夠戰勝英特爾和AMD嗎?解析ASIC芯片設計成本

OKX Jumpstart將于2023年4月23日開啟SUI銷售:據OKX官方消息,OKX Jumpstart將于2023年4月23日 (UTC+8) 開啟SUI新幣銷售,活動將采用最新的“認購+抽簽”的方式銷售SUI幣,銷售價格為0.1美元,支付幣種為OKB,這個流程包括持倉統計、新幣認購、抽簽與發放,通過OKX APP,并完成KYC2驗證等條件即可參與活動。同時針對Sui生態的貢獻者,額外開啟白名單銷售。白名單銷售只面向Sui生態的貢獻者開放,用戶需要完成Sui Foundation的白名單驗證。[2023/4/15 14:05:32]

規模經濟總是普遍存在的——不管是從成本角度,還是經驗角度。對于ASIC芯片設計成本,芯片設計師們似乎總是存在很大爭論,下面就讓星球君帶大家一起看看解析一下受到業內關注的九個問題:問題一:不管挖礦算法是ProgPow,還是ETHash,哈希值都是由外部動態隨機存取存儲器的存儲帶寬決定的,是這樣嗎?事實并非如此。ProgPow的哈希值是由兩個因素決定的:1、計算核心2、內存帶寬這就是為什么Ethash和ProgPow之間存在差異,如下圖1和圖2所示:圖1:英偉達芯片產品挖礦哈希率比較

圖2:AMD芯片產品挖礦哈希率比較

現階段,ETHash挖礦更有利可圖,針對該算法的內存需求明顯增加,對于高帶寬存儲器的需求不斷增長也促使下一代高速存儲器技術被開發了出來,比如GDDR6和HMB2。對于高帶寬內存的需求并非全部來自“Ethash”,整個高帶寬內存市場規模高達150億美元,其中只有很少一部分來自采礦行業。高帶寬內存的核心市場需求主要包括:GPU、現場可編程門陣列、人工智能、高性能計算、以及游戲。相比于1.2萬億美元的人工智能市場、300億美元的PC游戲市場、350億美元的手持游戲機市場、以及290億美元的高性能計算市場,挖礦行業的高帶寬內存需求真的是“微不足道”。問題二:由于ProgPow現有架構和算法與ETHash存在相似之處,Innosilicon的下一款ASIC芯片將會為ProgPow量身定制嗎?事實上,ProgPow和ETHash之間唯一的相似之處就是在全局內存中使用了無環圖。從計算的角度來看,ETHash只需要一個固定的“keccak_f1600”內核和一個模數函數。另一方面,ProgPow需要的則是能夠執行16通道寬的隨機數學序列,同時還要能夠訪問高帶寬一級緩存。設計一個能夠執行ProgPow數學序列的計算內核,比設計一個能夠實現類似“keccak”這樣的固定函數哈希要難得多。另外需要注意的是,ETHash的哈希值只取決于內存帶寬,而ProgPow算法則同時取決于內存帶寬和隨機數學序列的核心計算——理解這一點非常重要。工作量證明的本質其實是通過耗費硬件和能源成本進行數學計算證明,作為一種算法,ETHash在數學證明中并不會耗費大部分硬件費用。相反,ETHash只捕獲內存接口,這就是為什么你可以使用一個用于加密貨幣挖礦的ASIC芯片來把數學計算中沒有被捕獲到的部分給消減掉。問題三:由于GPU是通用加速芯片,因此設計、制造和測試GPU的周期通常需要大約十二個月,而且還需要進行大量硬件模擬和軟件開發工作,使其能夠覆蓋不同的計算方案和場景。ProgPoW希望能夠捕獲全部硬件成本,由于該算法更新的部分能夠捕獲運行不同計算場景的計算硬件——直到架構褶皺——因此對于ASIC芯片設計來說,可能需要耗費不止3-4個月的時間。由于時間跨度較長,隨之會引發出另一個問題:為什么浮點運算被省略掉了?這個問題的答案其實也非常簡單:浮點運算不能跨芯片移植,不同芯片往往會以不同方式來處理與特殊值相關的邊界案例。邊角案例也被成為病態案例,是指其操作參數在正常范圍以外的問題或是情形,而且多半是幾個環境變數或是條件都在極端值的情形,即使這些極端值都還在參數規格范圍內。其中最大的分歧在于非數字數值的處理,這會在使用隨機輸入時自然發生,引用維基百科頁面的解釋:如果有多個非數字數值輸入,其有效負載結果應該來自其中一個非數字數值輸入,但標準卻沒有具體說明。這意味著,如果要使用浮點運算的話,基本上每個浮點都需要進行“if)val=0.0”檢查配對,這種檢查通常可以在硬件中完成,因此也會讓用于加密貨幣挖礦的ASIC芯片從中受益。接下來,哈希率和“hash-per-watt”又是什么呢?哈希率是衡量能源成本的指標,只要每個人都以同樣的方式進行衡量,每單位的能源消耗就不那么重要——礦工也會繼續投入盡可能多的能源挖礦。不過即便你把測量單位從1ETHash切換成1ProgPow-hash,運營成本的經濟性其實也不會發生變化。全局哈希率會評估每個人對保護網絡共享的總經濟權重,只要每個人的貢獻都被公平地衡量且使用相同的單位,對于普通礦工來說,切換到ProgPow算法不會帶來什么變化。當然,有人會說如果以太坊實施了ProgPow算法可能會有助于把礦工集中在擁有高端GPU的大礦場里,同時也會刺激礦場把GPU升級到最新型號。但是ProgPow算法開發團隊IfDefElse需要再次重申的是:規模經濟永遠都會存在,而且也是現實世界里無法避免的事實。問題四:相比于GPU,ASIC芯片生產商可以使用較小的GDDR6內存來獲得成本優勢。在保持內存成本水平的同時,16個GDDR64GB的內存條能夠實現兩倍的帶寬優勢,是這樣嗎?首先,擁有兩倍的帶寬優勢就需要兩倍的計算,這其實是一種線性擴容,并不能看做是一種優勢。其次,我們目前應該還沒有為GDDR6準備好生產4GB內存芯片的準備。全球第三大內存芯片廠商Micron只生產8GB芯片,三星則生產8GB和16GB芯片。對于內存芯片而言,GDDR6IO接口區域是非常昂貴的,而且與存儲器單元相比,每一代接口都占用了更多的實際存儲器管芯,由于端口物理層不能像存儲器單元那樣通過工藝手段縮小。不可否認,真正推動內存市場的是一些“長周期買家”,比如游戲機、GPU等,他們也傾向于支持容量更大的內存。事實上,如今的內存供應商沒有動力去大批量生產一個4GB的內存,畢竟市場對這種內存容量的需求并不大。問題五:RTX2090芯片中有許多模塊占用了大量芯片模片區面積,而且對ProgPow毫無用處,包括PCIE、NVLINK、L2Cache、3072分片單元、64個ROP、192個時間測量單元等,如何看待這個問題?RTX2080不是討論這個問題的好參照物,由于一些新功能,英偉達的RTX系列芯片中有些模塊占據了大部分芯片模片區面積,比如光線追蹤核心等。ProgPow設計則是與英偉達和AMD生態系統中的存量芯片產品搭配使用的,因此無法使用英偉達和AMD新款芯片產品中的新功能。如果想有一個更好類比的話,或許AMDRX5xx系列或是英偉達GTX1xxx系列是個不錯的參照。正如我們之前所述,GPU中也有部分功能沒有被ProgPow利用,比如:浮點邏輯、二級緩存、以及紋理緩存和ROP等。分片單元是向量數學被執行的地方,這絕對是ProgPow所要求的。用于加密貨幣挖掘的ASIC芯片還希望添加能夠實現“keccak”功能的區域。作為ProgPow算法的開發團隊,我們估計ProgPowASIC芯片的模片區面積會比同等GPU小30%——但是,即便是在最好的情況下,其功耗最多也只會降低20%。相比之下,雖然GPU上有些邏輯模塊沒有被充分應用而造成部分芯片模片區面積浪費,但功耗卻是最小的。問題六:與大芯片相比,小芯片的收益會更高嗎?怎么說好呢,這聽上去像是在普及芯片制造知識,或許我們需要寫一篇《芯片制造101》的培訓文檔。此外,對于收益計算公式可以參考一篇2006年發表的文章《CompareLogic-ArrayToASIC-ChipCostperGoodDie》,其中你會發現,早在13年之前芯片收益和流程控制就已經有很大創新了。對于具有單個功能單元的芯片,模片區面積較小的芯片收益會比模片區面積較大的芯片更高。但是對于現代GPU來說,情況并非如此。如今的GPU幾乎可以任意恢復、組合,小型復制單元的缺陷基本上可以忽略。只要每個可壓縮功能單元足夠小,那么GPU芯片收益幾乎可以和功能模塊更大的芯片一樣高。為了更好地解釋這個概念,我們可以舉一個簡單的腦洞實驗:1、假設你有一個大芯片“GiantChipA”,它占據了整個晶片。這個“GiantChipA”是由10萬個可拆卸子組件組成,但是其中必須確保80%的子組件是無缺陷的,才能保證“GiantChipA”正常工作,而在嵌入過程中,壞的子組件會被繞過。2、另外,假設你還有一個小芯片“TinyChipB”,它只有一個功能模塊組成,但是這個小芯片卻小到足以在同一個晶片上裝配10萬個子組件。在這種情況下,只要一個子組件壞了,意味著整個“TinyChipB”芯片就是壞的。3、如果每個晶片上平均分布了2萬個有缺陷的子組件,那么“GiantChipA”的收益可以為100%,因為他們可以將20%有缺陷的子組件拆掉,而“TinyChipB”的收益可能僅為80%,因為他們無法拆掉有缺陷的子組件。如果你看看AMD的Polaris20系列產品和英偉達的GP104產品,會在模擬鏡頭下發現這些GPU中部署了大量微小的“可拆卸”子模塊組成。

Solana生態支付協議Zebec宣布將向用戶空投總計500萬枚ZBC代幣:10月27日消息,Solana生態現金流支付協議Zebec在推特上表示,即將達到500個Zepoch節點,當達到500個Zepoch節點時,將根據用戶的Zebec積分向其空投總計500萬枚ZBC代幣,此外將為早期Zepoch節點持有者提供更多獎勵,用戶擁有的Zebec積分越多,從500萬枚ZBC代幣池中分享的份額就越多。

此前今年3月份消息,Zebec通過公開和私募代幣銷售完成2800萬美元融資,并藉此推出了代幣ZBC,Circle、Coinbase、Lightspeed等參投。[2022/10/27 11:48:00]

問題七:ASIC礦機電壓可以很輕松地降低到0.4V,只有GPU的二分之一……這樣低電壓的ASIC設計已經被比特幣挖礦設備ASIC礦機制造商所采用,所以現在我們沒有理由不相信他們不會把這種策略應用在ProgPowASIC礦機上,能談談這個問題嗎?當芯片僅由計算構成,那么低電壓設計才能奏效,比如一個專門針對SHA256d挖礦算法計算的ASIC礦機。集成其他原件——比如SRAM,這也是ProgPow數據緩存所必需的——的難度極大,也不可能在低電壓下工作。問題八:同樣的節能效果也能在LPDDR4xDRAM上實現,其功耗比GDDR6還低,談談這個問題吧。不能僅考慮能耗問題,LPDDR4x的帶寬比GDDR6低很多,前者每個引腳帶寬是4.2Gb/s,后者則是16Gb/s。LPDDR4x計算芯片上需要四倍的內存芯片和四倍的內存接口才能達到GDDR6相同的性能,這樣一算,其成本其實是顯著增加的。值得注意的是,高帶寬計算芯片的接口通常是有限的,這意味著芯片模塊面積必須要足夠大,周邊幾乎不允許任何信號從芯片脫落到印制電路板上,LPDDR4x設計需要大約四倍的芯片周長焊盤數才能達到相同的帶寬,也就是說,其成本不僅僅在存儲芯片上,計算芯片區域的成本同樣也要計算在里面,所以綜合算下來其實總成本并不低。更糟糕的是,由于任何芯片都是以速度為導向的,當芯片模塊面積更大的時候,意味著浪費的功率也會更多。所以,不妨讓我們再想想為什么如今的GPU不能再LPDDR4x上運行。首先,LPDDR4x在帶寬成本上的表現并不盡如人意,對于給定的帶寬量級,LPDDR4x的成本要高出四倍以上,繼而導致成本顯著增加——LPDDR4x在9W功率時256GB/s帶寬的成本約為150美元,相比之下GDDR6在11W功率時同樣帶寬成本還不到40美元,因此LPDDR4x并沒有讓礦工省到什么錢。問題九:像英偉達這樣的GPU生產商雇傭了大約8000人來開發GPU,這些GPU也非常復雜;而像LinZhi這樣的ASIC生產商只雇傭了十幾個人,而且只開發用于ETHash挖礦算法的ASIC礦機。這些公司的勞動力成本相差100被,因此可不可以說ASIC芯片在成本和上市時間方面比GPU芯片更具優勢。在此要說的是,規模經濟是一個重要因素。GPU行業也是在全球各種銷售渠道中攤銷,目前總市場規模大約為4200億美元,其中AMD市值約為116億美元,英偉達約為1545億美元,最大的英特爾約為2548億美元。僅就內存市場而言,還需要在這個總規模達到5000億美元的行業里分攤物理端口和晶片的成本,其中擁有320,671名員工的三星電子市值約為3259億美元,他們也是在美國最活躍的專利申請者;第二名是擁有34,100名員工的MicronTechnology,其市值約為601億美元,但是第一個開發出20Gbps高速GDDR6內存的芯片制造商;海力士擁有187,903名員工,市值約為568億美元,他們開發了全球首款1Ynm16GbDDR5DRAM。相比之下,用于加密貨幣挖礦的ASIC芯片行業總市值不過1460億美元,其中730億屬于比特幣。另外我們還要看看上市時間和技術接受模型,在此不妨以著名的S9礦機繼任者開發時間作為參考。如果經過充分研發、并且計算難度不是很高的SHA256d算法計算芯片都需要耗費三年時間才能進行迭代,那么又有什么可以保證像GPU一樣的、支持ProgPow算法的ASIC礦機快速投產上市呢?我們還可以分析一下最近挖掘以太坊加密貨幣的ASIC礦機情況,GDDR6芯片樣品試用期已經有一年時間了,到目前仍然沒有發布能夠被廣泛應用的新版本產品。ProgPow核心開發團隊IfDefElse的最后一點想法ProgPow其實針對是一種挖礦硬件,這種硬件受到了規模經濟的支持,具有高可見性并獲得了較大競爭優勢。ProgPow核心開發團隊IfDefElse規模并不大,而且團隊成員也都有全職工作,所以他們無法及時回復所有問題和文章,更沒時間在各種加密貨幣和區塊鏈線上論壇里喋喋不休。雖然IfDefElse對硬件設計和開發非常感興趣,但他們仍然建議涉足這一領域的人需要保持謹慎,因為硬件和軟件一樣,是一個多元化的領域,即便你是一個對加密貨幣挖礦ASIC芯片非常熟悉的大咖,但在GPU-ASIC領域里可能無法成為一個專家。

印尼央行繼續實施數字貨幣發行計劃:7月6日消息,印尼央行繼續實施數字貨幣發行計劃。(金十)[2022/7/6 1:54:17]

CZ:5到10年內DeFi規模將超過CeFi:7月1日消息,幣安創始人CZ在接受Bankless視頻專訪時表示,5到10年內DeFi規模將超過CeFi。我們不想在未來持有任何人的現金或數據。[2022/7/1 1:45:12]

KiKi Finance 將在Terra 鏈上發布KiKi代幣:據官方報道,6月10日KiKi團隊將在Terra鏈上推出代幣KiKi,并對投票用戶進行空投。KiKi Finance 是一個多鏈質押聚合平臺,近期推出FIL、新LUNA、ATOM等雙倍收益產品。[2022/6/10 4:16:30]

Tags:GPOROGPOWPROGPO幣HydrogenPOWA價格Proof

酷幣交易所
BTC:BTC數據周報(2019年第9期 總第21期)_USD

鏈上活躍性指標整體下降短期市場信心受挫,BTC平均價格或將在箱體震蕩加大投資操作難度報告要點從市場交易數據來看,上周BTC平均價格的再次反彈可以看作是對前次反彈的確認.

1900/1/1 0:00:00
數字資產:交易所丟幣,比特幣數字資產追回有多難?_比特幣

這兩天幣價漲的厲害,全球數字資產總市值達已經突破1769億美元。市場的復蘇帶來了人氣,也招來了攻擊者.

1900/1/1 0:00:00
ETH:一文讀懂區塊鏈開發者生態建設方法與難點_區塊鏈存證平臺法院

編者按:本文來自鏈聞ChainNews,作者:ReganBozman,CoinList運營總監,編譯:程子盈,Odaily星球日報經授權發布.

1900/1/1 0:00:00
BTC:閃電網絡LOGO & 閃電網絡中文社區LOGO 全球有獎征集令_OGO

活動說明 數據顯示,全球閃電網絡里,中國社區的參與占比不到1%。然而,隨著越來越多的國內錢包方選擇支持閃電網絡,這樣的局面正在改變.

1900/1/1 0:00:00
EOS:公鏈共識與治理迷局——區塊鏈技術引卷之六_BTC

通證通研究院×FENBUSHIDIGITAL聯合出品文:宋雙杰,CFA;孫含儒特別顧問:沈波;Rin;JX導讀自2017年發布初版白皮書以來,EOS就受到廣泛關注.

1900/1/1 0:00:00
POS:人們常說的“拜占庭將軍”問題究竟是啥?_Posscoin

何謂“拜占庭將軍問題”?拜占庭將軍問題首先是由LeslieLamport等人在1982年提出,被稱為TheByzantineGeneralsProblem或者ByzantineFailure.

1900/1/1 0:00:00
ads