3月22日,玩家和AI從業者們又愛又恨的老黃,帶著他的新“核彈”來了。遺憾的是,這次的新“核彈”與玩家沒有太大關系,主要是針對企業和工業市場,與玩家有關的RTX40系估計最快也要等到9月份才會有消息。
好了,廢話不多說,讓我們看看老黃這次又拿了怎樣的“大寶貝”出來。首先是A100顯卡的接任者,新一代計算卡皇H100閃亮登場,H100采用全新的Hopper架構和臺積電最新的4nm工藝,各方面的參數對比上一代的A100都有明顯的提升。
英偉達的超級服務器芯片Grace也再度曝光,對比上一次給出的數據,此次曝光的Grace芯片性能有了驚人的提升,根據發布會的描述來看,英偉達似乎也走上與蘋果相同的道路,用更多的芯片拼裝成一顆處理器。
除了硬件方面的產品曝光和發布,英偉達在軟件領域同樣帶來了不少新東西,比如主打云端協作的OmniverseCloud,讓多名用戶可以在云端直接參與同一個媒體文件的編輯和渲染等工作。
此外英偉達還展示了不少基于虛擬現實環境的工業、交通模擬案例,還有一套由AI驅動的虛擬角色系統,該系統可以通過深度學習進行動作訓練,訓練結束后不需要額外的骨骼動作設計等操作就能夠依照指令做出對應動作,這下不僅是AI從業者狂喜,電影及游戲從業者也要狂喜。
Rescale與英偉達合作構建自動化工業元宇宙:7月19日消息,高性能云計算服務商Rescale宣布與英偉達達成合作,將 Nvidia GPU Cloud(NGC)集成到其用于高性能計算(HPC)應用程序的容器庫中,幫助企業構建數字孿生并打造工業元宇宙的基礎構建模塊。據悉,韓泰輪胎已經在Rescale與英偉達合作構建的工業元宇宙中進行新輪胎設計研發,包括在虛擬世界中進行各種“數字孿生輪胎”的測試工作,繼而加快產品開發速度。(venturebeat)[2022/7/20 2:24:16]
不得不說,老黃這次帶來的東西并不少,每一樣都能對AI等行業的發展帶來明顯的改變,下面我們就來詳細的看看英偉達到底都發布了什么吧。
H100與Grace
從去年開始,就有消息稱英偉達將會在今年發布新一代計算卡,并且將用上全新的Hopper架構。目前來看消息準確的,只不過當初大家猜測新一代計算卡將采用臺積電5nm工藝,但是如今看來英偉達選擇一步到位使用了最新的4nm工藝,雖然本質上是5nm+,但是在功耗方面則有著更好的表現,而且也可以集成更高的晶體管。
實際上,從H100的核心規格來看,也不難理解為什么英偉達最終選了4nm,高達800億的晶體管集成度,比上一代A100多了整整260億個,內核數量則是提高到了16896個,這是目前世界上內核數量最高的芯片核心,同時也是上一代100的2.5倍。
消息稱英偉達下一代RTX 40系列將使用臺積電5nm工藝:8月29日消息,業內人士@Kopite7kimi此前曾提前數月正確預測了幾乎整個NVIDIA Ampere系列,其他大部分爆料也得到了證實。他表示:英偉達計劃將臺積電N5工藝引入下一代游戲架構Ada Lovelace而不是三星工藝。 此前有一位以爆料AMD內容而聞名的爆料者@Greymon55 也透露,英偉達計劃使用臺積電N5工藝。此外,@Kopite7kimi還表示,Lovelace GPU實際上會比之前預期的要早一些,不過他沒有透露具體的日期,業界預計是在 2022年9月左右。(IT之家)[2021/8/29 22:45:06]
夸張的內核參數提升帶來的性能提升也極為夸張,根據英偉達官方給出的數據,H100的浮點計算和張量核心運算能力將比上一代提升至少3倍,FP32高達60萬億次/秒,而上一代的A100為19.5萬億次/秒。
H100還將是首款支持PCIe5.0和HBM3,讓內存帶寬達到驚人的3TB/s,老黃表示只需要20張H100就可以處理目前全球的網絡流量,雖然聽起來很夸張,但是確實體現出了H100夸張的性能參數。
英偉達:預計加密挖礦芯片將帶來4億美元收入:英偉達表示,預計加密貨幣挖礦芯片將帶來4億美元的收入。可根據需要增加芯片的挖礦能力,提供專為挖礦設計的新芯片。 (金十)[2021/5/27 22:48:25]
強大性能也伴隨著夸張的功耗,英偉達給出的H100功耗高達700W,作為對比上一代A100的功耗僅400W,不過用2倍的功耗換來3倍的性能提升,整體來說也不虧。
H100還針對AI訓練等所要用到的模型進行針對性優化,為Transformer搭載了優化引擎,讓大模型的訓練速度可以提升至原來的6倍,極大的降低了大型AI模型等訓練所需要的時間,這個特性也與下面將會談到的AI虛擬角色系統相呼應。
在英偉達給出的測試數據中,訓練一個擁有1750億參數的GPT-3模型,時間將由原來的一周降低到僅需19小時,而一個擁有3950億參數的Transforme模型也僅需21小時就可以完成訓練,效率提升近9倍。
雖然參數看起來十分美好,但是實際的性能表現如何還有待后續的實際測試結果來揭曉,至少從RTX30系和A100的經驗來看,最終的實際性能提升幅度可能在2倍-2.5倍之間,不太可能真的達到3倍,不過即使只有2倍提升也已經相當出色,至少在AI方面已經完全碾壓了AMD的計算卡。
分析:加密貨幣價格飆升可能會提振對英偉達圖形處理器的需求:據媒體消息,最近加密貨幣價格的飆升可能會提振對英偉達圖形處理器的需求。這些芯片是為視頻游戲設計的,但也用于以太坊等加密貨幣的挖礦。這個過程涉及匹配和更新加密貨幣交易以換取回報,價格越高,利潤越高。以太坊的價格現在已經回到1000美元以上,而且自圣誕節以來幾乎翻了一番,加密驅動的需求可能會影響到英偉達第四財季的銷售,該財季將于本月結束。加拿大皇家銀行的高管Mitch Steves周二在一份報告中表示,以太坊超過1000美元意味著對高端圖形芯片的強勁需求。(華爾街日報)[2021/1/6 16:34:49]
而且,H100還引入了英偉達最新的NVIDIANVLink第四代互連技術,該技術能夠進一步提升多GPU串聯的效率,在英偉達給出的數據中,串聯后的I/O帶寬能夠擴展至900GB/s,比上一代提升了50%。
再來看看英偉達的新“玩具”Grace,這是英偉達為服務器業務準備的超級服務器芯片,此前就有過不少的曝光,這次則是有了更多的信息,同時還帶來了全新的系列產品。Grace芯片采用最新的ArmV9架構,英偉達以此為基準打造了兩款超級芯片——GraceHopper和GraceCPU超級芯片。
動態 | 英偉達下調2019財年Q4收入預估,因挖礦收入下降等:據Coindesk報道,根據1月28日的最新報告,英偉達(Nvidia)稱,其2019財年第四季度(截止于1月31日)營收預計為22億美元,低于此前預估的27億美元。除了加密礦商的相關收入大幅下降之外,英偉達表示,尤其是中國的經濟困境和不確定性損害了英偉達其他客戶(游戲玩家和數據中心)對GPU的需求。據報道,英偉達將于2月14日公布其第四季度全部業績。[2019/1/29]
其中,GraceHopper由一個GraceCPU和一個Hopper架構的GPU的GPU組成,兩者將會形成一個完整的運算系統,只需要一顆芯片就可以搭建出一個強大的運算服務器,同時也可以將多個芯片串聯起來組成更龐大的運算陣列。
而GraceCPU超級芯片則是由兩顆GraceCPU組成,兩顆芯片通過NVIDIANVLink-C2C技術互連,組成一個內置了144個Arm核心并且擁有1TB/s內存帶寬的巨無霸級芯片。
說實話,英偉達的這顆GraceCPU超級芯片很難不讓人聯想到蘋果在春季發布會上發布的M1Ultra,同樣是基于Arm架構,同樣是由兩顆芯片組合而成,同樣也有著夸張的內存帶寬和性能表現。
顯然,芯片互聯拼裝技術已經成為行業的趨勢之一,AMD方面也曝光有采用類似技術的CPU正在研發中,最早將在2023年與大家見面。只能說如今單顆芯片的性能發展已經接近極限,接下來想要擁有更大的提升,或許將不得不借助類似的互聯技術進行芯片堆疊了。
不過,GraceCPU超級芯片的功耗并不低,英偉達官方給出的數據是500W,已經遠遠超過了傳統的x86架構CPU,當然,考慮到GraceCPU超級芯片的夸張性能:SPECrate跑分740分,較第二名提升60%,這個功耗也不是不能接受。
顯然,在Arm服務器領域,英偉達的野心是非常大的。
英偉達的虛擬世界
除了一堆高性能的硬件,英偉達此次也展出了不少的軟件示范案例,其中就包括使用H100等硬件來模擬一個虛擬現實環境,用以進行各種測試和模擬。在英偉達的示范中,未來的企業可以通過強大的英偉達硬件構建一個擬真的虛擬測試環境,并在其中測試自動駕駛、智能工廠的運作等。
通過虛擬測試環境的使用,研究者可以更輕松的測試自動駕駛面對各種突發狀況時的反饋,并且在測試中直接定位問題,降低整體的測試成本。此外,還可以構建一個1:1的“數字化工廠”提前模擬運行,尋找提高效率和找到可能出現的問題,降低工廠正式運行后出現問題的概率。
英偉達將這一套應用稱為“數字孿生”,能夠大幅度降低自動化工廠和自動駕駛等方面的研究及測試投入。
OmniverseCloud是英偉達新推出的一款云端創作服務,用戶通過OmniverseCloud可以在任意地點訪問和編輯大型3D場景,并且無須等待大量數據的傳輸,并且還可以讓用戶能夠直接在線協作共同搭建3D模型。
在過去,3D模型和3D場景的協同構建都需要在一個服務器上進行,而在OmniverseCloud推出后,相關創作者就可以通過任意支持OmniverseCloud的終端,直接用網絡訪問協作空間并參與其中,極大的提升了創作者的響應速度和工作自由。
另外,英偉達還為創作者們準備了第二個驚喜,一套由AI驅動的虛擬角色系統,該系統可以讓AI在短時間內完成訓練,學會各種指令所對應的動作。比如一個簡單的劈砍動作,在正常的制作流程中首先需要動作架構師通過對動作骨架的一步步調整,然后再放到場景中進行測試,整個流程需要耗費大量的時間,而且每個不同的動作都需要重新進行調試。
而在這套AI虛擬角色系統的幫助下,當你想要虛擬模型做出劈砍的動作,只需要一條指令,AI就會從已學習的動作中找出關聯動作并自動運行,直接節省了大量的時間和人力,對于游戲開發者和特效制作者而言,這個系統將讓他們能夠將更多的精力放在其它地方。
英偉達的此次發布會,雖然并沒有太多的提到元宇宙,但是從硬件到軟件都是未來構建元宇宙的基礎。目前元宇宙無法成為現實的原因主要是兩點,一個是硬件性能無法滿足我們的需要,另一個就是軟件領域尚不成熟,無法提供實時的擬真環境模擬,而這兩者是點亮元宇宙科技的基礎。
在此之前,我們首先需要的就是更強大的計算硬件及更智能的AI系統。英偉達的H100,虛擬現實環境及AI虛擬角色系統的出現,將讓我們朝著真正的元宇宙再邁進一大步。
移動支付網消息:4月2日,數字人民幣第三批試點地區公布,新增11個城市。當前,很多人對數字人民幣個人錢包比較關注,對公錢包表示“有些受傷”。其實,數字人民幣對公錢包也在“飛速成長”.
1900/1/1 0:00:00無論你是不是區塊鏈技術方面的專家,只要你待在Crypto的世界里夠久。以太坊擴容,layer2,Rollup這些詞語對于你來說都不會陌生.
1900/1/1 0:00:00在元宇宙生態里,NFT比虛擬人重要得多。NFT才是元宇宙的中心。說是宇宙中心,因為我曾經在號稱宇宙中心的北京五道口附近住過幾年——五道口是一個頂級學府和工人俱樂部共存、鐵路從馬路中穿膛而過、最昂.
1900/1/1 0:00:00長期以來,以太坊L2之爭的焦點都被ZKRollup和Optimisticrollup兩者占據。因為OP的EVM兼容性和技術較為成熟等特性,更容易被項目開發者采用,因此,OP在當下更為通用和主流.
1900/1/1 0:00:00Web3旨在賦予網絡中的任何參與者自治的權力和控制權,但要去除中介,我們需要將網絡層與應用層分開的方法,進入數據中心。社會已經變得依賴數據,我們的經濟正日益成為數據經濟.
1900/1/1 0:00:00令人驚訝的是,雖然核心的操作機制非常簡單,但這些協議卻帶來了非常理想化的系統結果,使它們適合大規模部署.
1900/1/1 0:00:00