用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

jh 4年前 (2022-03-22)

黃仁勛：不裝了，我就是AI。

就在今天凌晨，英偉達(dá)CEO黃仁勛帶來了名為“I AM AI”的線上主題演講！

即使告別了我們熟悉的廚房，但黃仁勛照樣給我們端上多道“硬核大菜”。

先是搭載全新Hopper架構(gòu)的H100 GPU，接著是Grace超級(jí)芯片，然后依次談到了機(jī)器人、自動(dòng)汽車以及其他軟件更新。

總得來看，英偉達(dá)再度將GPU的算力推向了極致，借此加強(qiáng)自身在AI、汽車等領(lǐng)域的實(shí)力。同時(shí)，英偉達(dá)已經(jīng)為下一波AI浪潮以及無限幻想的元宇宙做好了準(zhǔn)備。

800億晶體管的“算力怪獸”

作為AI算力的保障，以及英偉達(dá)的“老本行”，全新GPU自然是GTC 2022最值得關(guān)注的新品。

首先帶來的新品是H100 GPU，該芯片由800億個(gè)晶體管構(gòu)建而成，采用了專為英偉達(dá)加速計(jì)算需求而優(yōu)化的TSMC 4N工藝，單個(gè)H100最大支持40TB/s的IO帶寬。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

用黃仁勛的話來說：20塊H100 GPU就可承托全球互聯(lián)網(wǎng)的流量。這足以看出這塊芯片的恐怖算力。

H100同時(shí)還集多個(gè)首個(gè)于一身，包括首款支持PCIe 5.0的GPU，首款采用HBM3標(biāo)準(zhǔn)的GPU，以及全球首款具有機(jī)密計(jì)算功能的GPU。

相比于上一代Ampere架構(gòu)的A100，H100帶來了6項(xiàng)突破性的創(chuàng)新：

1、目前世界最先進(jìn)的芯片。

2、搭載最新Transformer引擎，速度提升至上一代的6倍。

3、第二代安全多實(shí)例，可以同時(shí)處理不同類型的任務(wù)。

4、具備機(jī)密計(jì)算功能，此前隱私計(jì)算只能在CPU上實(shí)現(xiàn)，但H100成為第一個(gè)實(shí)現(xiàn)該功能的GPU，可以保護(hù)AI模型和正在處理的客戶數(shù)據(jù)。

5、支持第4代NVLink，每個(gè)NVLink Switch網(wǎng)絡(luò)最多可以連接多達(dá)256個(gè)H100，相較于上一代產(chǎn)品，帶寬高出9倍。

6、Hooper架構(gòu)引入了名為DPX的新指令集，可加速動(dòng)態(tài)規(guī)劃，算法速度有了顯著提升。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

在H100的幫助下，研究人員和開發(fā)者可以訓(xùn)練龐大的模型。比如包含3950億個(gè)參數(shù)的混合專家模型，訓(xùn)練速度加速高達(dá)9倍，訓(xùn)練時(shí)間從幾周縮短到幾天。

值得一提的是，黃仁勛并沒有過多介紹Hopper架構(gòu)。該架構(gòu)以美國計(jì)算機(jī)領(lǐng)域的先驅(qū)科學(xué)家Grace Hopper 的名字命名，被單獨(dú)用作計(jì)算加速使用，而未來推出的RTX 40系列顯卡使用的GPU將基于Ada Lovelace架構(gòu)。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

雖然此次公布的H100與此前的爆料略有縮水，但不妨礙其成為超算界最強(qiáng)引擎，這也稱得上英偉達(dá)進(jìn)一步擴(kuò)大在AI計(jì)算領(lǐng)域領(lǐng)導(dǎo)力的體現(xiàn)。

世界上最快的AI超級(jí)計(jì)算機(jī)

借助DFX POD架構(gòu)與NVLink連接，8塊H100構(gòu)成了一個(gè)巨型AI系統(tǒng)——NVIDIA DGX H100。該系統(tǒng)可以滿足大型語言模型、推薦系統(tǒng)、醫(yī)療健康研究和氣候科學(xué)的大規(guī)模計(jì)算需求。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

你以為這個(gè)系統(tǒng)已經(jīng)很強(qiáng)大了？

基于DGX H100，英偉達(dá)推出全球運(yùn)行速度最快的AI超級(jí)計(jì)算機(jī)——NVIDIA EOS。該超級(jí)電腦共配備576臺(tái)DGX H100系統(tǒng)，共計(jì)4608塊DGX H100 GPU，顯存帶寬高達(dá)768TB/s，有望成為全球運(yùn)行速度最快的 AI 系統(tǒng)。而整個(gè)互聯(lián)網(wǎng)不過只有100TB/s。

據(jù)悉，NVIDIA EOS預(yù)計(jì)將提供18.4 Exaflops的AI計(jì)算性能，這比目前運(yùn)行速度最快的日本Fugaku超級(jí)計(jì)算機(jī)還快4倍。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

為了將數(shù)量龐大的H100連接起來，英偉達(dá)還推出了NVLink Switch網(wǎng)絡(luò)系統(tǒng)和更強(qiáng)的DFX superPOD架構(gòu)，這樣就可以連接32個(gè)結(jié)點(diǎn)、256個(gè)H100 GPU。你可以想象成一個(gè)“加強(qiáng)版”的DGX H100系統(tǒng)。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

黃仁勛說：“對(duì)于英偉達(dá)的OEM和云計(jì)算合作伙伴來說，EOS將成為先進(jìn)AI基礎(chǔ)設(shè)施的藍(lán)圖。”

未來，該系統(tǒng)可以為汽車、醫(yī)療健康、制造、通信、零售等行業(yè)提供開發(fā)大型模型所需的AI性能。

最強(qiáng)大的AI專屬CPU

在去年GTC大會(huì)上，英偉達(dá)透露了首款數(shù)據(jù)中心專屬CPU Grace，而在今年，這款面向AI基礎(chǔ)設(shè)施和高性能計(jì)算的超級(jí)CPU正式亮相。

這次的Grace有兩個(gè)版本，第一個(gè)版本叫做Grace-Hopper，是“CPU+GPU結(jié)合體，使用NVLink技術(shù)連接，帶寬高達(dá)900GB/s。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

而名為“Grace CPU超級(jí)芯片”的版本則由兩個(gè)CPU芯片封裝組成，它們之間通過NVLink-C2C連接。整個(gè)超級(jí)芯片總計(jì)144個(gè)CPU內(nèi)核（基于ARMv9指令集），緩存容量396MB，支持LPDDR5X ECC內(nèi)存，帶寬高達(dá)1TB/s。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

性能方面，Grace CPU 超級(jí)芯片的SPECint 2017得分為業(yè)內(nèi)領(lǐng)先的740分，黃仁勛表示這個(gè)性能沒有什么產(chǎn)品可與之媲美，稱贊為“最強(qiáng)大的CPU”。

據(jù)悉，借助帶有糾錯(cuò)碼的LPDDR5x內(nèi)存組成的子系統(tǒng)，Grace CPU 超級(jí)芯片可以實(shí)現(xiàn)速度與功耗的最佳平衡，帶寬高達(dá)1TB/s，整體功耗僅500W。

有趣的是，這套芯片系統(tǒng)展示了NVLink-C2C的強(qiáng)大擴(kuò)展性，加之英偉達(dá)早些時(shí)候發(fā)布的UCIe標(biāo)準(zhǔn)（通用小芯片互連傳輸通道），未來用戶采用英偉達(dá)產(chǎn)品時(shí)，可以像搭積木一樣靈活選擇CPU和GPU的組合。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

One More Thing

· Omniverse平臺(tái)

在去年CTC大會(huì)上，黃仁勛就重點(diǎn)介紹了Omniverse平臺(tái)。該平臺(tái)為3D設(shè)計(jì)師提供了一個(gè)共享的虛擬世界，他們可以從不同的軟件應(yīng)用程序和不同的地理位置進(jìn)行協(xié)作。

今年，英偉達(dá)專注于讓個(gè)人和企業(yè)更廣泛地使用Omniverse平臺(tái)。新的Omniverse Cloud使創(chuàng)作者能夠即時(shí)訪問Omniverse，即使他們沒有基于Nvidia RTX的系統(tǒng)。同時(shí)推出的Omniverse OVX則是一個(gè)旨在滿足大規(guī)模仿真需求的計(jì)算系統(tǒng)。

· 自動(dòng)駕駛汽車

作為英偉達(dá)在AI領(lǐng)域的重要探索，汽車產(chǎn)品線將在未來六年內(nèi)增加至超過110億美元。

本次，英偉達(dá)推出了最新版本的Hyperion 9自動(dòng)駕駛平臺(tái)，這既是Nvidia DRIVE Orin平臺(tái)的基本架構(gòu)，也是英偉達(dá)用于自動(dòng)駕駛汽車的硬件架構(gòu)。據(jù)悉，該平臺(tái)將有14個(gè)攝像頭、9個(gè)雷達(dá)、3個(gè)激光雷達(dá)和20個(gè)超聲傳感器，將于2026年投入使用。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

有趣的是，黃仁勛透露了已經(jīng)采用DRIVE Orin平臺(tái)的廠商，其中，中國廠商占據(jù)了不少席位，而比亞迪也將從2023年上半年開始采用DRIVE Orin平臺(tái)。

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

結(jié)語

除了上述更新外，英偉達(dá)還推出了機(jī)器人平臺(tái)、AI計(jì)算基礎(chǔ)架構(gòu)、醫(yī)療儀器平臺(tái)以及六款使用Ampere架構(gòu)的全新RTX GPU，產(chǎn)品線可謂十分豐富，這里就不再過多介紹。

總得來看，英偉達(dá)一直在緊跟兩條主線前行，一條是AI，另一條則是Omniverse平臺(tái)。

雖然這次黃仁勛并沒有直接點(diǎn)名元宇宙，但無處不在的TJ（黃仁勛數(shù)字替身）還是展示出英偉達(dá)對(duì)于元宇宙的重視程度。

希望在未來的GTC大會(huì)上，黃仁勛能給我們帶來屬于元宇宙的“核彈”。

最后，記得關(guān)注微信公眾號(hào)：鎂客網(wǎng)（im2maker），更多干貨在等你！

鎂客網(wǎng)

科技 | 人文 | 行業(yè)

微信ID：im2maker

長按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

国内精品久久影院综合日日,中文字幕乱码亚洲无线三区,欧美亚洲综合成人专区,51久久夜色精品国产水果派解说,国语自产精品视频在线第100页

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

800億晶體管的“算力怪獸”

世界上最快的AI超級(jí)計(jì)算機(jī)

最強(qiáng)大的AI專屬CPU

One More Thing

結(jié)語

最新文章

注冊

国内精品久久影院综合日日,中文字幕乱码亚洲无线三区,欧美亚洲综合成人专区,51久久夜色精品国产水果派解说,国语自产精品视频在线第100页

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”

800億晶體管的“算力怪獸”

世界上最快的AI超級(jí)計(jì)算機(jī)

最強(qiáng)大的AI專屬CPU

One More Thing

結(jié)語

最新文章

登錄

注冊

用20塊GPU裝下整個(gè)互聯(lián)網(wǎng)！本次GTC大會(huì)，黃仁勛繼續(xù)大秀“AI肌肉”