頂配12999元的RTX 40系列、算力2000 TOPS的自動(dòng)駕駛芯片……英偉達(dá)「狂秀肌肉」
“親兒子”背刺,汽車客戶著手自研,以太坊合并……面對(duì)諸多外部因素,英偉達(dá)之后會(huì)如何呢?
昨日夜間11點(diǎn),依舊一身皮衣的黃仁勛亮相發(fā)布會(huì),一連發(fā)布多款新產(chǎn)品,帶來了兩年一大升級(jí)的GeForce RTX 40系列,也帶來了自動(dòng)駕駛領(lǐng)域的最新之作。
其中,如同此前網(wǎng)上所傳聞的,RTX 40系列首發(fā)產(chǎn)品包含GeForce RTX 4090和GeForce RTX 4080兩個(gè)型號(hào)三款產(chǎn)品,至于其性能如何,我們接下來慢慢看。
RTX 4090:新架構(gòu)、DLSS 3與臺(tái)積電4nm工藝
在首發(fā)的三款產(chǎn)品中,RTX 4090 GPU為旗艦產(chǎn)品,采用了臺(tái)積電4nm工藝,擁有760億個(gè)晶體管、超18000個(gè)CUDA核心和美光24GB GDDR6X顯存,能夠在4K分辨率的游戲中持續(xù)以超過100 FPS運(yùn)行。
而取代過往的Ampere架構(gòu),此次RTX 40系列首次采用了新架構(gòu)——Ada Lovelace,這是一位女性的名字,她被許多人認(rèn)為是世界上第一個(gè)計(jì)算機(jī)程序員。
依據(jù)黃仁勛介紹,基于Ada Lovelace架構(gòu),RTX 40系列在SM多單元處理器等方面都進(jìn)行了換代升級(jí)。
比如SM多單元處理器,性能最高達(dá)到90 TFLOPS,吞吐量是上一代Ampere架構(gòu)的2倍。其中英偉達(dá)全新引入了Shader Execution Reordering(著色器執(zhí)行重排序技術(shù)),通過即時(shí)重新安排著色器負(fù)載來提高執(zhí)行效率,從而更好地利用GPU資源。依據(jù)老黃現(xiàn)場(chǎng)介紹,基于這一改變,RTX 40系列可獲得2-3倍的光線追蹤性能提升,整體游戲性能提升可高達(dá)25%。
再來看RT Core,其擁有了兩個(gè)全新硬件單元,分別是Opacity Micromap和Micro-Mesh引擎,前者將光線追蹤的Alpha-Test幾何性能提升2倍,后者可動(dòng)態(tài)生成微網(wǎng)格,在不犧牲性能和存儲(chǔ)的前提下產(chǎn)生額外的幾何圖形以提升豐富度?;谶@一升級(jí),RTX 40系列擁有2倍的射線三角形相交吞吐量,有效光線追蹤計(jì)算能力達(dá)到191 TFLOPS,是上一代產(chǎn)品的2.8倍。
此外,黃仁勛還重點(diǎn)介紹了RTX 40系列新引入的DLSS 3.0技術(shù),它包含四項(xiàng)組件,其中最為關(guān)鍵的是新加入的AI幀生成器,可分析兩幀連續(xù)的游戲圖像,并計(jì)算幀到幀中物體和元素的運(yùn)動(dòng)矢量數(shù)據(jù)。舉個(gè)例子,DLSS 3.0可以使原本開啟光線追蹤后僅為23幀/秒的《賽博朋克2077》以101幀/秒呈現(xiàn)(DLSS 2.0的效果為提升到62幀/秒)。
除了RTX 4090,英偉達(dá)在這場(chǎng)發(fā)布會(huì)上還帶來了兩個(gè)版本RTX 4080,即RTX 4080 16GB和 RTX 4080 12GB,除了內(nèi)存不同外,16GB版本擁有9728個(gè)CUDA核心,12GB版本則是擁有7680個(gè)CUDA核心。
至于發(fā)布時(shí)間與價(jià)格:
RTX 4090將于10月12日上市,售價(jià)12999元起;
RTX 4080 16GB將于11月上市,售價(jià)9499元起;
RTX 4080 12GB將于11月上市,售價(jià)7199元起。
是的,相比上一代,漲價(jià)了。
Thor:全新自動(dòng)駕駛芯片,還身兼多職
RTX 40系列之后,老黃緊接著帶來的是全新自動(dòng)駕駛旗艦級(jí)芯片“Thor(雷神)”,用黃仁勛的話來說:“Atlan不再是第一了……它將被Thor取代”。
依照英偉達(dá)原先規(guī)劃,單顆算力達(dá)到1000 TOPS的Atlan將于2023年向開發(fā)者提供樣品,并于2025年大規(guī)模量產(chǎn)上車。如今來看,Atlan似乎是被砍了,并且主角也由Atlan換成了Thor。
依據(jù)介紹,Thor搭載了770億晶體管,可實(shí)現(xiàn)算力2000 TOPS和2000 TFLOPs。而之所以能夠做到這點(diǎn),黃仁勛歸納為三點(diǎn)升級(jí):CPU(Grace)、GPU(Ada Lovelace)和處理Transformer模型的引擎(Hopper)。
其中,Grace是英偉達(dá)首款數(shù)據(jù)中心CPU,主要面向大型數(shù)據(jù)密集型HPC和AI應(yīng)用,擁有非常好的單線程性能;Ada Lovelace是英偉達(dá)最新的GPU產(chǎn)品,有助于車載計(jì)算資源集中化的同時(shí),也將成本降低數(shù)百美元;Hopper則提供了Transformer引擎和Vision Transformer的快速變革,可以將深度神經(jīng)網(wǎng)絡(luò)的推理性能提高9倍。
值得注意的是,除了性能上的提升,Thor更為令人驚嘆的是能夠做到“身兼多職”,基于多域計(jì)算,不僅能單獨(dú)負(fù)責(zé)自動(dòng)駕駛系統(tǒng)的計(jì)算需求,還能將2000 TOPS和2000 TFLOPs分開配置使用,一部分用于駕駛艙AI和信息娛樂系統(tǒng),另一部分用于自動(dòng)駕駛。這意味著,你可以在一臺(tái)計(jì)算機(jī)上同時(shí)運(yùn)行汽車底層的Linux,輔助駕駛的QNX,智能座艙的安卓等多個(gè)操作系統(tǒng),真正做到了1顆芯片當(dāng)6顆用。
而為了加快芯片之間的數(shù)據(jù)傳輸,英偉達(dá)也在Thor中集成了最初為數(shù)據(jù)中心應(yīng)用開發(fā)的NVLINK連接。
Jetson Orin Nano:微型機(jī)器人系統(tǒng)級(jí)模塊,速度提升80倍
硬件方面,除了最新消費(fèi)級(jí)GPU RTX 40系列、全新自動(dòng)駕駛芯Thor,英偉達(dá)還帶來了一款微型機(jī)器人系統(tǒng)級(jí)模塊芯片Jetson Orin Nano。
依據(jù)介紹,相較于3月份發(fā)布的Jetson Nano,Jetson Orin Nano的性能大幅提升了約80倍,但是價(jià)格相對(duì)較低,很可能成為入門級(jí)AI邊緣設(shè)備和機(jī)器人開發(fā)的新標(biāo)準(zhǔn)。
Orin Nano能夠以迄今為止最小的 Jetson 外形尺寸提供高達(dá)40 TOPS,采用與英偉達(dá)先前宣布的Orin NX兼容的模塊,支持具有Ampere架構(gòu)GPU的AI應(yīng)用程序管道。
該產(chǎn)品共提供2個(gè)版本,售價(jià)199美元起:
Orin Nano 8GB,提供高達(dá) 40 TOPS 的功率,功率可配置為 7W 至 15W;
Orin Nano 4GB,提供高達(dá) 20 TOPS 的功率選項(xiàng),功率選項(xiàng)低至 5W 至 10W。
最后
整場(chǎng)發(fā)布會(huì),英偉達(dá)在產(chǎn)品展示上依舊是穩(wěn)定輸出,也再一次向外界告知,英偉達(dá)已經(jīng)不僅僅是一家GPU公司,其業(yè)務(wù)早已遍布多個(gè)領(lǐng)域,并在其中的多個(gè)站到了頭部的位置。
只不過近一段時(shí)間以來,圍繞英偉達(dá)也是壞消息不斷,比如自動(dòng)駕駛頭部企業(yè)Cruise宣布著手自研自動(dòng)駕駛芯片,更是一口氣開發(fā)四種,背后原因,則是為了降低外購芯片的成本。對(duì)于英偉達(dá)來說,這并不是一個(gè)好消息。
與此同時(shí),曾經(jīng)親密的合作伙伴、被外界視為英偉達(dá)“親兒子”的EVGA宣布與其終止合作,不再生產(chǎn)新顯卡,又比如以太坊合并,終結(jié)了大規(guī)模顯卡挖礦時(shí)代,這一波攻勢(shì)下,新顯卡的銷量有待后面市場(chǎng)的考驗(yàn)。其漲價(jià)的背后,不知是不是也有著想消耗舊顯卡庫存的考量。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
