英偉達(dá)發(fā)布新一代自動(dòng)駕駛芯片Orin、深度學(xué)習(xí)推理引擎TensorRT 7,GPU已賣15億塊
今年的英偉達(dá)GTC,黃仁勛都說了啥?
今天,英偉達(dá)GTC大會(huì)在蘇州召開,黃仁勛再次一身皮衣亮相,口頭禪從去年的買買買,變?yōu)?ldquo;The more you buy,The more you save”,兩個(gè)多小時(shí)的主題演講中,“推銷”了從云端到邊緣各個(gè)不同場(chǎng)景下的軟硬件產(chǎn)品。
現(xiàn)場(chǎng),黃仁勛系統(tǒng)地介紹了各個(gè)軟件平臺(tái)的新進(jìn)展,并發(fā)布了面向自動(dòng)駕駛的新一代處理器Orin,以及“實(shí)現(xiàn)最大飛躍”的深度學(xué)習(xí)編譯器TensorRT 7。
從云到邊緣,英偉達(dá)的新重點(diǎn)
從AlexNet到BERT,計(jì)算機(jī)實(shí)現(xiàn)從圖像到自然語言處理上的突破。而AI也正在從云端擴(kuò)展到邊緣計(jì)算端。
從云到邊緣,英偉達(dá)正在為了每個(gè)場(chǎng)景打造一個(gè)平臺(tái),包括用于訓(xùn)練的DGX,用于超大規(guī)模云的HGX,用于邊緣的EGX,以及用于終端的AGX。
以面向終端的AGX為例,自動(dòng)駕駛和機(jī)器人是英偉達(dá)的兩個(gè)重點(diǎn)。
· 自動(dòng)駕駛:發(fā)布DRIVE AGX Orin
現(xiàn)場(chǎng),英偉達(dá)發(fā)布了用于自動(dòng)駕駛和機(jī)器人的軟件定義平臺(tái)——NVIDIA DRIVE AGX Orin。該平臺(tái)內(nèi)置全新Orin系統(tǒng)級(jí)芯片,Orin由170億個(gè)晶體管組成,集成了NVIDIA新一代GPU架構(gòu)和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺加速器,每秒可運(yùn)行200萬億次計(jì)算,是上一代Xavier系統(tǒng)級(jí)芯片性能的7倍。
Orin可處理在自動(dòng)駕駛汽車和機(jī)器人中同時(shí)運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了ISO 26262 ASIL-D等系統(tǒng)安全標(biāo)準(zhǔn)。
值得注意的是,Orin支持可編程,并且有豐富的工具和軟件庫支持,與之前的Xavier處理器兼容,支持從L2到L5級(jí)別的自動(dòng)駕駛。
而且由于Orin和Xavier均可通過開放的CUDA、TensorRT API及各類庫進(jìn)行編程,因此開發(fā)者能夠在一次性投資后使用跨多代的產(chǎn)品。
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“打造安全的自動(dòng)駕駛汽車,也許是當(dāng)今社會(huì)所面臨的最大計(jì)算挑戰(zhàn)。實(shí)現(xiàn)自動(dòng)駕駛汽車所需的投入呈指數(shù)級(jí)增長(zhǎng),面對(duì)復(fù)雜的開發(fā)任務(wù),像Orin這樣的可擴(kuò)展、可編程、軟件定義的AI平臺(tái)不可或缺。”
硬件之外,英偉達(dá)還發(fā)布了一套使用主動(dòng)學(xué)習(xí)、聯(lián)邦學(xué)習(xí)和遷移學(xué)習(xí)來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的工具。以聯(lián)邦學(xué)習(xí)為例,可以讓多個(gè)組織和公司在不移動(dòng)或共享數(shù)據(jù)的情況下進(jìn)行合作,英偉達(dá)將訓(xùn)練模型發(fā)送給各個(gè)合作伙伴,每個(gè)合作伙伴在自己的數(shù)據(jù)上訓(xùn)練模型。
現(xiàn)場(chǎng),英偉達(dá)宣布和滴滴達(dá)成合作,滴滴將使用NVIDIA GPU和其他技術(shù)開發(fā)自動(dòng)駕駛和云計(jì)算解決方案。
· 機(jī)器人:發(fā)布全新Isaac SDK
今年3月的GTC會(huì)議上,英偉達(dá)就著重強(qiáng)調(diào)了機(jī)器人業(yè)務(wù)。今天,黃仁勛在現(xiàn)場(chǎng)發(fā)布了全新版本Isaac軟件開發(fā)套件(SDK),為機(jī)器人提供更新的AI感知和仿真功能。
Isaac SDK包括Isaac Robotics Engine(提供應(yīng)用程序框架),Isaac GEM(預(yù)先構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型、算法、庫、驅(qū)動(dòng)程序和API),用于室內(nèi)物流的參考應(yīng)用程序以及訓(xùn)練機(jī)器人Isaac Sim的第一個(gè)版本(提供導(dǎo)航功能)。
為了加快AI機(jī)器人的開發(fā)速度,全新Isaac SDK包括各種基于攝像頭的感知深度神經(jīng)網(wǎng)絡(luò),包括:
對(duì)象檢測(cè)——識(shí)別用于導(dǎo)航、交互或操控的對(duì)象;
自由空間分割——檢測(cè)和分割外部世界,例如確定人行道在哪里,以及機(jī)器人可以在哪里行駛;
3D姿態(tài)估計(jì)——了解目標(biāo)的位置和方向,從而實(shí)現(xiàn)諸如機(jī)械臂拾取物體的任務(wù);
2D人體姿態(tài)估計(jì)——將姿態(tài)估計(jì)應(yīng)用于人,這對(duì)于與人互動(dòng)的機(jī)器人(例如配送機(jī)器人)和協(xié)作機(jī)器人(專門設(shè)計(jì)用于與人合作)非常重要。
以新推出Isaac Sim機(jī)器人為例,它可以將所生成的軟件部署到在現(xiàn)實(shí)世界中運(yùn)行的真實(shí)機(jī)器人中。通過仿真,開發(fā)人員可以在極端情況下(即困難或異常情況下)對(duì)機(jī)器人進(jìn)行測(cè)試,以進(jìn)一步加強(qiáng)對(duì)它的訓(xùn)練。這有望大大加快機(jī)器人的開發(fā)速度,從而實(shí)現(xiàn)綜合數(shù)據(jù)的訓(xùn)練。
另外,Isaac SDK還支持多機(jī)器人仿真。這使開發(fā)人員可以將多個(gè)機(jī)器人放入仿真環(huán)境中進(jìn)行測(cè)試,以便它們學(xué)會(huì)彼此相關(guān)的工作。
發(fā)布TensorRT 7,減少會(huì)話AI推理延遲
英偉達(dá)在去年的GTC China上發(fā)布了支持自動(dòng)低精度推理的TensorRT 5,今天英偉達(dá)發(fā)布了TensorRT 7,內(nèi)置新型深度學(xué)習(xí)編譯器,支持各種類型的RNN、CNN和Transformer,相較于TRT 5只支持30種變換,TRT 7可以支持1000多種不同的計(jì)算變換和優(yōu)化。
TRT 7可為開發(fā)者設(shè)計(jì)的大量RNN配置自動(dòng)生成代碼,逐點(diǎn)融合LSTM單元,甚至可跨多個(gè)時(shí)間步長(zhǎng)進(jìn)行融合,并且盡可能做自動(dòng)低精度推理。
借助TRT 7,全球各地的開發(fā)者都可以實(shí)現(xiàn)會(huì)話式AI應(yīng)用,大幅減少推理延遲。舉個(gè)例子,通常情況下,一套端到端的自然語言理解流程可能由幾十種模型構(gòu)成,比如RNN、CNN、自編碼器等等,TRT 7可對(duì)所有模型進(jìn)行編譯,使其在英偉達(dá)GPU上運(yùn)行?;谟ミ_(dá)T4的推理會(huì)話AI只需要0.3秒,而CPU的推理延遲卻高達(dá)3秒。
GPU加CUDA,從火星著陸到基因測(cè)序,無所不能
如今,英偉達(dá)已經(jīng)售出了15億塊GPU,在使用的每塊GPU都兼容CUDA。英偉達(dá)的CUDA平臺(tái)具有豐富的庫、工具和應(yīng)用程序。僅在去年,英偉達(dá)發(fā)布了500多個(gè)SDK和庫,通過優(yōu)化軟件棧,英偉達(dá)提高了GPU的性能,讓深度學(xué)習(xí)訓(xùn)練在三年內(nèi)提高了4倍,深度學(xué)習(xí)推理在一年內(nèi)提高了2倍。
HPC應(yīng)用方面,NASA在英偉達(dá)GPU上通過FUN3D軟件運(yùn)行火星著陸情景模擬,產(chǎn)生高達(dá)150TB的數(shù)據(jù),英偉達(dá)借助DGX-2上運(yùn)行的Magnum IO GPU Direct Storage技術(shù),可“實(shí)時(shí)”對(duì)這些數(shù)據(jù)進(jìn)行可視化處理。
另外,由于GPU的訓(xùn)練成本只有傳統(tǒng)CPU的十分之一,并且可支持更大規(guī)模的模型訓(xùn)練,英偉達(dá)發(fā)布了深度推薦系統(tǒng),百度以及阿里均有采用。
CUDA方面,英偉達(dá)發(fā)布了由CUDA加速的Parabricks基因組分析工具包,可實(shí)現(xiàn)30到50倍的加速,目前華大基因已經(jīng)采用Parabricks來進(jìn)行基因變異檢測(cè),除此之外,CUDA新增加了對(duì)5G vRAN應(yīng)用的支持。
和騰訊合作,推出云游戲服務(wù)
在游戲方面,微軟出品的游戲《我的世界》支持RTX,可以實(shí)時(shí)完成預(yù)烘焙全局光線和一般反射的燈光效果。同時(shí),黃仁勛還宣布了其他6款GeForce RTX 游戲。
隨著谷歌、微軟入局云游戲,英偉達(dá)也將眼光投向了云游戲,現(xiàn)場(chǎng)英偉達(dá)宣布與騰訊合作推出START云游戲服務(wù),由英偉達(dá)提供GPU支持。
硬件方面,英偉達(dá)為PC筆記本提供的Max-Q設(shè)計(jì),可將高性能GPU集成到輕薄筆記本中,數(shù)據(jù)顯示,今年,GeForce RTX MAX 筆記本電腦是增長(zhǎng)速度最快的游戲平臺(tái)。
3D內(nèi)容創(chuàng)作上,黃仁勛介紹了英偉達(dá)的OMNIVERSE的進(jìn)展,發(fā)布面向建筑行業(yè)(AEC)的OMNIVERSE,在工作流中增加實(shí)時(shí)協(xié)作功能。
最后:
這一年,英偉達(dá)也明顯越來越重視邊緣以及端側(cè)產(chǎn)品,也一改以往售賣硬件“又貴又大”的規(guī)則,推出了性價(jià)比超高、便宜好用的小型嵌入式芯片產(chǎn)品。
曾經(jīng)主導(dǎo)云端AI芯片市場(chǎng)的英偉達(dá),在面對(duì)競(jìng)爭(zhēng)對(duì)手的突圍后,正在用云端加邊緣一體化的解決方案吸引更多客戶,并且愈加強(qiáng)調(diào)他們?cè)谲浻布系膬?yōu)勢(shì)。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
