高光后再轉(zhuǎn)身,英偉達(dá)的AI芯片進(jìn)階之路

巫盼 6年前 (2019-12-09)

英偉達(dá)會(huì)有個(gè)華麗的轉(zhuǎn)身嗎?

最近,端測(cè)的AI推理芯片市場(chǎng)一片火熱,英偉達(dá)和英特爾正面對(duì)壘,初創(chuàng)企業(yè)如履寒冰。而云上AI訓(xùn)練市場(chǎng),已經(jīng)從早期的GPU一統(tǒng)天下,發(fā)展到如今多方勢(shì)力割據(jù)的局面。

作為最早吃到AI紅利的科技公司之一,英偉達(dá)在面對(duì)連續(xù)幾個(gè)季度的營(yíng)收增速下滑后,不得不從數(shù)據(jù)中心下沉到邊緣和端上,發(fā)力更多場(chǎng)景。

在軟硬件生態(tài)上,英偉達(dá)堪稱(chēng)是AI硬件廠商的標(biāo)桿,如今再回望顯卡巨頭的人工智能轉(zhuǎn)型之路,多次起落,頗為曲折。

“意外”的開(kāi)始

在很長(zhǎng)的一段時(shí)間內(nèi),外界對(duì)英偉達(dá)有兩個(gè)印象:顯卡大廠、皮衣老黃。一個(gè)是英偉達(dá)的核心GPU產(chǎn)品,一個(gè)是英偉達(dá)的形象代言人。

高光后再轉(zhuǎn)身,英偉達(dá)的AI芯片進(jìn)階之路

從1993年成立到成為和AMD、英特爾抗衡的半導(dǎo)體巨頭,英偉達(dá)經(jīng)歷了幾個(gè)關(guān)鍵的階段:一是圖形處理器突圍期,拿下大半的游戲顯卡市場(chǎng);二是AI巔峰期,借著AI和挖礦一鳴驚人,三是AI轉(zhuǎn)型后時(shí)期,從高處下沉后的再反思。

早年的英偉達(dá)憑借GeForce系列顯卡在游戲市場(chǎng)所向披靡,和成立于1969年的AMD同坐一把交椅,N卡和A卡孰優(yōu)孰劣之爭(zhēng)也是游戲界老生常談的話(huà)題。

高光后再轉(zhuǎn)身,英偉達(dá)的AI芯片進(jìn)階之路

在此期間,英偉達(dá)既遇到顯卡質(zhì)量事故,面臨合作伙伴高額的賠償,也遭到競(jìng)爭(zhēng)對(duì)手惡意拒絕技術(shù)專(zhuān)利共享,一路起起落落,一波三折。好在他們技術(shù)實(shí)力過(guò)硬,除了旗艦產(chǎn)品GeForce各方面性能給力,英偉達(dá)也在收購(gòu)不同圖像處理公司,加大技術(shù)研發(fā)投入,加強(qiáng)在游戲渲染硬件上的優(yōu)勢(shì)。

但即便如此,此時(shí)的英偉達(dá)更多的還是游戲宅眼中的“大神”,距離除PC之外更廣闊的主流B端市場(chǎng)還很遠(yuǎn)。

轉(zhuǎn)折點(diǎn)發(fā)生在2012年的ImageNet(圖像識(shí)別領(lǐng)域賽事)大賽上,當(dāng)時(shí)Geoffrey Hinton的學(xué)生通過(guò)兩個(gè)GPU將深度卷積神經(jīng)網(wǎng)絡(luò)AlexNet的準(zhǔn)確率提高了10.8%,震撼了學(xué)術(shù)界,英偉達(dá)也借此一戰(zhàn)成名,從游戲市場(chǎng)一大步跨入AI市場(chǎng)。

看似無(wú)心插柳柳成蔭,但實(shí)際上背后是英偉達(dá)在GPU上多年的厚積薄發(fā)。當(dāng)學(xué)術(shù)界開(kāi)始嘗試用GPU做通用計(jì)算(GPGPU)時(shí),英偉達(dá)看到了GPU在圖形運(yùn)算之外的潛力,搗鼓出了改變深度學(xué)習(xí),也改變了英偉達(dá)自己的CUDA(通用并行計(jì)算平臺(tái)),一個(gè)用于GPU通用計(jì)算的并行計(jì)算平臺(tái)和編程模型,從軟硬件層面釋放了GPU做并行計(jì)算的能力,非常適合運(yùn)行深度學(xué)習(xí)算法。

高光后再轉(zhuǎn)身,英偉達(dá)的AI芯片進(jìn)階之路

然而在2012到來(lái)之前,這個(gè)產(chǎn)品的特點(diǎn)只有一個(gè):只燒錢(qián)不賺錢(qián)。但當(dāng)Geoffrey Hinton和兩個(gè)學(xué)生用GPU+CUDA開(kāi)啟深度學(xué)習(xí)黃金時(shí)代后,一切都不同了。

自此之后,英偉達(dá)的GPU代替CPU成了AI訓(xùn)練市場(chǎng)的香餑餑,到底有多香呢?

其股價(jià)從2015年1月的20美元飆升至2018年10月的280美元,英偉達(dá)乘著深度學(xué)習(xí)和區(qū)塊鏈的東風(fēng),成為AI芯片領(lǐng)域的絕對(duì)霸主。

黃仁勛更是在GTC 2015上直言,“我們不是硬件公司,我們是AI公司”。

那么,英偉達(dá)如何從CUDA開(kāi)啟自己的AI輝煌時(shí)刻呢?在其排列種組合類(lèi)繁多的AI芯片產(chǎn)品中,GPU又是如何步步深入到人工智能的訓(xùn)練、推理市場(chǎng)?

眼花繚亂的AI產(chǎn)品線

通常情況下,AI計(jì)算包括兩個(gè)步驟,一是訓(xùn)練深度學(xué)習(xí)模型,即訓(xùn)練;二是將訓(xùn)練好的模型部署到實(shí)際應(yīng)用環(huán)境,也就是推理。

早期,英偉達(dá)在訓(xùn)練市場(chǎng)占據(jù)了絕對(duì)的優(yōu)勢(shì),谷歌、亞馬遜等無(wú)一例外皆使用GPU作為大量數(shù)據(jù)訓(xùn)練的算力支持。

在股價(jià)飛漲的那幾年,英偉達(dá)也推出了適用于不同場(chǎng)景的AI芯片和配套的軟件,打造了一個(gè)龐大的AI生態(tài)圈。

刨除用于PC游戲、影視的顯卡產(chǎn)品,在其官網(wǎng)可以看到,英偉達(dá)的AI產(chǎn)品可被歸類(lèi)為:DGX系統(tǒng)、DRIVE PX、Jetson、Tesla、T4企業(yè)服務(wù)器。

每個(gè)產(chǎn)品之間有的是包含和被包含的關(guān)系,比如Tesla是DGX系統(tǒng)的基礎(chǔ)組成硬件,有的大類(lèi)產(chǎn)品列表下還可以再細(xì)分針對(duì)不同場(chǎng)景、性能、價(jià)格有所差異的產(chǎn)品。

簡(jiǎn)單梳理來(lái)看,英偉達(dá)的AI芯片產(chǎn)品主要是以GPU為核心,而GPU的微架構(gòu)會(huì)逐年迭代,Tesla(此處是架構(gòu),非GPU產(chǎn)品)、Fermi、Kepler、Maxwell、Pascal、Volta以及最新的Turing,越往后微架構(gòu)的計(jì)算能力越高。比如從Volta開(kāi)始,英偉達(dá)就集成了用于AI計(jì)算的Tensor Core,算力可想而知。

所有的GPU產(chǎn)品都會(huì)按照性能、功耗、使用場(chǎng)景搭配不同的架構(gòu),英偉達(dá)于2017年推出的Tesla V100基于的就是架構(gòu)Volta GV100。而代號(hào)為Tesla的GPU產(chǎn)品也是目前云端主流的訓(xùn)練推理芯片,其專(zhuān)為高性能計(jì)算、深度學(xué)習(xí)而生。

2018年,英偉達(dá)推出了基于Turning架構(gòu)的云端推理GPU產(chǎn)品Tesla T4,這也是T4企業(yè)服務(wù)器產(chǎn)品的核心硬件構(gòu)成。

在Tesla系列GPU的基礎(chǔ)上,英偉達(dá)再進(jìn)行“排列組合”,推出了超級(jí)計(jì)算機(jī)DGX,專(zhuān)為加速數(shù)據(jù)中心和簡(jiǎn)化深度學(xué)習(xí)工作流程而設(shè)計(jì),可加快實(shí)驗(yàn)速度、訓(xùn)練更大的模型。

高光后再轉(zhuǎn)身,英偉達(dá)的AI芯片進(jìn)階之路

硬件之外,英偉達(dá)近幾年也接連推出了優(yōu)化GPU運(yùn)算的相關(guān)配套軟件資源,包括用于推理的TensorRT,基于CUDA的高性能深度學(xué)習(xí)加速庫(kù)CuDNN、CuBLAS等等。

在站穩(wěn)數(shù)據(jù)中心的位置后,英偉達(dá)將目光投向了面向不同應(yīng)用場(chǎng)景的端側(cè)推理芯片。2015年,他們推出了面向自動(dòng)駕駛的Drive PX系列,以及適用于小型設(shè)備的Jetson系列。

端側(cè)AI芯片關(guān)鍵的一點(diǎn)在于它不僅包括GPU,還囊括了基于ARM架構(gòu)的CPU等其他芯片,是一個(gè)完整的SoC。簡(jiǎn)言之,英偉達(dá)的云上AI芯片是GPU的組合,端側(cè)的AI芯片則是GPU、CPU、DRAM、閃存等在內(nèi)的處理器組合。

在這里,我們需要區(qū)分一下英偉達(dá)的GPU產(chǎn)品和Tegra處理器,根據(jù)英偉達(dá)的財(cái)報(bào),其營(yíng)收主要就是這兩大產(chǎn)品線組成。GPU不用過(guò)多贅述,Tegra處理器是他們?cè)?008年推出的用于移動(dòng)設(shè)備和平板電腦的芯片組(SoC),后期更多的應(yīng)用是向自動(dòng)駕駛和智能硬件終端方向靠攏。

目前,最新一代Tegra處理器名稱(chēng)取自“X教授”,叫做Xavier系列。其中,DRIVE Xavier是英偉達(dá)最新自動(dòng)駕駛計(jì)算平臺(tái)NVIDIA DRIVE AGX Pegasus的核心AI芯片,去年他們又發(fā)布了名為Jetson AGX Xavier的端側(cè)AI芯片,可驅(qū)動(dòng)新一代機(jī)器人及自動(dòng)機(jī)器。

同樣,在軟件方面,英偉達(dá)也打造了四個(gè)AI計(jì)算平臺(tái):Clara醫(yī)療圖像平臺(tái)、Metropolis智能交通平臺(tái)、ISSAC機(jī)器人、DRIVE自動(dòng)駕駛平臺(tái)。

粗看英偉達(dá)的顯卡系列,很多人會(huì)覺(jué)得眼花繚亂,但萬(wàn)變不離其宗的是,英偉達(dá)所有的芯片都是根據(jù)應(yīng)用場(chǎng)景靈活搭配不同的GPU架構(gòu),從而提供不同的算力需求,所以GPU的架構(gòu)是英偉達(dá)的核心殺手锏。

但實(shí)際上為了能夠賣(mài)出更多的顯卡產(chǎn)品,英偉達(dá)確實(shí)在走廣撒網(wǎng)的路線,用“機(jī)海”戰(zhàn)術(shù)保持穩(wěn)定的業(yè)務(wù)營(yíng)收增長(zhǎng)。

不過(guò)根據(jù)英偉達(dá)近一年的財(cái)報(bào),數(shù)據(jù)中心業(yè)務(wù)的增長(zhǎng)已經(jīng)開(kāi)始放緩,競(jìng)爭(zhēng)對(duì)手們正在蠢蠢欲動(dòng)分食剩下的蛋糕。

繼谷歌推出TPU后,云端AI芯片的競(jìng)爭(zhēng)勢(shì)頭如燎原之勢(shì)往外延伸,Intel最近推出了NNP-T/NNT-I 用于云端訓(xùn)練/推理,華為則在去年就推出了“昇騰”系列芯片用于云端訓(xùn)練/推理,而阿里平頭哥也帶來(lái)了“含光”系列芯片用于云端推理……

前有狼后有虎的危機(jī)下,英偉達(dá)在今年3月?lián)魯±蠈?duì)手英特爾,以69.7億美元的高價(jià)收購(gòu)了以色列服務(wù)器芯片公司Mellanox以提振數(shù)據(jù)中心的業(yè)務(wù),同時(shí)發(fā)布一系列端側(cè)的AI芯片,強(qiáng)化云端之外的邊緣側(cè)的布局。

高光之后的轉(zhuǎn)身

相較于云上的訓(xùn)練和推理,端側(cè)的推理芯片市場(chǎng)也非常熱鬧。由于應(yīng)用場(chǎng)景的不同,端側(cè)的算法各有差異,相應(yīng)的對(duì)性能、功耗以及延遲的要求也有區(qū)別,所以在這個(gè)市場(chǎng)沒(méi)有絕對(duì)的巨無(wú)霸,可以一統(tǒng)江山。

這也是為什么多數(shù)初創(chuàng)公司會(huì)選擇從端側(cè)的推理芯片切入,無(wú)巨頭壟斷、場(chǎng)景豐富、自由度高。

如果云端的AI處理主要強(qiáng)調(diào)精度、處理能力、內(nèi)存容量和帶寬,對(duì)價(jià)格不那么敏感,那端側(cè)的AI處理則主要關(guān)注功耗、響應(yīng)時(shí)間、體積、成本和隱私安全等問(wèn)題,這些無(wú)一例外都是英偉達(dá)曾經(jīng)的劣勢(shì)。

所以從去年年底到現(xiàn)在,英偉達(dá)一改以往售賣(mài)硬件“又貴又大”的規(guī)則,推出了性?xún)r(jià)比超高、便宜好用的小型嵌入式芯片Jetson Nano和Jetson Xavier NX。Jetson系列都是低功耗的模塊化系統(tǒng),具備CPU、GPU、PMIC、DRAM和閃存,進(jìn)一步豐富端側(cè)的應(yīng)用場(chǎng)景。

高光后再轉(zhuǎn)身,英偉達(dá)的AI芯片進(jìn)階之路

曾經(jīng)主導(dǎo)云端AI芯片市場(chǎng)的英偉達(dá),在面對(duì)競(jìng)爭(zhēng)對(duì)手的突圍后,正在用云端加邊緣一體化的解決方案吸引更多客戶(hù),面向終端以及邊緣端的Jetson系列產(chǎn)品就是英偉達(dá)的新武器。

如今再去看英偉達(dá)的AI布局,已經(jīng)非常清晰明了,只要技術(shù)可以觸及的軟硬件,統(tǒng)統(tǒng)都要自己做,廣撒網(wǎng)多撈魚(yú),產(chǎn)品總會(huì)越賣(mài)越多。

雖然GPU是一塊磚,哪里需要往哪里搬,但是隨著諸如FPGA、ASIC等產(chǎn)品在端側(cè)的快速鋪貨,英偉達(dá)的GPU優(yōu)勢(shì)并不明顯。

不過(guò),英偉達(dá)的產(chǎn)品策略對(duì)市場(chǎng)的反應(yīng)速度一直很快,從顯卡起家的他們并不會(huì)囿于GPU的思維,英偉達(dá)的DLA(深度學(xué)習(xí)加速器)和Xavier,一個(gè)ASIC和一個(gè)SoC,都證明了他們可以創(chuàng)建各種各樣的加速器,而不僅僅是GPU。

而且英偉達(dá)耕耘這么多年,本身的優(yōu)勢(shì)也非常明顯。強(qiáng)大成熟的軟硬件生態(tài)能力是很多初創(chuàng)公司都無(wú)法比肩的,其次是技術(shù)的優(yōu)勢(shì),顯卡架構(gòu)的迭代和升級(jí)都是英偉達(dá)每年上億研發(fā)支出的成果。除此之外,早期的產(chǎn)業(yè)端積累以及產(chǎn)品的口碑也讓他們的端側(cè)擴(kuò)張之路會(huì)走的更加順暢。

在人工智能技術(shù)快速迭代、新架構(gòu)層出不窮,以及應(yīng)用場(chǎng)景更加多元的當(dāng)下,英偉達(dá)從AI引領(lǐng)者的角色正在轉(zhuǎn)變?yōu)橐粋€(gè)追趕者,從他們的AI產(chǎn)品線中也能管窺一豹,以點(diǎn)帶面,強(qiáng)調(diào)云邊緣端一體化,抓幾個(gè)重點(diǎn)場(chǎng)景推出軟硬件在內(nèi)的解決方案,同時(shí)以賦能者的身份,涌入市場(chǎng)前景更為廣闊的端側(cè)市場(chǎng)。

曾經(jīng)被AI眷顧的英偉達(dá),高光之后,會(huì)有個(gè)華麗的轉(zhuǎn)身嗎?

最后,今年的GTC大會(huì)將于12月16-19日在蘇州召開(kāi),屆時(shí),鎂客網(wǎng)也會(huì)帶來(lái)現(xiàn)場(chǎng)報(bào)道。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到