高光后再轉(zhuǎn)身,英偉達(dá)的AI芯片進(jìn)階之路
英偉達(dá)會有個(gè)華麗的轉(zhuǎn)身嗎?
最近,端測的AI推理芯片市場一片火熱,英偉達(dá)和英特爾正面對壘,初創(chuàng)企業(yè)如履寒冰。而云上AI訓(xùn)練市場,已經(jīng)從早期的GPU一統(tǒng)天下,發(fā)展到如今多方勢力割據(jù)的局面。
作為最早吃到AI紅利的科技公司之一,英偉達(dá)在面對連續(xù)幾個(gè)季度的營收增速下滑后,不得不從數(shù)據(jù)中心下沉到邊緣和端上,發(fā)力更多場景。
在軟硬件生態(tài)上,英偉達(dá)堪稱是AI硬件廠商的標(biāo)桿,如今再回望顯卡巨頭的人工智能轉(zhuǎn)型之路,多次起落,頗為曲折。
“意外”的開始
在很長的一段時(shí)間內(nèi),外界對英偉達(dá)有兩個(gè)印象:顯卡大廠、皮衣老黃。一個(gè)是英偉達(dá)的核心GPU產(chǎn)品,一個(gè)是英偉達(dá)的形象代言人。
從1993年成立到成為和AMD、英特爾抗衡的半導(dǎo)體巨頭,英偉達(dá)經(jīng)歷了幾個(gè)關(guān)鍵的階段:一是圖形處理器突圍期,拿下大半的游戲顯卡市場;二是AI巔峰期,借著AI和挖礦一鳴驚人,三是AI轉(zhuǎn)型后時(shí)期,從高處下沉后的再反思。
早年的英偉達(dá)憑借GeForce系列顯卡在游戲市場所向披靡,和成立于1969年的AMD同坐一把交椅,N卡和A卡孰優(yōu)孰劣之爭也是游戲界老生常談的話題。
在此期間,英偉達(dá)既遇到顯卡質(zhì)量事故,面臨合作伙伴高額的賠償,也遭到競爭對手惡意拒絕技術(shù)專利共享,一路起起落落,一波三折。好在他們技術(shù)實(shí)力過硬,除了旗艦產(chǎn)品GeForce各方面性能給力,英偉達(dá)也在收購不同圖像處理公司,加大技術(shù)研發(fā)投入,加強(qiáng)在游戲渲染硬件上的優(yōu)勢。
但即便如此,此時(shí)的英偉達(dá)更多的還是游戲宅眼中的“大神”,距離除PC之外更廣闊的主流B端市場還很遠(yuǎn)。
轉(zhuǎn)折點(diǎn)發(fā)生在2012年的ImageNet(圖像識別領(lǐng)域賽事)大賽上,當(dāng)時(shí)Geoffrey Hinton的學(xué)生通過兩個(gè)GPU將深度卷積神經(jīng)網(wǎng)絡(luò)AlexNet的準(zhǔn)確率提高了10.8%,震撼了學(xué)術(shù)界,英偉達(dá)也借此一戰(zhàn)成名,從游戲市場一大步跨入AI市場。
看似無心插柳柳成蔭,但實(shí)際上背后是英偉達(dá)在GPU上多年的厚積薄發(fā)。當(dāng)學(xué)術(shù)界開始嘗試用GPU做通用計(jì)算(GPGPU)時(shí),英偉達(dá)看到了GPU在圖形運(yùn)算之外的潛力,搗鼓出了改變深度學(xué)習(xí),也改變了英偉達(dá)自己的CUDA(通用并行計(jì)算平臺),一個(gè)用于GPU通用計(jì)算的并行計(jì)算平臺和編程模型,從軟硬件層面釋放了GPU做并行計(jì)算的能力,非常適合運(yùn)行深度學(xué)習(xí)算法。
然而在2012到來之前,這個(gè)產(chǎn)品的特點(diǎn)只有一個(gè):只燒錢不賺錢。但當(dāng)Geoffrey Hinton和兩個(gè)學(xué)生用GPU+CUDA開啟深度學(xué)習(xí)黃金時(shí)代后,一切都不同了。
自此之后,英偉達(dá)的GPU代替CPU成了AI訓(xùn)練市場的香餑餑,到底有多香呢?
其股價(jià)從2015年1月的20美元飆升至2018年10月的280美元,英偉達(dá)乘著深度學(xué)習(xí)和區(qū)塊鏈的東風(fēng),成為AI芯片領(lǐng)域的絕對霸主。
黃仁勛更是在GTC 2015上直言,“我們不是硬件公司,我們是AI公司”。
那么,英偉達(dá)如何從CUDA開啟自己的AI輝煌時(shí)刻呢?在其排列種組合類繁多的AI芯片產(chǎn)品中,GPU又是如何步步深入到人工智能的訓(xùn)練、推理市場?
眼花繚亂的AI產(chǎn)品線
通常情況下,AI計(jì)算包括兩個(gè)步驟,一是訓(xùn)練深度學(xué)習(xí)模型,即訓(xùn)練;二是將訓(xùn)練好的模型部署到實(shí)際應(yīng)用環(huán)境,也就是推理。
早期,英偉達(dá)在訓(xùn)練市場占據(jù)了絕對的優(yōu)勢,谷歌、亞馬遜等無一例外皆使用GPU作為大量數(shù)據(jù)訓(xùn)練的算力支持。
在股價(jià)飛漲的那幾年,英偉達(dá)也推出了適用于不同場景的AI芯片和配套的軟件,打造了一個(gè)龐大的AI生態(tài)圈。
刨除用于PC游戲、影視的顯卡產(chǎn)品,在其官網(wǎng)可以看到,英偉達(dá)的AI產(chǎn)品可被歸類為:DGX系統(tǒng)、DRIVE PX、Jetson、Tesla、T4企業(yè)服務(wù)器。
每個(gè)產(chǎn)品之間有的是包含和被包含的關(guān)系,比如Tesla是DGX系統(tǒng)的基礎(chǔ)組成硬件,有的大類產(chǎn)品列表下還可以再細(xì)分針對不同場景、性能、價(jià)格有所差異的產(chǎn)品。
簡單梳理來看,英偉達(dá)的AI芯片產(chǎn)品主要是以GPU為核心,而GPU的微架構(gòu)會逐年迭代,從Tesla(此處是架構(gòu),非GPU產(chǎn)品)、Fermi、Kepler、Maxwell、Pascal、Volta以及最新的Turing,越往后微架構(gòu)的計(jì)算能力越高。比如從Volta開始,英偉達(dá)就集成了用于AI計(jì)算的Tensor Core,算力可想而知。
所有的GPU產(chǎn)品都會按照性能、功耗、使用場景搭配不同的架構(gòu),英偉達(dá)于2017年推出的Tesla V100基于的就是架構(gòu)Volta GV100。而代號為Tesla的GPU產(chǎn)品也是目前云端主流的訓(xùn)練推理芯片,其專為高性能計(jì)算、深度學(xué)習(xí)而生。
2018年,英偉達(dá)推出了基于Turning架構(gòu)的云端推理GPU產(chǎn)品Tesla T4,這也是T4企業(yè)服務(wù)器產(chǎn)品的核心硬件構(gòu)成。
在Tesla系列GPU的基礎(chǔ)上,英偉達(dá)再進(jìn)行“排列組合”,推出了超級計(jì)算機(jī)DGX,專為加速數(shù)據(jù)中心和簡化深度學(xué)習(xí)工作流程而設(shè)計(jì),可加快實(shí)驗(yàn)速度、訓(xùn)練更大的模型。
硬件之外,英偉達(dá)近幾年也接連推出了優(yōu)化GPU運(yùn)算的相關(guān)配套軟件資源,包括用于推理的TensorRT,基于CUDA的高性能深度學(xué)習(xí)加速庫CuDNN、CuBLAS等等。
在站穩(wěn)數(shù)據(jù)中心的位置后,英偉達(dá)將目光投向了面向不同應(yīng)用場景的端側(cè)推理芯片。2015年,他們推出了面向自動駕駛的Drive PX系列,以及適用于小型設(shè)備的Jetson系列。
端側(cè)AI芯片關(guān)鍵的一點(diǎn)在于它不僅包括GPU,還囊括了基于ARM架構(gòu)的CPU等其他芯片,是一個(gè)完整的SoC。簡言之,英偉達(dá)的云上AI芯片是GPU的組合,端側(cè)的AI芯片則是GPU、CPU、DRAM、閃存等在內(nèi)的處理器組合。
在這里,我們需要區(qū)分一下英偉達(dá)的GPU產(chǎn)品和Tegra處理器,根據(jù)英偉達(dá)的財(cái)報(bào),其營收主要就是這兩大產(chǎn)品線組成。GPU不用過多贅述,Tegra處理器是他們在2008年推出的用于移動設(shè)備和平板電腦的芯片組(SoC),后期更多的應(yīng)用是向自動駕駛和智能硬件終端方向靠攏。
目前,最新一代Tegra處理器名稱取自“X教授”,叫做Xavier系列。其中,DRIVE Xavier是英偉達(dá)最新自動駕駛計(jì)算平臺NVIDIA DRIVE AGX Pegasus的核心AI芯片,去年他們又發(fā)布了名為Jetson AGX Xavier的端側(cè)AI芯片,可驅(qū)動新一代機(jī)器人及自動機(jī)器。
同樣,在軟件方面,英偉達(dá)也打造了四個(gè)AI計(jì)算平臺:Clara醫(yī)療圖像平臺、Metropolis智能交通平臺、ISSAC機(jī)器人、DRIVE自動駕駛平臺。
粗看英偉達(dá)的顯卡系列,很多人會覺得眼花繚亂,但萬變不離其宗的是,英偉達(dá)所有的芯片都是根據(jù)應(yīng)用場景靈活搭配不同的GPU架構(gòu),從而提供不同的算力需求,所以GPU的架構(gòu)是英偉達(dá)的核心殺手锏。
但實(shí)際上為了能夠賣出更多的顯卡產(chǎn)品,英偉達(dá)確實(shí)在走廣撒網(wǎng)的路線,用“機(jī)海”戰(zhàn)術(shù)保持穩(wěn)定的業(yè)務(wù)營收增長。
不過根據(jù)英偉達(dá)近一年的財(cái)報(bào),數(shù)據(jù)中心業(yè)務(wù)的增長已經(jīng)開始放緩,競爭對手們正在蠢蠢欲動分食剩下的蛋糕。
繼谷歌推出TPU后,云端AI芯片的競爭勢頭如燎原之勢往外延伸,Intel最近推出了NNP-T/NNT-I 用于云端訓(xùn)練/推理,華為則在去年就推出了“昇騰”系列芯片用于云端訓(xùn)練/推理,而阿里平頭哥也帶來了“含光”系列芯片用于云端推理……
前有狼后有虎的危機(jī)下,英偉達(dá)在今年3月?lián)魯±蠈κ钟⑻貭?,?9.7億美元的高價(jià)收購了以色列服務(wù)器芯片公司Mellanox以提振數(shù)據(jù)中心的業(yè)務(wù),同時(shí)發(fā)布一系列端側(cè)的AI芯片,強(qiáng)化云端之外的邊緣側(cè)的布局。
高光之后的轉(zhuǎn)身
相較于云上的訓(xùn)練和推理,端側(cè)的推理芯片市場也非常熱鬧。由于應(yīng)用場景的不同,端側(cè)的算法各有差異,相應(yīng)的對性能、功耗以及延遲的要求也有區(qū)別,所以在這個(gè)市場沒有絕對的巨無霸,可以一統(tǒng)江山。
這也是為什么多數(shù)初創(chuàng)公司會選擇從端側(cè)的推理芯片切入,無巨頭壟斷、場景豐富、自由度高。
如果云端的AI處理主要強(qiáng)調(diào)精度、處理能力、內(nèi)存容量和帶寬,對價(jià)格不那么敏感,那端側(cè)的AI處理則主要關(guān)注功耗、響應(yīng)時(shí)間、體積、成本和隱私安全等問題,這些無一例外都是英偉達(dá)曾經(jīng)的劣勢。
所以從去年年底到現(xiàn)在,英偉達(dá)一改以往售賣硬件“又貴又大”的規(guī)則,推出了性價(jià)比超高、便宜好用的小型嵌入式芯片Jetson Nano和Jetson Xavier NX。Jetson系列都是低功耗的模塊化系統(tǒng),具備CPU、GPU、PMIC、DRAM和閃存,進(jìn)一步豐富端側(cè)的應(yīng)用場景。
曾經(jīng)主導(dǎo)云端AI芯片市場的英偉達(dá),在面對競爭對手的突圍后,正在用云端加邊緣一體化的解決方案吸引更多客戶,面向終端以及邊緣端的Jetson系列產(chǎn)品就是英偉達(dá)的新武器。
如今再去看英偉達(dá)的AI布局,已經(jīng)非常清晰明了,只要技術(shù)可以觸及的軟硬件,統(tǒng)統(tǒng)都要自己做,廣撒網(wǎng)多撈魚,產(chǎn)品總會越賣越多。
雖然GPU是一塊磚,哪里需要往哪里搬,但是隨著諸如FPGA、ASIC等產(chǎn)品在端側(cè)的快速鋪貨,英偉達(dá)的GPU優(yōu)勢并不明顯。
不過,英偉達(dá)的產(chǎn)品策略對市場的反應(yīng)速度一直很快,從顯卡起家的他們并不會囿于GPU的思維,英偉達(dá)的DLA(深度學(xué)習(xí)加速器)和Xavier,一個(gè)ASIC和一個(gè)SoC,都證明了他們可以創(chuàng)建各種各樣的加速器,而不僅僅是GPU。
而且英偉達(dá)耕耘這么多年,本身的優(yōu)勢也非常明顯。強(qiáng)大成熟的軟硬件生態(tài)能力是很多初創(chuàng)公司都無法比肩的,其次是技術(shù)的優(yōu)勢,顯卡架構(gòu)的迭代和升級都是英偉達(dá)每年上億研發(fā)支出的成果。除此之外,早期的產(chǎn)業(yè)端積累以及產(chǎn)品的口碑也讓他們的端側(cè)擴(kuò)張之路會走的更加順暢。
在人工智能技術(shù)快速迭代、新架構(gòu)層出不窮,以及應(yīng)用場景更加多元的當(dāng)下,英偉達(dá)從AI引領(lǐng)者的角色正在轉(zhuǎn)變?yōu)橐粋€(gè)追趕者,從他們的AI產(chǎn)品線中也能管窺一豹,以點(diǎn)帶面,強(qiáng)調(diào)云邊緣端一體化,抓幾個(gè)重點(diǎn)場景推出軟硬件在內(nèi)的解決方案,同時(shí)以賦能者的身份,涌入市場前景更為廣闊的端側(cè)市場。
曾經(jīng)被AI眷顧的英偉達(dá),高光之后,會有個(gè)華麗的轉(zhuǎn)身嗎?
最后,今年的GTC大會將于12月16-19日在蘇州召開,屆時(shí),鎂客網(wǎng)也會帶來現(xiàn)場報(bào)道。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
