高端GPU瘋狂缺貨,誰(shuí)有機(jī)會(huì)挑戰(zhàn)英偉達(dá)?
AI生產(chǎn)力的爆炸還在繼續(xù)。
AI時(shí)代,但凡廠商涉及到AI相關(guān)業(yè)務(wù),都或多或少分得這個(gè)萬(wàn)億級(jí)市場(chǎng)的一杯羹。
但喧鬧之下,真正能算得上“AI贏家”的廠商屈指可數(shù)。其中,手握核心算力的英偉達(dá)可謂一騎絕塵,在業(yè)務(wù)、營(yíng)收等方面都遙遙領(lǐng)先于競(jìng)爭(zhēng)對(duì)手。
受大模型和生成式AI需求暴增影響,英偉達(dá)借助著出色的GPU硬件瘋狂吸金,慢慢打造起自己的“AI壁壘”。
不過壟斷之下必有勇夫,在想象力無限的“錢景”面前,硅谷巨頭和初創(chuàng)公司們顯然不會(huì)甘心英偉達(dá)獨(dú)吞市場(chǎng)。
有缺口,就有機(jī)會(huì)
英偉達(dá)能在AI行業(yè)率先領(lǐng)跑,靠的是黃仁勛敏銳的市場(chǎng)觀察力。
早在“AI寒冬”時(shí),英偉達(dá)就開始逆勢(shì)投資,全力押注AI,布局了“CPU+GPU+DPU”產(chǎn)品矩陣。因此,英偉達(dá)的AI壁壘其實(shí)早早就已經(jīng)建好,不僅搶跑了AMD、英特爾等競(jìng)爭(zhēng)者,同時(shí)也震懾了后來者。
隨著AI浪潮的到來,英偉達(dá)的產(chǎn)品迅速搶占了市場(chǎng),在“訓(xùn)練”和“推理”兩大環(huán)節(jié),英偉達(dá)GPU已經(jīng)做到了一家獨(dú)大,包括AWS、Azure、谷歌云、一眾國(guó)內(nèi)主流云廠商,以及微軟、谷歌旗下的大模型產(chǎn)品,都極度依賴英偉達(dá)的高端GPU來訓(xùn)練。
一方面,英偉達(dá)的高端GPU產(chǎn)品足夠優(yōu)秀,支撐得起廠商們的AI算力需求;另一方面,以CUDA為代表的英偉達(dá)并行計(jì)算和編程平臺(tái)是目前市面上能找到最好產(chǎn)品,AMD、英特爾都沒有替代品。
最終,英偉達(dá)幾乎成了AI芯片的唯一選擇,獨(dú)享市場(chǎng)也并不奇怪。
不過壟斷之下,英偉達(dá)高端GPU逐漸成了一種稀有資源,尤其是最頂尖的H100顯卡,只有少數(shù)科技巨頭才有渠道購(gòu)入,就連馬斯克旗下AI初創(chuàng)公司xAI 都得排隊(duì)才能購(gòu)入。
據(jù)媒體報(bào)道,H100在今年8月的市場(chǎng)總需求可能在43.2萬(wàn)張左右,排期則到了2024年第一季度到第二季度。在瞬息萬(wàn)變的AI競(jìng)賽場(chǎng),半年時(shí)間的窗口期足夠一輪洗牌。
面對(duì)這樣的缺口,英偉達(dá)的對(duì)手們自然不會(huì)錯(cuò)過這個(gè)機(jī)會(huì)。
同為GPU巨頭的AMD,最初并沒有將AI列為第一戰(zhàn)略。比起英偉達(dá),他們的AI產(chǎn)品更專注于傳統(tǒng)路線,盡可能優(yōu)化產(chǎn)生大量數(shù)據(jù)時(shí)的工作負(fù)載,以此實(shí)現(xiàn)性能的提升。
因此,雖然AMD的EPYC Milan處理器在數(shù)據(jù)中心有非常高的采購(gòu)率,但并不適配AI訓(xùn)練,同時(shí)由于AMD的ROCM生態(tài)剛剛起步,并不適合一些AI場(chǎng)景,這就導(dǎo)致AMD的GPU產(chǎn)品雖然出色,但很少被科技公司采購(gòu)。
不過,當(dāng)下市場(chǎng)急需一個(gè)“平價(jià)版”的英偉達(dá),AMD無疑是最好的選擇。
就在今年6月,AMD推出MI300X,這款新芯片預(yù)計(jì)Q4開始出貨,在英偉達(dá)GPU極度缺貨的情況下,在HBM容量和帶寬上瘋狂堆料的AMD MI300X或許成為一款很好的替代品。
至于英特爾,雖然在GPU市場(chǎng)很難取得突破,但憑借多年來的“人脈關(guān)系”,英特爾在中國(guó)市場(chǎng)與合作伙伴推出了特供版深度學(xué)習(xí)加速器——Habana Gaudi 2。
這款產(chǎn)品最大的特點(diǎn)就是在符合美國(guó)工業(yè)與安全局出口規(guī)定的前提下,性能沒有縮水。英特爾聲稱,目前Gaudi 2比英偉達(dá)A100價(jià)格更有競(jìng)爭(zhēng)力,且性能更高。
對(duì)于中國(guó)AI廠商來說,在H100、A100芯片無法供應(yīng)中國(guó)市場(chǎng)的情況下,英特爾聯(lián)合合作伙伴推動(dòng)Gaudi 2 AI加速器在中國(guó)市場(chǎng)的布局,無疑會(huì)給整個(gè)市場(chǎng)帶來變革,這是中國(guó)市場(chǎng)對(duì)于AI算力的強(qiáng)大需求所決定的。
不同路線層出不窮,初創(chuàng)企業(yè)看向差異化
大模型瘋狂索取算力,除了消耗著GPU產(chǎn)品的性能,同時(shí)還吞噬著大量的能源。
根據(jù)斯坦福人工智能研究所(HAI)發(fā)布的《2023年人工智能指數(shù)報(bào)告》,OpenAI的GPT-3單次訓(xùn)練耗電量高達(dá)1287兆瓦時(shí)。有專家推算,這個(gè)耗電量相當(dāng)于3000輛特斯拉,每輛跑滿20萬(wàn)英里(32.2萬(wàn)公里)。而這還只是ChatGPT一個(gè)大模型的耗電量,其他大模型全部運(yùn)作的耗電量,更是難以估量。
在龐大的功耗下,H100芯片成了AI廠商的一個(gè)“負(fù)擔(dān)”,同時(shí)也為一些新興的初創(chuàng)芯片廠商提供了利好消息。包括存算一體、Chiplet、HBM等解決方案紛紛被廠商挖掘出來,目的是實(shí)現(xiàn)AI芯片的降本增效。
例如在Chiplet賽道,加拿大AI芯片初創(chuàng)公司Tenstorrent就是目前比較亮眼的獨(dú)角獸之一,他們?cè)?021年吸引了傳奇芯片專家Jim Keller作為公司總裁兼CTO,并在此后拿下多筆巨額融資。
據(jù)報(bào)道,他們計(jì)劃以異構(gòu)和Chiplet設(shè)計(jì)的形式來開發(fā)RISC-V和AI芯片,目前已經(jīng)開發(fā)出基于12nm工藝的Grayskull和Wormhole兩款芯片,F(xiàn)P8算力高達(dá)328TFlops,在進(jìn)度上非???。
而在高性能AI芯片方面,Tenstorrent計(jì)劃于2024年推出可對(duì)標(biāo)英偉達(dá)最新發(fā)布的GH200 Grace Hopper平臺(tái),其最大特點(diǎn)就是相比類似性能的GPU系統(tǒng)便宜5到10倍。
靠著完善的產(chǎn)品規(guī)劃和技術(shù)骨干團(tuán)隊(duì),Tenstorrent在最近一次是從現(xiàn)代汽車集團(tuán)和三星的投資基金籌集到1億美元用于產(chǎn)品開發(fā),其估值也提升到14億美元以上。
還有一些初創(chuàng)企業(yè)并沒有直接從芯片角度出發(fā),例如初創(chuàng)公司Modulal就是從英偉達(dá)壟斷的AI軟件領(lǐng)域入手,希望通過其軟件為企業(yè)提供了另一種選擇,使開發(fā)者可以更簡(jiǎn)單地在其他公司設(shè)計(jì)的芯片上訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型,包括英特爾、AMD的GPU以及谷歌的TPU等等。
這家公司的來頭同樣不小,其聯(lián)合創(chuàng)始人兼首席執(zhí)行官Chris Lattner在蘋果公司任職期間,參與創(chuàng)建了Swift編程語(yǔ)言。而Modular的種子輪融資名單里包括了知名天使投資公司SV Angel。
除了前面提到的方向以外,硅谷還有不少初創(chuàng)企業(yè)從其他賽道入手,并與巨頭抱團(tuán)共建生態(tài),希望借此搶下一些市場(chǎng)份額。
當(dāng)然,不單是國(guó)外芯片企業(yè)大秀肌肉開始了芯片競(jìng)爭(zhēng),國(guó)內(nèi)半導(dǎo)體公司也開始了對(duì)AI芯片的研發(fā)。包括摩爾線程、天數(shù)智芯、沐曦在內(nèi)的多家國(guó)產(chǎn)GPU芯片都得到了金額較大的融資,產(chǎn)品研發(fā)進(jìn)度也非常快。
寫在最后
大模型時(shí)代,算力作為最重要的基礎(chǔ)設(shè)施,目前已經(jīng)成為一種稀缺資源??梢哉f,誰(shuí)掌握了算力,就手握了競(jìng)爭(zhēng)的資本。這其中,擁有GPU核心技術(shù)的英偉達(dá)更是提前建好了“AI壁壘”,讓競(jìng)爭(zhēng)者們羨慕不已。
不過AI市場(chǎng)非常大,同時(shí)半導(dǎo)體行業(yè)又具備復(fù)雜性,英偉達(dá)GPU在一卡難求的情況下,市場(chǎng)必然尋找替代品,這為后來者們提供了難得的機(jī)遇。
當(dāng)然,英偉達(dá)的護(hù)城河足夠深,并且保持著可持續(xù)競(jìng)爭(zhēng)優(yōu)勢(shì)。除了H100以外,英偉達(dá)近期拋出新一代GH200 Grace Hopper超級(jí)芯片、AI Workbench、AI Enterprise 4.0,以及Hugging Face等重磅武器。既然數(shù)量供不上,那就以質(zhì)換量。
當(dāng)然,這些產(chǎn)品的門檻非常高,目前來看仍只是少數(shù)科技巨頭才有機(jī)會(huì)采購(gòu)。
隨著賽道越來越激烈,英偉達(dá)絲毫沒有松懈,AI生產(chǎn)力的爆炸還在繼續(xù)。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
