卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

jh 2年前 (2024-04-11)

天下苦英偉達(dá)久矣。

卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

讓英偉達(dá)躺著賺錢?其他科技巨頭們不干了!

這幾天,谷歌、英特爾、Meta等科技巨頭集體官宣新款AI芯片。其中既有英特爾Gaudi 3這樣直接硬剛英偉達(dá)H200的“性能怪獸”,也有谷歌Axion這種主打高效全能的“性能鋼炮”。

而這些芯片都有同一個(gè)特性,都是為了AI模型服務(wù)。

在此之前,微軟、亞馬遜都陸續(xù)推出了自研處理器的計(jì)劃。

這場(chǎng)AI軍備競(jìng)賽,最終還是卷向了硬件。

主打性價(jià)比,英特爾硬剛英偉達(dá)

當(dāng)?shù)貢r(shí)間4月9日,在Intel Vision 2024會(huì)議上,英特爾CEO帕特·基辛格(Pat Gelsinger)推出了最新AI芯片Gaudi3,并現(xiàn)場(chǎng)與DJ來了一場(chǎng)蹦迪。

卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

為什么基辛格如此高興?讓我們看看這款芯片的參數(shù)——芯片模型訓(xùn)練層面,Gaudi3比英偉達(dá)H100快40%;推理層面Gaudi 3比英偉達(dá)H100快50%。

與現(xiàn)在最強(qiáng)的英偉達(dá)H200相比,Gaudi 3的推理速度依然保持優(yōu)勢(shì)。雖然基辛格沒有在現(xiàn)場(chǎng)給出直接的數(shù)據(jù),但他表示Gaudi 3在某些領(lǐng)域的性能甚至?xí)谩?/p>

卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

英偉達(dá)H200的性能毋庸置疑,它具備460萬億次的浮點(diǎn)運(yùn)算能力,并且有豐富的CUDA生態(tài)。相比之下,Gaudi 3其實(shí)并沒有太大優(yōu)勢(shì),更別說對(duì)標(biāo)B200這種最強(qiáng)大的芯片。

但Gaudi 3的特點(diǎn)就是“又好用又便宜”。

目前,H100的售價(jià)約在每臺(tái)2.5萬至4萬美元之間。那么作為升級(jí)款的H200,其上市后必然不會(huì)低于這個(gè)價(jià)格。

同理,英偉達(dá)的Backwell芯片預(yù)計(jì)售價(jià)為3-4萬美元,也符合英偉達(dá)目前的“身價(jià)”。這對(duì)于急需AI芯片的客戶來說,購(gòu)入H100已經(jīng)是一筆不小的開銷。

成本高是一回事,買不到貨更客戶們頭疼。

最近,X用戶“The Technology Brother”發(fā)布了一張圖片,數(shù)據(jù)顯示Meta公司囤積了全球最多的 H100 GPU,數(shù)量達(dá)到驚人的35萬塊,剩下的公司從3萬塊到300塊不等。

卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

根據(jù)GPU Utils網(wǎng)站在2023年的測(cè)算,H100缺口高達(dá)43萬張。如此大的供應(yīng)缺口,一些小公司只能等著訂單排隊(duì)。

H100芯片賣給誰,基本是英偉達(dá)CEO黃仁勛說了算。目前只有大客戶還有CoreWeave這種英偉達(dá)親自投資的公司才有優(yōu)先購(gòu)買權(quán),亞馬遜、微軟等競(jìng)爭(zhēng)對(duì)手只能限量供應(yīng)。

卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

更不要說,國(guó)內(nèi)AI公司只能購(gòu)買到A800這樣的閹割版產(chǎn)品。在AI算力競(jìng)賽面前,手握高端GPU就是手握優(yōu)勢(shì)。

當(dāng)然,限制H100并不全是英偉達(dá)的問題,臺(tái)積電的產(chǎn)能也要背很大的鍋。

總的來說,Gaudi 3不僅性能不輸H100,英特爾又有自己的代工能力,難怪基辛格有硬剛英偉達(dá)的信心。

當(dāng)客戶變成對(duì)手

除了多了一位競(jìng)爭(zhēng)對(duì)手外,英偉達(dá)的客戶們也選擇自研芯片的方式來減少對(duì)高端GPU的依賴。

在英特爾公布Gaudi3后,谷歌在Next大會(huì)上宣布推出自研首款基于Arm的CPU——Axion。

卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

據(jù)悉這款CPU處理器Axion,將提供比英特爾CPU更好的性能和能源的效率,并且比目前基于Arm的最快通用芯片,性能還要高出30%。

雖然對(duì)標(biāo)著英特爾的CPU,但谷歌這塊芯片實(shí)際是為了訓(xùn)練復(fù)雜的AI模型做準(zhǔn)備。和Gaudi 3一樣,Axion主打一個(gè)“性價(jià)比”,靠著自己出色的AI能力,為包括Google地球引擎和YouTube廣告平臺(tái)在內(nèi)的多項(xiàng)服務(wù)提供算力。

同樣是自研芯片項(xiàng)目,谷歌也對(duì)自家超算平臺(tái)進(jìn)行了升級(jí),推出了TPU v5p。

這是一個(gè)類似于英偉達(dá)GPU的替代品產(chǎn)品,用于AI加速任務(wù)。在自家最先進(jìn)的AI模型Gemini和開放AI模型Gemma支持下,TPU v5p將支持更大、更苛刻的模型。

有著CPU與TPU的雙重加持,谷歌的自研芯片項(xiàng)目越來越豐富。

無獨(dú)有偶,Meta也趕在了今天推出了新一代訓(xùn)練和推理加速器MTIA 。

早在去年5月,Meta公布了 7nm工藝的MTIA v1,專注于向數(shù)據(jù)中心服務(wù)。

而此次推出的新款 MTIA 芯片,采用5nm工藝,使用更大的物理設(shè)計(jì)、擁有更多的處理核心,功耗從25W提升到了90W,時(shí)鐘頻率也從800MHz提高到了 1.35GHz,整體性能提高了3倍。

卷起來了!科技巨頭齊發(fā)AI芯片,買GPU不如自研香

Meta表示,目前已經(jīng)在16個(gè)數(shù)據(jù)中心使用新款 MTIA芯片,這就意味著Meta在自研芯片上費(fèi)了不小的精力。

除了近期陸續(xù)公布新芯片的三家巨頭以外,算上亞馬遜AWS推出的Trainium和Inferentia兩個(gè)系列AI芯片,以及微軟在自家技術(shù)大會(huì)期間發(fā)布的用于云端AI訓(xùn)練和推理芯片Maia 100,目前絕大多數(shù)科技公司們都有了自研AI芯片項(xiàng)目。

結(jié)語

AI算力的軍備競(jìng)賽,正在愈演愈烈。每家科技公司都已經(jīng)預(yù)料到AI模型的規(guī)模會(huì)迅速擴(kuò)大。

然而從目前現(xiàn)狀來看,英偉達(dá)GPU依然牢牢掌握著全球算力資源,并且通過最新的AI芯片不斷穩(wěn)固當(dāng)前的商業(yè)模式。

但GPU的價(jià)格擺在那里,即使是財(cái)大氣粗的科技巨頭,也要計(jì)算性能和成本效益。

既然自己有能力在硬件上做出性能相當(dāng)且最合適自己的AI芯片,那么誰不想與英偉達(dá)全面一較高下呢?

不過在缺少生態(tài)和產(chǎn)量的前提下,英偉達(dá)的GPU依然是科技公司的首選。就看臺(tái)積電和英特爾在代工這一環(huán)節(jié),能不能給點(diǎn)力了。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到