存算一體,拯救“瘋狂吃電”的AI芯片?
華人科學(xué)家20年研究,又有了新成果。
進(jìn)入2024年,AI 的膨脹速度依然讓人驚嘆。
但也有一些人認(rèn)為,AI對于電力的恐怖需求,未來會限制它的發(fā)展速度,“AI的盡頭是算力,而算力的盡頭是電力”。
有研究機(jī)構(gòu)根據(jù)英偉達(dá)出貨情況進(jìn)行估算,目前OpenAI大約需要3617個英偉達(dá)A100計算平臺來支持其ChatGPT的使用,而這些計算平臺所包含的GPU,每天的總能耗高達(dá)564MWh,即56.4萬度電。
而這僅僅是OpenAI一家公司,隨著谷歌、Meta等公司逐漸全盤AI化,其總體能耗將會是一個令人震驚的數(shù)字。
AI芯片消耗的電量主要出現(xiàn)在模型訓(xùn)練和推理兩方面,但實際上,AI芯片在進(jìn)行計算時,會在處理器和內(nèi)存單元不斷來回移動數(shù)據(jù),這同樣是一個耗能的過程。
一項降低功耗的新技術(shù)
近日,明尼蘇達(dá)大學(xué)雙城校區(qū)的研究人員對外宣布設(shè)計了一種全新的“計算隨機(jī)存取存儲器”(CRAM:computational random-access memory)原型芯片。
和傳統(tǒng)的馮·諾依曼架構(gòu)不同,這是一種“存算一體”架構(gòu),它使用稱為磁隧道結(jié) (MTJ) 的自旋電子器件,可以直接在內(nèi)存內(nèi)部進(jìn)行計算,由于自旋電子設(shè)備并不依賴電荷來存儲數(shù)據(jù),而是利用電子自旋,因此可以替代傳統(tǒng)的基于晶體管的芯片。
此外,根據(jù)研究團(tuán)隊公布的論文示例圖,我們可以注意到這種新型存儲器是通過將數(shù)據(jù)保存在內(nèi)存陣列內(nèi)進(jìn)行來處理,數(shù)據(jù)無需離開計算機(jī)存儲信息的網(wǎng)格,從而解決傳輸數(shù)據(jù)時產(chǎn)生。
該團(tuán)隊表示,和傳統(tǒng)馮·諾依曼架構(gòu)相比,基于 CRAM 的機(jī)器學(xué)習(xí)推理加速器能耗可降低至千分之一,甚至在某些場景應(yīng)用下可以達(dá)到 1/1700 或者 1/2500。在能源需求激增的AI時代,這種新技術(shù)無疑對提升能源效率起到至關(guān)重要的作用。
目前,該研究已經(jīng)發(fā)表在《自然》雜志的同行評議科學(xué)期刊 《npj Unconventional Computing》上,研究人員稱擁有該設(shè)備所用技術(shù)的多項專利。從報道可知,這項研究已經(jīng)醞釀了20多年,并且與明尼蘇達(dá)大學(xué)理工學(xué)院王建平博士有很大關(guān)系。
王建平教授是新型磁性材料和自旋電子器件領(lǐng)域的世界知名專家,側(cè)重于信息存儲、記憶和計算以及生物醫(yī)學(xué)傳感方向的研究。
自 2008年以來,王建平通過交換耦合復(fù)合介質(zhì)(ECC)的開創(chuàng)性實驗演示,高效利用了HDD硬盤驅(qū)動器的技術(shù),有效減少數(shù)據(jù)中心的整體數(shù)量,節(jié)約了全球能量消耗。
同時,王建平正是計算機(jī)隨機(jī)存取存儲器(CRAM)記憶單元的發(fā)明者。但在二十年前,他們提出拋棄馮·諾依曼模型的提議,無疑是被認(rèn)為是“瘋狂的”。
但最終他們團(tuán)隊還是堅持了下來,其發(fā)明的MTJ 器件已被英特爾、美光等公司變成了商業(yè)產(chǎn)品。
目前,該團(tuán)隊一直計劃與明尼蘇達(dá)州當(dāng)?shù)?span id="p0xu6beiaw" class='wp_keywordlink_affiliate'>半導(dǎo)體企業(yè)合作,提供大規(guī)模演示并生產(chǎn)硬件以推進(jìn)AI功能。
存算一體,何時能火
存算一體架構(gòu)的優(yōu)勢,其實就是打破了“存儲墻”和“功耗墻”問題。
前者指的是存儲器的性能跟不上 CPU 的性能,從而影響了系統(tǒng)的整體性能。而后者就是開頭提到的數(shù)據(jù)在處理器和存儲單元之間傳輸會產(chǎn)生的巨大功耗。
除此以外,存算一體架構(gòu)可以直接在設(shè)計時就為特定領(lǐng)域的計算問題提供更大的算力,非常適合于當(dāng)下的AI計算乃至未來更大規(guī)模的數(shù)據(jù)處理。
但值得一提的是,存算一體并不是什么新事物,而到目前該架構(gòu)也未形成統(tǒng)一的技術(shù)路徑,主流的包括近存計算(PNM)、存內(nèi)處理(PIM)、存內(nèi)計算(CIM)三種。
而存算一體芯片所面臨的挑戰(zhàn)也非常多,例如依賴先進(jìn)的封裝技術(shù)以此在芯片內(nèi)部實現(xiàn)更高的密度,而目前的一線封裝大廠已經(jīng)很難再擠出產(chǎn)能。
此外,在芯片設(shè)計方面,存算一體芯片對架構(gòu)設(shè)計的難度和復(fù)雜度要求很高,市面上也缺乏成熟的EDA軟件以及測試軟件。
最后就是在生態(tài)方面,目前無論是芯片大廠還是創(chuàng)業(yè)公司,各廠商開發(fā)出來的芯片都是圍繞自行定義的編程接口,軟件生態(tài)基本做不到互相通用,極大地影響了存算一體芯片推廣使用。
因此在目前電能資源還算充裕的前提下,存算一體芯片還是很難替代現(xiàn)有的AI芯片。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
