不做大模型的AI芯片,清華大學“ACCEL”有何不同?
更快,更低功耗
提及人工智能AI相關的算力芯片,現(xiàn)在絕大多數(shù)人的第一反應都是英偉達NVIDIA的GPU,作為AI模型搭建的基礎,英偉達的A100/H100幾乎成為了一塊塊“金磚”,深受業(yè)界喜愛。
然而,一方面,外部管制在上月又一次收緊,國內人工智能行業(yè)很難再獲取高端算力的支持;另一方面,以GPU為首的傳統(tǒng)數(shù)字邏輯電路芯片在處理復雜的人工智能算法時,也存在速度有限、功耗較大的困境。
面對這一挑戰(zhàn),清華大學自動化系戴瓊海院士、吳嘉敏助理教授與電子工程系方璐副教授、喬飛副研究員聯(lián)合攻關,提出了一種全新的計算架構——“全模擬光電智能計算芯片”(ACCEL)。
這顆芯片的理論算力性能可以達到目前高性能商用芯片的3000余倍,成果發(fā)表在了《自然》雜志上。
用光計算,更迅速
今年10月的2023諾貝爾物理學獎,授予了阿秒激光技術,光速作為人類已知的宇宙中最快速度擁有著很多獨特的特性,在物理學中有很多應用。
“如何用光做計算”是業(yè)界、學界的重要課題之一。
根據(jù)清華大學發(fā)表的項目論文所述,“全模擬光電計算芯片”(all-analog chip combining electronic and light computing,ACCEL)主要是針對人工智能領域計算機視覺相關任務的芯片。
傳統(tǒng)的計算機視覺處理方案,是外界光線投射到如相機CMOS這樣的芯片上,經(jīng)過光電轉換后輸出的數(shù)字電信號,再加以處理。
而ACCEL的處理方式完全不同,其輸入的圖像并非是一個以數(shù)字形式存在的“圖片”,而是物理意義上的“光”,相當于給計算機加了一雙人眼,而非攝像頭。
(圖源:清華大學)
輸入的圖像從光學計算部分(optical analog computing,OAC)進入,經(jīng)過數(shù)據(jù)壓縮處理之后,投射到光電二極管陣列上(論文中稱為電子模擬計算electronic analog computing,EAC),EAC通過OAC反饋的信息產生相應的輸出,表現(xiàn)為“有或無”的“1或0”,從而實現(xiàn)從模擬信號到數(shù)字信號的轉變,達成結果。
從技術層面看,光線在OAC部分僅僅是照射通過了一塊類似光刻機掩膜版的組件,就完成了信號壓縮和處理,省略了光信號到電信號的轉換,理論上沒有功耗,而且處理速度為光速。加上后續(xù)EAC的信號轉換輸出一共需要約4.4nJ能量和2ns時間,即可實現(xiàn)一次計算。
由于光子的高速特性,在處理信息時具有極高的速度和效率,同時功耗很低。根據(jù)論文提供的實驗數(shù)據(jù),在相同計算精度下以串行方式處理圖像時,ACCEL在實驗中實現(xiàn)了每幀72納秒的計算延遲和每幀4.38納焦耳的能耗,遠小于英偉達A100 GPU的每幀0.26毫秒延遲和每幀18.5毫焦能耗數(shù)據(jù)。
(圖源:《自然》)
ACCEL的等效算力4600TOP/s,能效比74800TOP/s/W,是英偉達A100 GPU的3000倍以上。
摩爾定律已致極限
傳統(tǒng)的集成電路技術進步在近些年開始逐步陷入瓶頸。影響了半導體行業(yè)半個多世紀的“摩爾定律”已經(jīng)逐漸放緩,甚至有些失效的預兆。從近兩年消費電子領域的困境可以窺見一二。
(圖源:Freeimages)
近幾年,手機、PC類處理器的性能提升速度已經(jīng)放緩,現(xiàn)今最為先進的3nm工藝產量與良率都面臨困境,即便是已經(jīng)發(fā)布的產品,性能提升也比較有限,并且,隨著晶體管尺寸一再逼近物理極限,密度大增的芯片帶來了功耗與發(fā)熱的雙重考驗。
用光替代電作為信息傳輸?shù)男螺d體,是其中一條探索道路。
清華大學此次發(fā)布的這顆ACCEL只是一顆32×32陣列的小型芯片,工藝上用的是可以稱之為“落后”的180nm工藝,更多是為了概念驗證。如果換用相對成熟的28nm,甚至是7nm這樣的先進工藝,都有望實現(xiàn)更高的處理速度,以及更大的神經(jīng)網(wǎng)絡以支持更復雜的任務。
另一方面,傳統(tǒng)的集成電路芯片處理AI這樣的復雜任務時,除了需要芯片本身的算力以外,還需要配合存儲器來實現(xiàn)數(shù)據(jù)存取,比如現(xiàn)在的GPU一般都會搭配高帶寬的HBM內存,這會造成能量的極大消耗。
清華大學電子工程系副教授方璐表示:除算力優(yōu)勢外,在智能視覺目標識別任務和無人系統(tǒng)(如自動駕駛)場景計算中,ACCEL的系統(tǒng)級能效(單位能量可進行的運算數(shù))經(jīng)實測是現(xiàn)有高性能芯片的400萬余倍,這一超低功耗的優(yōu)勢將有助于改善限制芯片集成的芯片發(fā)熱問題,有望為未來芯片設計帶來突破。
有什么用?
恰如前文所說,ACCEL主要是針對人工智能領域計算機視覺相關任務的芯片,應用場景也是集中在如圖像識別、高通量篩選、自動駕駛等。尤其在自動駕駛這種需要低延遲和低功耗的應用中可能會有優(yōu)秀的表現(xiàn)。
在終端上,主要應用可能會是超低功耗的生物識別等等。
必須說明的是,ACCEL對目前發(fā)展火熱的“大模型”訓練幾乎沒有幫助,無法取代通用AI算力芯片。
但伴隨著AI芯片競爭日趨激烈,如Intel、AMD、微軟、谷歌等廠商都在積極布局,清華大學的研究者們也在努力將光電芯片向著通用計算應用的方向發(fā)展,算是為國產AI算力芯片的設計提供了一個新思路。
本文作者:Visssom,觀點僅代表個人,題圖源:清華大學
最后,記得關注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產業(yè)媒體
關注技術驅動創(chuàng)新
