后摩爾時代,異構(gòu)計算會是通用系統(tǒng)的唯一解決方案嗎?

Lynn 6年前 (2019-10-16)

應用倒逼異構(gòu)計算發(fā)展,產(chǎn)業(yè)落實卻又困難重重。

說起異構(gòu)計算,它起源于上世紀80年代,其在技術(shù)層面的定義很簡單:不同類型指令集和體系架構(gòu)的計算單元組成系統(tǒng)的計算方式,以區(qū)別于同構(gòu)計算。不過從商用角度來看,僅看硬件,其涉及到的計算單元就包括CPU、GPU、ASIC、FPGA等,類型之多和搭配之豐富讓其成為了一件讓人“望而卻步”的事情。

但是現(xiàn)在,華為、阿里等在人工智能領域有深入布局的公司均在異構(gòu)計算技術(shù)上有不同程度的探索和戰(zhàn)略規(guī)劃,特別是在移動應用領域,三星、蘋果等公司更是主要的參與者。繼云計算之后,異構(gòu)計算也逐漸發(fā)展成為了另一個具有更為廣泛含義的產(chǎn)業(yè)發(fā)展方向代名詞。

在《鯤鵬計算產(chǎn)業(yè)發(fā)展白皮書》(下文簡稱“白皮書”)中,華為這樣闡釋計算產(chǎn)業(yè)創(chuàng)新發(fā)展的必要性:“面對新興應用對計算平臺提出的端—邊—云協(xié)同、海量多樣化數(shù)據(jù)智能處理、實時分析等需求,IT基礎設施需要在計算體系架構(gòu)、芯片架構(gòu)、業(yè)務部署架構(gòu)等諸多方面進行創(chuàng)新來適配該需求,從而找到最優(yōu)解決方案。”

這里面所提到的架構(gòu)和技術(shù)創(chuàng)新最優(yōu)方案,在不斷發(fā)展的過程中,已經(jīng)逐步形成了大家的共識,也就是我們所熟知的異構(gòu)計算產(chǎn)業(yè)。

后摩爾時代,異構(gòu)計算帶來效率提升

說起催生異構(gòu)計算產(chǎn)業(yè)發(fā)展起來的重要因素,應用需求的增長是主要推動力,深度學習算法的發(fā)展和快速普及則是關鍵的導火索,而摩爾定律的失效恰好成為最后推手。

進入后摩爾時代,整個計算機產(chǎn)業(yè)都從“重硬件”觀念中走了出來,軟件的地位隨著深度學習算法的出現(xiàn)逐步走高。

不同于傳統(tǒng)算法,深度學習算法的出現(xiàn)讓處理海量數(shù)據(jù)成為可能,它對應用的滲透也讓單一功能之間可以產(chǎn)生聯(lián)動,場景中數(shù)據(jù)(如語音、文本、圖片、視頻等)和功能的處理因此變得復雜起來,隨之而來的是整個市場中沒有一種滿足所有業(yè)務訴求的通用計算架構(gòu),這也成為所有企業(yè)不得不直面的困難。

以阿里巴巴的在線交易OLTP數(shù)據(jù)庫系統(tǒng)為例來看,根據(jù)統(tǒng)計,OLTP每天的記錄寫入量達到了幾十億。從2011年開始參戰(zhàn)雙十一到2017年的雙十一,系統(tǒng)的峰值吞吐達到了千萬級TPS (transactions per second),呈倍數(shù)增長。

迅速的業(yè)務增長對服務器數(shù)量和系統(tǒng)存儲都是一個嚴峻的考驗,盲目加裝服務器顯然不符合成本預期,因此為了滿足業(yè)務對性能和成本近乎苛刻的要求——在功耗和成本不做過多提升的基礎上完成對邏輯復雜調(diào)度任務的執(zhí)行和海量數(shù)據(jù)的高效并發(fā)處理,整個系統(tǒng)架構(gòu)都需要改變和創(chuàng)新。

未來通用系統(tǒng)的唯一出路,異構(gòu)計算難進退

面對多樣的處理需求,選擇異構(gòu)處理器、異構(gòu)體系結(jié)構(gòu)組成的異構(gòu)系統(tǒng)成為企業(yè)自然而然的選擇。異構(gòu)計算能夠充分發(fā)揮CPU/GPU在通用計算上的靈活性,及時響應數(shù)據(jù)處理需求,搭配上FPGA/ASIC等特殊能力,來充分發(fā)揮協(xié)處理器的效能,根據(jù)特定需求合理地分配計算資源。這樣做的好處顯而易見,在處理速度和功耗之間找到平衡,達到高效又省電的效果。

事實是它確實提升了企業(yè)處理高速并行任務的效率。華為實驗室曾給出數(shù)據(jù)公開力證了“異構(gòu)”設計的好處:以大數(shù)據(jù)應用為例,相比于傳統(tǒng)處理器,鯤鵬處理器(異構(gòu)處理器)的綜合性能提升30%,并在同等性能條件下,功耗降低20%。

在異構(gòu)計算的帶動下,HSA(異構(gòu)系統(tǒng)體系結(jié)構(gòu))逐步代替了傳統(tǒng)的ISA(本機指令集體系結(jié)構(gòu)),SoC(復雜的片上系統(tǒng))、3D異構(gòu)封裝也成為芯片設計廠商主流的選擇,而非遵從摩爾定律的約束。

可以說,異構(gòu)計算切實走進了技術(shù)商用發(fā)展的舞臺。

從鯤鵬看未來發(fā)展

目前,隨著異構(gòu)計算的商用,配合改變最大的仍然是底層芯片架構(gòu),因此芯片廠商的動作也最為頻繁,除了國內(nèi)幾家以異構(gòu)設計為關鍵業(yè)務的芯片設計公司,老牌廠商也紛紛迎合市場需求在異構(gòu)計算技術(shù)上進行布局。如英特爾最新推出的AI平臺,就包含了CPU、GPU、DSP、NNP、FPGA等一系列不同的處理核心,英偉達的機器人平臺Jetson Xavier也包含了6種處理器——GPU/CPU/NPU/NVDLA等。

不過縱觀整個商用市場,將異構(gòu)計算盤面鋪得最大的非華為莫屬。通過鯤鵬生態(tài)的建設,華為首次將計算業(yè)務直接推出并落實,因此去看異構(gòu)計算產(chǎn)業(yè)商業(yè)化的發(fā)展,從鯤鵬生態(tài)的布局可以窺得一二。

未來通用系統(tǒng)的唯一出路,異構(gòu)計算難進退

據(jù)白皮書上介紹,華為將鯤鵬計算產(chǎn)業(yè)定義為基于鯤鵬處理器構(gòu)建的全棧IT基礎設施、行業(yè)應用及服務,其中包括PC、服務器、存儲、操作系統(tǒng)、中間件、虛擬化、數(shù)據(jù)庫、云服務、行業(yè)應用以及咨詢管理服務等各個細分環(huán)節(jié)。

自上個月發(fā)布白皮書以來,華為迅速在四川、河北等多地落戶研發(fā)中心,發(fā)布了“華為鯤鵬”培訓認證體系并與Arm、金山云等超過150家廠商建立合作??梢哉f,從人才、政策到上下游廠商生態(tài)建設,華為進行了非常全面的布局。

從它的動作來看,目前華為選擇了政府、金融、電信和互聯(lián)網(wǎng)等行業(yè)的主要場景。而對于未來,它是這樣設想的,“隨著鯤鵬計算產(chǎn)業(yè)向縱深發(fā)展,將逐步實現(xiàn)全行業(yè)、全場景覆蓋,基于鯤鵬處理器的算力將會像水像電一樣無所不及,為政府、運營商、金融、互聯(lián)網(wǎng)、能源、交通、教育、醫(yī)療等各個行業(yè)帶來產(chǎn)業(yè)變革的新機遇。”

但不難發(fā)現(xiàn),鯤鵬生態(tài)的建設免不了一場浩大工程,除了要與海內(nèi)外生態(tài)廠家合作,它還要投入到操作系統(tǒng)、編譯器、工具鏈、算法優(yōu)化庫等的開發(fā)和維護,同時針對數(shù)據(jù)中心大數(shù)據(jù)、分布式存儲、云原生應用等場景,開發(fā)基于鯤鵬處理器的各類解決方案產(chǎn)品,這都不是一朝一夕可以達成的。

難啃的骨頭,需合力破生態(tài)的局

由上看出,異構(gòu)系統(tǒng)所涉及的環(huán)節(jié)十分之多,華為面臨的困難是十分明顯的,整個異構(gòu)計算商業(yè)化進程的推進阻力也是顯而易見:每個環(huán)節(jié)都要創(chuàng)新意味著上下游廠商均向一處使力,這不僅僅涉及到各廠商自身的創(chuàng)新,上下游的配合、標準的建立都將成為一個浩大的工程。

我們了解到,在硬件領域,整機廠商行業(yè)整體的利潤率就比較低,且設計能力參差不齊,在考慮兼容性等性能的條件下做出設計上的改變顯然難如登天;而在基礎軟件領域,由于此前產(chǎn)業(yè)的發(fā)展,現(xiàn)在已經(jīng)形成不同芯片不同基礎軟件的“百花齊放”狀態(tài),做好系統(tǒng)之間的兼容顯然也不是容易的事情;至于行業(yè)應用領域,也存在著用基于傳統(tǒng)計算架構(gòu)的行業(yè)標準來評估新計算架構(gòu),制約行業(yè)應用往新計算架構(gòu)遷移的問題。比如HPC行業(yè)普遍采用衡量雙精度浮點計算能力的HPL標準來評估系統(tǒng)性能,但這并不符合內(nèi)存密集型等應用的業(yè)務實際需求。

由此不難發(fā)現(xiàn),雖然異構(gòu)計算帶來的計算效率提升是指數(shù)級的,但是需要配套工具、基礎設施等,帶來的生態(tài)問題也是嚴峻的。

針對存在的問題,華為發(fā)展鯤鵬計算產(chǎn)業(yè)給出了幾大關鍵舉措:為幫助廠商快速開發(fā)基于鯤鵬處理器和PC等計算產(chǎn)品,降低系統(tǒng)設計和開發(fā)難度,華為自己開發(fā)服務器主板和PC主板;支持整機廠商基于鯤鵬處理器主板發(fā)展自由品牌;軟件層面的開源。

但是,顯然還不夠。

異構(gòu)計算生態(tài)的建設少不了華為這樣的巨頭去推進,但作為商用個體,華為的號召力難免要弱;同時,幾大舉措雖然指出了大方向,但是關鍵技術(shù)至今尚未顯露,如華為盛推的鴻蒙系統(tǒng),這必然會大大降低上下游廠商的士氣和興趣。而且從短短32頁的白皮書來看,華為對于鯤鵬計算產(chǎn)業(yè)的設想細則不夠明晰,這難免會讓人產(chǎn)生質(zhì)疑。此外,未來計算產(chǎn)業(yè)創(chuàng)新多少有些傷經(jīng)動骨,生態(tài)重建難度之大可想而知。

異構(gòu)計算是一塊難啃的“骨頭”。

不過由需求推動,市場里不同領域內(nèi)也涌現(xiàn)出了成功案例,它們提醒我們,從更長遠的角度去看,也許需要給異構(gòu)計算自然發(fā)展更多的時間。

目前,在硬件層面,高通、Intel等紛紛在各個領域做起了異構(gòu)平臺,寒武紀、谷歌等公司也為云或端側(cè)真正的異構(gòu)處理器的設計貢獻了思路;同時在基礎軟件層面,為了發(fā)展異構(gòu)系統(tǒng),2012年HSA基金會就已經(jīng)成立,并取得了一定進展:簡化了異構(gòu)編程,推出了免版稅的開放規(guī)范、創(chuàng)建了標準和可全面運行的生產(chǎn)系統(tǒng),允許使用許多常見的編程語言(包括C / C ++、Python、OpenCL、Java等)對不同類型的處理器進行編程??梢哉f星星之火已然點起。

未來通用系統(tǒng)的唯一出路,異構(gòu)計算難進退

最后

今年,從各個公司的動作和各大報道上可以察覺出,“異構(gòu)計算”來勢洶洶。在華為的白皮書中我們可以看出,異構(gòu)計算的提出源于需求催生的架構(gòu)創(chuàng)新,但是在尋求技術(shù)與架構(gòu)創(chuàng)新的路上,如何落實異構(gòu)計算成為最大的難題。

在技術(shù)發(fā)展歷史上,無論是人工智能還是半導體領域,其發(fā)展都超過了一個甲子,相比較來看,誕生于上世紀80年代的異構(gòu)計算確實顯得年輕了許多,因為所涉環(huán)節(jié)之多,它很容易讓人提出質(zhì)疑:現(xiàn)在過多談論異構(gòu)計算生態(tài)是否為時過早?

不得不說,異構(gòu)計算產(chǎn)業(yè)的落實,必然是一件需要技術(shù)和生態(tài)兩方面支撐的事情,道阻且長。

最后,記得關注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關注

硬科技產(chǎn)業(yè)媒體

關注技術(shù)驅(qū)動創(chuàng)新

分享到