后摩爾時(shí)代,異構(gòu)計(jì)算會(huì)是通用系統(tǒng)的唯一解決方案嗎?

Lynn 6年前 (2019-10-16)

應(yīng)用倒逼異構(gòu)計(jì)算發(fā)展,產(chǎn)業(yè)落實(shí)卻又困難重重。

說(shuō)起異構(gòu)計(jì)算,它起源于上世紀(jì)80年代,其在技術(shù)層面的定義很簡(jiǎn)單:不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式,以區(qū)別于同構(gòu)計(jì)算。不過(guò)從商用角度來(lái)看,僅看硬件,其涉及到的計(jì)算單元就包括CPU、GPU、ASIC、FPGA等,類型之多和搭配之豐富讓其成為了一件讓人“望而卻步”的事情。

但是現(xiàn)在,華為、阿里等在人工智能領(lǐng)域有深入布局的公司均在異構(gòu)計(jì)算技術(shù)上有不同程度的探索和戰(zhàn)略規(guī)劃,特別是在移動(dòng)應(yīng)用領(lǐng)域,三星、蘋果等公司更是主要的參與者。繼云計(jì)算之后,異構(gòu)計(jì)算也逐漸發(fā)展成為了另一個(gè)具有更為廣泛含義的產(chǎn)業(yè)發(fā)展方向代名詞。

在《鯤鵬計(jì)算產(chǎn)業(yè)發(fā)展白皮書》(下文簡(jiǎn)稱“白皮書”)中,華為這樣闡釋計(jì)算產(chǎn)業(yè)創(chuàng)新發(fā)展的必要性:“面對(duì)新興應(yīng)用對(duì)計(jì)算平臺(tái)提出的端—邊—云協(xié)同、海量多樣化數(shù)據(jù)智能處理、實(shí)時(shí)分析等需求,IT基礎(chǔ)設(shè)施需要在計(jì)算體系架構(gòu)、芯片架構(gòu)、業(yè)務(wù)部署架構(gòu)等諸多方面進(jìn)行創(chuàng)新來(lái)適配該需求,從而找到最優(yōu)解決方案。”

這里面所提到的架構(gòu)和技術(shù)創(chuàng)新最優(yōu)方案,在不斷發(fā)展的過(guò)程中,已經(jīng)逐步形成了大家的共識(shí),也就是我們所熟知的異構(gòu)計(jì)算產(chǎn)業(yè)。

后摩爾時(shí)代,異構(gòu)計(jì)算帶來(lái)效率提升

說(shuō)起催生異構(gòu)計(jì)算產(chǎn)業(yè)發(fā)展起來(lái)的重要因素,應(yīng)用需求的增長(zhǎng)是主要推動(dòng)力,深度學(xué)習(xí)算法的發(fā)展和快速普及則是關(guān)鍵的導(dǎo)火索,而摩爾定律的失效恰好成為最后推手。

進(jìn)入后摩爾時(shí)代,整個(gè)計(jì)算機(jī)產(chǎn)業(yè)都從“重硬件”觀念中走了出來(lái),軟件的地位隨著深度學(xué)習(xí)算法的出現(xiàn)逐步走高。

不同于傳統(tǒng)算法,深度學(xué)習(xí)算法的出現(xiàn)讓處理海量數(shù)據(jù)成為可能,它對(duì)應(yīng)用的滲透也讓單一功能之間可以產(chǎn)生聯(lián)動(dòng),場(chǎng)景中數(shù)據(jù)(如語(yǔ)音、文本、圖片、視頻等)和功能的處理因此變得復(fù)雜起來(lái),隨之而來(lái)的是整個(gè)市場(chǎng)中沒(méi)有一種滿足所有業(yè)務(wù)訴求的通用計(jì)算架構(gòu),這也成為所有企業(yè)不得不直面的困難。

以阿里巴巴的在線交易OLTP數(shù)據(jù)庫(kù)系統(tǒng)為例來(lái)看,根據(jù)統(tǒng)計(jì),OLTP每天的記錄寫入量達(dá)到了幾十億。從2011年開始參戰(zhàn)雙十一到2017年的雙十一,系統(tǒng)的峰值吞吐達(dá)到了千萬(wàn)級(jí)TPS (transactions per second),呈倍數(shù)增長(zhǎng)。

迅速的業(yè)務(wù)增長(zhǎng)對(duì)服務(wù)器數(shù)量和系統(tǒng)存儲(chǔ)都是一個(gè)嚴(yán)峻的考驗(yàn),盲目加裝服務(wù)器顯然不符合成本預(yù)期,因此為了滿足業(yè)務(wù)對(duì)性能和成本近乎苛刻的要求——在功耗和成本不做過(guò)多提升的基礎(chǔ)上完成對(duì)邏輯復(fù)雜調(diào)度任務(wù)的執(zhí)行和海量數(shù)據(jù)的高效并發(fā)處理,整個(gè)系統(tǒng)架構(gòu)都需要改變和創(chuàng)新。

未來(lái)通用系統(tǒng)的唯一出路,異構(gòu)計(jì)算難進(jìn)退

面對(duì)多樣的處理需求,選擇異構(gòu)處理器、異構(gòu)體系結(jié)構(gòu)組成的異構(gòu)系統(tǒng)成為企業(yè)自然而然的選擇。異構(gòu)計(jì)算能夠充分發(fā)揮CPU/GPU在通用計(jì)算上的靈活性,及時(shí)響應(yīng)數(shù)據(jù)處理需求,搭配上FPGA/ASIC等特殊能力,來(lái)充分發(fā)揮協(xié)處理器的效能,根據(jù)特定需求合理地分配計(jì)算資源。這樣做的好處顯而易見(jiàn),在處理速度和功耗之間找到平衡,達(dá)到高效又省電的效果。

事實(shí)是它確實(shí)提升了企業(yè)處理高速并行任務(wù)的效率。華為實(shí)驗(yàn)室曾給出數(shù)據(jù)公開力證了“異構(gòu)”設(shè)計(jì)的好處:以大數(shù)據(jù)應(yīng)用為例,相比于傳統(tǒng)處理器,鯤鵬處理器(異構(gòu)處理器)的綜合性能提升30%,并在同等性能條件下,功耗降低20%。

在異構(gòu)計(jì)算的帶動(dòng)下,HSA(異構(gòu)系統(tǒng)體系結(jié)構(gòu))逐步代替了傳統(tǒng)的ISA(本機(jī)指令集體系結(jié)構(gòu)),SoC(復(fù)雜的片上系統(tǒng))、3D異構(gòu)封裝也成為芯片設(shè)計(jì)廠商主流的選擇,而非遵從摩爾定律的約束。

可以說(shuō),異構(gòu)計(jì)算切實(shí)走進(jìn)了技術(shù)商用發(fā)展的舞臺(tái)。

從鯤鵬看未來(lái)發(fā)展

目前,隨著異構(gòu)計(jì)算的商用,配合改變最大的仍然是底層芯片架構(gòu),因此芯片廠商的動(dòng)作也最為頻繁,除了國(guó)內(nèi)幾家以異構(gòu)設(shè)計(jì)為關(guān)鍵業(yè)務(wù)的芯片設(shè)計(jì)公司,老牌廠商也紛紛迎合市場(chǎng)需求在異構(gòu)計(jì)算技術(shù)上進(jìn)行布局。如英特爾最新推出的AI平臺(tái),就包含了CPU、GPU、DSP、NNP、FPGA等一系列不同的處理核心,英偉達(dá)的機(jī)器人平臺(tái)Jetson Xavier也包含了6種處理器——GPU/CPU/NPU/NVDLA等。

不過(guò)縱觀整個(gè)商用市場(chǎng),將異構(gòu)計(jì)算盤面鋪得最大的非華為莫屬。通過(guò)鯤鵬生態(tài)的建設(shè),華為首次將計(jì)算業(yè)務(wù)直接推出并落實(shí),因此去看異構(gòu)計(jì)算產(chǎn)業(yè)商業(yè)化的發(fā)展,從鯤鵬生態(tài)的布局可以窺得一二。

未來(lái)通用系統(tǒng)的唯一出路,異構(gòu)計(jì)算難進(jìn)退

據(jù)白皮書上介紹,華為將鯤鵬計(jì)算產(chǎn)業(yè)定義為基于鯤鵬處理器構(gòu)建的全棧IT基礎(chǔ)設(shè)施、行業(yè)應(yīng)用及服務(wù),其中包括PC、服務(wù)器、存儲(chǔ)、操作系統(tǒng)、中間件、虛擬化、數(shù)據(jù)庫(kù)、云服務(wù)、行業(yè)應(yīng)用以及咨詢管理服務(wù)等各個(gè)細(xì)分環(huán)節(jié)。

自上個(gè)月發(fā)布白皮書以來(lái),華為迅速在四川、河北等多地落戶研發(fā)中心,發(fā)布了“華為鯤鵬”培訓(xùn)認(rèn)證體系并與Arm、金山云等超過(guò)150家廠商建立合作??梢哉f(shuō),從人才、政策到上下游廠商生態(tài)建設(shè),華為進(jìn)行了非常全面的布局。

從它的動(dòng)作來(lái)看,目前華為選擇了政府、金融、電信和互聯(lián)網(wǎng)等行業(yè)的主要場(chǎng)景。而對(duì)于未來(lái),它是這樣設(shè)想的,“隨著鯤鵬計(jì)算產(chǎn)業(yè)向縱深發(fā)展,將逐步實(shí)現(xiàn)全行業(yè)、全場(chǎng)景覆蓋,基于鯤鵬處理器的算力將會(huì)像水像電一樣無(wú)所不及,為政府、運(yùn)營(yíng)商、金融、互聯(lián)網(wǎng)、能源、交通、教育、醫(yī)療等各個(gè)行業(yè)帶來(lái)產(chǎn)業(yè)變革的新機(jī)遇。”

但不難發(fā)現(xiàn),鯤鵬生態(tài)的建設(shè)免不了一場(chǎng)浩大工程,除了要與海內(nèi)外生態(tài)廠家合作,它還要投入到操作系統(tǒng)、編譯器、工具鏈、算法優(yōu)化庫(kù)等的開發(fā)和維護(hù),同時(shí)針對(duì)數(shù)據(jù)中心大數(shù)據(jù)、分布式存儲(chǔ)、云原生應(yīng)用等場(chǎng)景,開發(fā)基于鯤鵬處理器的各類解決方案產(chǎn)品,這都不是一朝一夕可以達(dá)成的。

難啃的骨頭,需合力破生態(tài)的局

由上看出,異構(gòu)系統(tǒng)所涉及的環(huán)節(jié)十分之多,華為面臨的困難是十分明顯的,整個(gè)異構(gòu)計(jì)算商業(yè)化進(jìn)程的推進(jìn)阻力也是顯而易見(jiàn):每個(gè)環(huán)節(jié)都要?jiǎng)?chuàng)新意味著上下游廠商均向一處使力,這不僅僅涉及到各廠商自身的創(chuàng)新,上下游的配合、標(biāo)準(zhǔn)的建立都將成為一個(gè)浩大的工程。

我們了解到,在硬件領(lǐng)域,整機(jī)廠商行業(yè)整體的利潤(rùn)率就比較低,且設(shè)計(jì)能力參差不齊,在考慮兼容性等性能的條件下做出設(shè)計(jì)上的改變顯然難如登天;而在基礎(chǔ)軟件領(lǐng)域,由于此前產(chǎn)業(yè)的發(fā)展,現(xiàn)在已經(jīng)形成不同芯片不同基礎(chǔ)軟件的“百花齊放”狀態(tài),做好系統(tǒng)之間的兼容顯然也不是容易的事情;至于行業(yè)應(yīng)用領(lǐng)域,也存在著用基于傳統(tǒng)計(jì)算架構(gòu)的行業(yè)標(biāo)準(zhǔn)來(lái)評(píng)估新計(jì)算架構(gòu),制約行業(yè)應(yīng)用往新計(jì)算架構(gòu)遷移的問(wèn)題。比如HPC行業(yè)普遍采用衡量雙精度浮點(diǎn)計(jì)算能力的HPL標(biāo)準(zhǔn)來(lái)評(píng)估系統(tǒng)性能,但這并不符合內(nèi)存密集型等應(yīng)用的業(yè)務(wù)實(shí)際需求。

由此不難發(fā)現(xiàn),雖然異構(gòu)計(jì)算帶來(lái)的計(jì)算效率提升是指數(shù)級(jí)的,但是需要配套工具、基礎(chǔ)設(shè)施等,帶來(lái)的生態(tài)問(wèn)題也是嚴(yán)峻的。

針對(duì)存在的問(wèn)題,華為發(fā)展鯤鵬計(jì)算產(chǎn)業(yè)給出了幾大關(guān)鍵舉措:為幫助廠商快速開發(fā)基于鯤鵬處理器和PC等計(jì)算產(chǎn)品,降低系統(tǒng)設(shè)計(jì)和開發(fā)難度,華為自己開發(fā)服務(wù)器主板和PC主板;支持整機(jī)廠商基于鯤鵬處理器主板發(fā)展自由品牌;軟件層面的開源。

但是,顯然還不夠。

異構(gòu)計(jì)算生態(tài)的建設(shè)少不了華為這樣的巨頭去推進(jìn),但作為商用個(gè)體,華為的號(hào)召力難免要弱;同時(shí),幾大舉措雖然指出了大方向,但是關(guān)鍵技術(shù)至今尚未顯露,如華為盛推的鴻蒙系統(tǒng),這必然會(huì)大大降低上下游廠商的士氣和興趣。而且從短短32頁(yè)的白皮書來(lái)看,華為對(duì)于鯤鵬計(jì)算產(chǎn)業(yè)的設(shè)想細(xì)則不夠明晰,這難免會(huì)讓人產(chǎn)生質(zhì)疑。此外,未來(lái)計(jì)算產(chǎn)業(yè)創(chuàng)新多少有些傷經(jīng)動(dòng)骨,生態(tài)重建難度之大可想而知。

異構(gòu)計(jì)算是一塊難啃的“骨頭”。

不過(guò)由需求推動(dòng),市場(chǎng)里不同領(lǐng)域內(nèi)也涌現(xiàn)出了成功案例,它們提醒我們,從更長(zhǎng)遠(yuǎn)的角度去看,也許需要給異構(gòu)計(jì)算自然發(fā)展更多的時(shí)間。

目前,在硬件層面,高通、Intel等紛紛在各個(gè)領(lǐng)域做起了異構(gòu)平臺(tái),寒武紀(jì)、谷歌等公司也為云或端側(cè)真正的異構(gòu)處理器的設(shè)計(jì)貢獻(xiàn)了思路;同時(shí)在基礎(chǔ)軟件層面,為了發(fā)展異構(gòu)系統(tǒng),2012年HSA基金會(huì)就已經(jīng)成立,并取得了一定進(jìn)展:簡(jiǎn)化了異構(gòu)編程,推出了免版稅的開放規(guī)范、創(chuàng)建了標(biāo)準(zhǔn)和可全面運(yùn)行的生產(chǎn)系統(tǒng),允許使用許多常見(jiàn)的編程語(yǔ)言(包括C / C ++、Python、OpenCL、Java等)對(duì)不同類型的處理器進(jìn)行編程??梢哉f(shuō)星星之火已然點(diǎn)起。

未來(lái)通用系統(tǒng)的唯一出路,異構(gòu)計(jì)算難進(jìn)退

最后

今年,從各個(gè)公司的動(dòng)作和各大報(bào)道上可以察覺(jué)出,“異構(gòu)計(jì)算”來(lái)勢(shì)洶洶。在華為的白皮書中我們可以看出,異構(gòu)計(jì)算的提出源于需求催生的架構(gòu)創(chuàng)新,但是在尋求技術(shù)與架構(gòu)創(chuàng)新的路上,如何落實(shí)異構(gòu)計(jì)算成為最大的難題。

在技術(shù)發(fā)展歷史上,無(wú)論是人工智能還是半導(dǎo)體領(lǐng)域,其發(fā)展都超過(guò)了一個(gè)甲子,相比較來(lái)看,誕生于上世紀(jì)80年代的異構(gòu)計(jì)算確實(shí)顯得年輕了許多,因?yàn)樗姝h(huán)節(jié)之多,它很容易讓人提出質(zhì)疑:現(xiàn)在過(guò)多談?wù)摦悩?gòu)計(jì)算生態(tài)是否為時(shí)過(guò)早?

不得不說(shuō),異構(gòu)計(jì)算產(chǎn)業(yè)的落實(shí),必然是一件需要技術(shù)和生態(tài)兩方面支撐的事情,道阻且長(zhǎng)。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到