2016年人工智能產(chǎn)業(yè)梳理:一朝引爆,穩(wěn)步前進(jìn)(上篇)
一場(chǎng)人機(jī)大戰(zhàn)引起了人工智能熱,在其普及的背后,是整個(gè)產(chǎn)業(yè)的穩(wěn)健布局。
在已經(jīng)過(guò)去的2016年,谷歌旗下DeepMind團(tuán)隊(duì)打造的AlphaGo引爆了新一輪的人工智能熱,開(kāi)啟了2016年的人工智能時(shí)代。由此,在蝴蝶效應(yīng)下,更多的人工智能產(chǎn)品融入了人們的生活,也讓人們意識(shí)到了智能化時(shí)代的到來(lái)。
人工智能之所以能夠大面積普及并獲得如今的成功,其背后的產(chǎn)業(yè)布局功不可沒(méi)。在下面的這篇文章中,各位看官不如跟著鎂客網(wǎng)的腳步,一起探索下人工智能的背后,其中主要分為四大模塊,分別為:基礎(chǔ)層、應(yīng)用層、軟件和媒體,在這四大模塊中,有的則進(jìn)一步分化成多個(gè)部分。本篇將先從基礎(chǔ)層開(kāi)始講起。
顧名思義,基礎(chǔ)層包括了人工智能技術(shù)研發(fā)所需的一切準(zhǔn)備,主要為芯片&傳感器、算法框架和云服務(wù)&大數(shù)據(jù)。具備了這些條件,科研人員們才可以更好地研發(fā)、訓(xùn)練自己的人工智能技術(shù),提高準(zhǔn)確度。
芯片&傳感器
在人工智能領(lǐng)域,算法的實(shí)現(xiàn)依賴(lài)于計(jì)算機(jī)強(qiáng)大的運(yùn)行速度,因此芯片就顯得尤為重要。而在運(yùn)行之上,人工智能產(chǎn)品需要大量的數(shù)據(jù)來(lái)提供服務(wù),這方面就得依靠那些相當(dāng)于人類(lèi)“眼耳鼻”的傳感器來(lái)搜集。
英偉達(dá)
憑借具備識(shí)別、標(biāo)記功能的圖像處理器,在人工智能還未全面興起之前,英偉達(dá)就先一步掌控了這一時(shí)機(jī)。在2016年,英偉達(dá)更是一連發(fā)布了多款針對(duì)深度學(xué)習(xí)的芯片,像4月份發(fā)布的一款可執(zhí)行深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)任務(wù)的Tesla P100 GPU,又比如9月份發(fā)布的基于Pascal架構(gòu)的深度學(xué)習(xí)芯片Tesla P4和Tesla P40,其中,Pascal架構(gòu)能助推深度學(xué)習(xí)加速65倍。
除了研發(fā)芯片,英偉達(dá)進(jìn)一步擴(kuò)大了自己的人工智能布局,發(fā)布了多個(gè)用于不同領(lǐng)域的硬件和平臺(tái),比如世界上首個(gè)人工智能超級(jí)計(jì)算機(jī)以及在CES 2017發(fā)布的自動(dòng)駕駛芯片XAVIER AICAR SUPERCOMPUTER、智能家居硬件Spot、搭載了人工智能系統(tǒng)ProAI(由ZF、英偉達(dá)聯(lián)合研發(fā))的車(chē)載電腦等。
ARM
迄今為止,全球85%的智能移動(dòng)設(shè)備中都采取了ARM架構(gòu),其中,超過(guò)95%的智能手機(jī)運(yùn)用了ARM的處理器,在智能硬件和物聯(lián)網(wǎng)高速發(fā)展的如今,ARM有著絕對(duì)的地位。
此外,根據(jù)其2015年Q4財(cái)報(bào),ARM所授權(quán)的芯片主要都用在了移動(dòng)計(jì)算、智能汽車(chē)、安全系統(tǒng)和物聯(lián)網(wǎng)。在智能汽車(chē)領(lǐng)域,包括NVIDIA、高通在內(nèi)都是基于A(yíng)RM設(shè)計(jì)開(kāi)發(fā)了面向駕駛輔助系統(tǒng)的超級(jí)計(jì)算機(jī)。早前,對(duì)于收購(gòu)ARM一事,軟銀CEO孫正義就曾明確表示ARM芯片將推動(dòng)人工智能走向奇點(diǎn)。而在收購(gòu)之后,軟銀也對(duì)ARM早已開(kāi)始的人工智能項(xiàng)目“Blue Sky Program”表示了極大的支持。
中星微
在極度依賴(lài)國(guó)外進(jìn)口的我國(guó)芯片產(chǎn)業(yè)中,中星微可謂一匹突出重圍的“黑馬”。在今年6月份,中星微率先推出了中國(guó)首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)芯片“星光智能一號(hào)”,這也是全球首枚具備深度學(xué)習(xí)人工智能的嵌入式視頻采集壓縮編碼系統(tǒng)級(jí)芯片,并已于3月6日實(shí)現(xiàn)了量產(chǎn)。
該芯片采用了“數(shù)據(jù)驅(qū)動(dòng)”并行計(jì)算的架構(gòu),單顆NPU(28nm)能耗僅為400mW,極大地提升了計(jì)算能力與功耗的比例,可以廣泛應(yīng)用于智能駕駛輔助、無(wú)人機(jī)、機(jī)器人等嵌入式機(jī)器視覺(jué)領(lǐng)域。
Nervana
Nervana一直在努力將機(jī)器學(xué)習(xí)功能全力引入到芯片之中,是人工智能ASIC芯片供應(yīng)商。得到Intel的支持后,Nervana正計(jì)劃推出其針對(duì)深度學(xué)習(xí)算法的定制芯片Nervana Engine。據(jù)Nervana相關(guān)人員表示,相比GPU,Nervana Engine在訓(xùn)練方面可以提升10倍性能。
此前,Intel在收購(gòu)Nervana一事在業(yè)內(nèi)引起了震動(dòng),而到目前為止,借助Nervana Engine芯片在深度學(xué)習(xí)訓(xùn)練方面優(yōu)于傳統(tǒng) GPU 的能耗和性能優(yōu)勢(shì),Intel也相繼推出了一系列適應(yīng)深度神經(jīng)網(wǎng)絡(luò)的特殊處理器。
Velodyne
在自動(dòng)駕駛領(lǐng)域,激光雷達(dá)是一個(gè)不可或缺的硬件,而Velodyne一直是自動(dòng)駕駛試驗(yàn)汽車(chē)使用的光探測(cè)和測(cè)距傳感器領(lǐng)域的領(lǐng)導(dǎo)者。為了成本,福特和百度對(duì)Velodyne進(jìn)行了投資。
在傳感器的研制上,Velodyne一直致力于研發(fā)固態(tài)激光雷達(dá),而為了更好地進(jìn)入市場(chǎng),其也表示將降低雷達(dá)成本。就在去年12月份,Velodyne表示,他們已經(jīng)成功設(shè)計(jì)出了可應(yīng)用于自動(dòng)駕駛汽車(chē)上的全新固態(tài)技術(shù)激光雷達(dá),更令人高興的是,當(dāng)實(shí)現(xiàn)量產(chǎn)的那一天,該傳感器的單價(jià)將降至 50 美元以下,較之如今的一出口就是幾萬(wàn)美元真的是天差地別。
除了以上介紹的芯片商和傳感器生產(chǎn)商之外,還有許多在各自市場(chǎng)有著極大話(huà)語(yǔ)權(quán)的公司,比如正在發(fā)力人工智能芯片領(lǐng)域的Intel、推出全球首款固態(tài)激光雷達(dá)的Quanergy等等。
算法框架
Tensor Flow
TensorFlow是Google于2015年末開(kāi)源的深度學(xué)習(xí)框架,目前已被Google用于支持語(yǔ)音識(shí)別、搜索等多款商業(yè)化應(yīng)用。TensorFlow一大特色就是其靈活的架構(gòu)可以部署在一個(gè)或多個(gè)CPU、GPU的臺(tái)式以及服務(wù)器中,或者使用單一的API應(yīng)用在移動(dòng)設(shè)備中。并且,在上手上,TensorFlow也很容易使用,有python和C++兩種接口,其他語(yǔ)言可以使用相關(guān)工具使用接口,比如SWIG。
不過(guò),在使用TensorFlow的時(shí)候有一個(gè)缺陷,那就是使用者需要編寫(xiě)大量的代碼,必須一遍又一遍地重新發(fā)明輪子。
Torch
Torch是一個(gè)誕生已有10年之久、擁有大量機(jī)器學(xué)習(xí)算法支持的科學(xué)計(jì)算框架,在因Facebook人工智能研究所用而出名之前,Torch一直是深藏功與名,其使用者中甚至包括被Google收購(gòu)之前的DeepMind。
在使用中,Torch框架擁有構(gòu)建模型簡(jiǎn)單、高度模塊化、快速高效的GPU支持、可嵌入到iOS、Android和FPGA后端的接口等優(yōu)勢(shì)。論其劣勢(shì)就主要在于語(yǔ)言,如果想使用該框架,使用者需要先學(xué)會(huì)Lua語(yǔ)言,而不是市面上運(yùn)用較普遍的Python、Matlab 或C++等。
Caffe
Caffe由加州大學(xué)伯克利的PHD賈揚(yáng)清開(kāi)發(fā),全稱(chēng)Convolutional Architecture for Fast Feature Embedding,是一個(gè)清晰而高效的開(kāi)源深度學(xué)習(xí)框架。
在算法框架中,Caffe應(yīng)該算是一個(gè)貴族了。最初,Caffe并不是一個(gè)通用框架,而僅僅關(guān)注計(jì)算機(jī)視覺(jué),Google最著名的DeepDream項(xiàng)目(識(shí)別貓)就是以此為基礎(chǔ)進(jìn)行的。
Caffe框架有幾大優(yōu)勢(shì),比如模型與相應(yīng)優(yōu)化都是以文本形式而非代碼形式給出,上手較快;能夠很快運(yùn)行最棒的模型與海量的數(shù)據(jù);方便擴(kuò)展到新的任務(wù)和設(shè)置上;可以通過(guò)BSD-2參與開(kāi)發(fā)與討論等等。當(dāng)然,Caffe框架也有著自己的短處,像不夠靈活、文檔極度貧乏、安裝過(guò)程易使人抓狂之類(lèi)。
DSSTNE
DSSTNE是Amazon用來(lái)開(kāi)發(fā)深度學(xué)習(xí)模型的一套框架,全稱(chēng)為Deep Scalable Sparse Tensor Network Engine。
在一開(kāi)始的設(shè)計(jì)初衷上,DSSTNE就明確了自己的目標(biāo),并將“推薦系統(tǒng)”做到了極致。DSSTNE采用 GPU 運(yùn)行,因而在得到好結(jié)果的同時(shí),其也能夠保持快速的運(yùn)行速度,不過(guò)在另一方面,這個(gè)因素也導(dǎo)致使用者不能隨意在CPU和GPU中切換。雖然對(duì)編程能力沒(méi)有要求,但是因?yàn)樵诰€(xiàn)教程、開(kāi)發(fā)者進(jìn)行操作嘗試的指導(dǎo)太少等多種因素,DSSTNE框架目前還并不是很成熟,或許幾個(gè)月之后的新版本能夠帶給使用者更多的驚喜。
PaddlePaddle
由百度于去年8月底開(kāi)源,是一個(gè)基于Spark的異構(gòu)分布式深度學(xué)習(xí)系統(tǒng),是中國(guó)第一個(gè)機(jī)器學(xué)習(xí)開(kāi)源平臺(tái)。
在使用中,PaddlePaddle框架讓開(kāi)發(fā)者拋開(kāi)底層編碼,專(zhuān)注于構(gòu)建深度學(xué)習(xí)模型的高層部分,降低了開(kāi)發(fā)機(jī)器學(xué)習(xí)模型的門(mén)檻,簡(jiǎn)單易上手。而充分利用GPU集群性能的做法,使得PaddlePaddle框架能夠快速的進(jìn)行大量數(shù)據(jù)的運(yùn)行。此外,Paddle框架還支持多種深度學(xué)習(xí)模型,包括DNN(深度神經(jīng)網(wǎng)絡(luò))、CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(遞歸神經(jīng)網(wǎng)絡(luò)),以及NTM這樣的復(fù)雜記憶模型。在開(kāi)源的最初,賈楊清等業(yè)內(nèi)人士都發(fā)表了自己對(duì)于PaddlePaddle框架的看法,基本上也都給予了正面的價(jià)。
基于算法框架,各團(tuán)隊(duì)可以更好、更快的搭建和訓(xùn)練自己的算法,大大的加速了人工智能技術(shù)的研發(fā)進(jìn)程和產(chǎn)品平臺(tái)的搭建。在算法框架領(lǐng)域,除了以上那些提到的老前輩或是新貴,還有許多知名的存在,已經(jīng)開(kāi)源的有微軟的DMTK(分布式機(jī)器學(xué)習(xí)工具包)、OpenAI的AI訓(xùn)練平臺(tái)Universe、亞馬遜的“御用”的深度學(xué)習(xí)平臺(tái)“多語(yǔ)言機(jī)器學(xué)習(xí)資料庫(kù)”MXNet等,未開(kāi)源的像Facebook的基于深度學(xué)習(xí)的文本解析引擎Deeptext等。
云服務(wù)&大數(shù)據(jù)
亞馬遜AWS
說(shuō)起云服務(wù),亞馬遜的AWS絕對(duì)是行業(yè)老大。據(jù)Synergy Research Group的最新數(shù)據(jù),在公有云市場(chǎng),AWS已經(jīng)占據(jù)了45%的市場(chǎng)份額,遠(yuǎn)超微軟、谷歌等企業(yè)。
占據(jù)著“先發(fā)者”的優(yōu)勢(shì),AWS在云服務(wù)市場(chǎng)是無(wú)往不利,并從最初的數(shù)據(jù)計(jì)算和存儲(chǔ)服務(wù),擴(kuò)展到了如今的70多種服務(wù),成為了全球產(chǎn)品線(xiàn)最完整的云計(jì)算服務(wù)廠(chǎng)商。此外,隨著人工智能熱的泛起,AWS中也逐漸加入了人工智能服務(wù),就在去年11月底在開(kāi)發(fā)者大會(huì)上公布的三項(xiàng)AI服務(wù),其中包括了圖像識(shí)別工具Rekognition、語(yǔ)音識(shí)別工具Polly、以及聊天交互工具Lex。目前,這些服務(wù)已經(jīng)在亞馬遜內(nèi)部得到了使用,像虛擬助手Alexa就是以L(fǎng)ex為內(nèi)核,對(duì)自然語(yǔ)言進(jìn)行處理。
微軟Azure
微軟Azure是僅次于亞馬遜AWS的第二大云服務(wù)提供商,也是微軟當(dāng)前的主要盈利業(yè)務(wù)之一。在人工智能時(shí)代,微軟CEO納德拉曾表示,要將Azure打造成世界上首臺(tái)AI超級(jí)計(jì)算機(jī)。
在A(yíng)zure的布局上,微軟已經(jīng)做出了多個(gè)動(dòng)作,比如去年11月份與人工智能非盈利性研究公司OpenAI達(dá)成合作,意欲借助其背后的深度機(jī)器人技術(shù)和專(zhuān)家支持,將Azure打造成一個(gè)打造人工智能支持軟件的最佳場(chǎng)所。此外,在云服務(wù)上,微軟宣布將推出Azure Bot服務(wù),允許企業(yè)和開(kāi)發(fā)者在A(yíng)zure上存儲(chǔ)和運(yùn)行機(jī)器人,與此同時(shí),其還將推出下一代以Azure為載體的、基于Pascal的硬件創(chuàng)新 GPU。在這些動(dòng)作之下,微軟Azure的道路正在不斷地進(jìn)行拓寬。
阿里云
雖然AWS強(qiáng)勢(shì)進(jìn)入了中國(guó),但是“地頭蛇”阿里云卻沒(méi)打算放棄自己在國(guó)內(nèi)市場(chǎng)“第一把交椅”的名頭,更是將目光放在了全球市場(chǎng)。
2016年8月,阿里云宣布正式換了logo,并同時(shí)發(fā)布了基于阿里云打造的人工智能ET,其擁有智能語(yǔ)音識(shí)別、圖像或視頻識(shí)別、情感分析等技術(shù),展現(xiàn)了阿里云在人工智能云服務(wù)的布局。目前,作為占據(jù)了國(guó)內(nèi)云服務(wù)市場(chǎng)50%以上的頭頭,阿里云已經(jīng)被運(yùn)用在了多個(gè)領(lǐng)域,主要以B端市場(chǎng)和政府為主。其中,阿里云“城市大腦”在杭州上線(xiàn)測(cè)試,城市全局實(shí)時(shí)分析、公共資源調(diào)配等手到擒來(lái),體現(xiàn)了阿里云服務(wù)的強(qiáng)大。
Cloudera
作為一家大數(shù)據(jù)公司,Cloudera以Apache Hadoop和其他開(kāi)源技術(shù)為基礎(chǔ),向企業(yè)提供數(shù)據(jù)管理和分析平臺(tái),此外,其還提供了支持、培訓(xùn)以及其他的專(zhuān)業(yè)服務(wù)。
基于這些服務(wù),Cloudera能夠幫助客戶(hù)高效獲取、存儲(chǔ)、處理和分析海量數(shù)據(jù),使客戶(hù)能夠利用最先進(jìn)的數(shù)據(jù)分析技術(shù),以更低的成本,快速、靈活地做出各項(xiàng)決策。當(dāng)下,Cloudera的數(shù)據(jù)平臺(tái)Cloudera Enterprise正被很多全球領(lǐng)先的組織所使用。
Tableau
Tableau致力于數(shù)據(jù)可視化,將數(shù)據(jù)運(yùn)算與美觀(guān)的圖表完美地嫁接在一起。基于數(shù)據(jù)越容易操控,公司越能清楚自己所作所為的理念,其開(kāi)發(fā)了一個(gè)叫做Tableau的軟件,為數(shù)字媒體提供了一個(gè)全新且免費(fèi)的數(shù)據(jù)展示工具,任何人在沒(méi)有編程知識(shí)背景的情況下也能生成漂亮的數(shù)據(jù)圖表和地圖。
目前,在云服務(wù)&大數(shù)據(jù)領(lǐng)域,一些初創(chuàng)公司也在奮力崛起,緊追人工智能時(shí)代的腳步,比如國(guó)內(nèi)的小視科技(相關(guān)閱讀:「鎂客·請(qǐng)講」小視科技:拓展大數(shù)據(jù)反欺詐在各行業(yè)應(yīng)用,保護(hù)個(gè)人隱私)、ONEAPM和聽(tīng)云等企業(yè),以及國(guó)外的Confluent、Maana和StreamSets等。在人工智能的研發(fā)中,大數(shù)據(jù)和云服務(wù)承擔(dān)著不小的責(zé)任,基于云服務(wù),一些能力不夠的團(tuán)隊(duì)可以借助平臺(tái)上的工具來(lái)更好的創(chuàng)建和訓(xùn)練自己的算法,公司則可以借助這些工具進(jìn)行數(shù)據(jù)分析和處理、打造自己的一個(gè)平臺(tái)。而在大數(shù)據(jù)上,可以說(shuō),沒(méi)有大數(shù)據(jù),就沒(méi)有如今的人工智能產(chǎn)品,通過(guò)大數(shù)據(jù)的訓(xùn)練,人工智能技術(shù)可以提高自身的準(zhǔn)確性,公司也可以擺脫數(shù)據(jù)工作的繁瑣,讓公司的數(shù)據(jù)運(yùn)作變得更為簡(jiǎn)潔化。不過(guò),不管是云服務(wù)還是大數(shù)據(jù),兩者之間都有著共同性,而在另一方面,“如何維護(hù)網(wǎng)絡(luò)安全”也是兩者所需要面對(duì)的難題,同時(shí)也是未來(lái)大數(shù)據(jù)的發(fā)展趨勢(shì)之一。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
