2016年人工智能產(chǎn)業(yè)梳理:一朝引爆,穩(wěn)步前進(jìn)(上篇)
一場人機(jī)大戰(zhàn)引起了人工智能熱,在其普及的背后,是整個產(chǎn)業(yè)的穩(wěn)健布局。
在已經(jīng)過去的2016年,谷歌旗下DeepMind團(tuán)隊(duì)打造的AlphaGo引爆了新一輪的人工智能熱,開啟了2016年的人工智能時代。由此,在蝴蝶效應(yīng)下,更多的人工智能產(chǎn)品融入了人們的生活,也讓人們意識到了智能化時代的到來。
人工智能之所以能夠大面積普及并獲得如今的成功,其背后的產(chǎn)業(yè)布局功不可沒。在下面的這篇文章中,各位看官不如跟著鎂客網(wǎng)的腳步,一起探索下人工智能的背后,其中主要分為四大模塊,分別為:基礎(chǔ)層、應(yīng)用層、軟件和媒體,在這四大模塊中,有的則進(jìn)一步分化成多個部分。本篇將先從基礎(chǔ)層開始講起。
顧名思義,基礎(chǔ)層包括了人工智能技術(shù)研發(fā)所需的一切準(zhǔn)備,主要為芯片&傳感器、算法框架和云服務(wù)&大數(shù)據(jù)。具備了這些條件,科研人員們才可以更好地研發(fā)、訓(xùn)練自己的人工智能技術(shù),提高準(zhǔn)確度。
芯片&傳感器
在人工智能領(lǐng)域,算法的實(shí)現(xiàn)依賴于計(jì)算機(jī)強(qiáng)大的運(yùn)行速度,因此芯片就顯得尤為重要。而在運(yùn)行之上,人工智能產(chǎn)品需要大量的數(shù)據(jù)來提供服務(wù),這方面就得依靠那些相當(dāng)于人類“眼耳鼻”的傳感器來搜集。
英偉達(dá)
憑借具備識別、標(biāo)記功能的圖像處理器,在人工智能還未全面興起之前,英偉達(dá)就先一步掌控了這一時機(jī)。在2016年,英偉達(dá)更是一連發(fā)布了多款針對深度學(xué)習(xí)的芯片,像4月份發(fā)布的一款可執(zhí)行深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)任務(wù)的Tesla P100 GPU,又比如9月份發(fā)布的基于Pascal架構(gòu)的深度學(xué)習(xí)芯片Tesla P4和Tesla P40,其中,Pascal架構(gòu)能助推深度學(xué)習(xí)加速65倍。
除了研發(fā)芯片,英偉達(dá)進(jìn)一步擴(kuò)大了自己的人工智能布局,發(fā)布了多個用于不同領(lǐng)域的硬件和平臺,比如世界上首個人工智能超級計(jì)算機(jī)以及在CES 2017發(fā)布的自動駕駛芯片XAVIER AICAR SUPERCOMPUTER、智能家居硬件Spot、搭載了人工智能系統(tǒng)ProAI(由ZF、英偉達(dá)聯(lián)合研發(fā))的車載電腦等。
ARM
迄今為止,全球85%的智能移動設(shè)備中都采取了ARM架構(gòu),其中,超過95%的智能手機(jī)運(yùn)用了ARM的處理器,在智能硬件和物聯(lián)網(wǎng)高速發(fā)展的如今,ARM有著絕對的地位。
此外,根據(jù)其2015年Q4財(cái)報,ARM所授權(quán)的芯片主要都用在了移動計(jì)算、智能汽車、安全系統(tǒng)和物聯(lián)網(wǎng)。在智能汽車領(lǐng)域,包括NVIDIA、高通在內(nèi)都是基于ARM設(shè)計(jì)開發(fā)了面向駕駛輔助系統(tǒng)的超級計(jì)算機(jī)。早前,對于收購ARM一事,軟銀CEO孫正義就曾明確表示ARM芯片將推動人工智能走向奇點(diǎn)。而在收購之后,軟銀也對ARM早已開始的人工智能項(xiàng)目“Blue Sky Program”表示了極大的支持。
中星微
在極度依賴國外進(jìn)口的我國芯片產(chǎn)業(yè)中,中星微可謂一匹突出重圍的“黑馬”。在今年6月份,中星微率先推出了中國首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)芯片“星光智能一號”,這也是全球首枚具備深度學(xué)習(xí)人工智能的嵌入式視頻采集壓縮編碼系統(tǒng)級芯片,并已于3月6日實(shí)現(xiàn)了量產(chǎn)。
該芯片采用了“數(shù)據(jù)驅(qū)動”并行計(jì)算的架構(gòu),單顆NPU(28nm)能耗僅為400mW,極大地提升了計(jì)算能力與功耗的比例,可以廣泛應(yīng)用于智能駕駛輔助、無人機(jī)、機(jī)器人等嵌入式機(jī)器視覺領(lǐng)域。
Nervana
Nervana一直在努力將機(jī)器學(xué)習(xí)功能全力引入到芯片之中,是人工智能ASIC芯片供應(yīng)商。得到Intel的支持后,Nervana正計(jì)劃推出其針對深度學(xué)習(xí)算法的定制芯片Nervana Engine。據(jù)Nervana相關(guān)人員表示,相比GPU,Nervana Engine在訓(xùn)練方面可以提升10倍性能。
此前,Intel在收購Nervana一事在業(yè)內(nèi)引起了震動,而到目前為止,借助Nervana Engine芯片在深度學(xué)習(xí)訓(xùn)練方面優(yōu)于傳統(tǒng) GPU 的能耗和性能優(yōu)勢,Intel也相繼推出了一系列適應(yīng)深度神經(jīng)網(wǎng)絡(luò)的特殊處理器。
Velodyne
在自動駕駛領(lǐng)域,激光雷達(dá)是一個不可或缺的硬件,而Velodyne一直是自動駕駛試驗(yàn)汽車使用的光探測和測距傳感器領(lǐng)域的領(lǐng)導(dǎo)者。為了成本,福特和百度對Velodyne進(jìn)行了投資。
在傳感器的研制上,Velodyne一直致力于研發(fā)固態(tài)激光雷達(dá),而為了更好地進(jìn)入市場,其也表示將降低雷達(dá)成本。就在去年12月份,Velodyne表示,他們已經(jīng)成功設(shè)計(jì)出了可應(yīng)用于自動駕駛汽車上的全新固態(tài)技術(shù)激光雷達(dá),更令人高興的是,當(dāng)實(shí)現(xiàn)量產(chǎn)的那一天,該傳感器的單價將降至 50 美元以下,較之如今的一出口就是幾萬美元真的是天差地別。
除了以上介紹的芯片商和傳感器生產(chǎn)商之外,還有許多在各自市場有著極大話語權(quán)的公司,比如正在發(fā)力人工智能芯片領(lǐng)域的Intel、推出全球首款固態(tài)激光雷達(dá)的Quanergy等等。
算法框架
Tensor Flow
TensorFlow是Google于2015年末開源的深度學(xué)習(xí)框架,目前已被Google用于支持語音識別、搜索等多款商業(yè)化應(yīng)用。TensorFlow一大特色就是其靈活的架構(gòu)可以部署在一個或多個CPU、GPU的臺式以及服務(wù)器中,或者使用單一的API應(yīng)用在移動設(shè)備中。并且,在上手上,TensorFlow也很容易使用,有python和C++兩種接口,其他語言可以使用相關(guān)工具使用接口,比如SWIG。
不過,在使用TensorFlow的時候有一個缺陷,那就是使用者需要編寫大量的代碼,必須一遍又一遍地重新發(fā)明輪子。
Torch
Torch是一個誕生已有10年之久、擁有大量機(jī)器學(xué)習(xí)算法支持的科學(xué)計(jì)算框架,在因Facebook人工智能研究所用而出名之前,Torch一直是深藏功與名,其使用者中甚至包括被Google收購之前的DeepMind。
在使用中,Torch框架擁有構(gòu)建模型簡單、高度模塊化、快速高效的GPU支持、可嵌入到iOS、Android和FPGA后端的接口等優(yōu)勢。論其劣勢就主要在于語言,如果想使用該框架,使用者需要先學(xué)會Lua語言,而不是市面上運(yùn)用較普遍的Python、Matlab 或C++等。
Caffe
Caffe由加州大學(xué)伯克利的PHD賈揚(yáng)清開發(fā),全稱Convolutional Architecture for Fast Feature Embedding,是一個清晰而高效的開源深度學(xué)習(xí)框架。
在算法框架中,Caffe應(yīng)該算是一個貴族了。最初,Caffe并不是一個通用框架,而僅僅關(guān)注計(jì)算機(jī)視覺,Google最著名的DeepDream項(xiàng)目(識別貓)就是以此為基礎(chǔ)進(jìn)行的。
Caffe框架有幾大優(yōu)勢,比如模型與相應(yīng)優(yōu)化都是以文本形式而非代碼形式給出,上手較快;能夠很快運(yùn)行最棒的模型與海量的數(shù)據(jù);方便擴(kuò)展到新的任務(wù)和設(shè)置上;可以通過BSD-2參與開發(fā)與討論等等。當(dāng)然,Caffe框架也有著自己的短處,像不夠靈活、文檔極度貧乏、安裝過程易使人抓狂之類。
DSSTNE
DSSTNE是Amazon用來開發(fā)深度學(xué)習(xí)模型的一套框架,全稱為Deep Scalable Sparse Tensor Network Engine。
在一開始的設(shè)計(jì)初衷上,DSSTNE就明確了自己的目標(biāo),并將“推薦系統(tǒng)”做到了極致。DSSTNE采用 GPU 運(yùn)行,因而在得到好結(jié)果的同時,其也能夠保持快速的運(yùn)行速度,不過在另一方面,這個因素也導(dǎo)致使用者不能隨意在CPU和GPU中切換。雖然對編程能力沒有要求,但是因?yàn)樵诰€教程、開發(fā)者進(jìn)行操作嘗試的指導(dǎo)太少等多種因素,DSSTNE框架目前還并不是很成熟,或許幾個月之后的新版本能夠帶給使用者更多的驚喜。
PaddlePaddle
由百度于去年8月底開源,是一個基于Spark的異構(gòu)分布式深度學(xué)習(xí)系統(tǒng),是中國第一個機(jī)器學(xué)習(xí)開源平臺。
在使用中,PaddlePaddle框架讓開發(fā)者拋開底層編碼,專注于構(gòu)建深度學(xué)習(xí)模型的高層部分,降低了開發(fā)機(jī)器學(xué)習(xí)模型的門檻,簡單易上手。而充分利用GPU集群性能的做法,使得PaddlePaddle框架能夠快速的進(jìn)行大量數(shù)據(jù)的運(yùn)行。此外,Paddle框架還支持多種深度學(xué)習(xí)模型,包括DNN(深度神經(jīng)網(wǎng)絡(luò))、CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(遞歸神經(jīng)網(wǎng)絡(luò)),以及NTM這樣的復(fù)雜記憶模型。在開源的最初,賈楊清等業(yè)內(nèi)人士都發(fā)表了自己對于PaddlePaddle框架的看法,基本上也都給予了正面的價。
基于算法框架,各團(tuán)隊(duì)可以更好、更快的搭建和訓(xùn)練自己的算法,大大的加速了人工智能技術(shù)的研發(fā)進(jìn)程和產(chǎn)品平臺的搭建。在算法框架領(lǐng)域,除了以上那些提到的老前輩或是新貴,還有許多知名的存在,已經(jīng)開源的有微軟的DMTK(分布式機(jī)器學(xué)習(xí)工具包)、OpenAI的AI訓(xùn)練平臺Universe、亞馬遜的“御用”的深度學(xué)習(xí)平臺“多語言機(jī)器學(xué)習(xí)資料庫”MXNet等,未開源的像Facebook的基于深度學(xué)習(xí)的文本解析引擎Deeptext等。
云服務(wù)&大數(shù)據(jù)
亞馬遜AWS
說起云服務(wù),亞馬遜的AWS絕對是行業(yè)老大。據(jù)Synergy Research Group的最新數(shù)據(jù),在公有云市場,AWS已經(jīng)占據(jù)了45%的市場份額,遠(yuǎn)超微軟、谷歌等企業(yè)。
占據(jù)著“先發(fā)者”的優(yōu)勢,AWS在云服務(wù)市場是無往不利,并從最初的數(shù)據(jù)計(jì)算和存儲服務(wù),擴(kuò)展到了如今的70多種服務(wù),成為了全球產(chǎn)品線最完整的云計(jì)算服務(wù)廠商。此外,隨著人工智能熱的泛起,AWS中也逐漸加入了人工智能服務(wù),就在去年11月底在開發(fā)者大會上公布的三項(xiàng)AI服務(wù),其中包括了圖像識別工具Rekognition、語音識別工具Polly、以及聊天交互工具Lex。目前,這些服務(wù)已經(jīng)在亞馬遜內(nèi)部得到了使用,像虛擬助手Alexa就是以Lex為內(nèi)核,對自然語言進(jìn)行處理。
微軟Azure
微軟Azure是僅次于亞馬遜AWS的第二大云服務(wù)提供商,也是微軟當(dāng)前的主要盈利業(yè)務(wù)之一。在人工智能時代,微軟CEO納德拉曾表示,要將Azure打造成世界上首臺AI超級計(jì)算機(jī)。
在Azure的布局上,微軟已經(jīng)做出了多個動作,比如去年11月份與人工智能非盈利性研究公司OpenAI達(dá)成合作,意欲借助其背后的深度機(jī)器人技術(shù)和專家支持,將Azure打造成一個打造人工智能支持軟件的最佳場所。此外,在云服務(wù)上,微軟宣布將推出Azure Bot服務(wù),允許企業(yè)和開發(fā)者在Azure上存儲和運(yùn)行機(jī)器人,與此同時,其還將推出下一代以Azure為載體的、基于Pascal的硬件創(chuàng)新 GPU。在這些動作之下,微軟Azure的道路正在不斷地進(jìn)行拓寬。
阿里云
雖然AWS強(qiáng)勢進(jìn)入了中國,但是“地頭蛇”阿里云卻沒打算放棄自己在國內(nèi)市場“第一把交椅”的名頭,更是將目光放在了全球市場。
2016年8月,阿里云宣布正式換了logo,并同時發(fā)布了基于阿里云打造的人工智能ET,其擁有智能語音識別、圖像或視頻識別、情感分析等技術(shù),展現(xiàn)了阿里云在人工智能云服務(wù)的布局。目前,作為占據(jù)了國內(nèi)云服務(wù)市場50%以上的頭頭,阿里云已經(jīng)被運(yùn)用在了多個領(lǐng)域,主要以B端市場和政府為主。其中,阿里云“城市大腦”在杭州上線測試,城市全局實(shí)時分析、公共資源調(diào)配等手到擒來,體現(xiàn)了阿里云服務(wù)的強(qiáng)大。
Cloudera
作為一家大數(shù)據(jù)公司,Cloudera以Apache Hadoop和其他開源技術(shù)為基礎(chǔ),向企業(yè)提供數(shù)據(jù)管理和分析平臺,此外,其還提供了支持、培訓(xùn)以及其他的專業(yè)服務(wù)。
基于這些服務(wù),Cloudera能夠幫助客戶高效獲取、存儲、處理和分析海量數(shù)據(jù),使客戶能夠利用最先進(jìn)的數(shù)據(jù)分析技術(shù),以更低的成本,快速、靈活地做出各項(xiàng)決策。當(dāng)下,Cloudera的數(shù)據(jù)平臺Cloudera Enterprise正被很多全球領(lǐng)先的組織所使用。
Tableau
Tableau致力于數(shù)據(jù)可視化,將數(shù)據(jù)運(yùn)算與美觀的圖表完美地嫁接在一起?;跀?shù)據(jù)越容易操控,公司越能清楚自己所作所為的理念,其開發(fā)了一個叫做Tableau的軟件,為數(shù)字媒體提供了一個全新且免費(fèi)的數(shù)據(jù)展示工具,任何人在沒有編程知識背景的情況下也能生成漂亮的數(shù)據(jù)圖表和地圖。
目前,在云服務(wù)&大數(shù)據(jù)領(lǐng)域,一些初創(chuàng)公司也在奮力崛起,緊追人工智能時代的腳步,比如國內(nèi)的小視科技(相關(guān)閱讀:「鎂客·請講」小視科技:拓展大數(shù)據(jù)反欺詐在各行業(yè)應(yīng)用,保護(hù)個人隱私)、ONEAPM和聽云等企業(yè),以及國外的Confluent、Maana和StreamSets等。在人工智能的研發(fā)中,大數(shù)據(jù)和云服務(wù)承擔(dān)著不小的責(zé)任,基于云服務(wù),一些能力不夠的團(tuán)隊(duì)可以借助平臺上的工具來更好的創(chuàng)建和訓(xùn)練自己的算法,公司則可以借助這些工具進(jìn)行數(shù)據(jù)分析和處理、打造自己的一個平臺。而在大數(shù)據(jù)上,可以說,沒有大數(shù)據(jù),就沒有如今的人工智能產(chǎn)品,通過大數(shù)據(jù)的訓(xùn)練,人工智能技術(shù)可以提高自身的準(zhǔn)確性,公司也可以擺脫數(shù)據(jù)工作的繁瑣,讓公司的數(shù)據(jù)運(yùn)作變得更為簡潔化。不過,不管是云服務(wù)還是大數(shù)據(jù),兩者之間都有著共同性,而在另一方面,“如何維護(hù)網(wǎng)絡(luò)安全”也是兩者所需要面對的難題,同時也是未來大數(shù)據(jù)的發(fā)展趨勢之一。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
