計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

鎂客 9年前 (2016-07-08)

本文從算法、市場(chǎng)及硬件三個(gè)角度觀察深度學(xué)習(xí)對(duì)計(jì)算機(jī)視覺(jué)的影響。

【編者按】本文由新智元整理,來(lái)源:vision-system.com,整理:王楠

本文從算法、市場(chǎng)及硬件三個(gè)角度觀察深度學(xué)習(xí)對(duì)計(jì)算機(jī)視覺(jué)的影響。以下三個(gè)視頻中,谷歌TensorFlow移動(dòng)端和嵌入式應(yīng)用團(tuán)隊(duì)負(fù)責(zé)人Pete Warden介紹了如何用TensorFlow框架開(kāi)發(fā)不同的低能耗深度學(xué)習(xí)產(chǎn)品。調(diào)研公司Tractica首席分析師表示,到2024年,深度學(xué)習(xí)服務(wù)業(yè)產(chǎn)值將超過(guò)500億美元。IEEE Fellow Chris Rowen預(yù)測(cè),神經(jīng)網(wǎng)絡(luò)將催生出新的價(jià)值鏈,全新的IP、工具和數(shù)據(jù)服務(wù)也會(huì)應(yīng)運(yùn)而生。

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

嵌入式視覺(jué)聯(lián)盟主編Brian Dipert今天發(fā)布博文,介紹了2016年嵌入式視覺(jué)峰會(huì)(Embedded Vision Summit)中有關(guān)深度學(xué)習(xí)的內(nèi)容:

谷歌工程師Pete Warden介紹如何利用TensorFlow框架,開(kāi)發(fā)為Google Translate、Google Photos等不同產(chǎn)品訂制的深度學(xué)習(xí)方案;

調(diào)研公司Tractica的首席分析師Bruce Daley從市場(chǎng)的角度介紹深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)產(chǎn)業(yè)生態(tài)中的影響,以及Tractica對(duì)未來(lái)計(jì)算機(jī)視覺(jué)市場(chǎng)發(fā)展和機(jī)遇的預(yù)測(cè);

最后,電子設(shè)計(jì)自動(dòng)化軟件公司Cadence的CTO、IEEE Fellow Chris Rowen給出了神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)產(chǎn)業(yè)的五大趨勢(shì)。

讓嵌入式機(jī)器智能成為可能

TensorFlow移動(dòng)端和嵌入式應(yīng)用團(tuán)隊(duì)負(fù)責(zé)人Pete Warden,介紹了如何使用TensorFlow框架開(kāi)發(fā)不同的深度學(xué)習(xí)產(chǎn)品,還談了谷歌為什么選擇開(kāi)源TensorFlow,以及讓這個(gè)機(jī)器學(xué)習(xí)框架支持低功耗應(yīng)用的方法。Warden此前是機(jī)器學(xué)習(xí)算法公司Jetpac 的CTO,在2014年該公司被谷歌收購(gòu)后加入谷歌。

Warden開(kāi)場(chǎng)直奔主題,再次為人盡皆知的TensorFlow打廣告:是深度學(xué)習(xí)開(kāi)源框架;支持視覺(jué)、語(yǔ)音及自然語(yǔ)言處理等多種應(yīng)用;在谷歌公司內(nèi)外都有廣泛應(yīng)用,在谷歌內(nèi)部的應(yīng)用包括Google Translate、Google Photos、OK Google、RankBrain。

Warden號(hào)召開(kāi)發(fā)人員都來(lái)使用TensorFlow,因?yàn)門(mén)ensorFlow擁有經(jīng)過(guò)完善測(cè)試、產(chǎn)品級(jí)的代碼,專門(mén)針對(duì)工程師需求,歷史記錄會(huì)得到妥善管理,他們團(tuán)隊(duì)一直認(rèn)真工作,所以長(zhǎng)期支持沒(méi)有問(wèn)題。

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

TensorFlow使用圖表示計(jì)算任務(wù),圖中的節(jié)點(diǎn)被稱之為 op,一個(gè) op 獲得 0 個(gè)或多個(gè) Tensor, 執(zhí)行計(jì)算, 產(chǎn)生 0 個(gè)或多個(gè) Tensor。每個(gè) Tensor 是一個(gè)類型化的多維數(shù)組,比如一個(gè)圖像集可以表示為四維浮點(diǎn)數(shù)數(shù)組。

Warden介紹了怎樣用TensorFlow打造App:首先,下載一個(gè)免費(fèi)的TensorFlow模型,當(dāng)然這個(gè)模型是已經(jīng)訓(xùn)練過(guò)了的,然后,使用你自己的圖像數(shù)據(jù)訓(xùn)練這個(gè)模型。這之后就可以開(kāi)始用TensorFlow搭建自己的平臺(tái),在移動(dòng)設(shè)備上用C++運(yùn)行。Warden接著講了在TensorFlow上調(diào)用C++的方法。

在談到為什么世界上還需要一個(gè)開(kāi)源機(jī)器學(xué)習(xí)框架的時(shí)候,Warden表示,TensorFlow與OpenCL不同,是一種描述神經(jīng)網(wǎng)絡(luò)的高級(jí)語(yǔ)言,不過(guò)TensorFlow也支持OpenCL和CUDA。至于TensorFlow與OpenCV的區(qū)別——總之OpenCV很好,有很多傳統(tǒng)計(jì)算機(jī)視覺(jué)模塊,鑒于深度學(xué)習(xí)得出的結(jié)果一般會(huì)更好,將兩者整合起來(lái)也很容易。

TensorFlow具有獨(dú)一無(wú)二的架構(gòu),模塊化和數(shù)據(jù)流的優(yōu)化性能高于其他開(kāi)源深度學(xué)習(xí)框架。在谷歌,TensorFlow的開(kāi)發(fā)過(guò)程一直是產(chǎn)品導(dǎo)向的。

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

作為移動(dòng)端和嵌入式應(yīng)用團(tuán)隊(duì)的負(fù)責(zé)人,Warden強(qiáng)調(diào),TensorFlow非常重視移動(dòng)端和嵌入式應(yīng)用的開(kāi)發(fā),TensorFlow結(jié)構(gòu)很容易簡(jiǎn)化,也就能夠應(yīng)用于低功耗App。TensorFlow支持推理的8比特整數(shù)計(jì)算,并且專門(mén)針對(duì)8比特整數(shù)代碼做了優(yōu)化。

深度學(xué)習(xí)服務(wù)產(chǎn)業(yè)市值將超過(guò)500億美元

深度學(xué)習(xí)算法是加速大規(guī)模數(shù)據(jù)分析并使其自動(dòng)化的關(guān)鍵工具,有很多商業(yè)應(yīng)用。調(diào)研公司Tractica的首席分析師Bruce Daley從市場(chǎng)的角度介紹深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)產(chǎn)業(yè)生態(tài)中的影響,在名為《深度學(xué)習(xí)如何拓展計(jì)算機(jī)視覺(jué)市場(chǎng)》中,Daley圍繞深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)市場(chǎng)和技術(shù)、使用案例以及產(chǎn)業(yè)生態(tài)。作為T(mén)ractica的首席分析師,Daley還給出了Tractica調(diào)研發(fā)現(xiàn)的具體市場(chǎng)機(jī)會(huì)和產(chǎn)業(yè)整體趨勢(shì)。

首先,Daley回顧了人工智能發(fā)展歷史及標(biāo)志性事件,快進(jìn)到2015年,企業(yè)級(jí)人工智能應(yīng)用開(kāi)始出現(xiàn)。根據(jù)Tractica預(yù)計(jì),到2025年,光是深度學(xué)習(xí)軟件的銷售額就能達(dá)到104億美元,而且硬件和服務(wù)還會(huì)增長(zhǎng)更多,其中深度學(xué)習(xí)相關(guān)服務(wù)的產(chǎn)值高達(dá)500多億美元。

深度學(xué)習(xí)雖然不會(huì)對(duì)生活造成直接影響,但它會(huì)從最根本的層面改變生活——改變數(shù)據(jù)。你可以用同樣是算法處理各種不同類型的數(shù)據(jù)。隨著社會(huì)越來(lái)越數(shù)字化,數(shù)據(jù)增加,深度學(xué)習(xí)展現(xiàn)出了優(yōu)勢(shì)。不過(guò),Daley也指出,在產(chǎn)品周期里當(dāng)過(guò)了成熟期以后,數(shù)據(jù)的價(jià)值就會(huì)逐漸降低。同時(shí),深度學(xué)習(xí)也有局限:雖然應(yīng)用廣泛,但依賴高質(zhì)量的數(shù)據(jù),無(wú)法用數(shù)學(xué)語(yǔ)言描述,人才嚴(yán)重不足。

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

深度學(xué)習(xí)的市場(chǎng)將是這個(gè)樣子的

到了具體應(yīng)用,Daley表示,F(xiàn)acebook 用戶每天都會(huì)上傳3.5億張照片,谷歌的圖片列表更是高達(dá)1萬(wàn)億之多,用人力給這些圖片打標(biāo)簽是不可能的,但這些又都是寶貴的數(shù)據(jù),這時(shí)候深度學(xué)習(xí)就派上用場(chǎng)了。

就像谷歌可以用計(jì)算機(jī)識(shí)別貓,如果一個(gè)人在網(wǎng)上看了很多貓的照片,那么計(jì)算機(jī)會(huì)自動(dòng)推薦更多的與貓相關(guān)的內(nèi)容。不過(guò),這種技術(shù)很神奇,但消費(fèi)者為什么會(huì)花錢(qián)買(mǎi)呢?因此必須有好的商業(yè)模式。

接下來(lái),Daley介紹了使用深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)系統(tǒng)在農(nóng)業(yè)、零售業(yè)、服裝(量身定制)、廣告、制造等產(chǎn)業(yè)中的應(yīng)用和趨勢(shì),以及在這些產(chǎn)業(yè)中值得關(guān)注的企業(yè)。

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

神經(jīng)網(wǎng)絡(luò):5個(gè)你想不到的未來(lái)

最后,電子設(shè)計(jì)自動(dòng)化軟件公司Cadence的CTO、IEEE Fellow Chris Rowen,分析了神經(jīng)網(wǎng)絡(luò)計(jì)算的本質(zhì)及局限,尤其是在實(shí)時(shí)和嵌入式系統(tǒng)中的應(yīng)用。

Rowen表示,雖然最近神經(jīng)網(wǎng)絡(luò)可能有些過(guò)于“火”了,但還是有一些機(jī)會(huì)可以切實(shí)分析地分析一些意想不到但卻很有可能發(fā)生的未來(lái)。Rowen預(yù)測(cè),計(jì)算機(jī)視覺(jué)產(chǎn)業(yè)接下來(lái)會(huì)發(fā)生一系列變革,從神經(jīng)網(wǎng)絡(luò)改變數(shù)據(jù)商業(yè)模式到云端、全新軟硬件中的應(yīng)用。

計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí):技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)

Rowen在演講中給出的不怎么驚人的預(yù)測(cè)是:

神經(jīng)網(wǎng)絡(luò)的云端的應(yīng)用會(huì)增多

神經(jīng)網(wǎng)絡(luò)很快將擁有實(shí)時(shí)嵌入功能

能耗和帶寬的限制將推動(dòng)CNN在嵌入式和服務(wù)器等處理器上的優(yōu)化

實(shí)時(shí)神經(jīng)網(wǎng)絡(luò)不僅能識(shí)別物體,還能識(shí)別行動(dòng)

計(jì)算機(jī)視覺(jué)將成為計(jì)算和高端部署的主要問(wèn)題

然后,Rowen 認(rèn)為很有可能出現(xiàn)的是:

通過(guò)網(wǎng)絡(luò)和引擎結(jié)構(gòu)優(yōu)化,近期會(huì)帶寬會(huì)編程原來(lái)的20倍

不久后將會(huì)出現(xiàn)1000-tera MAC神經(jīng)網(wǎng)絡(luò)嵌入式芯片和1000000 tera-MAC神經(jīng)網(wǎng)絡(luò)服務(wù)器

新的EDA模式

新的價(jià)值鏈會(huì)帶來(lái)全新的IP、工具和數(shù)據(jù)服務(wù)

數(shù)據(jù)為王,擁有大規(guī)模、多樣化數(shù)據(jù)的人是贏家

可能傷及隱私

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到