iPhone X帶起的深度攝像頭熱,移動端的路到底怎么走?

巫盼 8年前 (2017-12-06)

最近一段時間,我們也采訪了不少做深度傳感器的廠商,聊來聊去,繞不開的一個話題就是:曾經(jīng)小眾的深度攝像頭市場,正在慢慢走向大眾化。

我們大腦皮層有50%的區(qū)域是用于視覺,在經(jīng)過幾億年的進(jìn)化以后,我們的眼睛可以在150毫秒內(nèi)將看到的場景識別理解出來。但是,現(xiàn)在要讓機(jī)器只憑簡單的攝像頭做到這些是不可能的。

所以出現(xiàn)了可以捕捉三維深度信息的深度傳感器,雖然聽名字這是一顆傳感器,其實它的最終形態(tài)和我們的眼睛一樣,需要去觀察、認(rèn)識以及理解這個世界。

尤其是在蘋果推出Face ID之后,相關(guān)的智能手機(jī)廠商都想跟風(fēng),雖然這股風(fēng)現(xiàn)在還沒起來,但是大多已經(jīng)開始蠢蠢欲動。最近,華為在某場手機(jī)發(fā)布會上,也公布了點云深度攝像頭Jupiter X,和Phone X的“齊劉海”系統(tǒng)十分相似……

從小眾走向大眾的深度傳感器市場

最近一段時間,我們也采訪了不少做深度傳感器的廠商,聊來聊去,繞不開的一個話題就是:曾經(jīng)小眾的深度攝像頭市場,正在慢慢走向大眾化,而iPhone X在其中發(fā)揮了關(guān)鍵性的作用。

數(shù)據(jù)顯示,深度攝像頭市場規(guī)模將從2015年的12.5億美元增長到2021年的78.9 億美元,年均增長率達(dá)35%。

來自Markets and Markets的一份報告也顯示,預(yù)計到2020年全球機(jī)器視覺市場規(guī)模將達(dá)到125億美元。麥姆斯咨詢也顯示,預(yù)計2016~2022年間3D傳感器市場規(guī)模的復(fù)合年增長率為26.5%,2022年將達(dá)到54.6億美元。

這也是為什么蘋果、微軟、英特爾這樣的大公司會在五年時間內(nèi),紛紛投資或者收購深度傳感器、手勢識別算法以及上下游相關(guān)解決方案公司:

比如蘋果在2013年花費3.6億美元收購的PrimeSense,其前身是微軟Kinect的技術(shù)提供商,被蘋果收入麾下后,他們的結(jié)構(gòu)光方案也就成功的運用到iPhone X上。

而蘋果的帶頭作用也已經(jīng)對整個智能手機(jī)市場產(chǎn)生影響,很多手機(jī)廠商正著手尋求和國內(nèi)外3D傳感器供應(yīng)商合作。

另外一方面,隨著AI和智能制造時代的到來,機(jī)器人市場對于深度傳感器的需求也隨之增加。

毫不夸張的說,深度攝像頭所代表的三維視覺技術(shù)是一項非常基礎(chǔ)的技術(shù),早早的進(jìn)行技術(shù)或者專利的布局,就是為之后的大規(guī)模應(yīng)用夯實基礎(chǔ)。

深度攝像頭的“三駕馬車”

深度攝像頭雖然也叫作攝像頭,但是它和我們?nèi)粘R姷降倪€是有很大區(qū)別,以我們?nèi)粘J褂玫氖謾C(jī)相機(jī)為例,無論像素有多高,它也只能捕捉到一些簡單的二維信息,而深度攝像頭如其名所示,它能夠測量視野內(nèi)空間每個點的深度數(shù)據(jù),從而獲得完整三維坐標(biāo)信息。

而一旦獲得這種三維信息,就能為機(jī)器感知和智能分析提供最基礎(chǔ)的數(shù)據(jù)信息。

目前,市面上比較成熟的深度信息捕捉方案主要就三種:結(jié)構(gòu)光、雙目視覺以及TOF(飛行時間)。

第一種是結(jié)構(gòu)光方案,通過發(fā)射特定圖形的散斑或者點陣的激光紅外圖案,攝像頭捕捉到被測物體反射回來的圖案,計算上面散斑或者點的大小,然后跟原始的尺寸做對比,從而測算出被測物體到攝像頭之間的距離。

第二個叫雙目,主要通過兩個普通的攝像頭獲得深度信息,簡而言之它就是模仿人眼的結(jié)構(gòu),通過兩個攝像頭的視差來確定距離信息。

第三種是TOF,它是通過發(fā)出的激光反射回來的時間算距離,TOF的方案在第二代Kinect上有使用過,傳感器發(fā)出調(diào)制的脈沖紅外光,然后遇到物體反射后,它會計算出光線發(fā)射和反射時間差或者相位差,實現(xiàn)距離的測量,最終產(chǎn)生深度信息。

可以說,既有的三種方案各有所長,TOF的響應(yīng)速度快、精度高,不易受環(huán)境光線干擾,但是功耗和成本都比較大;結(jié)構(gòu)光的工業(yè)化應(yīng)用較多;雙目立體成像更適合室外強(qiáng)光條件和高分辨率應(yīng)用,目前主要應(yīng)用在機(jī)器人視覺、自動駕駛等方面。

但是,現(xiàn)在很多技術(shù)廠商在盡可能的取長補(bǔ)短,彌補(bǔ)既有技術(shù)的短板。

深度攝像頭的產(chǎn)業(yè)鏈分解

無論是哪種方案,追根溯源其產(chǎn)業(yè)鏈的話,如下圖所示:

從產(chǎn)業(yè)鏈來看,相比較傳統(tǒng)的攝像頭,比較突出的就是紅外相關(guān)的元件。其實,如果對比兩者的結(jié)構(gòu),也能很明顯發(fā)現(xiàn)深度攝像頭增加了不少新的硬件組件。

2D 攝像頭模組結(jié)構(gòu)

典型的3D 攝像頭模組結(jié)構(gòu)

發(fā)射端上新增了紅外激光發(fā)射器和輔助元件,包括衍射光柵和光學(xué)棱鏡部件(如準(zhǔn)直鏡頭);在接收端,新增紅外接收部分,包括鏡頭、紅外傳感器和窄帶紅外濾光片;在圖像處理器芯片上,由于算法上的復(fù)雜性,也比簡單的2D成像芯片成本更高。

還是以蘋果iPhone X為例,它的黑劉海就引入了紅外光學(xué)發(fā)射器VCSEL(垂直共振腔表面放射激光)。

相比較傳統(tǒng)的LED,VCSEL的精度、體積以及低功耗更適合移動端,現(xiàn)在大多數(shù)深度攝像頭都會采用VCSEL作為紅外光源,像蘋果的VCSEL供應(yīng)商之一是IQE,另一供應(yīng)商則是Lumentum。

市場研究機(jī)構(gòu)預(yù)測,2015年VCSEL市場規(guī)模為9.546億美元,至2022年預(yù)計將增長至31.241億美元,2016~2022年期間的復(fù)合年增長率可達(dá)17.3%。

VCSEL憑借其緊湊的尺寸、高可靠性、低功耗以及較低的制造成本而應(yīng)用廣泛。而汽車產(chǎn)業(yè)電氣系統(tǒng)對VCSEL的應(yīng)用增長,正推動整個VCSEL的市場增長。

隨著這塊市場的逐漸打開,提供綜合技術(shù)方案的廠商也開始嶄露頭角,比如我們此前采訪過的圖漾和華捷艾米,都是以提供最終的軟硬件產(chǎn)品,甚至是算法為主。

另外,現(xiàn)在一大趨勢就是三維視覺在算法端上和人工智能的結(jié)合,從而進(jìn)一步提高識別的精確度。

以人臉識別為例,像我們熟悉的商湯、曠視都接二連三獲得數(shù)億美元的融資,這塊市場的容量可想而知,商湯、曠視都是算法段的高手,但是3D攝像頭可以減少對這部分算法的依賴,通過采集人臉圖像的深度信息,直接在終端上提高人臉識別技術(shù)的準(zhǔn)確率。

機(jī)器人、無人駕駛、安防、VR/AR,深度攝像頭就像萬金油

在一項智研咨詢的數(shù)據(jù)調(diào)查中,2016-2022年3D成像會在消費電子領(lǐng)域迎來爆發(fā),其平均年復(fù)合增速達(dá)到了160%,如下圖所示,

為此鎂客君也整理一份深度傳感器的應(yīng)用市場情況,從宏觀上來看,基本上囊括了移動智能手機(jī)、機(jī)器人、自動駕駛、安防等領(lǐng)域,也難怪為什么大公司十分熱衷于收購這些技術(shù)公司。

如果簡單梳理一下深度攝像頭的應(yīng)用方向,如下圖所示,主要集中在消費端和工業(yè)領(lǐng)域:

說到安防中的行為識別和生物特征識別。傳統(tǒng)的安防攝像頭只能記錄下海量的視頻信息,而無法對視頻里面人的行為做分析和預(yù)警,有了深度攝像頭,就有了對人的動作獲取的硬件基礎(chǔ),配合深度學(xué)習(xí)算法,就可以對人的行為做識別和預(yù)警,安防的設(shè)備能夠真正能夠體現(xiàn)出它的價值。

智能制造方面,包括流水化生產(chǎn)線上的工業(yè)機(jī)器人,無人倉儲內(nèi)的送貨機(jī)器人都需要及時獲取深度信息,比如送貨機(jī)器自動將不同大小、體重的包裹運送到規(guī)定的位置,僅僅是二維平面信息完全不夠,它必須要配備深度攝像頭去獲取包括深度在內(nèi)的三維信息。

同樣是我們?nèi)粘3R姷膾叩貦C(jī)器人,它在室內(nèi)的避障也需要深度攝像頭去以捕獲周圍的環(huán)境信息,然后再規(guī)劃出合適的路徑。

就像圖漾的聯(lián)合創(chuàng)始人徐韜所說,“三維視覺在整個人工智能領(lǐng)域的基礎(chǔ)性地位,深度攝像頭的應(yīng)用范圍其實是在不斷拓展,將來有望成為所有機(jī)器的標(biāo)配傳感器。”

在娛樂消費端,大家就比較熟悉它的幾個應(yīng)用場景,比如類似于微軟Kinect的體感游戲機(jī)。要實現(xiàn)體感交互,很重要的就是手勢、身體骨骼動作的識別等,以華捷艾米的3D體感芯片為例,其中就包含了骨骼跟蹤技術(shù)以及slam算法(定位、跟蹤以及路徑規(guī)劃技術(shù)的核心)等。

消費端的另一個切入口就是我們一直提到的基于智能手機(jī)的面部識別,這也是現(xiàn)階段不少手機(jī)廠商攻克的難點。用華捷艾米聯(lián)合創(chuàng)始人沈瑄的話來說,“安卓手機(jī)要到明年9、10月份才能逐漸擁有類似于iPhone X的Face ID功能。”

結(jié)構(gòu)光、TOF各有各的難點,移動端正在成為兵家必爭之地

當(dāng)然,技術(shù)的應(yīng)用也要追求小而美,蘋果在2013年收購結(jié)構(gòu)光方案的鼻祖PrimeSense,但是直到四年后的現(xiàn)在,才成功將其小型化到可以應(yīng)用到智能手機(jī)上。

可以說,在深度攝像頭的發(fā)展歷程中,如何去縮減傳感器的體積以及降低功耗一直是各大公司努力的方向。同樣是英特爾的RealSense技術(shù),它的設(shè)備體積就非常大,而且需要借助PC電腦來完成識別,不適用于現(xiàn)在的移動端需求。

相比較行業(yè)應(yīng)用,移動端在深度傳感器上的需求差別會非常大,徐韜曾經(jīng)向鎂客君提到,“移動端深度傳感器的體積更小、功耗更低,很多東西都要重新研發(fā),需要投入大量的人才和資源去做這個事情。”

對于消費端來說,只有低功耗、小體積才能實現(xiàn)真正的商業(yè)化,這也是為什么很多廠商在做嵌入式方案、或者以“曲線救國”的形式去降低功耗等。

此前,公認(rèn)的是TOF比結(jié)構(gòu)光更加適合應(yīng)用到智能手機(jī)上,因為采用TOF原理來實現(xiàn)動作追蹤和深度感知已經(jīng)出現(xiàn)在谷歌的Project Tango方案中,Project Tango主要用于空間三維數(shù)據(jù)的采集。去年聯(lián)想推出了一款Project Tango技術(shù)方案的手機(jī),但是時間證明,外形過大、重量過度的Tango手機(jī)并沒有打開市場,現(xiàn)在關(guān)于這款手機(jī)的量產(chǎn)和銷量也不得而知,不得不說,TOF的方案還需要“斟酌”。

深圳一家做深度攝像頭方案的繁維科技創(chuàng)始人程斯特則表示,“確切來說,TOF確實是比較適合移動端,但目前也不能說相比之下,結(jié)構(gòu)光就不適合于移動端,很多人都斷章取義了。”

確實,從iPhone X的趨勢來看,結(jié)構(gòu)光正在成功攻陷移動端。

但值得注意的是,F(xiàn)ace ID并不是普通的結(jié)構(gòu)光技術(shù),它實際上叫做激光散斑,是PrimeSense的專利技術(shù),而蘋果收購了他們,目前這個技術(shù)也只能是蘋果使用。

也就是說,F(xiàn)ace ID的激光散斑技術(shù)比較封閉,而且對處理器要求高,相對來說對接受器要求比較低;但是,TOF技術(shù)對于接收器要求比較高,而對于處理器要求很低。所以TOF的方案一定要把芯片做小,減少接收端的壓力。

一旦能實現(xiàn)這點,深度傳感器會快速打開消費端應(yīng)用的市場。

“所有的技術(shù)在某個時間點都有最優(yōu)的性價比選擇,只能說在當(dāng)前這個階段,結(jié)構(gòu)光是最佳的選擇,這也是為什么蘋果會選擇結(jié)構(gòu)光。其實從蘋果的角度,它的實力、現(xiàn)金流,做任何技術(shù)都可以,但是它為什么選了結(jié)構(gòu)光,也說明其他技術(shù)在一些問題上沒法在當(dāng)前階段做一些消費級的產(chǎn)品。”沈瑄表示。

雖然移動消費端的市場誘惑很大,但是這也意味著更激烈的競爭。像高通已經(jīng)和奇景光電共同推出完整的解決方案,以高通在移動芯片市場的壟斷地位,其他廠商很難和它進(jìn)行直面的競爭。

但是這也并不妨礙一些綜合方案解決商“快馬加鞭”地優(yōu)化自己的算法和技術(shù),去盡可能的進(jìn)入到這塊紅海市場中。

結(jié)語:

此前,鎂客君在采訪北航教授李波的時候,他提到,將來計算機(jī)的感知系統(tǒng)應(yīng)該是用綜合型的視覺來完成,而不是現(xiàn)在被動式的采圖。比如我們會用激光、紅外、雷達(dá)、GPS等結(jié)合起來的攝像設(shè)備。

“客觀世界遠(yuǎn)遠(yuǎn)不止深度,還有很多像溫度、濕度、速度、方向等等,所以未來的深度相機(jī)應(yīng)該要把更多的信息整合到一起。”

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到