硬紀(jì)元AI峰會(huì)前瞻:成像技術(shù)距離下一次顛覆還有多遠(yuǎn)?
在現(xiàn)實(shí)生活中,越來越多的行業(yè)用到了攝像頭,像直播、監(jiān)控等等,而在當(dāng)下,因?yàn)槟承┪锢碓颍胀〝z像頭已經(jīng)不能夠滿足行業(yè)發(fā)展的需求。
不論是成像技術(shù),亦或是三維感知,其實(shí)都屬于深度感知的范疇。雖然目前市場對于深度感知技術(shù)的需求呈井噴狀態(tài),但是能夠提供成熟產(chǎn)品和方案的公司卻屈指可數(shù),造成這一現(xiàn)象的核心原因就是技術(shù)門檻過高。
從三維感知的角度來看,AI人工智能主要分為感知和認(rèn)知兩個(gè)層面。
針對感知層而言,有一個(gè)里程碑事件是深度傳感器的普及。2009年,微軟Kinect 誕生是當(dāng)時(shí)的一個(gè)大事件,是人工智能感知傳感器中的革命性的里程碑,從此以后大家終于可以很方便和低成本地獲取3D信息了;另外,計(jì)算機(jī)視覺長期存在兩大難題:圖像理解和三維重建。
一直以來,求解3D都是人們的夢想,最初它需要拍兩張或多張照片,費(fèi)很大的勁兒來重建。但今天有了sensor,人們直接可以測量3D,它一下就開啟了今天和未來的很多應(yīng)用。
但是,Kinect V2是基于連續(xù)波間相法的ToF(Time-of-Flight)深度相機(jī),它存在不能抗陽光,不能遠(yuǎn)距離工作的缺陷。而另一種獲取三維數(shù)據(jù)的方式是通過機(jī)械掃描式激光雷達(dá),但它同樣存在無法解決的缺陷:產(chǎn)能受限成本高、數(shù)據(jù)稀疏空間分辨率低,限制了它們的應(yīng)用范圍。
深度感知現(xiàn)有的三種解決方案
現(xiàn)階段常見的深度感知解決方案,主要依靠深度攝像頭,在獲取平面圖像之外,還可以獲取圖像中的深度信息,比如說三維的位置以及尺寸等信息,這也就讓計(jì)算機(jī)獲得了環(huán)境和對象的三維立體數(shù)據(jù)。
從技術(shù)角度來細(xì)分的話,深度感知攝像頭目前有如下三種解決方案:
結(jié)構(gòu)光:目前應(yīng)用最廣泛的深度感知方案,基本原理是由結(jié)構(gòu)光投射器向被測物體表面投射可控制的光點(diǎn)、光條或光面結(jié)構(gòu),并由圖像傳感器獲得圖像,通過系統(tǒng)幾何關(guān)系,利用三角原理計(jì)算得到物體的三維坐標(biāo)。上文中提到的Kinect 1代就是使用的這項(xiàng)技術(shù)。
雙目視覺:只需安裝兩個(gè)攝像頭,利用雙目立體視覺成像原理,通過兩個(gè)攝像機(jī)來提取包括三維位置在內(nèi)的信息進(jìn)行深度感知。因?yàn)闆]有涉及光學(xué)系統(tǒng),所以雙目視覺解決方案的成本較低,但是該項(xiàng)技術(shù)對于硬件設(shè)備的要求又相對較高。
ToF:飛行時(shí)間(Time of Flight)技術(shù)的縮寫,基本原理是傳感器發(fā)出經(jīng)調(diào)制的近紅外光,遇物體后反射,傳感器通過計(jì)算光線發(fā)射和反射時(shí)間差或相位差,來換算被拍攝景物的距離,以產(chǎn)生深度信息,此外再結(jié)合傳統(tǒng)的相機(jī)拍攝,就能將物體的三維輪廓以不同顏色代表不同距離的地形圖方式呈現(xiàn)出來。ToF是受環(huán)境影響最小的技術(shù),不過由于其分辨率不高,所以并不適用于高精度需求的應(yīng)用場景。
三維感知技術(shù)對于AI的革命性推動(dòng)及應(yīng)用
目前全球范圍內(nèi)感知深度的ToF傳感器有很多種,其中以光珀智能科技的ToF傳感器最具代表性。
杭州光珀智能科技有限公司(以下簡稱“光珀”)主要專注于全球新一代ToF傳感器技術(shù)的研發(fā)。光珀在基于PCT的專利保護(hù)下提出原理創(chuàng)新,使得他們的ToF傳感器和傳統(tǒng)的ToF深度相機(jī)(基于連續(xù)波間相法)相比,其遠(yuǎn)距離及抗陽光的特性更類似傳統(tǒng)意義上的激光雷達(dá)。同時(shí)也解決了機(jī)械掃描式激光雷達(dá)產(chǎn)能受限成本高、數(shù)據(jù)稀疏空間分辨率低的兩大缺陷。
光珀智能CEO白云峰介紹說:“目前,我們已經(jīng)推出了‘光珀第一代ToF傳感器芯片’,并由此構(gòu)建了三個(gè)固態(tài)面陣激光雷達(dá)技術(shù)平臺(tái),分別滿足不同距離下(近、中、遠(yuǎn))、強(qiáng)陽光下(100Klux)、大場景(70?)、高精度(<1%)、高空間分辨率(0.06?H)等三維感知需求。這三個(gè)技術(shù)平臺(tái)可以服務(wù)于智能安防、機(jī)器人的導(dǎo)航與避障、無人駕駛的環(huán)境感知。特別是在無人駕駛領(lǐng)域,光珀的傳感器滿足了量產(chǎn)無人車對激光雷達(dá)低成本、高空間分辨率的兩大需要。
“光珀正和科研院校聯(lián)手創(chuàng)建大場景下的稠密三維數(shù)據(jù)集。而我們相信,這樣的數(shù)據(jù)集會(huì)對未來人工智能的發(fā)展有著革命性的推動(dòng)作用。”
深度感知領(lǐng)域還能有哪些突破?
現(xiàn)階段的深度感知技術(shù)還處于前期,雖然在硬件性能和算法程序上已經(jīng)有所突破,但是依然面臨諸多限制,這也導(dǎo)致了很多應(yīng)用場景還處于商業(yè)化探索階段。那么,對于深度感知領(lǐng)域,還能有哪些突破?
如果你想得到答案,就一定不要錯(cuò)過鎂客網(wǎng)7月9日在北京國家會(huì)議中心舉辦的“3E“硬紀(jì)元”AI+產(chǎn)業(yè)應(yīng)用創(chuàng)新峰會(huì)”,峰會(huì)期間將會(huì)有眾多人工智能、深度感知領(lǐng)域的大咖,分享他們的最新見解與洞察。所以,你還在猶豫什么,趕緊點(diǎn)擊鏈接報(bào)名參加吧!
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
