關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

巫盼 9年前 (2016-11-15)

巨頭們都關(guān)注的AR關(guān)鍵技術(shù)有哪些?它們目前的發(fā)展?fàn)顩r又是如何呢?

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

最近又有爆料稱(chēng),蘋(píng)果要在明年發(fā)布iPhone 8的時(shí)候推出支持AR技術(shù)的設(shè)備。雖然蘋(píng)果對(duì)于AR的關(guān)注度一直很高,但是現(xiàn)在并沒(méi)有明確的證據(jù)表明蘋(píng)果正在研發(fā)AR硬件設(shè)備,很多消息都是科技圈內(nèi)爆料大神們各種捕風(fēng)捉影的猜測(cè)。

除了蘋(píng)果之外,國(guó)內(nèi)外很多巨頭都非常關(guān)注AR的發(fā)展。此前易觀智庫(kù)發(fā)布的《中國(guó)AR行業(yè)應(yīng)用專(zhuān)題研究報(bào)告》中顯示,這些巨頭正在基于自身的業(yè)務(wù)生態(tài),以實(shí)驗(yàn)室或者收購(gòu)的形式搶先布局AR的底層技術(shù)。那么AR關(guān)鍵技術(shù)有哪些?它們目前的發(fā)展?fàn)顩r又是如何呢?

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

根據(jù)AR科研帶頭人Ronald Azuma提出的定義,增強(qiáng)現(xiàn)實(shí)應(yīng)用系統(tǒng)開(kāi)發(fā)的三大關(guān)鍵技術(shù)可總結(jié)為三維注冊(cè)技術(shù)、虛實(shí)融合顯示技術(shù)以及人機(jī)交互技術(shù)。

系統(tǒng)顯示技術(shù)

AR的簡(jiǎn)單定義就是將計(jì)算機(jī)生成的虛擬數(shù)字信息疊加到現(xiàn)實(shí)的生活場(chǎng)景中。這個(gè)“疊加”是需要通過(guò)顯示設(shè)備作為中介來(lái)實(shí)現(xiàn)。AR的顯示技術(shù)包括三種類(lèi)型:頭戴式顯示、手持顯示以及投影顯示技術(shù)。

目前最常見(jiàn)的就是手持顯示技術(shù),它的載體包括移智能手機(jī)、平板電腦等移動(dòng)設(shè)備。此前火爆全球的AR游戲《Pokemon Go》就是借助手機(jī)的顯示屏在現(xiàn)實(shí)生活中捉小精靈,這些移動(dòng)設(shè)備的屏幕充當(dāng)?shù)木褪且粋€(gè)窗口或者放大器的作用,用來(lái)顯示那些模擬的數(shù)字信息。

頭戴式顯示是國(guó)內(nèi)外眾多AR硬件廠商研究關(guān)注的重點(diǎn),按照工作原理可以分為光學(xué)透視式和視頻透視式兩種。光學(xué)透視技術(shù)是通過(guò)安裝在設(shè)備眼前的光學(xué)透鏡來(lái)呈現(xiàn)出真實(shí)和虛擬世界。首先計(jì)算機(jī)生成的虛擬信息經(jīng)過(guò)光學(xué)系統(tǒng)放大后反射后進(jìn)入視野,透過(guò)透鏡又能直接看到現(xiàn)實(shí)場(chǎng)景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實(shí)現(xiàn)AR的效果。微軟的Hololens就是屬于光學(xué)透視式的頭戴顯示器。這種顯示技術(shù)的優(yōu)點(diǎn)就在于結(jié)構(gòu)簡(jiǎn)單,真實(shí)感和安全性更高,但是易受光線外部光線的干擾。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來(lái)捕捉獲取外部真實(shí)環(huán)境,計(jì)算機(jī)將數(shù)字模擬信息疊加到攝像機(jī)的視頻信號(hào)上,再將真實(shí)場(chǎng)景和虛擬場(chǎng)景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場(chǎng)更大,而且不受外界的強(qiáng)光干擾。不過(guò)一旦攝像機(jī)與用戶的視點(diǎn)不能保持完全重合,會(huì)產(chǎn)生一些偏差。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

投影式顯示是將生成的虛擬對(duì)象信息直接投影到需要融合的真實(shí)場(chǎng)景中。它可以不借助任何硬件設(shè)備,直接用肉眼看到被投射出在現(xiàn)實(shí)環(huán)境下的虛擬場(chǎng)景。但是投影設(shè)備體積龐大,比較容易受到光照變化影響,這塊目前的實(shí)際應(yīng)用比較少。

現(xiàn)在還有一種光場(chǎng)顯示技術(shù),以Magic Leap的光場(chǎng)技術(shù)為例,它不需要任何屏幕為載體,通過(guò)記錄并復(fù)現(xiàn)光場(chǎng)就能完成虛擬物體的顯示。通過(guò)呈現(xiàn)不同深度的圖像,使用戶在觀察近景或遠(yuǎn)景時(shí),可以實(shí)現(xiàn)主動(dòng)的對(duì)焦。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

對(duì)比這三種顯示技術(shù),手持式顯示技術(shù)的載體是最為常見(jiàn)的,所以在面向C端用戶的AR電商、游戲上應(yīng)用廣泛。而頭戴式顯示在TOC端的工業(yè)應(yīng)用上潛力巨大,比如宇航制造業(yè),通過(guò)使用這種設(shè)備來(lái)提高生產(chǎn)工作的效率。

三維注冊(cè)技術(shù)

在實(shí)際的AR體驗(yàn)中,因?yàn)槿说挠^察視線會(huì)不斷地變化,AR系統(tǒng)需要實(shí)時(shí)的根據(jù)用戶的視場(chǎng)重新建立位置坐標(biāo)系,進(jìn)行追蹤。而三維注冊(cè)技術(shù)就是實(shí)時(shí)地跟蹤用戶頭部的位置和視線方向,根據(jù)這些信息來(lái)確定虛擬物體在真實(shí)空間坐標(biāo)中的位置,并將它實(shí)時(shí)地顯示在顯示器中的正確位置。它具體包含了跟蹤技術(shù)、標(biāo)定技術(shù)和匹配技術(shù)。

三維注冊(cè)技術(shù)又可以分為基于硬件設(shè)備和計(jì)算機(jī)視覺(jué)兩種。

基于硬件設(shè)備的追蹤技術(shù)主要是通過(guò)硬件傳感器跟蹤技術(shù)來(lái)實(shí)現(xiàn),主要包括慣性導(dǎo)航系統(tǒng)、全球定位系統(tǒng)(GPS)、電磁、光學(xué)或超聲波位置跟蹤器等。谷歌的Project Tango就是通過(guò)手機(jī)的傳感器來(lái)進(jìn)行運(yùn)動(dòng)追蹤。雖然它無(wú)需通過(guò)計(jì)算機(jī)復(fù)雜的算法來(lái)獲取位置信息,速度比較快,但是相應(yīng)的注冊(cè)精度不是很高,比如GPS定位很容易受到復(fù)雜地形位置的干擾,而慣性定位追蹤的偏差度會(huì)隨時(shí)間增長(zhǎng)不斷增大。

關(guān)鍵技術(shù)梳理,告訴你AR并沒(méi)有那么神秘

基于計(jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)主要是指利用計(jì)算機(jī)視覺(jué)獲取真實(shí)場(chǎng)景的信息后,經(jīng)過(guò)圖像處理方面的知識(shí)來(lái)識(shí)別和跟蹤定位真實(shí)場(chǎng)景。細(xì)分可以劃為基于傳統(tǒng)標(biāo)志的注冊(cè)算法和基于自然特征點(diǎn)無(wú)標(biāo)志注冊(cè)算法?;谟?jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)的精度較高,但是對(duì)計(jì)算量非常大,而且算法復(fù)雜,對(duì)系統(tǒng)的要求非常高。

為了取長(zhǎng)補(bǔ)短,得到更加精確的注冊(cè)結(jié)果,現(xiàn)在有結(jié)合兩種技術(shù)的混合注冊(cè)方法。通常是先由跟蹤傳感器大概估計(jì)位置姿態(tài),再通過(guò)視覺(jué)法進(jìn)一步精確調(diào)整定位。一般采用的復(fù)合法有視覺(jué)與電磁跟蹤結(jié)合、視覺(jué)與慣導(dǎo)跟蹤結(jié)合、視覺(jué)與GPS跟蹤結(jié)合等。

人機(jī)交互技術(shù)

因?yàn)锳R是將虛擬的數(shù)字信息疊加在現(xiàn)實(shí)環(huán)境中,所以非常注重用戶在真實(shí)環(huán)境中和虛擬物體的自然交互。這就需要有針對(duì)性的設(shè)計(jì)用來(lái)交互的“工具”,保證能夠執(zhí)行用戶對(duì)虛擬物體發(fā)出的各種指令。

AR的交互方式現(xiàn)在有通過(guò)外界的硬件設(shè)備來(lái)實(shí)現(xiàn),如鼠標(biāo)鍵盤(pán),數(shù)據(jù)手套等等。還有一種更自然的交互方式,就是通過(guò)基于計(jì)算機(jī)視覺(jué)的手勢(shì)識(shí)別,以及語(yǔ)音識(shí)別等等。它們不需要借助其他硬件載體,就可以直接和虛擬物體進(jìn)行交互,而這種人機(jī)交互依賴(lài)于以深度學(xué)習(xí)算法為基礎(chǔ)的人工智能的發(fā)展?,F(xiàn)在的AR硬件設(shè)備大多都可以實(shí)現(xiàn)簡(jiǎn)單的語(yǔ)音和手勢(shì)動(dòng)作的識(shí)別交互,但是涉及到一些復(fù)雜的指令的時(shí)候,可能會(huì)無(wú)法進(jìn)行及時(shí)的命令反饋。

上面提到的三大塊只是AR技術(shù)的主干支,在每一個(gè)主干下面都能衍生出其他分支技術(shù)。隨著技術(shù)的不斷深入發(fā)展,未來(lái)的AR會(huì)和真實(shí)世界完全融合。就像《黑鏡》第三季的《游戲測(cè)試》故事那樣,人們或許會(huì)逐漸無(wú)法分辨何為現(xiàn)實(shí)何為虛擬。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到