看不清摸不著還能識(shí)別出物體,目標(biāo)算法讓機(jī)器人更聰明
研究人員開發(fā)出新算法,使機(jī)器人無(wú)需多角度取景,就可以迅速識(shí)別出三維空間里的物體。
目前機(jī)器人識(shí)別三維空間里的物體都是通過(guò)多個(gè)角度觀察來(lái)收集信息,從而做出判斷,故而常出現(xiàn)反應(yīng)速度慢和對(duì)存儲(chǔ)和計(jì)算資源的需求量大等問題。對(duì)此,研究人員開發(fā)出一套新的計(jì)算機(jī)視覺算法,即使在部分物體被遮擋的條件下,它也能夠使機(jī)器人直接識(shí)別出物體,無(wú)需多角度收集信息。
類似傳統(tǒng)的用于訓(xùn)練機(jī)器人的計(jì)算機(jī)視覺算法,該算法也需要通過(guò)四千個(gè)分布在十個(gè)不同類別的物體數(shù)據(jù)的訓(xùn)練,以此來(lái)了解這個(gè)世界。
當(dāng)我們需要機(jī)器人識(shí)別物體時(shí),傳統(tǒng)的算法只是用來(lái)訓(xùn)練如何識(shí)別物體的特征和物體疊加的總體特征,而此處新的算法會(huì)計(jì)算對(duì)象的相似度和物體之間不同之處這兩項(xiàng)因素。
具體來(lái)看,就是當(dāng)它需要識(shí)別鍋和罐頭的時(shí)候,算法不會(huì)花時(shí)間檢測(cè)中空部分,而是尋找其他因素;而當(dāng)算法確定物體是個(gè)鍋的時(shí)候,它會(huì)將重點(diǎn)放在鍋的深度或手柄的位置,以確定鍋的類型。
對(duì)此,Ben Burchfiel博士說(shuō):“這樣可以釋放儲(chǔ)存和計(jì)算資源,讓學(xué)習(xí)變得更容易。”
不過(guò)在識(shí)別任務(wù)中,很多時(shí)候物體都是被遮掩的。雖然傳統(tǒng)的深度學(xué)習(xí)算法能夠解析復(fù)雜的輸入數(shù)據(jù),并輸出一個(gè)簡(jiǎn)單的預(yù)測(cè)結(jié)果,但是當(dāng)對(duì)象模糊時(shí),傳統(tǒng)的算法往往無(wú)法給出準(zhǔn)確的結(jié)果,正確率極低。而這里的新算法可以通過(guò)關(guān)聯(lián)的形狀特征來(lái)構(gòu)建整個(gè)對(duì)象。
根據(jù)訓(xùn)練結(jié)果,嵌入該算法的機(jī)器人大約只需花一秒來(lái)預(yù)測(cè)結(jié)果,正確率目前可達(dá)到75%,而且它無(wú)需從不同角度獲取物體信息,就可以推斷出物體不可見的部分。
Burchfiel表示,目前需要做的就是用大量的數(shù)據(jù)對(duì)這一算法進(jìn)行訓(xùn)練,以達(dá)到更高的準(zhǔn)確度和實(shí)現(xiàn)對(duì)算法的優(yōu)化。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
