谷歌DeepMind新進(jìn)展,讓深度學(xué)習(xí)學(xué)會(huì)“過目不忘”
只需通過一個(gè)例子,該算法便可認(rèn)出圖像中的物體或其他東西。
正常情況下,計(jì)算機(jī)算法通常需要成千上萬個(gè)例子才能學(xué)會(huì)一件事情,但谷歌DeepMind的研究人員卻找到了一種新的方法,直接繞過這一流程。這種新方法被他們稱為“單次學(xué)習(xí)”,即算法只需通過一個(gè)例子便可認(rèn)出圖像中的物體或其他東西。
事實(shí)上,不少算法的確能夠準(zhǔn)確地識(shí)別物體,但該結(jié)果以龐大的數(shù)據(jù)訓(xùn)練為前提,因而不是一般的耗費(fèi)時(shí)間和金錢。此外,如此多的數(shù)據(jù)搜集也顯得并不實(shí)際——例如,不可能為了讓一個(gè)機(jī)器人在一套不熟悉的房子里行走而為其提供長時(shí)間的學(xué)習(xí)機(jī)會(huì)。
為解決這個(gè)問題,谷歌DeepMind研究員奧里奧爾·溫亞爾斯(Oriol Vinyals)在深度學(xué)習(xí)系統(tǒng)中增加了一個(gè)記憶組件。該團(tuán)隊(duì)利用一個(gè)名為ImageNet的標(biāo)記圖片數(shù)據(jù)庫對(duì)該系統(tǒng)的能力進(jìn)行了驗(yàn)證。
目前,該算法仍需要分析數(shù)百種圖片,但未來它將學(xué)會(huì)對(duì)圖片中獨(dú)特元素的分析,用一張照片識(shí)別新的物體。對(duì)此,溫亞爾斯稱,如果能夠快速識(shí)別出一個(gè)新單詞的意思,這項(xiàng)技術(shù)的用途便會(huì)得到明確體現(xiàn)。這對(duì)谷歌非常有用,因此該公司可以借此快速學(xué)習(xí)某個(gè)新的搜索項(xiàng)的含義。
DeepMind并不是第一個(gè)研究單次學(xué)習(xí)方法的團(tuán)隊(duì),但之前人們所開發(fā)得單次學(xué)習(xí)系統(tǒng)通常不兼容深度學(xué)習(xí)系統(tǒng)。“我認(rèn)為這是一種很有趣的方法,它提供了一種新穎的方式對(duì)大規(guī)模的數(shù)據(jù)庫進(jìn)行單次學(xué)習(xí)。”韓國先進(jìn)科技學(xué)院大腦和機(jī)器智能實(shí)驗(yàn)室主任Sang Wan Lee說,“這為人工智能社區(qū)做出了技術(shù)貢獻(xiàn),計(jì)算機(jī)視覺研究人員可能非常重視此事。”
當(dāng)然,也有人對(duì)這項(xiàng)技術(shù)的用途提出質(zhì)疑。哈佛大學(xué)腦科學(xué)系副教授山姆·格什曼(Sam Gershman)表示,人類通常是通過理解一張圖像的組成元素來學(xué)習(xí)的,這需要一些實(shí)際的知識(shí)或嘗試。例如,“賽格威可能看上去與自行車或摩托車大不相同,但它卻可以使用相同的零件。”
不過,格什曼和Sang Wan Lee都表示,機(jī)器要在學(xué)習(xí)能力上比拼人類仍然要經(jīng)過一段時(shí)間的發(fā)展。“我們遠(yuǎn)遠(yuǎn)沒有揭開人類單次學(xué)習(xí)的秘密。”Sang Wan Lee說。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
