微軟AI可基于圖片回答問題,比蘋果siri更強(qiáng)大

周彤 10年前 (2015-11-27)

微軟AI技術(shù)新進(jìn)展,未來可提供更多服務(wù)。

微軟AI可基于圖片回答問題,比蘋果siri更強(qiáng)大1

大家可能都用過蘋果siri,還記得第一次用的時(shí)候,都覺得很神奇吧!然而,近日,微軟在卡耐基梅隆大學(xué)的一個(gè)研究小組開發(fā)出了一個(gè)新的AI系統(tǒng),這個(gè)系統(tǒng)可以訓(xùn)練機(jī)器識(shí)別圖像的內(nèi)容,并回答自然語(yǔ)言提出的問題。

當(dāng)你拿著一張圖片去問它時(shí),這個(gè)新的系統(tǒng)就會(huì)回答你所問的問題,當(dāng)然這只局限于圖片上的信息。研發(fā)人員表示,其實(shí)當(dāng)系統(tǒng)回答用戶所問的問題,其過程是很復(fù)雜的。它需要多步驟推理,具體解決方案是 “堆棧注意力網(wǎng)絡(luò)(Stack Attention Networks)”,圖片經(jīng)過多層深度神經(jīng)網(wǎng)絡(luò)進(jìn)行“注意力”分析,計(jì)算出哪些區(qū)域與問題有關(guān)。另外,圖像自動(dòng)字幕和機(jī)器翻譯都用到了單層 “注意力” 分析技術(shù)。

微軟AI可基于圖片回答問題,比蘋果siri更強(qiáng)大2

其實(shí)在去年,微軟就已經(jīng)研究院創(chuàng)造了一個(gè)自動(dòng)字幕系統(tǒng),可以讓機(jī)器觀察圖像和描述其中內(nèi)容。自那時(shí)以來,該項(xiàng)目持續(xù)發(fā)展,而且現(xiàn)在成為微軟研究院整體戰(zhàn)略的一個(gè)核心部分。機(jī)器智能,或者說創(chuàng)建一個(gè)真正的AI,一直是微軟多年來的既定目標(biāo)。在云計(jì)算和機(jī)器學(xué)習(xí)技術(shù)進(jìn)步的幫助下,現(xiàn)在這方面的工作已取得突破。

在未來,這項(xiàng)技術(shù)或許可以用于實(shí)時(shí)識(shí)別并預(yù)測(cè)人的需求,給你提供更多的服務(wù)。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到