Facebook升級AI屏幕閱讀工具,用動詞“讀”圖片

韓璐 9年前 (2017-02-03)

升級之后,F(xiàn)acebook人工智能能夠更為準確的“讀”出圖片。

2015年10月,Facebook宣布了一個正在進行的大膽計劃:通過人工智能技術(shù),幫助盲人或者視力障礙用戶“看到”其平臺上的照片。在2016年4月5日,這個屏幕閱讀工具正式在iOS平臺上線,iPhone用戶只需開啟輔助功能中的VoiceOver,在使用Facebook時,其中的人工智能就能自動識別并“讀”出圖片內(nèi)容。

就在近日,F(xiàn)acebook對這個工具進行了一次升級。在以往的版本中,F(xiàn)acebook人工智能技術(shù)“讀”出的圖片內(nèi)容多為名詞,比如下面這張照片:

Facebook升級AI屏幕閱讀工具,用動詞“讀”圖片

它的解讀可能是大自然、戶外、云、草、地平線、植物、樹。而在升級之后,F(xiàn)acebook的人工智能還能夠使用動詞來對圖片進行描述。

Facebook升級AI屏幕閱讀工具,用動詞“讀”圖片

Facebook的應(yīng)用機器學(xué)習(xí)負責(zé)人Joaquin Candela周四在博客中表示:“此前這個屏幕閱讀工具只能描述照片中的物體。今天我們宣布我們已經(jīng)添加了12組動詞,所以圖像描述現(xiàn)在將包括‘人們走路’、‘人們跳舞’、‘騎馬’、‘玩樂器’等等。”

據(jù)悉,在此項人工智能技術(shù)的開發(fā)中,F(xiàn)acebook在其中使用了神經(jīng)網(wǎng)絡(luò)技術(shù),借助于數(shù)千萬張照片對此AI系統(tǒng)進行訓(xùn)練,以提高圖片內(nèi)容識別的準確率。

按照Facebook當(dāng)初的目標(biāo),這項工具的開發(fā)是為了照顧盲人和視力障礙用戶,不過,在實際運用中,此工具還有更大的實用意義。除了為視力障礙者提供服務(wù)之外,通過人工智能對圖片內(nèi)容的描述,人們也可以根據(jù)關(guān)鍵詞來對圖片進行搜索,目前,人們可以在Google Photos中體驗這項功能。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到