如何通過人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)圖像識別?
假如在人工智能里定義一個女人需要滿足100個特征,那么在海量的圖像里只要滿足這100個我們定義的特征,那么她就是女人。
人工神經(jīng)網(wǎng)絡(luò)作為一個新技術(shù)正不斷融入各個學(xué)科,其獨有的優(yōu)勢在數(shù)字圖像處理中也得到了不錯的運用。針對卷積神經(jīng)網(wǎng)絡(luò)做圖像識別,則是一個相當(dāng)火的方向,如騰訊云識別,只要上傳任意一張圖像就能識別出圖中有人還是有花等,那這到底是怎么實現(xiàn)的呢?
下面我們就以如何通過神經(jīng)網(wǎng)絡(luò)識別人物肖像來說事。
假設(shè)有一張女人的圖像:
這是一張大小為350x450的圖像,那現(xiàn)在我們在人工智能里設(shè)定,如果在看到其他的圖,只要其大小為350x450,并且所有像素點跟上面這張圖一樣,那就判定圖中的人是女的。
很顯然,在海量的圖像里除了這張能再找到完全一樣的才怪。那怎么辦嘞,每個人都長的不一樣,有的白一點,有的黑一點,即使是同一個女人,也有可能她吃胖了,那豈不是認(rèn)不出來了?
這時神經(jīng)網(wǎng)絡(luò)發(fā)揮作用了,我們看這張圖時看到了什么特征?帽子、長發(fā)、卷發(fā)、大眼睛而且還露背了。
再分析一下,頭發(fā)是黑色的,黑色的像素亮度低,頭發(fā)一般是一簇的,卷發(fā)是大卷的,大眼睛在整個臉部占比多一點,好像都是廢話,但對于神經(jīng)網(wǎng)絡(luò)不是,這都是特征。
若我們有10萬張長發(fā)的人的圖像,讓神經(jīng)分析所有圖中像素點的位置和像素點的值的共同點,最終會得到一個網(wǎng)絡(luò),只要跟這個網(wǎng)絡(luò)里記憶的特征相同或者相似的就會被定義為長發(fā)。10萬個長發(fā)發(fā)型樣本幾乎覆蓋了所有能想到的發(fā)型,當(dāng)再拿一張長發(fā)的人的圖像來通過網(wǎng)絡(luò),就會查到一個大多數(shù)女人的特征:長發(fā)。
那該有人問了,這還是不能知道圖中的人是男是女啊,有的動物也是長發(fā),比如馬。。。。。。
那我們再增加特征唄,10萬張嘴的特征,10萬張鼻子的特征等,只管往上加,每一個物種都有其共同特征和獨有特征。
假如在人工智能里定義一個女人需要滿足100個特征,那么在海量的圖像里只要滿足這100個我們定義的特征,那么她就是女人。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
