最新讀唇術(shù)機(jī)器來了:主要依靠新的讀唇算法

周彤 10年前 (2016-03-26)

計(jì)算機(jī)科學(xué)家 Bear 帶來最新讀唇技術(shù),可以利用讀唇算法識別唇形讀出內(nèi)容并轉(zhuǎn)換成文字。

近日,相關(guān)消息透露,東英吉利大學(xué)計(jì)算機(jī)科學(xué)家 Helen Bear 和她的同事 Harvey 共同研發(fā)出一套新的讀唇算法,這套算法可以幫助計(jì)算機(jī)提高識別自然語言的能力,可以根據(jù)發(fā)音的唇形來讀出內(nèi)容并且轉(zhuǎn)換成文字。

不過這聽起來怎么那么充滿科幻的色彩呢?

其實(shí)所謂的讀唇術(shù)就是傳統(tǒng)意義上的語音識別,而要想真正挑戰(zhàn)這項(xiàng)技術(shù)還是很不容易的,因?yàn)榇叫蔚陌l(fā)音很容易受到一些微妙的變化而改變,當(dāng)我們的口型微張、微閉,或者舌面高低發(fā)生變化,這些都會導(dǎo)致嘴型發(fā)生變化,很難準(zhǔn)確識別。

而 Bear 科學(xué)家和她的同事研發(fā)出來的算法現(xiàn)在已經(jīng)可以精確的識別一個嘴型所對應(yīng)的特定音素,它主要是通過對發(fā)音嘴型的重復(fù)訓(xùn)練從而形成一定的概念。而且現(xiàn)在這個算法的識別的精準(zhǔn)度已經(jīng)越來越高了。

哈哈~這是不是意味著大家以后都不能在一些特定場所說著悄悄話了呢?

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到