微軟最新研制的語(yǔ)音識(shí)別機(jī)器已經(jīng)可以媲美人類(lèi)
優(yōu)化的語(yǔ)音識(shí)別技術(shù)在未來(lái)被期待能夠給微軟一系列產(chǎn)品注入新的活力。
今日,微軟發(fā)出公告,聲稱(chēng)其所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在人聲語(yǔ)音識(shí)別上已經(jīng)媲美人類(lèi)。微軟表示其用NIST 2000自動(dòng)化系統(tǒng)來(lái)同專(zhuān)業(yè)筆記員進(jìn)行能力對(duì)比,首次實(shí)現(xiàn)了機(jī)器出錯(cuò)率小于人類(lèi)的突破。
可以說(shuō)優(yōu)化的語(yǔ)音識(shí)別技術(shù),在未來(lái)被期待能夠給微軟一系列產(chǎn)品注入新的活力。“無(wú)論是個(gè)人用戶(hù)方面還是商業(yè)產(chǎn)品,語(yǔ)音識(shí)別的應(yīng)用前景都很可觀。借此,Xbox可以實(shí)現(xiàn)快速的語(yǔ)音輸入,語(yǔ)音助手小娜也可以實(shí)現(xiàn)更流暢的對(duì)答。”在近日發(fā)布的一份更新博客中,微軟如此說(shuō)道。
微軟CEO薩提亞·納德拉(Satya- Nadella)對(duì)語(yǔ)音識(shí)別不吝贊美之情,稱(chēng)語(yǔ)音識(shí)別的突破意義不亞于當(dāng)初圖形界面(GUI)被引入電腦。并預(yù)言語(yǔ)音識(shí)別技術(shù)將在未來(lái)幾年迅速普及。
近年來(lái),語(yǔ)音識(shí)別連續(xù)迎來(lái)突破。今年早些時(shí)候,中國(guó)互聯(lián)網(wǎng)巨頭百度和華盛頓大學(xué)以及斯坦福大學(xué)共同開(kāi)展對(duì)不同輸入方式的對(duì)比研究。結(jié)果表明百度的深度語(yǔ)音識(shí)別技術(shù)Deep Speech 2能夠?qū)崿F(xiàn)三倍于人類(lèi)鍵盤(pán)手打的輸入速度。另外美國(guó)國(guó)防部下屬的DARPA自1970年代開(kāi)始就致力于語(yǔ)音識(shí)別技術(shù)的研究,并貢獻(xiàn)良多。DARPA所開(kāi)展的語(yǔ)音理解研究(SUR)在開(kāi)發(fā)語(yǔ)音識(shí)別技術(shù)的過(guò)程中起了關(guān)鍵作用,影響至今。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
