迪士尼研究院用深度學(xué)習(xí)打造語音動畫,讓VR社交更真實

巫盼 8年前 (2017-08-17)

基于深度學(xué)習(xí)的系統(tǒng)可以提供更高的準確性以及細節(jié)度。

最近,迪士尼研究院聯(lián)合東安格利亞大學(xué)、加利福尼亞理工大學(xué)和卡內(nèi)基梅隆大學(xué)的研究人員,發(fā)布了一篇題為“A Deep Learning Approach for Generalized Speech Animation”的論文,闡述了通過深度學(xué)習(xí)來實現(xiàn)程序語音動畫的方法。該方法采樣完人們的錄音后,即可自動生成與語音相匹配的口型動畫。

迪士尼研究院用深度學(xué)習(xí)打造語音動畫,讓VR社交更真實

據(jù)了解,這是一個借助深度學(xué)習(xí)方法進行訓(xùn)練的系統(tǒng),它能夠分析來自任何揚聲器的音頻,學(xué)習(xí)從語音標簽輸入序列到口部運動的任意非線性映射,然后系統(tǒng)會自動生成相應(yīng)的口形以及符合語音的面部模型。

如果應(yīng)用到虛擬現(xiàn)實中,可以讓虛擬的人物形象在說話的時候保持和現(xiàn)實中用戶相同的口型變化,讓VR社交應(yīng)用的VR形象更加逼真。而且對于虛擬化身語音動畫來說,雖然口型追蹤是比較準確的方法,但是在這種口型追蹤硬件普及之前,迪士尼研究院的程序語音動畫是一個行之有效的好方式。

另外,在一些VR社交應(yīng)用中也有通過系統(tǒng)實現(xiàn)語音動畫的方式,主要也是基于音頻來制作虛擬形象的口型動畫,而基于深度學(xué)習(xí)的系統(tǒng)可以提供更高的準確性以及細節(jié)度。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到