迪士尼研究院用深度學習打造語音動畫,讓VR社交更真實

巫盼 8年前 (2017-08-17)

基于深度學習的系統(tǒng)可以提供更高的準確性以及細節(jié)度。

最近,迪士尼研究院聯(lián)合東安格利亞大學、加利福尼亞理工大學和卡內(nèi)基梅隆大學的研究人員,發(fā)布了一篇題為“A Deep Learning Approach for Generalized Speech Animation”的論文,闡述了通過深度學習來實現(xiàn)程序語音動畫的方法。該方法采樣完人們的錄音后,即可自動生成與語音相匹配的口型動畫。

迪士尼研究院用深度學習打造語音動畫,讓VR社交更真實

據(jù)了解,這是一個借助深度學習方法進行訓練的系統(tǒng),它能夠分析來自任何揚聲器的音頻,學習從語音標簽輸入序列到口部運動的任意非線性映射,然后系統(tǒng)會自動生成相應的口形以及符合語音的面部模型。

如果應用到虛擬現(xiàn)實中,可以讓虛擬的人物形象在說話的時候保持和現(xiàn)實中用戶相同的口型變化,讓VR社交應用的VR形象更加逼真。而且對于虛擬化身語音動畫來說,雖然口型追蹤是比較準確的方法,但是在這種口型追蹤硬件普及之前,迪士尼研究院的程序語音動畫是一個行之有效的好方式。

另外,在一些VR社交應用中也有通過系統(tǒng)實現(xiàn)語音動畫的方式,主要也是基于音頻來制作虛擬形象的口型動畫,而基于深度學習的系統(tǒng)可以提供更高的準確性以及細節(jié)度。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到