布局人工智能,搜狗“知音”扮演著什么角色?
看語(yǔ)音交互引擎“知音”如何玩轉(zhuǎn)搜狗的人工智能!
就在昨日下午,搜狗舉行了一場(chǎng)發(fā)布會(huì),正式推出自家的最新產(chǎn)品——語(yǔ)音交互引擎“知音”,這是一款基于深度學(xué)習(xí)算法的智能語(yǔ)音引擎,具有理解與思考能力。此外,在發(fā)布會(huì)上,其CTO楊洪濤也首次披露了公司未來(lái)8年主要的發(fā)展方向。
“知音”到底有多強(qiáng)?
在現(xiàn)場(chǎng)介紹環(huán)節(jié),搜狗語(yǔ)音交互中心負(fù)責(zé)人王硯峰向我們展示了一項(xiàng)關(guān)于“知音”準(zhǔn)確率的測(cè)試。在今年3月份,搜狗將知音與百度及科大訊飛的語(yǔ)音輸入法放在一起,由北京郵電大學(xué)、北大深圳研究生院擔(dān)任評(píng)測(cè)機(jī)構(gòu),得出評(píng)測(cè)結(jié)論:搜狗訊飛能力基本持平,整體領(lǐng)先百度。姑且先不論這項(xiàng)測(cè)評(píng)的相關(guān)細(xì)節(jié),單從表面的結(jié)果來(lái)看,搜狗知音的語(yǔ)音識(shí)別能力不容小覷。
除此之外,知音還有著其他3個(gè)優(yōu)勢(shì)。首先就是語(yǔ)音識(shí)別解決了因語(yǔ)速過(guò)快導(dǎo)致吞音問(wèn)題,降低了30%的識(shí)別錯(cuò)誤率,并將語(yǔ)音識(shí)別的速度提升了3倍;其次就是支持用戶對(duì)錯(cuò)誤的語(yǔ)音識(shí)別進(jìn)行修正,比如說(shuō)把“一生”的“一”改為醫(yī)院的“醫(yī)”,以便系統(tǒng)給出最準(zhǔn)確的反饋;最后是支持多輪對(duì)話,處理更復(fù)雜的用戶交互邏輯,比如說(shuō)去首都機(jī)場(chǎng),機(jī)器會(huì)問(wèn)你“去T1還是T2”,在確定航站樓后,它還會(huì)繼續(xù)詢問(wèn)“是出發(fā)還是接人”。
“知音”的大用處
擴(kuò)大國(guó)內(nèi)語(yǔ)音輸入應(yīng)用版圖。隨著時(shí)代的進(jìn)步與技術(shù)的發(fā)展,在信息檢索、文字輸入的時(shí)候,越來(lái)越多的人拋棄了繁瑣的鍵盤操作,投入語(yǔ)音輸入的懷抱。就比如說(shuō)目前穩(wěn)居國(guó)內(nèi)第一大語(yǔ)音輸入法應(yīng)用的搜狗輸入法,其語(yǔ)音輸入頻次達(dá)到每天1.4億次,比一年前增長(zhǎng)了55%,并且它的語(yǔ)音識(shí)別準(zhǔn)確率也已然超過(guò)了97%。
除了輸入法,在搜索引擎、社交軟件、物聯(lián)網(wǎng)等等方面,也越來(lái)越多的運(yùn)用到了語(yǔ)音識(shí)別技術(shù),在此基礎(chǔ)上,搜狗此時(shí)推出性能在國(guó)內(nèi)來(lái)說(shuō)較為領(lǐng)先的語(yǔ)音交互引擎知音,如果只是自家內(nèi)部消化的話,在輸入法、搜索引擎等市場(chǎng)上,搜狗或?qū)?huì)進(jìn)行再一次的市場(chǎng)擴(kuò)張,若能夠?qū)崿F(xiàn)開(kāi)源的話,除了能夠?qū)χ暨M(jìn)行更多的完善,搜狗亦將打造另一種商業(yè)模式。
打入車聯(lián)網(wǎng)。此前,在一場(chǎng)針對(duì)王硯峰的專訪中,當(dāng)提及語(yǔ)音識(shí)別技術(shù)的重要應(yīng)用方向,他表示:“從當(dāng)前的產(chǎn)品發(fā)展結(jié)合技術(shù)對(duì)于產(chǎn)品體驗(yàn)的增值方面來(lái)看,車內(nèi)的語(yǔ)音目前是我們覺(jué)得最具有價(jià)值的。”
在2013年,權(quán)威電子行業(yè)研究機(jī)構(gòu)IMS Research指出,預(yù)估至2019年,全球約有55%的新車將具備語(yǔ)音識(shí)別功能,而整體車用語(yǔ)音識(shí)別市場(chǎng)營(yíng)收也將由2011年的8,100萬(wàn)美元,劇增至2019年的1億7,000萬(wàn)美元。而根據(jù)王硯峰的說(shuō)法,汽車語(yǔ)音識(shí)別市場(chǎng)已經(jīng)開(kāi)始進(jìn)入爆發(fā)期。雖然市場(chǎng)還尚不成熟,但知音的加入無(wú)疑是他們進(jìn)入車聯(lián)網(wǎng)的一大助力,比如說(shuō)將知音加入旗下應(yīng)用“搜狗地圖”車載版。
“知音”背后的人工智能布局
早從2013年開(kāi)始,搜狗就開(kāi)始了人工智能方面的研究。根據(jù)今年Q2財(cái)報(bào)來(lái)看,非美國(guó)通用會(huì)計(jì)準(zhǔn)則下,搜狗的凈利潤(rùn)達(dá)到2.2億元人民幣,而此前在4月,搜狗宣布捐贈(zèng)清華大學(xué)1.8億元人民幣,聯(lián)合成立“清華大學(xué)天工智能計(jì)算研究院”,深入開(kāi)發(fā)包含人工智能在內(nèi)的前沿技術(shù)。單單從這兩個(gè)數(shù)據(jù)來(lái)看,在人工智能的資金投入上,搜狗可謂是毫不手軟,足可見(jiàn)其對(duì)于人工智能的野心之大。
而在發(fā)布會(huì)上,楊洪濤也首次透露搜狗未來(lái)8年的發(fā)展方向“自然交互+知識(shí)計(jì)算”,這其中就深藏了搜狗未來(lái)人工智能布局的縮影。那這其中,“知音”又擔(dān)任著怎樣的地位呢?
人機(jī)自然交互研究的是人與機(jī)器的對(duì)話,以及非生命機(jī)器對(duì)于高級(jí)生命人類的理解,賦予機(jī)器以智能,使機(jī)器成為高級(jí)的智能工具。從這其中,我們就可以知道,在對(duì)人機(jī)自然交互的研究中,“語(yǔ)言”作為社會(huì)中最基本的交流媒介,它的重要性不言而喻。另外,對(duì)于人們來(lái)說(shuō),口頭交流才是最舒服、最方便的方式。因而,“知音”在很大程度上就代表了搜夠在自然交互上領(lǐng)域的成就,而在未來(lái),它只會(huì)表現(xiàn)的更加智能,能夠更為理解人類。
知識(shí)計(jì)算多用于搜索引擎,究其本質(zhì)就是將人類知識(shí)盡可能變成可計(jì)算的,使每個(gè)普通人在針對(duì)某個(gè)特定問(wèn)題時(shí)都能獲得相應(yīng)專家水平的答案,而不是一些只是包含了關(guān)鍵詞的網(wǎng)頁(yè)。此前,谷歌曾對(duì)美國(guó)青少年及成年人進(jìn)行一項(xiàng)調(diào)查,調(diào)查顯示約有55.5%的人會(huì)使用語(yǔ)音搜索,這意味著未來(lái)將有更多的人會(huì)在使用搜索引擎的時(shí)候選擇語(yǔ)音輸入。而我們?cè)谡Z(yǔ)音輸入的時(shí)候,只有語(yǔ)音的識(shí)別足夠準(zhǔn)確,繼而才能讓系統(tǒng)反饋準(zhǔn)確的答案,才能發(fā)揮知識(shí)計(jì)算最大的效用。因此,在搜狗知識(shí)計(jì)算的研究中,語(yǔ)音交互引擎“知音”或許不是最重要的,但對(duì)其在實(shí)際應(yīng)用中的輔助作用不可忽視!
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
