布局人工智能,搜狗“知音”扮演著什么角色?

韓璐 9年前 (2016-08-05)

看語音交互引擎“知音”如何玩轉(zhuǎn)搜狗的人工智能!

布局人工智能,搜狗“知音”扮演著什么角色?

就在昨日下午,搜狗舉行了一場發(fā)布會,正式推出自家的最新產(chǎn)品——語音交互引擎“知音”,這是一款基于深度學(xué)習(xí)算法的智能語音引擎,具有理解與思考能力。此外,在發(fā)布會上,其CTO楊洪濤也首次披露了公司未來8年主要的發(fā)展方向。

“知音”到底有多強(qiáng)?

布局人工智能,搜狗“知音”扮演著什么角色?

在現(xiàn)場介紹環(huán)節(jié),搜狗語音交互中心負(fù)責(zé)人王硯峰向我們展示了一項關(guān)于“知音”準(zhǔn)確率的測試。在今年3月份,搜狗將知音與百度及科大訊飛的語音輸入法放在一起,由北京郵電大學(xué)、北大深圳研究生院擔(dān)任評測機(jī)構(gòu),得出評測結(jié)論:搜狗訊飛能力基本持平,整體領(lǐng)先百度。姑且先不論這項測評的相關(guān)細(xì)節(jié),單從表面的結(jié)果來看,搜狗知音的語音識別能力不容小覷。

除此之外,知音還有著其他3個優(yōu)勢。首先就是語音識別解決了因語速過快導(dǎo)致吞音問題,降低了30%的識別錯誤率,并將語音識別的速度提升了3倍;其次就是支持用戶對錯誤的語音識別進(jìn)行修正,比如說把“一生”的“一”改為醫(yī)院的“醫(yī)”,以便系統(tǒng)給出最準(zhǔn)確的反饋;最后是支持多輪對話,處理更復(fù)雜的用戶交互邏輯,比如說去首都機(jī)場,機(jī)器會問你“去T1還是T2”,在確定航站樓后,它還會繼續(xù)詢問“是出發(fā)還是接人”。

“知音”的大用處

布局人工智能,搜狗“知音”扮演著什么角色?

擴(kuò)大國內(nèi)語音輸入應(yīng)用版圖。隨著時代的進(jìn)步與技術(shù)的發(fā)展,在信息檢索、文字輸入的時候,越來越多的人拋棄了繁瑣的鍵盤操作,投入語音輸入的懷抱。就比如說目前穩(wěn)居國內(nèi)第一大語音輸入法應(yīng)用的搜狗輸入法,其語音輸入頻次達(dá)到每天1.4億次,比一年前增長了55%,并且它的語音識別準(zhǔn)確率也已然超過了97%。

除了輸入法,在搜索引擎、社交軟件、物聯(lián)網(wǎng)等等方面,也越來越多的運用到了語音識別技術(shù),在此基礎(chǔ)上,搜狗此時推出性能在國內(nèi)來說較為領(lǐng)先的語音交互引擎知音,如果只是自家內(nèi)部消化的話,在輸入法、搜索引擎等市場上,搜狗或?qū)M(jìn)行再一次的市場擴(kuò)張,若能夠?qū)崿F(xiàn)開源的話,除了能夠?qū)χ暨M(jìn)行更多的完善,搜狗亦將打造另一種商業(yè)模式。

布局人工智能,搜狗“知音”扮演著什么角色?

打入車聯(lián)網(wǎng)。此前,在一場針對王硯峰的專訪中,當(dāng)提及語音識別技術(shù)的重要應(yīng)用方向,他表示:“從當(dāng)前的產(chǎn)品發(fā)展結(jié)合技術(shù)對于產(chǎn)品體驗的增值方面來看,車內(nèi)的語音目前是我們覺得最具有價值的。

在2013年,權(quán)威電子行業(yè)研究機(jī)構(gòu)IMS Research指出,預(yù)估至2019年,全球約有55%的新車將具備語音識別功能,而整體車用語音識別市場營收也將由2011年的8,100萬美元,劇增至2019年的1億7,000萬美元。而根據(jù)王硯峰的說法,汽車語音識別市場已經(jīng)開始進(jìn)入爆發(fā)期。雖然市場還尚不成熟,但知音的加入無疑是他們進(jìn)入車聯(lián)網(wǎng)的一大助力,比如說將知音加入旗下應(yīng)用“搜狗地圖”車載版。

布局人工智能,搜狗“知音”扮演著什么角色?

“知音”背后的人工智能布局

早從2013年開始,搜狗就開始了人工智能方面的研究。根據(jù)今年Q2財報來看,非美國通用會計準(zhǔn)則下,搜狗的凈利潤達(dá)到2.2億元人民幣,而此前在4月,搜狗宣布捐贈清華大學(xué)1.8億元人民幣,聯(lián)合成立“清華大學(xué)天工智能計算研究院”,深入開發(fā)包含人工智能在內(nèi)的前沿技術(shù)。單單從這兩個數(shù)據(jù)來看,在人工智能的資金投入上,搜狗可謂是毫不手軟,足可見其對于人工智能的野心之大。

而在發(fā)布會上,楊洪濤也首次透露搜狗未來8年的發(fā)展方向“自然交互+知識計算”,這其中就深藏了搜狗未來人工智能布局的縮影。那這其中,“知音”又擔(dān)任著怎樣的地位呢?

布局人工智能,搜狗“知音”扮演著什么角色?

人機(jī)自然交互研究的是人與機(jī)器的對話,以及非生命機(jī)器對于高級生命人類的理解,賦予機(jī)器以智能,使機(jī)器成為高級的智能工具。從這其中,我們就可以知道,在對人機(jī)自然交互的研究中,“語言”作為社會中最基本的交流媒介,它的重要性不言而喻。另外,對于人們來說,口頭交流才是最舒服、最方便的方式。因而,“知音”在很大程度上就代表了搜夠在自然交互上領(lǐng)域的成就,而在未來,它只會表現(xiàn)的更加智能,能夠更為理解人類。

布局人工智能,搜狗“知音”扮演著什么角色?

知識計算多用于搜索引擎,究其本質(zhì)就是將人類知識盡可能變成可計算的,使每個普通人在針對某個特定問題時都能獲得相應(yīng)專家水平的答案,而不是一些只是包含了關(guān)鍵詞的網(wǎng)頁。此前,谷歌曾對美國青少年及成年人進(jìn)行一項調(diào)查,調(diào)查顯示約有55.5%的人會使用語音搜索,這意味著未來將有更多的人會在使用搜索引擎的時候選擇語音輸入。而我們在語音輸入的時候,只有語音的識別足夠準(zhǔn)確,繼而才能讓系統(tǒng)反饋準(zhǔn)確的答案,才能發(fā)揮知識計算最大的效用。因此,在搜狗知識計算的研究中,語音交互引擎“知音”或許不是最重要的,但對其在實際應(yīng)用中的輔助作用不可忽視!

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到