AIIA人工智能開發(fā)者大會(huì)開啟在即,思必馳俞凱暢談?wù)Z音交互技術(shù)的“AI互聯(lián)”
語音交互技術(shù)會(huì)使信息和人、信息和設(shè)備以更豐富的形式鏈接在一起,它已成為AI最重要的交互方式。
在當(dāng)前的人工智能行業(yè)里,有一個(gè)非常有意思的比喻:AI就是“電”。
可能在1780年伽伐尼通過閃電研究電流現(xiàn)象的時(shí)候,除了科學(xué)界,沒有任何一個(gè)人會(huì)認(rèn)為他的研究將徹底改變?nèi)祟愇磥淼纳睢V钡?6年后,1866年西門子制成了世界上第一臺(tái)自勵(lì)式直流發(fā)電機(jī),人類才愿意去相信,電,是一個(gè)足以顛覆現(xiàn)有生活方式。由此到來的第二次工業(yè)革命,也充分印證了這一點(diǎn)。
現(xiàn)在,人工智能時(shí)代來了。AI技術(shù)正在以各種方式、從各個(gè)方面滲透入我們的生活。它極有可能會(huì)和“電”一樣,再次顛覆我們現(xiàn)有的生活。而作為人工智能相關(guān)技術(shù)中與用戶接觸最為直接的部分之一——語音交互也正在通過各種智能終端硬件潛移默化的改變著我們的生活方式。
10月15日,由國家發(fā)展和改革委員會(huì)、國家網(wǎng)信辦指導(dǎo),中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)主辦,蘇州工業(yè)園區(qū)管理委員會(huì)支持,鎂客網(wǎng)全程協(xié)辦的“AIIA人工智能開發(fā)者大會(huì)”將在蘇州舉辦。屆時(shí),思必馳首席科學(xué)家俞凱將從語音識(shí)別技術(shù)發(fā)展及落地應(yīng)用出發(fā),圍繞“對(duì)話智能”發(fā)表主題演講。思必馳也將主辦“智無界·創(chuàng)有形——AI開發(fā)者如何利用軟硬件技術(shù)融合實(shí)現(xiàn)創(chuàng)新”專題論壇。
活動(dòng)前夕,鎂客網(wǎng)獨(dú)家采訪了俞凱,他表示,“語音交互技術(shù)會(huì)使信息和人、信息和設(shè)備以更豐富的方式鏈接在一起,在人工智能這個(gè)“電局”中,它所承載的就是‘輸電電網(wǎng)’的功能。”
圖 | 思必馳首席科學(xué)家俞凱
與物聯(lián)網(wǎng)智能硬件終端飛速發(fā)展,是水到渠成的事情
前兩天,網(wǎng)絡(luò)上有個(gè)小視頻很火:一位女生模仿Siri得惟妙惟肖,被廣大網(wǎng)友評(píng)為是“Siri本Sir”。
這個(gè)視頻為什么火?有兩個(gè)格外重要的原因:第一,女生無論在聲線、語速、說話方式上都幾乎和Siri一模一樣;第二,Siri已經(jīng)成為了大眾生活中的一份子了,語音交互及相關(guān)應(yīng)用正在深入地滲透進(jìn)我們生活的方方面面。
據(jù)調(diào)查公司VoiceLabs去年發(fā)布的《2017年語音報(bào)告》顯示,僅2017年,語音產(chǎn)業(yè)結(jié)構(gòu)按照硬件產(chǎn)品、AI軟件、語音應(yīng)用Apps、生態(tài)系統(tǒng)服務(wù)相結(jié)合的架構(gòu),至少出臺(tái)了2450萬臺(tái)以語音為主要交互方式的智能硬件產(chǎn)品,市場總量達(dá)3300萬臺(tái),市場規(guī)模超200億美元。足見智能語音交互市場的龐大。
而值得一提的是,即便是最早出來的Siri,也早已不是iPhone的專屬,而是被廣泛應(yīng)用于蘋果所有的智能終端硬件上。亞馬遜、谷歌、百度等科技巨頭也是如此,智能語音交互技術(shù)在車載、智能家居等場景中的應(yīng)用早已不是“新鮮事”了。
“其實(shí),早在2012年的時(shí)候,我們就對(duì)智能手機(jī)做過一些探索。但當(dāng)時(shí)的智能手機(jī)應(yīng)用,APP應(yīng)用、集成和產(chǎn)品設(shè)計(jì)才是核心競爭力,其他技術(shù)只是輔助手段。”對(duì)此,俞凱解釋稱,“物聯(lián)網(wǎng)本身的爆發(fā)性是非常驚人的,因?yàn)槲锫?lián)網(wǎng)終端硬件產(chǎn)品大多屏幕很小甚至沒有屏幕,相較于手機(jī),其對(duì)語音交互的需求更加緊迫。這也是思必馳決定在2014年果斷轉(zhuǎn)戰(zhàn)至智能硬件領(lǐng)域的主要原因。”
對(duì)于思必馳來說,其所專注的語音交互技術(shù),是具有核心創(chuàng)新競爭力的。在覆蓋度上,包括語音識(shí)別、語義理解、對(duì)話、決策等,思必馳已經(jīng)走到了全鏈路一體化階段,而不只是一個(gè)單純的模塊。“DUI”平臺(tái)的推出,更為思必馳加強(qiáng)了于眾開發(fā)者之間的聯(lián)系與合作。
除此之外,思必馳已有提供大規(guī)模、可定制服務(wù)的能力。“簡單來說,能夠做出一個(gè)好不是真的好,能做出十個(gè)不同的好才算是好。根據(jù)用戶的需求提供定制的個(gè)性化智能語音交互系統(tǒng),讓其不僅具有高通用識(shí)別和交互能力,還能在相關(guān)領(lǐng)域擁有個(gè)性化的知識(shí)積累和交互邏輯能力,這樣才能稱為全鏈路賦能。”
因?yàn)樯鲜鰩状笤颍?014年決定轉(zhuǎn)型時(shí),思必馳將重點(diǎn)落地場景放在了車載、家居等物聯(lián)網(wǎng)相關(guān)智能終端硬件領(lǐng)域中,這是極具前瞻性的。“平臺(tái)性的技術(shù)就應(yīng)該被更大的發(fā)揮出來,因?yàn)橛辛诉@些積累,所以到2017年我們?cè)谖锫?lián)網(wǎng)行業(yè)有了很大的發(fā)展。這是水到渠成的事情。”
據(jù)IDC對(duì)全球音箱出貨量的統(tǒng)計(jì),2017年,應(yīng)用思必馳語音交互技術(shù)的智能音箱的總出貨量排名,已是全球第三。
思必馳的使命是“溝通萬物,打理萬事”
在當(dāng)前的AI行業(yè)中,有很多的細(xì)分領(lǐng)域,談及語音交互技術(shù)在AI行業(yè)整體發(fā)展中所扮演的角色時(shí),俞凱給我們打了個(gè)比方:如果將現(xiàn)在的人工智能行業(yè)比喻成“電”,那么行業(yè)就由三部分組成,發(fā)電的、用電的、和輸電電網(wǎng)。
發(fā)電,如芯片、大數(shù)據(jù)等提供基礎(chǔ)智能服務(wù)的行業(yè),就是通過篩選、分析、處理信息,并通過這些信息提供智能服務(wù);
用電,如智能硬件中的機(jī)器人、智能醫(yī)療器械以及相關(guān)智能系統(tǒng)等;
輸電電網(wǎng),就是語音交互技術(shù),它會(huì)使得信息和人、信息和設(shè)備以更豐富的形式鏈接在一起,從而產(chǎn)生很多新的機(jī)會(huì)。而無論對(duì)于“發(fā)電”還是“用電”層面,這一交互媒介都已經(jīng)成為了AI最重要的入口之一。
由此來看,作為一家以擁有“媒介”核心技術(shù)的公司,思必馳所需要做的,就是通過語音這一媒介,去解決用戶“用電”中所有的問題,尤其在簡化“輸電”方式,提升“輸電”效率上。對(duì)此,俞凱強(qiáng)調(diào),“溝通萬物、打理萬事,就是我們當(dāng)前的使命。”
“為了更好的提供語音交互服務(wù),我們正在陸陸續(xù)續(xù)推出一些新的產(chǎn)品和相關(guān)技術(shù),后續(xù)也會(huì)有更多的驚喜,包括AI芯片。”
可以看到,在“端”上進(jìn)行布局已是大勢所趨。從語音交互的角度來說,用“溝通”連接萬物最主要的就是把物聯(lián)網(wǎng)上一些非標(biāo)準(zhǔn)的重要節(jié)點(diǎn)標(biāo)準(zhǔn)化,如各種規(guī)格性能的傳感器等。
而對(duì)于芯片的具體信息,俞凱表示現(xiàn)在還不方便透露過多。
關(guān)于大會(huì)的期待
很明顯的,對(duì)于思必馳來說,加強(qiáng)原始創(chuàng)新技術(shù)積累和打造有價(jià)值的實(shí)際應(yīng)用是其未來需要一直努力的方向。作為語音交互行業(yè)的佼佼者和此次“AIIA人工智能開發(fā)者大會(huì)”的演講嘉賓,俞凱期待能夠從開發(fā)者的角度看到一些新的想法和具有創(chuàng)新精神的應(yīng)用。
“開發(fā)者是人工智能產(chǎn)業(yè)發(fā)展的主力軍,我們期待與開發(fā)者緊密合作,用對(duì)話式人工智能溝通萬物打理萬事,一起讓智能的世界變得更美好。”
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
