AIIA人工智能開發(fā)者大會開啟在即,思必馳俞凱暢談?wù)Z音交互技術(shù)的“AI互聯(lián)”
語音交互技術(shù)會使信息和人、信息和設(shè)備以更豐富的形式鏈接在一起,它已成為AI最重要的交互方式。
在當(dāng)前的人工智能行業(yè)里,有一個非常有意思的比喻:AI就是“電”。
可能在1780年伽伐尼通過閃電研究電流現(xiàn)象的時候,除了科學(xué)界,沒有任何一個人會認(rèn)為他的研究將徹底改變?nèi)祟愇磥淼纳?。直?6年后,1866年西門子制成了世界上第一臺自勵式直流發(fā)電機(jī),人類才愿意去相信,電,是一個足以顛覆現(xiàn)有生活方式。由此到來的第二次工業(yè)革命,也充分印證了這一點。
現(xiàn)在,人工智能時代來了。AI技術(shù)正在以各種方式、從各個方面滲透入我們的生活。它極有可能會和“電”一樣,再次顛覆我們現(xiàn)有的生活。而作為人工智能相關(guān)技術(shù)中與用戶接觸最為直接的部分之一——語音交互也正在通過各種智能終端硬件潛移默化的改變著我們的生活方式。
10月15日,由國家發(fā)展和改革委員會、國家網(wǎng)信辦指導(dǎo),中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)主辦,蘇州工業(yè)園區(qū)管理委員會支持,鎂客網(wǎng)全程協(xié)辦的“AIIA人工智能開發(fā)者大會”將在蘇州舉辦。屆時,思必馳首席科學(xué)家俞凱將從語音識別技術(shù)發(fā)展及落地應(yīng)用出發(fā),圍繞“對話智能”發(fā)表主題演講。思必馳也將主辦“智無界·創(chuàng)有形——AI開發(fā)者如何利用軟硬件技術(shù)融合實現(xiàn)創(chuàng)新”專題論壇。
活動前夕,鎂客網(wǎng)獨家采訪了俞凱,他表示,“語音交互技術(shù)會使信息和人、信息和設(shè)備以更豐富的方式鏈接在一起,在人工智能這個“電局”中,它所承載的就是‘輸電電網(wǎng)’的功能。”
圖 | 思必馳首席科學(xué)家俞凱
與物聯(lián)網(wǎng)智能硬件終端飛速發(fā)展,是水到渠成的事情
前兩天,網(wǎng)絡(luò)上有個小視頻很火:一位女生模仿Siri得惟妙惟肖,被廣大網(wǎng)友評為是“Siri本Sir”。
這個視頻為什么火?有兩個格外重要的原因:第一,女生無論在聲線、語速、說話方式上都幾乎和Siri一模一樣;第二,Siri已經(jīng)成為了大眾生活中的一份子了,語音交互及相關(guān)應(yīng)用正在深入地滲透進(jìn)我們生活的方方面面。
據(jù)調(diào)查公司VoiceLabs去年發(fā)布的《2017年語音報告》顯示,僅2017年,語音產(chǎn)業(yè)結(jié)構(gòu)按照硬件產(chǎn)品、AI軟件、語音應(yīng)用Apps、生態(tài)系統(tǒng)服務(wù)相結(jié)合的架構(gòu),至少出臺了2450萬臺以語音為主要交互方式的智能硬件產(chǎn)品,市場總量達(dá)3300萬臺,市場規(guī)模超200億美元。足見智能語音交互市場的龐大。
而值得一提的是,即便是最早出來的Siri,也早已不是iPhone的專屬,而是被廣泛應(yīng)用于蘋果所有的智能終端硬件上。亞馬遜、谷歌、百度等科技巨頭也是如此,智能語音交互技術(shù)在車載、智能家居等場景中的應(yīng)用早已不是“新鮮事”了。
“其實,早在2012年的時候,我們就對智能手機(jī)做過一些探索。但當(dāng)時的智能手機(jī)應(yīng)用,APP應(yīng)用、集成和產(chǎn)品設(shè)計才是核心競爭力,其他技術(shù)只是輔助手段。”對此,俞凱解釋稱,“物聯(lián)網(wǎng)本身的爆發(fā)性是非常驚人的,因為物聯(lián)網(wǎng)終端硬件產(chǎn)品大多屏幕很小甚至沒有屏幕,相較于手機(jī),其對語音交互的需求更加緊迫。這也是思必馳決定在2014年果斷轉(zhuǎn)戰(zhàn)至智能硬件領(lǐng)域的主要原因。”
對于思必馳來說,其所專注的語音交互技術(shù),是具有核心創(chuàng)新競爭力的。在覆蓋度上,包括語音識別、語義理解、對話、決策等,思必馳已經(jīng)走到了全鏈路一體化階段,而不只是一個單純的模塊。“DUI”平臺的推出,更為思必馳加強(qiáng)了于眾開發(fā)者之間的聯(lián)系與合作。
除此之外,思必馳已有提供大規(guī)模、可定制服務(wù)的能力。“簡單來說,能夠做出一個好不是真的好,能做出十個不同的好才算是好。根據(jù)用戶的需求提供定制的個性化智能語音交互系統(tǒng),讓其不僅具有高通用識別和交互能力,還能在相關(guān)領(lǐng)域擁有個性化的知識積累和交互邏輯能力,這樣才能稱為全鏈路賦能。”
因為上述幾大原因,2014年決定轉(zhuǎn)型時,思必馳將重點落地場景放在了車載、家居等物聯(lián)網(wǎng)相關(guān)智能終端硬件領(lǐng)域中,這是極具前瞻性的。“平臺性的技術(shù)就應(yīng)該被更大的發(fā)揮出來,因為有了這些積累,所以到2017年我們在物聯(lián)網(wǎng)行業(yè)有了很大的發(fā)展。這是水到渠成的事情。”
據(jù)IDC對全球音箱出貨量的統(tǒng)計,2017年,應(yīng)用思必馳語音交互技術(shù)的智能音箱的總出貨量排名,已是全球第三。
思必馳的使命是“溝通萬物,打理萬事”
在當(dāng)前的AI行業(yè)中,有很多的細(xì)分領(lǐng)域,談及語音交互技術(shù)在AI行業(yè)整體發(fā)展中所扮演的角色時,俞凱給我們打了個比方:如果將現(xiàn)在的人工智能行業(yè)比喻成“電”,那么行業(yè)就由三部分組成,發(fā)電的、用電的、和輸電電網(wǎng)。
發(fā)電,如芯片、大數(shù)據(jù)等提供基礎(chǔ)智能服務(wù)的行業(yè),就是通過篩選、分析、處理信息,并通過這些信息提供智能服務(wù);
用電,如智能硬件中的機(jī)器人、智能醫(yī)療器械以及相關(guān)智能系統(tǒng)等;
輸電電網(wǎng),就是語音交互技術(shù),它會使得信息和人、信息和設(shè)備以更豐富的形式鏈接在一起,從而產(chǎn)生很多新的機(jī)會。而無論對于“發(fā)電”還是“用電”層面,這一交互媒介都已經(jīng)成為了AI最重要的入口之一。
由此來看,作為一家以擁有“媒介”核心技術(shù)的公司,思必馳所需要做的,就是通過語音這一媒介,去解決用戶“用電”中所有的問題,尤其在簡化“輸電”方式,提升“輸電”效率上。對此,俞凱強(qiáng)調(diào),“溝通萬物、打理萬事,就是我們當(dāng)前的使命。”
“為了更好的提供語音交互服務(wù),我們正在陸陸續(xù)續(xù)推出一些新的產(chǎn)品和相關(guān)技術(shù),后續(xù)也會有更多的驚喜,包括AI芯片。”
可以看到,在“端”上進(jìn)行布局已是大勢所趨。從語音交互的角度來說,用“溝通”連接萬物最主要的就是把物聯(lián)網(wǎng)上一些非標(biāo)準(zhǔn)的重要節(jié)點標(biāo)準(zhǔn)化,如各種規(guī)格性能的傳感器等。
而對于芯片的具體信息,俞凱表示現(xiàn)在還不方便透露過多。
關(guān)于大會的期待
很明顯的,對于思必馳來說,加強(qiáng)原始創(chuàng)新技術(shù)積累和打造有價值的實際應(yīng)用是其未來需要一直努力的方向。作為語音交互行業(yè)的佼佼者和此次“AIIA人工智能開發(fā)者大會”的演講嘉賓,俞凱期待能夠從開發(fā)者的角度看到一些新的想法和具有創(chuàng)新精神的應(yīng)用。
“開發(fā)者是人工智能產(chǎn)業(yè)發(fā)展的主力軍,我們期待與開發(fā)者緊密合作,用對話式人工智能溝通萬物打理萬事,一起讓智能的世界變得更美好。”
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
