語音識別:落地C端,光靠聯(lián)姻社交軟件還不夠
從理論上講,語音識別+社交軟件也許是一個“藍(lán)?!?,但是其中還有很大的提升空間。
縱觀人工智能所涵蓋的各種技術(shù),我們發(fā)現(xiàn)其中的語音識別與圖像識別最先實(shí)現(xiàn)了商業(yè)化。不過,照目前情況看來,不管是它們中的哪一個,C端市場似乎都是其商業(yè)化進(jìn)程中難以觸碰的一個點(diǎn)。
就在昨天,谷歌的社交軟件Allo被爆出將在本周上線。值得一提的是,區(qū)別于微信等社交軟件,Allo同時(shí)身兼著另外一個身份——語音助理。在這兩種屬性結(jié)合的背后,有人看到了語音識別技術(shù)在C端市場的希望。但是,這場“春天”真的是近在眼前嗎?
“語音識別+社交軟件”的新組合
以Allo為例,它所搭載的是谷歌最新開發(fā)的語音助理Google Assistant,其集合了谷歌目前為止最先進(jìn)的語音識別、自然語言理解等諸多核心技術(shù)。在今年的開發(fā)者大會上,谷歌發(fā)言人表示,Google Assistant已經(jīng)可以兼容第三方服務(wù),包括Ticketmaster、Spotify、Uber以及Whatsapp等等。這或許也就意味著,用戶可以在Allo上通過Google Assistant來享受這些服務(wù)。
至于Google Assistant在社交軟件上如何利用語音識別向人們提供服務(wù),依據(jù)Allo現(xiàn)有信息,我們可以簡單的做一個設(shè)想:A和B兩個人正在聊天,主題是小時(shí)候的夢想和興趣愛好,當(dāng)A稱自己在小學(xué)想學(xué)跳舞的時(shí)候,Google Assistant實(shí)時(shí)給出了一個小頁面,而上面都是一些附近舞蹈教學(xué)的信息。這個時(shí)候,A的OS估計(jì)是這樣的:呵呵~
當(dāng)然,除此之外,用戶也可以單獨(dú)與Google Assistant進(jìn)行對話,只要在文字的最后@一下語音助理,就可以直接跟它點(diǎn)對點(diǎn)的聊天了。
語音識別或?qū)⒋蜷_社交軟件新征程
出于聯(lián)絡(luò)情感、搭建工作關(guān)系等各種需要,人們每天都會用到社交軟件,甚至到了離不開的程度。而說到語音識別,卻很少在社交軟件上看到。不過Allo并不是第一個將社交軟件與語音識別技術(shù)相結(jié)合的產(chǎn)品,其實(shí)早在今年4月份,F(xiàn)acebook就宣布允許企業(yè)在Messenger平臺上搭建聊天機(jī)器人了。
在具體應(yīng)用上,F(xiàn)acebook的聊天機(jī)器人可以幫助用戶訂花、預(yù)定外賣、獲得銀行賬戶通知提醒等。但是,在實(shí)際體驗(yàn)中,它仍有著不可忽視的缺陷:比如問它能否發(fā)一些科技新聞,它卻發(fā)送了一則關(guān)于澳洲樹袋熊的新聞,由此就體現(xiàn)出了其語音識別等方面的技術(shù)缺陷。
另外,當(dāng)前的社交軟件正在一步步的向多功能化發(fā)展,比如說購票、支付、充值等等。在這樣一個社交軟件被大量第三方服務(wù)充斥的時(shí)代,語音識別似乎可以成為社交軟件的一個制勝點(diǎn)。一旦搭載了語音識別技術(shù),當(dāng)用戶購買電影票的時(shí)候,只需語音下達(dá)命令,語音助理就可以提出建議并完成下單,這一過程較之傳統(tǒng)的購票流程將大大縮減時(shí)間。
以此來看,語音識別在社交軟件領(lǐng)域也是可以打下一片天的。但是,要想真正實(shí)現(xiàn)落地,鑒于以下幾點(diǎn)原因,卻還需等待一段時(shí)間。
語音識別“落地”C端的關(guān)鍵所在
當(dāng)前,語音識別在社交軟件中的主要表現(xiàn)是將語音轉(zhuǎn)換成文字,但這只是冰山一角。而事實(shí)上,要想在社交軟件實(shí)現(xiàn)真正落地,語音識別還得等待三個因素的成熟:
首先就是技術(shù)的成熟。關(guān)于技術(shù)層面,說再多都是老生常談。其實(shí),單從表面的語音識別來看,這個技術(shù)已經(jīng)相當(dāng)成熟了。此前,鎂客君曾對Siri、科大訊飛、思必馳、度秘等軟件進(jìn)行過測試,結(jié)果顯示,哪怕有噪音干擾,科大訊飛等產(chǎn)品的語音識別能力也是相當(dāng)強(qiáng)悍的。
然而,要想落地,其關(guān)鍵還是語音識別背后更深層次的自然語言理解。只有在理解的基礎(chǔ)上,語音助理等語音識別衍生品才能真正懂得用戶的需求,從而進(jìn)一步的優(yōu)化服務(wù),而不是出現(xiàn)Facebook聊天機(jī)器人的那種低級錯誤。
其次是社交軟件第三方服務(wù)的成熟。以微信作比,目前的微信的第三方服務(wù)商包括藝龍、滴滴、微票兒、同程、大眾點(diǎn)評等,雖然這些服務(wù)包括了生活的方方面面,但使用的人還是少之又少,就像鎂客君從來都是直接去第三方服務(wù)的APP尋找服務(wù)。
從另一個方面來看,這種情況也指出微信在第三方服務(wù)還有很大的成長空間。作為當(dāng)前市場份額最大的社交軟件,如果微信能夠?qū)⒌谌椒?wù)發(fā)展成熟,一旦啟用語音助理,那將是一個質(zhì)的飛躍。這時(shí)候,不僅微信能夠再次鞏固自己的地位,對于第三方服務(wù)提供商以及語音識別公司,也將是一個利好機(jī)會。
最后則是與用戶習(xí)慣契合度的成熟。這方面,Allo的語音助理就是一個很典型的反面教程。哪怕服務(wù)再智能,也沒有人會喜歡自己與朋友聊天聊得正歡時(shí),一個頁面突然出現(xiàn)并打亂原有的節(jié)奏和氛圍。
另外,人們對于服務(wù)追求的是一種“極致”。將這種要求放到社交軟件的語音助手上,就意味著操作的簡便。譬如將聊天與服務(wù)放置于同一頁面,而且語音助理隨叫隨到,也不會干擾聊天過程,這就是一種語音服務(wù)的“極致”,也是語音識別在社交軟件上落地的先決條件。
如果想要實(shí)現(xiàn)落地,“用戶習(xí)慣”將是一個很關(guān)鍵的因素,因?yàn)檫@會直接影響到產(chǎn)品的體驗(yàn)效果。一個產(chǎn)品,只有用戶體驗(yàn)到位,才能讓其買單,進(jìn)而站穩(wěn)腳跟。
結(jié)語
從理論上講,語音識別與社交軟件的結(jié)合所帶來的不僅是社交軟件的顛覆,更是語音識別廠商的希望之所在。
不過,如果將其拿到現(xiàn)實(shí)中,盈利就是一個必須要考慮到的因素。畢竟在B端市場,廠商可以通過授權(quán)以獲取收益,但是在C端市場,這還是一個未能解決的問題。因此,鑒于以上多種因素,所謂語音識別在C端市場的“春天”,應(yīng)該還遠(yuǎn)未到來。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
