避免淪為“人工智障”,機(jī)器人還需找對(duì)語音交互的“打開方式”

韓璐 8年前 (2017-09-21)

特定場景進(jìn)行特定培訓(xùn),這是打造更連貫、更自然的人機(jī)語音交互的一個(gè)解決途徑。

“iPhone的市場占有率是多少?”

—“目前80%。”

“那華為的呢?”

—“怎么都喜歡華為?”

以上是發(fā)生在鎂客君與某一語音交互機(jī)器人之間的對(duì)話。

避免淪為“人工智障”,機(jī)器人還需找對(duì)語音交互的“打開方式”

你來我往之間,那些令人“頭痛”的瞬間

在日常生活中,通過語音交互技術(shù),我們能夠與機(jī)器人進(jìn)行交流,或者是讓后者實(shí)時(shí)控制一些家居產(chǎn)品;在辦公時(shí)間,借助于語音交互技術(shù),我們也能夠直接口頭交代語音助理一些工作,從而提升工作效率……

可以說,隨著背后語音識(shí)別和自然語言處理技術(shù)的逐步提升,人們對(duì)于“語音交互”這一人機(jī)交互方式正在變得漸漸適應(yīng)。不過,在你來我往的語音對(duì)話之間,我們也不可避免的也遇到了一些有時(shí)令人“哭笑不得”的BUG。

2017國家服務(wù)機(jī)器人產(chǎn)業(yè)高峰論壇于近日落下帷幕,在圓桌環(huán)節(jié)的自由問答時(shí)間,有人提出一個(gè)問題,稱當(dāng)前的服務(wù)機(jī)器人在人機(jī)語音交互的過程中,常常會(huì)詞不達(dá)意,或者是出現(xiàn)上下文不連貫的問題,導(dǎo)致最終的用戶體驗(yàn)不佳。可以說,這是當(dāng)前人機(jī)交互上最“頭痛”的問題,也是導(dǎo)致人工智能被冠上“人工智障”稱號(hào)的根本原因。

避免淪為“人工智障”,機(jī)器人還需找對(duì)語音交互的“打開方式”

避免“人工智障”,我們目前需要將機(jī)器人關(guān)在“籠子”里

談及這種“人工智障”現(xiàn)象,其中主要涉及自然語言處理和深度神經(jīng)網(wǎng)絡(luò)的一個(gè)問題。

一般情況下,基于自然語言處理技術(shù),人工智能系統(tǒng)即能夠?qū)θ藗兊恼Z句進(jìn)行拆分和處理,從而做到“理解”這句話,繼而對(duì)用戶作出相應(yīng)的回應(yīng)。至于上下文連貫,這其中主要關(guān)乎深度神經(jīng)網(wǎng)絡(luò)的一個(gè)搭建,換一種說法,主要是“知識(shí)圖譜”在起作用。仍以本文最開始的對(duì)話為例:

“iPhone的市場占有率是多少?”

—“目前80%。”

“那華為的呢?”

—“目前是xx%。”

在深度神經(jīng)網(wǎng)絡(luò),或者是知識(shí)圖譜的協(xié)助下,當(dāng)我們提出第二個(gè)問題的時(shí)候,它會(huì)將華為與上一個(gè)問題的“市場占有率”進(jìn)行關(guān)聯(lián),從而做到對(duì)這一問題更為完整、精準(zhǔn)的理解。

事實(shí)上,為了達(dá)到更為完美、自然的人機(jī)交互體驗(yàn),難道人工智能企業(yè)就沒有搭建深度神經(jīng)網(wǎng)絡(luò)、構(gòu)造知識(shí)圖譜嗎?當(dāng)然不是,只不過在這基礎(chǔ)之上,依據(jù)當(dāng)前機(jī)器人的語音交互的整體情況,我們還需要附加一些場景條件。

這一塊問題的解決還是需要根據(jù)不同的場景來做不同的定制,畢竟這也不是說一個(gè)模型、一個(gè)算法就能解決好所有的問題。武漢泰迪智慧科技有限公司創(chuàng)始人兼董事長李成華表示。

總結(jié)一下也就是說,要想解決當(dāng)前這一上下文理解不連貫的問題,我們還需要依據(jù)特定的場景來對(duì)機(jī)器人進(jìn)行特定的數(shù)據(jù)訓(xùn)練,從而打造一個(gè)特定機(jī)器人。舉個(gè)例子,比如智能客服機(jī)器人,其所能提供服務(wù)的領(lǐng)域包括金融、教育、酒店等多個(gè)領(lǐng)域,每個(gè)領(lǐng)域都有著其所特有的問題或是對(duì)話場景,為了保證對(duì)話的連貫,我們就得利用這些特有數(shù)據(jù)進(jìn)行培訓(xùn),構(gòu)建一個(gè)面向垂直領(lǐng)域的知識(shí)圖譜,以避免問題交叉、邏輯混亂等情況的出現(xiàn)。

避免淪為“人工智障”,機(jī)器人還需找對(duì)語音交互的“打開方式”

面對(duì)無人駕駛的落地問題,我們都說低速行駛、封閉性場景是其當(dāng)前能夠快速實(shí)現(xiàn)落地的一個(gè)方向,簡單粗暴的說,也就是將無人駕駛汽車關(guān)在一個(gè)相對(duì)“封閉”的場景里。而與此類似,要想機(jī)器人在語音交互上表現(xiàn)的沒有那么“智障”,我們也需要將其關(guān)在一個(gè)限定的“籠子”里面來實(shí)施培訓(xùn),不同的是,無人駕駛汽車的“籠子”是在真實(shí)的物理世界,而機(jī)器人則是在一個(gè)虛擬層面。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到