為了理解自然語言,聊天機(jī)器人還要走很多“歪路”
為理解自然語言,唯有慢慢的填坑。
上周,以先進(jìn)的機(jī)器學(xué)習(xí)和自然語言處理技術(shù)見長的聊天機(jī)器人初創(chuàng)公司Talla推出了一款HR機(jī)器人。而就在近日,其首席執(zhí)行官ROB MAY在某科技網(wǎng)站撰文,指出了一些聊天機(jī)器人在自然語言處理上面臨的問題,并表示,雖然自然語言處理技術(shù)能夠改善用戶體驗,但依舊面臨著各種技術(shù)挑戰(zhàn)。
以下是正文:
目前諸如Slack以及HipChat等聊天機(jī)器人的應(yīng)用逐步增多,企業(yè)都在使用聊天機(jī)器人發(fā)揮更多功能。不少應(yīng)用程序開發(fā)商都在試圖搶占這個新的風(fēng)口,特別是不斷加強(qiáng)對自然語言處理技術(shù)的研究,從而寄希望于通過該技術(shù)提升用戶體驗。
對于自然語言處理技術(shù),我們已經(jīng)投入很多精力來改進(jìn)、來提升相關(guān)的用戶體驗。自然語言處理技術(shù)是一個新興的研究領(lǐng)域,盡管我們擁有一個強(qiáng)大的數(shù)據(jù)科學(xué)研究團(tuán)隊,但對于該技術(shù)的研發(fā)還處于初始階段。目前來看,自然語言處理技術(shù)依舊不夠成熟,也不夠完善,相關(guān)的工程實例根本談不上良好的用戶體驗。
不久前,我們推出了具備自然語言處理功能的聊天機(jī)器人Task Assistant,超過700家公司使用了該產(chǎn)品,產(chǎn)生了不少相關(guān)教訓(xùn):
1、人類語言極為不同
即便是關(guān)于簡單任務(wù),人類與聊天機(jī)器人之間的交互也各有不同。在用戶語言中,充斥著各式各樣的夸張、隱喻、文字拼寫錯誤以及俚語,這些語言組織方式的存在使得聊天機(jī)器人需要大量的訓(xùn)練。
Facebook語言技術(shù)開發(fā)團(tuán)隊工程總監(jiān)艾倫·帕克(Alan Packer)曾就如何構(gòu)建機(jī)器翻譯技術(shù)進(jìn)行過深入探討。雖然工作語言并不像用戶的日常用語一樣多樣化,我們可以通過所提供聊天機(jī)器人的類型對不同工作進(jìn)行區(qū)分,從而對機(jī)器所能理解的語言加以限制。雖然自然語言處理技術(shù)仍非易事,但是通過針對不同工作用戶進(jìn)行相應(yīng)調(diào)整,能夠有效減少機(jī)器理解歧義引發(fā)的相關(guān)問題。
2、聊天機(jī)器人不能將所有不理解轉(zhuǎn)嫁給背后的人類客服
很多聊天機(jī)器人的背后都有人類干預(yù),當(dāng)機(jī)器無法理解用戶語言時,它們將相關(guān)問題轉(zhuǎn)給人類處理。這種處理問題的想法是通過這種方式訓(xùn)練聊天機(jī)器人,直至其存儲了足夠多的數(shù)據(jù)以應(yīng)對各種問題。但當(dāng)用戶期望獲得更好的用戶體驗,并期望機(jī)器能夠完全理解其意思時,這并不是一個可持續(xù)性的解決方法。因為當(dāng)用戶提出一個獨(dú)一無二的問題時,機(jī)器無法進(jìn)行擴(kuò)展。據(jù)統(tǒng)計,目前15%的谷歌搜索都是獨(dú)一無二的,這意味著每天都有上億次的獨(dú)特查詢。對于聊天機(jī)器人來說,要回答所有的人類問題時相當(dāng)困難的,因此單單依靠背后的人類客服并不是長久之計。
第一點(diǎn)已經(jīng)不用多說了,畢竟在這一點(diǎn)上,多數(shù)人都已有了自己的認(rèn)識,而關(guān)鍵的第二點(diǎn)卻一針見血的說出了當(dāng)前的一個盲點(diǎn)所在。的確,按照當(dāng)前的方法,聊天機(jī)器人也只是一個會模仿的提線木偶而已,并不能真正的理解自然語言,而這樣就代表著一切努力終將是白費(fèi)力氣。
不過,在當(dāng)前針對自然理解語言面臨的問題上,ROB還能夠提出這與眾不同的一點(diǎn),如此新穎奇特,也難怪他的公司在機(jī)器學(xué)習(xí)與自然語言處理上能達(dá)到如此成就。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
