號(hào)稱(chēng)能夠理解自然語(yǔ)言的聊天機(jī)器人,在圖靈測(cè)試下被分分鐘打臉

韓璐 9年前 (2016-07-20)

都說(shuō)聊天機(jī)器人已經(jīng)能夠與人正常交流了,可事實(shí)真是如此嗎?

近日,針對(duì)聊天機(jī)器人“自然語(yǔ)言理解”的“威諾格拉德模式挑戰(zhàn)賽”(Winograd Schema Challenge)落下帷幕。而在結(jié)果展示中,聊天機(jī)器人們的表現(xiàn)顯得不盡如人意,令人唏噓!

號(hào)稱(chēng)能夠理解自然語(yǔ)言的聊天機(jī)器人,在圖靈測(cè)試下被分分鐘打臉

一次人工智能熱,各巨頭紛紛“入水”

事實(shí)上,“聊天機(jī)器人”這個(gè)概念從上個(gè)世紀(jì)八十年代就出現(xiàn)了,而世界上第一個(gè)聊天機(jī)器人“阿爾貝特”也誕生于那個(gè)時(shí)代,但相較于現(xiàn)在的聊天機(jī)器人而言,那時(shí)的機(jī)器人還不能歸屬于“智能”一列。

自AlphaGo引領(lǐng)“人工智能”熱潮后,人們對(duì)聊天機(jī)器人的深度挖掘與探索也由此展開(kāi),其中當(dāng)屬佼佼者的主要是谷歌、Facebook、微軟、蘋(píng)果、亞馬遜等企業(yè)巨頭。

現(xiàn)在,iOS用戶(hù)在無(wú)聊的時(shí)候,可以隨時(shí)掏出iPhone手機(jī),然后對(duì)Siri進(jìn)行各種調(diào)戲;而安卓用戶(hù)也可以在多個(gè)谷歌應(yīng)用內(nèi)呼喚谷歌助手;打開(kāi)Windows,就會(huì)有Cortana(小娜)為你提供各項(xiàng)服務(wù);Facebook也為自家產(chǎn)品配備了聊天機(jī)器人,更是推出了針對(duì)商家的聊天機(jī)器人Slackbot;此外,人們懶癌發(fā)病的時(shí)候,只要對(duì)著亞馬遜Echo喊話(huà)就可以控制家電。對(duì)于現(xiàn)下這種局面,只能說(shuō)聊天機(jī)器人真可謂無(wú)所不在。

號(hào)稱(chēng)能夠理解自然語(yǔ)言的聊天機(jī)器人,在圖靈測(cè)試下被分分鐘打臉

一場(chǎng)挑戰(zhàn)賽,打破聊天機(jī)器人泡沫

當(dāng)前,不管是國(guó)外還是國(guó)內(nèi),越來(lái)越多的聊天機(jī)器人被相繼推向市場(chǎng),伴隨著在圖像和語(yǔ)言識(shí)別領(lǐng)域取得的巨大進(jìn)展,人們很容易產(chǎn)生機(jī)器在理解語(yǔ)言方面已經(jīng)十分厲害的錯(cuò)覺(jué)。然而現(xiàn)實(shí)給了人們重重一擊。

近日,一場(chǎng)名為“威諾格拉德模式挑戰(zhàn)賽”(Winograd Schema Challenge)的競(jìng)賽落下帷幕。這場(chǎng)競(jìng)賽是圖靈測(cè)試的變種,要求人工智能回答關(guān)于語(yǔ)句理解的一些常識(shí)性問(wèn)題,由加拿大多倫多大學(xué)的計(jì)算機(jī)科學(xué)家赫克托·萊維斯克(Hector Levesque)發(fā)起。

以問(wèn)題“市議員們拒絕示威者的游行許可,因?yàn)樗麄兒ε卤┝?rdquo;為例,按照威諾格拉德模式挑戰(zhàn)賽的風(fēng)格,該問(wèn)題包含了幾個(gè)重要的部分:

首先,具有同類(lèi)語(yǔ)義的兩個(gè)名詞(本題里指的是:市議員們和示威者 )

第二,有一個(gè)指代以上兩個(gè)名詞的模糊代詞(本題里指的是:他們)

第三,有一個(gè)特別的單詞,當(dāng)這個(gè)單詞被換成另外一個(gè)單詞時(shí),那么模糊代詞的意義就會(huì)改變(本題里,如果把“害怕”換成“主張”,那么句子里的“他們”的意思就會(huì)發(fā)生改變)

基于此,計(jì)算機(jī)需要回答的問(wèn)題就是:這個(gè)具有模糊含義的代詞指的是什么,并給出兩個(gè)選項(xiàng)讓計(jì)算機(jī)選擇。

根據(jù)研究,在人類(lèi)胡亂選擇的情況下,該問(wèn)題答對(duì)的概率是45%,而這次競(jìng)賽的結(jié)果顯示,人工智能最好的結(jié)果也只是48%,那高出來(lái)的3個(gè)百分點(diǎn)完全可以忽略不計(jì)了,最為值得思考的是,這個(gè)成績(jī)的擁有者還使用了最前沿的機(jī)器學(xué)習(xí)方法,如果這個(gè)成績(jī)真的代表了當(dāng)前聊天機(jī)器人的水平,那離理想中的“聊天機(jī)器人”還遠(yuǎn)著呢!

號(hào)稱(chēng)能夠理解自然語(yǔ)言的聊天機(jī)器人,在圖靈測(cè)試下被分分鐘打臉

面對(duì)現(xiàn)狀,探索聊天機(jī)器人未來(lái)趨勢(shì)

有心人會(huì)發(fā)現(xiàn),在上述比賽中,谷歌、Facebook等巨頭并沒(méi)有加入,雖然他們正在將注意力轉(zhuǎn)向自然語(yǔ)言理解,并多次暗示已取得了非常大的進(jìn)展,但有個(gè)事實(shí)不得不提,此前在Facebook聊天機(jī)器人的用戶(hù)體驗(yàn)上,有用戶(hù)問(wèn)它是否能夠推送科技新聞,而其反饋的卻是一則澳洲樹(shù)袋熊的新聞,這兩者完全相差了十萬(wàn)八千里。因而,在自然語(yǔ)言理解上,科技巨頭也有很長(zhǎng)的一段路要走。

不管是競(jìng)賽結(jié)果,還是用戶(hù)體驗(yàn),目前聊天機(jī)器人的水平還不能完全達(dá)標(biāo),而對(duì)于未來(lái)的發(fā)展趨勢(shì),它們還需要解決幾個(gè)問(wèn)題:

首先是對(duì)自然語(yǔ)言的理解。既然是聊天機(jī)器人,就得會(huì)“聊天”,而聊天這一技術(shù)活兒的基礎(chǔ)就是對(duì)語(yǔ)言和句子的理解。這是當(dāng)前最需要解決的問(wèn)題,也是最難解決的問(wèn)題,畢竟手動(dòng)編碼輸入這些知識(shí)需要花費(fèi)的時(shí)間不可想象,而且用數(shù)據(jù)統(tǒng)計(jì)的方法來(lái)學(xué)習(xí)真實(shí)世界的知識(shí)對(duì)于計(jì)算機(jī)來(lái)說(shuō)也十分困難,但為了打造出一個(gè)真正意義上的“聊天機(jī)器人”,這個(gè)問(wèn)題將是接下來(lái)研究員們所關(guān)注的重點(diǎn)。

其次是對(duì)語(yǔ)言的記憶。在一段自然談話(huà)中,人們常常以一個(gè)字或幾個(gè)字來(lái)指稱(chēng)此前所說(shuō)的一件事,從而就會(huì)出現(xiàn)模糊指代。這種時(shí)候,聊天機(jī)器人就必須能夠清楚理解這個(gè)詞的指代對(duì)象,這就需要它們通過(guò)深度學(xué)習(xí),從而按照語(yǔ)義的邏輯關(guān)系正確帶入指代對(duì)象,畢竟沒(méi)有人希望自己在交流的時(shí)候還需要將每件事重復(fù)解釋十幾遍的。

最后是聊天機(jī)器人的語(yǔ)音識(shí)別技術(shù)。的確,如今機(jī)器人的識(shí)別技術(shù)已經(jīng)很先進(jìn)了,譬如聊天機(jī)器人小娜就已經(jīng)學(xué)會(huì)了30多種語(yǔ)言。但在這里,有個(gè)細(xì)節(jié)需要我們注意一下,那就是口音的問(wèn)題,比如一個(gè)泰國(guó)人通過(guò)說(shuō)英語(yǔ)與小娜進(jìn)行交流(小娜還不會(huì)泰語(yǔ)),在嚴(yán)重的口音干擾下,聊天機(jī)器人真的能夠聽(tīng)得懂用戶(hù)在說(shuō)什么嗎?

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到