自然語(yǔ)言理解勢(shì)頭正強(qiáng)勁,可總還是缺點(diǎn)啥
機(jī)器人:對(duì)不起,我不知道您在說(shuō)什么。
用戶:Siri,幫我叫救護(hù)車。
Siri:好的,從現(xiàn)在開始我會(huì)叫你“救護(hù)車”。
根據(jù)人們的設(shè)想,我們只要說(shuō)一句話,人工智能機(jī)器人就應(yīng)該可以準(zhǔn)確、完美的完成我們下達(dá)的指令。但事實(shí)總是差強(qiáng)人意,面對(duì)人類語(yǔ)言的復(fù)雜性,人工智能的“自然語(yǔ)言理解”還有很長(zhǎng)的一段路要走。
“自然語(yǔ)言理解”的勢(shì)頭正強(qiáng)
在人類的生活中,“語(yǔ)言”是一個(gè)必備硬件,而在智能時(shí)代,“語(yǔ)言”也有著等同的重量。
哪些人在攻克“自然語(yǔ)言理解”?
蘋果收購(gòu)Siri、Novauris等,組建基于神經(jīng)網(wǎng)絡(luò)算法的語(yǔ)音識(shí)別團(tuán)隊(duì),打造聊天機(jī)器人Siri等產(chǎn)品;
Google收購(gòu)多項(xiàng)語(yǔ)音識(shí)別技術(shù)專利、SayNow 、Phonetic Arts等,推出智能家居Google Home,以及云自然語(yǔ)言API,近期宣布將打造聊天機(jī)器人Daniell;
Facebook收購(gòu)Wit.ai和Mobile Technologies等,以提高自身整體對(duì)自然語(yǔ)言的理解能力,推出聊天機(jī)器人Facebook Messenger;
Amazon收購(gòu)語(yǔ)音識(shí)別技術(shù)Yap、Evi、Ivona等,打造聊天機(jī)器人Alexa以及智能家居產(chǎn)品Echo;
英特爾收購(gòu)語(yǔ)音識(shí)別技術(shù)公司Indisys,于近期推出IFTTT式自然語(yǔ)言處理Web應(yīng)用程序;
IBM將自然語(yǔ)言理解運(yùn)用于超級(jí)計(jì)算機(jī)Watson,并在實(shí)際中解決了多個(gè)領(lǐng)域的眾多疑難雜問(wèn);
加拿大人工智能初創(chuàng)公司Maluuba,推出一款基于自然語(yǔ)言理解的機(jī)器學(xué)習(xí)系統(tǒng)。
并不只是國(guó)外的科技公司,國(guó)內(nèi)也有那么幾家公司在專注于自然語(yǔ)言理解。比如:立志做客服界微軟小冰的客服公司智齒科技,其人工智能客服為樂(lè)視節(jié)省了60%以上的客服成本,可以回答98%的問(wèn)題。
在這些公司中,做的最為出色地應(yīng)該是加拿大人工智能初創(chuàng)公司Maluuba,他們的機(jī)器學(xué)習(xí)系統(tǒng)EpiReader可以閱讀文章,其中就有近期大熱的《權(quán)力的游戲》,而在之后的提問(wèn)中,EpiReader也正確的回答了測(cè)試人員的問(wèn)題。
此外,據(jù)介紹,EpiReader使用了2層神經(jīng)網(wǎng)絡(luò),類似于人類大腦神經(jīng)元。第一層神經(jīng)網(wǎng)絡(luò)能讓系統(tǒng)基于對(duì)于段落的理解挑選可能存在的答案,第二層神經(jīng)網(wǎng)絡(luò)用來(lái)評(píng)估第一層給出的答案,并最終給出一個(gè)正確的回答,在這場(chǎng)測(cè)試中,EpiReader分別得到了74%和67.4%的準(zhǔn)確率,按照國(guó)內(nèi)有關(guān)專家的說(shuō)法,這成績(jī)超越了谷歌的DeepMind,F(xiàn)acebook 和IBM沃森在今年3月份公布的結(jié)果。
哪些領(lǐng)域用到“自然語(yǔ)言理解”?
首先就是最近大熱的聊天機(jī)器人。比如蘋果的Siri,至今為止,Siri已經(jīng)不知道被多少人調(diào)戲過(guò)了,話就不多說(shuō)了,直接上圖,你就能看到作為一個(gè)聊天機(jī)器人,Siri到底有多傲嬌。
其次就是語(yǔ)音識(shí)別。作為一項(xiàng)人工智能,語(yǔ)音識(shí)別也有著自己的市場(chǎng)。但是說(shuō)到語(yǔ)音識(shí)別的原理,其在依靠著自然語(yǔ)言理解的龐大數(shù)據(jù)庫(kù)之上,才能正確理解人們所說(shuō)的話,并給出正確的回應(yīng)。
最后就是云服務(wù)。眾所周知,云服務(wù)對(duì)于先進(jìn)的各家企業(yè)來(lái)說(shuō),都是一個(gè)很好的資源,他們可以在上面對(duì)自家的數(shù)據(jù)、產(chǎn)品進(jìn)行分析、測(cè)試。在其中,功能最齊全的應(yīng)該是谷歌的云服務(wù),其中就有自然語(yǔ)言API,擁有情感分析、實(shí)體識(shí)別以及語(yǔ)義分析三大功能,可以幫助人工智能研究團(tuán)隊(duì)完善自己的產(chǎn)品。
“自然語(yǔ)言理解”還欠缺點(diǎn)啥?
在目前來(lái)說(shuō),Maluuba的機(jī)器學(xué)習(xí)系統(tǒng)EpiReader應(yīng)該可以說(shuō)是至今性能最好的了,但這真的就夠了嗎?是不是還缺了那么一點(diǎn)?
自然語(yǔ)言的理解還有待繼續(xù)加強(qiáng)。的確,在填空測(cè)試中,EpiReader的成績(jī)完全壓了Google等公司一頭,也能夠在讀書之后正確回答問(wèn)題,但要知道,小說(shuō)的語(yǔ)言一般都是“官方語(yǔ)言”,并且邏輯性也相對(duì)較強(qiáng)的,而使用英語(yǔ)的人也多有著自己的“方言”用語(yǔ),要想讓人工智能更好地理解自然語(yǔ)言,它還需要一本“方言詞典”。
此外,口頭表達(dá)給自然語(yǔ)言理解增加了一個(gè)難度。在交流上,人們更傾向于口頭表達(dá),并且擁有自己的說(shuō)話方式、習(xí)慣,而且也不會(huì)如文字表達(dá)那樣更具有邏輯,這就要求自然語(yǔ)言理解能夠準(zhǔn)確識(shí)別出話語(yǔ)中的重點(diǎn)部分,千萬(wàn)不能出現(xiàn)Facebook聊天機(jī)器人那樣的錯(cuò)誤,在用戶提出看科技新聞的要求時(shí),反饋卻是一條澳洲樹袋熊的新聞,要是人與機(jī)器人面對(duì)面的話,這場(chǎng)面實(shí)在太尷尬!
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
