追一科技劉云峰:今年是NLP技術(shù)大年,要做全棧的AI公司

巫盼 6年前 (2019-10-17)

NLP之外,追一科技也在擴(kuò)大語(yǔ)音和視覺團(tuán)隊(duì),構(gòu)建語(yǔ)義、語(yǔ)音、多模態(tài)等AI技術(shù)的閉環(huán)。

“我上個(gè)月在南京的差旅住宿,花了多少錢?”

“我上周五通過信用卡消費(fèi)了多少錢?”

……

上述問題,聊天機(jī)器人可以立刻給你答案。

讓機(jī)器讀懂我們的的語(yǔ)言,并且輸出我們能明白的回答,這個(gè)過程就需要自然語(yǔ)言處理(NLP)技術(shù)的支持。換句話說,NLP充當(dāng)了機(jī)器和人類之間的翻譯工作,它在諸多AI應(yīng)用中發(fā)揮著關(guān)鍵作用。

與熱門的計(jì)算機(jī)視覺、語(yǔ)音識(shí)別等技術(shù)相比較,研究NLP的創(chuàng)業(yè)公司相對(duì)少很多,追一科技便是國(guó)內(nèi)首批從事NLP技術(shù)和深度學(xué)習(xí)的企業(yè)智能服務(wù)AI公司,李開復(fù)曾公開表示,“追一科技是國(guó)內(nèi)乃至全球最好NLP公司之一。”

就在最近,由追一科技主辦的首屆中文NL2SQL挑戰(zhàn)賽在南京落幕,從全球1457支隊(duì)伍中脫穎而出的五支隊(duì)伍角逐最后的冠軍,在此期間,鎂客網(wǎng)采訪了追一科技的聯(lián)合創(chuàng)始人兼CTO劉云峰,探討了當(dāng)前NLP技術(shù)的發(fā)展和應(yīng)用落地情況,以及追一科技在NLP技術(shù)浪潮中扮演的角色。

追一科技劉云峰:今年是NLP技術(shù)大年,要做全棧的AI公司

圖 | 追一科技聯(lián)合創(chuàng)始人兼CTO劉云峰

NLP是AI的關(guān)鍵一環(huán),追一已經(jīng)做到技術(shù)落地

通常情況下,我們會(huì)把AI分為“感知”和“認(rèn)知”兩個(gè)部分。其中,計(jì)算機(jī)視覺和語(yǔ)音識(shí)別屬于感知部分,而自然語(yǔ)言處理(NLP)則是認(rèn)知部分的重要內(nèi)容。從這個(gè)層面去解讀,NLP的研究難度比計(jì)算機(jī)視覺乃至語(yǔ)音技術(shù)都要更上一層樓。

但NLP的發(fā)展歷程比計(jì)算機(jī)視覺乃至語(yǔ)音理解都要早,早在上世紀(jì)50年代,電子計(jì)算機(jī)的出現(xiàn),就帶來了許多自然語(yǔ)言處理的任務(wù)需求,其中最典型的就是機(jī)器翻譯。而我們最為熟悉的NLP應(yīng)用則是網(wǎng)頁(yè)搜索,從海量的文本中進(jìn)行自然語(yǔ)言的信息檢索和抽取。

伴隨著大數(shù)據(jù)、深度學(xué)習(xí)技術(shù)的應(yīng)用,NLP也進(jìn)入了一個(gè)新的階段,用劉云峰的話來說,“以前我們只需要機(jī)器理解人的語(yǔ)言,但現(xiàn)在的自然語(yǔ)言理解,是希望機(jī)器像人一樣具備一定的常識(shí)和思維推理能力,這已經(jīng)比以前期望值高很多。”

相應(yīng)的,圍繞NLP的創(chuàng)業(yè),技術(shù)門檻自然很高,這也恰恰是追一科技的一大優(yōu)勢(shì)。

追一科技的主要?jiǎng)?chuàng)始團(tuán)隊(duì)中有三人來自騰訊,創(chuàng)始人兼CEO吳悅是原騰訊TEG事業(yè)群搜索部門負(fù)責(zé)人,主持構(gòu)建了騰訊分布式文件系統(tǒng)、大數(shù)據(jù)集群、大網(wǎng)頁(yè)搜索引擎推薦引擎等重要項(xiàng)目;CTO劉云峰在騰訊從事搜索技術(shù)、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)方向的研究長(zhǎng)達(dá)十年,在NLP領(lǐng)域有著豐富的技術(shù)和實(shí)戰(zhàn)經(jīng)驗(yàn)。

成立之初,追一科技從智能客服切入,舉個(gè)例子,通過追一科技的AI技術(shù)解決方案,可以直接和客服機(jī)器人進(jìn)行“正常語(yǔ)言”的交流對(duì)話,比如詢問賬單情況、幫忙訂張票、查找附近最近好吃的餐廳等等。

經(jīng)過三年的發(fā)展,他們已經(jīng)構(gòu)建了智能語(yǔ)義和算法平臺(tái)等AI技術(shù)棧,打造了以知識(shí)為驅(qū)動(dòng)的數(shù)字員工產(chǎn)品族,包括智能客服、數(shù)字催收、數(shù)據(jù)質(zhì)檢、上崗培訓(xùn)、用戶畫像、反洗錢分析、警情分析等。

追一科技劉云峰:今年是NLP技術(shù)大年,要做全棧的AI公司

目前,追一科技的智能服務(wù)解決方案,從客服機(jī)器人到人機(jī)協(xié)同等,也已經(jīng)在招商銀行信用卡、中國(guó)移動(dòng)、萬(wàn)達(dá)、攜程等企業(yè)中應(yīng)用落地。

發(fā)起NL2SQL挑戰(zhàn)賽,今年會(huì)是NLP技術(shù)大年

在和企業(yè)客戶打交道過程中,追一科技發(fā)現(xiàn)很多企業(yè)客戶的知識(shí)和數(shù)據(jù)都是以數(shù)據(jù)庫(kù)的形式存儲(chǔ),問題隨之而來,能不能基于數(shù)據(jù)庫(kù)去解決一些交互的問題,NL2SQL(自然語(yǔ)言轉(zhuǎn)結(jié)構(gòu)化查詢語(yǔ)句)就是答案。

NL2SQL是NLP的一個(gè)研究方向,可以將人類的自然語(yǔ)言自動(dòng)轉(zhuǎn)化為相應(yīng)的SQL語(yǔ)句,進(jìn)而與數(shù)據(jù)庫(kù)直接交互、并返回交互的結(jié)果。比如我們問:大眾10萬(wàn)到20萬(wàn)之間的車型有幾種?NL2SQL可以讓機(jī)器理解這樣的自然語(yǔ)言,并從表格中檢索出答案。

當(dāng)前,研究NL2SQL的企業(yè)非常少,劉云峰表示在年初NL2SQL挑戰(zhàn)賽之前,國(guó)內(nèi)除了微軟,就是追一科技在做。

所以,為了打開這個(gè)新興垂直技術(shù)的天花板,他們發(fā)起了此次NL2SQL挑戰(zhàn)賽。比賽同期追一科技還發(fā)布了業(yè)內(nèi)首個(gè)大規(guī)模的中文數(shù)據(jù)集,包括4870張表格數(shù)據(jù)、近50000條標(biāo)注數(shù)據(jù)以及相應(yīng)的SQL語(yǔ)句。

追一科技劉云峰:今年是NLP技術(shù)大年,要做全棧的AI公司

圖 | 首屆中文NL2SQL挑戰(zhàn)賽決賽現(xiàn)場(chǎng)

從比賽初期的60%準(zhǔn)確率,到復(fù)賽結(jié)束時(shí)最高92%的準(zhǔn)確率,劉云峰也非常意外,“這個(gè)結(jié)果比同類數(shù)據(jù)難度更低的WikiSQL成績(jī)還要好,說明我們?cè)诨A(chǔ)技術(shù)的研發(fā)方面,已經(jīng)追上甚至超過了國(guó)外同行的技術(shù)水平。”

不過他也表示,雖然此次發(fā)布的數(shù)據(jù)集已經(jīng)覆蓋了10多個(gè)行業(yè),也具備了一定的泛化能力,但技術(shù)真正落地還有很多工程化的工作,比如行業(yè)是否有這樣的數(shù)據(jù)積累,數(shù)據(jù)表格的復(fù)雜度以及文本的歧義等等,都需要針對(duì)垂直行業(yè)做進(jìn)一步的調(diào)優(yōu)。

談及舉辦這次比賽的初衷,劉云峰表示,“從AI的發(fā)展規(guī)律來看,一個(gè)技術(shù)如果有專門的技術(shù)挑戰(zhàn)賽,會(huì)加速的產(chǎn)業(yè)化落地,比如視覺領(lǐng)域的ImageNet,這些公開測(cè)試集或者挑戰(zhàn)賽出現(xiàn)的時(shí)間點(diǎn),恰好都是這個(gè)技術(shù)從論文走上產(chǎn)業(yè)化的臨界點(diǎn)。”

劉云峰也強(qiáng)調(diào),從技術(shù)成熟度來看,業(yè)內(nèi)已經(jīng)解決了很多NLP的基礎(chǔ)問題,今年會(huì)是NLP的大年,但是落地到場(chǎng)景上會(huì)有一、兩年的延后。“之后NLP會(huì)進(jìn)入到技術(shù)成熟階段的爆發(fā)期,能夠解決一些更為復(fù)雜的任務(wù)。”

NLP之外,做全棧的AI公司

“交互”是追一科技產(chǎn)品的核心方向,除了早期的文本、語(yǔ)音交互,采訪中劉云峰透露,追一科技正在做“多模態(tài)交互的數(shù)字人產(chǎn)品”,這是一個(gè)區(qū)別于虛擬主播等朗讀型機(jī)器人的交互型產(chǎn)品,囊括了語(yǔ)音技術(shù)、自然語(yǔ)言處理、視覺三大領(lǐng)域的技術(shù),并且擁有自我進(jìn)化的能力,能夠?qū)?shù)據(jù)知識(shí)歸類分析總結(jié),自我學(xué)習(xí)。

追一科技劉云峰:今年是NLP技術(shù)大年,要做全棧的AI公司

“這個(gè)虛擬形象的表情、肢體動(dòng)作會(huì)和說話內(nèi)容相匹配,可以做到實(shí)時(shí)的對(duì)話交互。”

劉云峰認(rèn)為,未來頭部的AI公司一定是全棧的AI公司。也就是說,每一個(gè)AI公司既要有自己最核心、最拿手的方向,對(duì)其他技術(shù)也需要了若指掌。

所以,NLP之外,追一科技也在擴(kuò)大語(yǔ)音和視覺團(tuán)隊(duì),構(gòu)建語(yǔ)義、語(yǔ)音、多模態(tài)等AI技術(shù)的閉環(huán)。

目前他們已經(jīng)做到語(yǔ)音技術(shù)的閉環(huán),而且相較于通用的語(yǔ)音識(shí)別,追一科技更關(guān)注語(yǔ)音交互領(lǐng)域的歧義問題,提高上下文場(chǎng)景里的語(yǔ)音識(shí)別準(zhǔn)確率。視覺方面,追一科技也更加關(guān)注交互所需要的視覺理解,比如用戶的手勢(shì)識(shí)別指令。

上文所提到的“數(shù)字人”產(chǎn)品就是追一科技在語(yǔ)音、視覺、NLP三大技術(shù)上的“集大成者”。

最后,談及NLP的大規(guī)模商業(yè)化問題,劉云峰認(rèn)為要解決共同化和平臺(tái)化的問題,企業(yè)服務(wù)的特點(diǎn)是定制化需求多,所以要做到“配置即定制”,將產(chǎn)品“PaaS”化,加強(qiáng)產(chǎn)品化能力以及與合作伙伴的黏性,更高效地解決企業(yè)需求。

結(jié)語(yǔ):

哪里有語(yǔ)言,哪里就有NLP發(fā)揮作用的地方。正如劉云峰所言,NLP這兩年在語(yǔ)言模型等基礎(chǔ)能力上已經(jīng)有所突破,下一步要完善的就是技術(shù)落地到商業(yè)場(chǎng)景中的工程化問題。

從論文到工業(yè)應(yīng)用,技術(shù)的傳遞鏈在加速,追一科技要做的就是解決好垂直領(lǐng)域的知識(shí)問題,在技術(shù)應(yīng)用爆發(fā)到來前,做好準(zhǔn)備。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到