專訪澳鵬田小鵬博士:以AI數(shù)據(jù)服務(wù),賦能各行業(yè)AI商業(yè)化進(jìn)程
2020中國國際數(shù)字經(jīng)濟(jì)大會(huì)暨展覽會(huì)。
隨著人工智能行業(yè)的高速發(fā)展,數(shù)據(jù)作為AI算法的重要基石,如何為機(jī)器學(xué)習(xí)算法訓(xùn)練、優(yōu)化提供數(shù)據(jù)采集、標(biāo)注等高質(zhì)量的服務(wù),成為人工智能熱潮中必不可少的一環(huán)。如何正確獲取數(shù)據(jù)、標(biāo)注數(shù)據(jù)、應(yīng)用數(shù)據(jù)?
10月28日,在由深圳市工業(yè)與信息化局、深圳市福田區(qū)人民政府指導(dǎo),高科技行業(yè)門戶OFweek維科網(wǎng)主辦的“2020中國國際數(shù)字經(jīng)濟(jì)大會(huì)暨展覽會(huì)”上,澳鵬(Appen)全球高級(jí)副總裁、大中國區(qū)總經(jīng)理田小鵬博士接受了OFweek維科網(wǎng)的專訪,暢談人工智能的基礎(chǔ)以及數(shù)據(jù)為社會(huì)、為行業(yè)、為企業(yè)的進(jìn)步所作出的貢獻(xiàn)。
圖:澳鵬(Appen)全球高級(jí)副總裁、大中國區(qū)總經(jīng)理田小鵬博士
人工智能助力新基建
最近,新型基礎(chǔ)設(shè)施建設(shè),即“新基建”一詞備受關(guān)注。基礎(chǔ)設(shè)施是經(jīng)濟(jì)社會(huì)發(fā)展的重要基石。在數(shù)字經(jīng)濟(jì)時(shí)代,5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、數(shù)據(jù)中心等新技術(shù),正在驅(qū)動(dòng)新一輪科技革命和產(chǎn)業(yè)變革,成為數(shù)字經(jīng)濟(jì)發(fā)展的基石。
關(guān)于新基建,田博士表示,今年三月,國家再次提出要加快推進(jìn)包括5G 網(wǎng)絡(luò)、人工智能、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施的建設(shè)進(jìn)度。本次“新基建”的提出,不僅為經(jīng)濟(jì)增長提供新的動(dòng)力,更為人工智能領(lǐng)域帶來了更廣泛的關(guān)注。人工智能不再僅僅是科技前沿,它已被列入了新基建的七大領(lǐng)域之一。
“國家把人工智能作為新的基礎(chǔ)設(shè)施來建設(shè),可以說是一項(xiàng)立足長遠(yuǎn)的規(guī)劃。”田博士稱。
在“新基建”與“舊基建”兩方面的對(duì)比上,田博士指出,曾經(jīng)的前沿技術(shù)已被納入國家基礎(chǔ)設(shè)施建設(shè)。“發(fā)生這種轉(zhuǎn)變的原因,一是科技已經(jīng)發(fā)展到了可以被日常應(yīng)用,并且能夠切實(shí)改善人們生產(chǎn)生活的程度,二是社會(huì)已經(jīng)發(fā)展到了需要科技產(chǎn)物的助力來進(jìn)一步提升生產(chǎn)效率和抗風(fēng)險(xiǎn)能力的程度。”
人工智能作為這個(gè)時(shí)代科技發(fā)展的偉大產(chǎn)物,早已滲透到了人們工作和生活中的方方面面。如何解決民生剛需、解除民生痛點(diǎn)?這是人工智能應(yīng)該做到的事情。在這一點(diǎn)上,田博士舉例指出:“在智能語音和智能語義的加持下,音響不再是單向輸出音頻的工具,而是能夠進(jìn)行人機(jī)互動(dòng)的智能設(shè)備;密碼解鎖在很多場(chǎng)景中,已經(jīng)被指紋、人臉識(shí)別替代。”
“可以說,人工智能是時(shí)代發(fā)展的新型燃料,通過高效挖掘數(shù)據(jù)價(jià)值,賦能各行業(yè)各領(lǐng)域智慧升級(jí)。”田博士說道。
人工智能助力后疫情時(shí)代產(chǎn)業(yè)發(fā)展
人工智能作為支撐經(jīng)濟(jì)社會(huì)數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型的關(guān)鍵新型基礎(chǔ)設(shè)施,不僅在助力疫情防控、復(fù)工復(fù)產(chǎn)等方面作用突出,同時(shí),在穩(wěn)投資、促消費(fèi)、助升級(jí)、培植經(jīng)濟(jì)發(fā)展新動(dòng)能等方面潛力巨大。
那么,人工智能如何作出貢獻(xiàn)?
田博士指出,在這場(chǎng)使人與人之間保持距離、把人們社交活動(dòng)頻次降至最低的新冠疫情中,“左手支撐疫情防控,右手支撐復(fù)工復(fù)產(chǎn)”的人工智能,在抗疫人力不足時(shí)挺身而出,將防疫和工作效率提升數(shù)倍。“疫情的影響還在持續(xù),而人工智能帶來的健康碼、AI醫(yī)生、送藥送餐機(jī)器人等各種高效管理和便民服務(wù),已經(jīng)同水、電、氣、網(wǎng)絡(luò)一樣,成了城市必不可少的‘基礎(chǔ)設(shè)施’。”
田博士進(jìn)一步指出,社會(huì)對(duì)于人工智能的需求遠(yuǎn)遠(yuǎn)不止于抗擊疫情。“此次疫情作為一個(gè)推手,已經(jīng)正式將人工智能全面推向社會(huì)的方方面面。智慧金融、智慧教育、智慧醫(yī)療、智慧交通等等都有著人工智能在其中發(fā)光發(fā)熱。需求已然成熟,后疫情時(shí)代的人工智能產(chǎn)業(yè),絕不僅僅指向其自身的發(fā)展,而是要推動(dòng)各行業(yè)完成智能化轉(zhuǎn)型升級(jí),實(shí)現(xiàn)新舊動(dòng)能的轉(zhuǎn)換。”
事實(shí)上,作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,人工智能正在對(duì)經(jīng)濟(jì)發(fā)展、社會(huì)進(jìn)步、國際政治經(jīng)濟(jì)格局等多個(gè)方面產(chǎn)生重大而深遠(yuǎn)的影響。根據(jù)德勤此前發(fā)布的《全球人工智能發(fā)展白皮書》預(yù)測(cè),到2025年,世界人工智能市場(chǎng)規(guī)模將超過6萬億美元,2017年至2025年復(fù)合增長率達(dá)30%。
中國的人工智能舞臺(tái)更是潛力巨大。我國《新一代人工智能發(fā)展規(guī)劃》提出:到2030年,中國人工智能核心產(chǎn)業(yè)規(guī)模將超過1萬億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過10萬億元。
AI算法是車,數(shù)據(jù)是油
根據(jù)國際數(shù)據(jù)公司(IDC)2018年末的測(cè)算,2018年至2025年,全球的數(shù)據(jù)總量將由33ZB增加至175ZB。其中,中國的數(shù)據(jù)增長量將保持30%的增長速度,將是所有地區(qū)中增長速度最快的。同樣,數(shù)據(jù)量的激增也催生出了數(shù)據(jù)服務(wù)行業(yè)這一龐大的市場(chǎng)。
機(jī)器強(qiáng)于人的地方在于它能夠存儲(chǔ)、處理大量數(shù)據(jù)。過去,機(jī)器得到的數(shù)據(jù)是人類獲取并選擇性錄入,它所產(chǎn)出的結(jié)論充滿局限性。而現(xiàn)在,在人工智能的幫助下,機(jī)器能夠自己聽、自己看,海量數(shù)據(jù)信息的記錄與分析為各行各業(yè)的日常決策與長遠(yuǎn)發(fā)展帶來前所未有的改變。
但問題來了——機(jī)器存儲(chǔ)、處理的大量數(shù)據(jù),從何處獲取,如何獲取成了關(guān)鍵。人工智能商業(yè)化在算力、算法和技術(shù)方面基本達(dá)到階段性成熟,想要加速落地,解決行業(yè)具體痛點(diǎn),就需要大量經(jīng)過標(biāo)注處理的相關(guān)數(shù)據(jù)做算法支撐。
數(shù)據(jù)決定了AI的落地程度,是商業(yè)化過程中重要的一環(huán)。
田博士舉了一個(gè)生動(dòng)的例子。同樣是看月亮,在不同的經(jīng)度,不同的緯度中,會(huì)有差異。如果采用在一個(gè)國家的不同地方所觀察到的月亮,而不是在全球各個(gè)地方實(shí)地觀察,那么其標(biāo)注的數(shù)據(jù)一旦應(yīng)用于全世界數(shù)據(jù)中,錯(cuò)誤的數(shù)據(jù)將會(huì)給后續(xù)一系列應(yīng)用帶來錯(cuò)誤的結(jié)果。
用AI來服務(wù)AI,賦與AI最初始的、準(zhǔn)確的數(shù)據(jù)是基礎(chǔ)。“如果把AI中的算法比作是車,那么數(shù)據(jù)便是油,想要車跑得更快、更好,‘喂’給它高質(zhì)量的油必不可少。”田博士稱。
智能化轉(zhuǎn)型的機(jī)遇與挑戰(zhàn)
今年6月,在澳鵬(Appen)全球發(fā)布的2020年AI現(xiàn)狀年度報(bào)告《AI與機(jī)器學(xué)習(xí)的現(xiàn)狀》中,近四分之三的調(diào)研企業(yè)組織表示AI對(duì)他們的業(yè)務(wù)而言至關(guān)重要,越來越多的企業(yè)開始將負(fù)責(zé)任的初始數(shù)據(jù)作為其實(shí)現(xiàn)業(yè)務(wù)成功的因素之一,這是機(jī)遇。
然而,人工智能項(xiàng)目的成功部署并沒有那么容易。據(jù)研究機(jī)構(gòu)Gartner的調(diào)研顯示,在2019年,只有不到20%的人工智能項(xiàng)目成功部署。其中,數(shù)據(jù)問題正是部署失敗的主要原因之一,這對(duì)于企業(yè)而言是一個(gè)無法避免的挑戰(zhàn)。
隨著技術(shù)的不斷發(fā)展,傳統(tǒng)企業(yè)一定會(huì)走向AI的道路,在這條道路上,他們對(duì)于數(shù)據(jù)的需求相較于以往提出了更高的要求:第1是需要大量的高質(zhì)量數(shù)據(jù);第2是數(shù)據(jù)的安全性、保密性、私密性及無歧視要求;第3是要求采標(biāo)一體化。
田博士指出,企業(yè)自己完成這些數(shù)據(jù)任務(wù)是具有挑戰(zhàn)性的,并且成本高昂,處理不當(dāng)時(shí)甚至可能弊大于利。對(duì)于希望高效完成AI部署的企業(yè)而言,與專業(yè)的數(shù)據(jù)伙伴開展合作尤為重要。
“20多年以來,澳鵬與全球領(lǐng)先的AI公司合作,提供高質(zhì)量的多樣化可擴(kuò)展標(biāo)注選擇,包括:先進(jìn)的人工智能輔助數(shù)據(jù)標(biāo)注平臺(tái)、遍布全球的多語言專家、全球超過一百萬的眾包資源,滿足180多種語言、方言和多樣化安全需求,以及符合道德規(guī)范的數(shù)據(jù)來源及公平的眾包報(bào)酬,降低品牌可能面臨的潛在風(fēng)險(xiǎn)。我們的部署速度比市場(chǎng)平均速度快三倍以上。”田博士如是說。
澳鵬的未來
關(guān)于澳鵬未來的戰(zhàn)略規(guī)劃,田博士稱,澳鵬將對(duì)其人工智能輔助數(shù)據(jù)標(biāo)注平臺(tái)的幾個(gè)重點(diǎn)領(lǐng)域加大投入:
1. 標(biāo)注工具箱,繼續(xù)優(yōu)化部分高復(fù)雜度的數(shù)據(jù)交付場(chǎng)景,比如自動(dòng)駕駛2D、3D標(biāo)注;
2. 模型輔助平臺(tái),研發(fā)行業(yè)一流的基于遷移學(xué)習(xí)和主動(dòng)學(xué)習(xí)框架的在線預(yù)標(biāo)注平臺(tái),大幅提升人機(jī)協(xié)同效率,為客戶創(chuàng)造價(jià)值;
3. 企業(yè)級(jí)數(shù)據(jù)API和可視化分析平臺(tái),研發(fā)企業(yè)級(jí)數(shù)據(jù)API和可視化分析平臺(tái),將平臺(tái)無縫接入客戶的模型研發(fā)流程,進(jìn)一步提升數(shù)據(jù)+模型的迭代效率。
田博士說:“去年10月,澳鵬中國首個(gè)數(shù)據(jù)服務(wù)交付中心——澳鵬科技(無錫)有限公司正式成立,投資200萬美元;今年5月,澳鵬數(shù)據(jù)科技(上海)有限公司正式成立,投資200萬美元。剛剛建成不久的大連服務(wù)交付站點(diǎn),則可以更多地為面向日語、韓語、俄羅斯語,包括覆蓋東北領(lǐng)域的公司提供服務(wù)。未來,澳鵬還將向更多的行業(yè)邁進(jìn),不斷砥礪前行,深耕細(xì)作。”
“澳鵬希望到2025年,可以做到10億美元的收入、上萬人規(guī)模的企業(yè),真正開始在大中華區(qū)的市場(chǎng),包括大陸、香港、臺(tái)灣等提供各種各樣的高質(zhì)量AI數(shù)據(jù)服務(wù)。”田博士稱。
關(guān)于澳鵬
澳鵬(Appen)是全球領(lǐng)先的人工智能數(shù)據(jù)服務(wù)提供商,主要價(jià)值體現(xiàn)在擁有成熟的數(shù)據(jù)工程管理方法論和技術(shù)輔助保證穩(wěn)定的高質(zhì)量交付;AI 數(shù)據(jù)平臺(tái)具備優(yōu)良的用戶體驗(yàn)和領(lǐng)先機(jī)器學(xué)習(xí)輔助標(biāo)注技術(shù),可大大提升數(shù)據(jù)標(biāo)注和工程效率;規(guī)?;乃接谢捅姲鼣?shù)據(jù)標(biāo)注,能使工程人員快速響應(yīng)顧客的交付需求。
澳鵬(Appen)通過其超過100萬名經(jīng)嚴(yán)格驗(yàn)證的全球眾包資源群體——覆蓋130多個(gè)國家超過180種語言——支持公司的全球客戶。
澳鵬(Appen)持續(xù)不斷創(chuàng)新,以全球領(lǐng)先經(jīng)驗(yàn),力爭成為頂尖的AI數(shù)據(jù)服務(wù)公司,服務(wù)AI機(jī)器學(xué)習(xí),并為全球高科技、汽車、消費(fèi)電子、電子商務(wù)、金融服務(wù)、醫(yī)療健康及科研機(jī)構(gòu)等行業(yè)提供高質(zhì)量、高效的、安全的數(shù)據(jù)服務(wù)。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
