云從科技溫浩:不能為了AI而做AI,應(yīng)該形成感知、認(rèn)知和決策閉環(huán)

伶軒 7年前 (2018-12-24)

AI企業(yè)發(fā)展應(yīng)該是一個(gè)從學(xué)術(shù)研究、行業(yè)驗(yàn)證、商業(yè)落地、行業(yè)平臺(tái)到智能生態(tài)的一層層深入過程。

12月21日,鎂客網(wǎng)在西子湖畔舉辦“2018硬科技行業(yè)領(lǐng)袖峰會(huì)暨鎂客網(wǎng)年會(huì)”,共邀產(chǎn)業(yè)同仁,與現(xiàn)場(chǎng)300多位觀眾一起回顧2018,展望2019。

本次峰會(huì)匯聚了Arm中國(guó)、云從科技等在內(nèi)的超過300家硬科技企業(yè)及投資機(jī)構(gòu)代表共同參與。在發(fā)表主題為《從核心技術(shù)閉環(huán)出發(fā),實(shí)現(xiàn)產(chǎn)業(yè)變革之路》的演講時(shí),云從科技聯(lián)合創(chuàng)始人溫浩認(rèn)為,AI企業(yè)發(fā)展應(yīng)該是一個(gè)從學(xué)術(shù)研究、行業(yè)驗(yàn)證、商業(yè)落地、行業(yè)平臺(tái)到智能生態(tài)的一層層深入過程,這也是人工智能企業(yè)理想的發(fā)展階段。

云從溫浩:不能為了AI而做AI,應(yīng)該形成感知、認(rèn)知和決策閉環(huán)

以下是溫浩先生的演講實(shí)錄:

感謝鎂客網(wǎng)的邀請(qǐng)。

我們先講一下云從在這3年多時(shí)間里,從打造核心技術(shù)閉環(huán)到領(lǐng)導(dǎo)產(chǎn)業(yè)是怎么做的。

云從是一家從中科院孵化出來的企業(yè),我們的技術(shù)累積已有十多年,創(chuàng)始人周曦博士師從美國(guó)計(jì)算機(jī)視覺之父黃煦濤教授。除此之外,我們也得到了各級(jí)領(lǐng)導(dǎo)的重視,參與制定了國(guó)家標(biāo)準(zhǔn)和部委標(biāo)準(zhǔn),承接了國(guó)家相關(guān)三大平臺(tái):人工智能智能基礎(chǔ)自然公共服務(wù)平臺(tái)、發(fā)改委高準(zhǔn)確度人臉識(shí)別的應(yīng)用還有工信部核心SOA芯片應(yīng)用。另外,我們?cè)趪?guó)內(nèi)還設(shè)立了五大研發(fā)中心。

目前,我們的業(yè)務(wù)主要聚焦三個(gè)行業(yè),銀行總行、安防和機(jī)場(chǎng)。我們的愿景是成為國(guó)家級(jí)平臺(tái),以能力和資源為支撐點(diǎn),憑借AI定義設(shè)備、定義場(chǎng)景做各個(gè)行業(yè)的解決方案。定義智慧生活,提升生活能力。

前一段有一個(gè)新聞,寧波的行人闖紅燈被抓拍,結(jié)果是公交車上的董明珠廣告。這個(gè)事情告訴我們,AI技術(shù)在應(yīng)用的時(shí)候存在很多問題,不能為了AI而做AI,它應(yīng)該是有感知、有認(rèn)知、有決策的一個(gè)閉環(huán)?;蛘吣愕募夹g(shù)夠先進(jìn),能夠形成一整套的有價(jià)值的方案。

云從要打造的就是技術(shù)閉環(huán),具備感知、認(rèn)知和決策能力。人工智能是"頭雁",人工智能解決的是問題的本身,怎樣讓能力提高,怎么去解決問題,讓它引領(lǐng)技術(shù)發(fā)展是我們當(dāng)前需要思考的主要問題。

當(dāng)前,在技術(shù)落地方面,除了語音識(shí)別,人臉識(shí)別是應(yīng)用最廣的技術(shù),很多人臉識(shí)別技術(shù)已經(jīng)成為了人機(jī)交互的視覺入口。

其實(shí),在語音識(shí)別中,京東、小米都有很大的投入,但在視覺上去沒有。而視覺識(shí)別中,除了人臉,還有人體識(shí)別,通過體態(tài)、衣著識(shí)別等,以后也都會(huì)有大規(guī)模的應(yīng)用。

人臉和人體是對(duì)人識(shí)別的比較完善的方案。我們?cè)谥锌圃鹤隽撕芏鄬?shí)驗(yàn),對(duì)人臉做了各種角度、各種光源的分析,形成一個(gè)結(jié)構(gòu)化的數(shù)據(jù),現(xiàn)在的識(shí)別率已經(jīng)接近96.6%的商用標(biāo)準(zhǔn)。舉個(gè)例子,一個(gè)女孩在公園里面跑步,沒有拍到人臉,但我們可以通過形體特征把她識(shí)別出來,這是一個(gè)跨攝像頭和沒有人臉的識(shí)別應(yīng)用,明年將會(huì)落地。

公認(rèn)的,人機(jī)交互的下一代交互方式就是“人臉+語音+AI”,比如VR交互。那么云從在視覺識(shí)別外,還聯(lián)合實(shí)驗(yàn)室、大學(xué)、中科院做了語音識(shí)別,措辭率很低。我們?cè)跊Q策方面做了很多模型,比如雙塔神經(jīng)網(wǎng)絡(luò)。

五官感知方面,我們通過感知技術(shù)做了統(tǒng)一大數(shù)據(jù)建模,通過機(jī)器人學(xué)習(xí)來畫像,得到策略推薦,再到執(zhí)行、反饋。比如"董明珠"闖紅燈事件,就是感知系統(tǒng)不夠完善,如果系統(tǒng)知道董明珠不可能出現(xiàn)在寧波,就完全可以避免這個(gè)問題。當(dāng)然,這是一個(gè)比較極端的例子。

我們還做了行業(yè)產(chǎn)品和解決方案,在銀行有50多個(gè)解決方案落地,通過感知技術(shù)做集成生物識(shí)別,比如ATM機(jī)刷臉取款等,這是比較簡(jiǎn)單的應(yīng)用。

除此之外,銀行對(duì)備付金預(yù)測(cè)也很關(guān)心,比如為上海建行的1000多個(gè)站點(diǎn)預(yù)測(cè)備付金,1個(gè)月超10億的話就能節(jié)省上百萬的利息,這是從感知到認(rèn)知的決策閉環(huán)。

零售行業(yè)線下門店方面,從店外進(jìn)來多少人,進(jìn)來多少次、流連于什么產(chǎn)品間等,我們都有一套客戶轉(zhuǎn)化率去做識(shí)別和決策。舉個(gè)例子,門店門口裝有人臉抓拍機(jī),可以判斷是VIP、會(huì)員、還是熟客,并根據(jù)性別年齡推送廣告;到貨架上,有感應(yīng)技術(shù)獲取畫像并將其推薦到店員的終端上去,由他/她為顧客做相關(guān)的推薦;最后的支付環(huán)節(jié),直接刷臉支付就可以了。

這才是現(xiàn)在AI技術(shù)可以幫助門店做的事情,而不是弄一個(gè)無人超市,對(duì)提高產(chǎn)量,毫無幫助。

最后我們認(rèn)為,AI落地將從最開始的學(xué)術(shù)研究,體現(xiàn)技術(shù)先進(jìn)性一步一步走到行業(yè)驗(yàn)證,在行業(yè)實(shí)戰(zhàn),最后到成為行業(yè)平臺(tái)和智能生態(tài)。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到