硬紀(jì)元AI峰會實錄|公子小白嚴(yán)漢明:這是智能機(jī)器人最好的時代

伶軒 8年前 (2017-07-17)

在當(dāng)下這么好的人工智能時代里,我們要怎么運用技術(shù)做出一款大家都喜歡的機(jī)器人呢?

2017年7月9日,由鎂客網(wǎng)、振威集團(tuán)聯(lián)合主辦的“3E‘硬紀(jì)元’AI+產(chǎn)業(yè)應(yīng)用創(chuàng)新峰會”在北京國家會議中心盛大開幕?,F(xiàn)場200位來自全球AI行業(yè)的頂級專家、知名創(chuàng)投機(jī)構(gòu)、創(chuàng)業(yè)公司團(tuán)隊和知名媒體齊聚一堂,共謀AI+行業(yè)的創(chuàng)新應(yīng)用,探討AI的當(dāng)下與未來。

硬紀(jì)元AI峰會實錄|公子小白嚴(yán)漢明:這是智能機(jī)器人最好的時代

來自公子小白的創(chuàng)始人嚴(yán)漢明,在峰會期間進(jìn)行了主題為“這是智能機(jī)器人最好的時代”的主題演講。嚴(yán)漢明表示,目前的人工智能還無法做到遷移學(xué)習(xí),舉一反三,它仍舊處于高感知、低認(rèn)知的狀態(tài)。我們要做的,就是讓它具備分析和推理能力,并具備多項功能。

以下為演講實錄(為方便閱讀,有所刪減):

剛剛陳博士講的非常好。在之前的圓桌論壇上,專家們也都就人工智能這一領(lǐng)域的現(xiàn)狀和發(fā)展方向做了深入的探討。那我就結(jié)合公子小白的產(chǎn)品研發(fā)經(jīng)驗和應(yīng)用場景與大家一起探討一下,在當(dāng)下這么好的人工智能時代里,我們要怎么運用技術(shù)做出一款大家都喜歡的機(jī)器人呢?

目前市面上所推出的關(guān)于語音智能類的交互產(chǎn)品,例如蘋果的HomePod、亞馬遜的Echo、谷歌的Google Home。而就國內(nèi)來說,包括近期阿里推出的天貓精靈、喜馬拉雅的小雅等,都是比較貼近人了生活的人工智能產(chǎn)品。

人工智能目前仍舊處于高感知、低認(rèn)知的狀態(tài)

人工智能技術(shù)很廣,包括圖像識別、語音識別等,已經(jīng)有了其非常成熟的商業(yè)模式了,甚至有些已經(jīng)開始盈利。例如,在語音識別領(lǐng)域,我們國內(nèi)的巨頭科大訊飛、百度等,都在做著非常大的布局和商業(yè)化嘗試。那更往前一部,自然語言處理又是什么呢?

人工智能實質(zhì)上就是在深度的神經(jīng)網(wǎng)絡(luò)上面構(gòu)建的一個符號處理系統(tǒng),這是我們在產(chǎn)品的探討和研發(fā)過程中總結(jié)出來的。深度學(xué)習(xí)可以解決機(jī)器的學(xué)習(xí)問題,例如你給它一些圖片、聲音素材等數(shù)據(jù),并對它進(jìn)行訓(xùn)練之后,就可以讓它很快的掌握一個單一的技能。

然而,人類不只能深度學(xué)習(xí),還具備增強(qiáng)學(xué)習(xí)和遷移學(xué)習(xí)的能力,也就是我們所說的舉一反三。但目前機(jī)器人不具備這個能力,所以在讓機(jī)器學(xué)會簡單學(xué)習(xí)之外,我們需要通過深度學(xué)習(xí)技術(shù)讓其掌握的這些技能,包括感知的技能。像小貓小狗一樣,讓它們有視覺,聽覺,還會自己保持平衡等等。

從原始社會打結(jié)記事算起到今天,我們除了通過手寫文字和電腦打字輸入等方式之外,還有很多其他的交流方式,形成了一整套非常復(fù)雜用于人類交流的語言處理系統(tǒng)。這個系統(tǒng)除了可以正常地進(jìn)行表達(dá)以外,還能夠通過聯(lián)想和推理等表達(dá)含義。

結(jié)合以上所說的,通過人工智能技術(shù)夠構(gòu)建我們的學(xué)習(xí)系統(tǒng),不僅可以使得深度神經(jīng)網(wǎng)絡(luò)將一些感知上的東西做得更加深入,還可以通過知識圖譜將其與人類的認(rèn)知結(jié)合起來。但目前的人工智能有一個特點,也是其存在的問題,就是它的圖像識別和處理能力可能比人類還高,然而它并不具備深刻認(rèn)識的能力,覆蓋率也非常的低,一個算法只能完成一件事情。例如語音識別算法,它只能識別語音,圖像識別算法也能識別圖片,雖然準(zhǔn)確率非常高,但它不能讓一個算法同時具備語音識別和圖像識別兩種能力,所以它就不能進(jìn)行很好的遷移學(xué)習(xí)。

當(dāng)然了,它的效率非常高,像AlphaGo一樣,已經(jīng)超過了人類最大的運算能力,但它的綜合決策能力就很弱了。不過對于下棋來說,規(guī)則比較單一,所以它能夠做的很好。那如果讓它來處理一些事情或者一國的政治呢,它就很難去決策了。因為這些事情里面包含了非常多的因素和非常多的條件所限制,目前人工智能技術(shù)是做不到的,它目前還處于高感知、低認(rèn)知的這樣一個狀態(tài)。

弱人工智能時代,產(chǎn)品落地需要更符合人性需求

在這樣的一個情況下,我們怎么在弱人工智能時代,將產(chǎn)品落地呢?像打卡門禁的這種人臉識別系統(tǒng)或者指紋識別系統(tǒng),它也可以用到人工智能的技術(shù),但它是很封閉的、很單一的一個領(lǐng)域;如果再發(fā)散一點,往娛樂化的方向去走,例如直播系統(tǒng),其實也用了一些信號處理或者是圖片壓縮等的人工智能處理的技術(shù)。

經(jīng)過四年的摸索,我們決定要做一些符合人性的產(chǎn)品,做一些虛擬的生命,通過人工智能技術(shù),促進(jìn)人工智能產(chǎn)業(yè)閉環(huán)。那我們怎樣才能在當(dāng)前的技術(shù)基礎(chǔ)上通過技術(shù)組合產(chǎn)生一個有生命感的虛擬產(chǎn)品呢?目前,還沒有一個產(chǎn)品可以擁有很多功能,可以播放、投影、打乒乓球、端茶倒水,又可以給你唱歌跳舞等。比方說我們在家里最常見的掃地機(jī)器人,它目前是機(jī)器人行業(yè)里面運用最大而且產(chǎn)量最高的一款產(chǎn)品,但它的功能也只是掃地,不能完全的多樣化。很多的國內(nèi)的主打娛樂的產(chǎn)品,所想到的只是跟低齡化人群相結(jié)合,比方說我們看的喜羊羊、熊大熊二,這些IP比較適合小孩子,不能覆蓋到全部的人群。

基于以上的分析和梳理,我們打造了一個能夠進(jìn)行自然語言交流和用三維虛擬成像去顯示的虛擬生命——琥珀虛言。它不僅搭載了語音識別、手勢識別、人臉識別等技術(shù),還具備了聲紋識別和多輪對話等功能。通過將技術(shù)、用戶畫像、交互場景等相結(jié)合,經(jīng)過其自己的記憶推理,以三維虛擬的形式輸出顯示。

我們還有款產(chǎn)品名為helloA,它是一款的三維全息360適度的機(jī)器人,所扮演的是一個三維虛擬的女孩子。它是通過結(jié)合AI和VR,用虛擬的方式把人體數(shù)字化打碎,再利用技術(shù)將這些數(shù)據(jù)進(jìn)行組合后所顯示出來的。與其他實體機(jī)器人相比,它的場景、動作和情感表達(dá)方式更為豐富,且成本較低,關(guān)節(jié)的能動性也較好。

我們還有一款機(jī)器人,公子小白,一共是兩個機(jī)器人,一個叫公子,一個叫小白。我們認(rèn)為,這是男生買給女生的最好的禮物。以兩個機(jī)器人為紐帶,來表達(dá)和維系男女朋友在戀愛過程中的一些很微妙的感覺,例如表達(dá)關(guān)懷和愛意等。這有別于現(xiàn)在的微信、短信、電話等,仿佛讓我們回到了以前上學(xué)時候?qū)懶呕蛘呤墙还P友時的狀態(tài),而這種種朦朧和距離的感覺更能夠牽動情侶直接的感情。

除了機(jī)器人以外,我們還做了一些行業(yè)定制解決方案。比方說我們?yōu)楹:郊瘓F(tuán)定制的空港小白,它可以結(jié)合航空系統(tǒng)提供交互訂機(jī)票、查詢機(jī)場狀態(tài)、航班狀態(tài)等等服務(wù)。我們還做了一些明星和藝人定制,讓這些藝人的IP款機(jī)器人跟真人進(jìn)行語音和視頻等溝通。此外,我們還可以通過機(jī)器人進(jìn)行社群和信息的管理。

我的分享就到這里,主要是結(jié)合我們產(chǎn)品和技術(shù)所做的一些思考,謝謝大家。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到