「人物特寫」電子科技大學(xué)陳建文:沒有完美的大數(shù)據(jù),現(xiàn)實(shí)世界都是小數(shù)據(jù)
千人千面,任何的樣本,都是小樣本,任何的數(shù)據(jù),都是小數(shù)據(jù)。
陳建文
電子科技大學(xué) 視覺智能研究中心主任
在國內(nèi)AI人的印象里,陳建文是一名創(chuàng)業(yè)者,也是一位學(xué)者。
但他最在意的,還是學(xué)者的身份——電子科技大學(xué)人工智能研究中心主任。
不過,顯然他這個學(xué)者不是嚴(yán)肅型的,而是跳脫型、開放型,那主要是因?yàn)樗氲蒙?、說得多。
因此,第一次見面,我們就被他的言論給“嚇”到了。
那是在7月9號的一次國內(nèi)頂級AI創(chuàng)新峰會上,當(dāng)時作為主辦方特邀嘉賓的陳建文就不時的爆出“駭人聽聞”的論斷。
時隔半月,在2017CJ上我們又見到了他,于是就有了下面的談話。又經(jīng)過一周左右零零散散的整理,終于成文:
支撐AI復(fù)興希望的是人類對未來的向往
在很多人的印象中,人工智能技術(shù)有著長達(dá)61年歷史、經(jīng)歷過三起兩落的曲折歷程,而其之所以會一直保留著復(fù)興的希望,很大程度上依賴于某些關(guān)鍵性技術(shù)的不斷升級和突破。
這些關(guān)鍵性技術(shù),既有感知技術(shù)、深度卷積神經(jīng)網(wǎng)絡(luò),也有大數(shù)據(jù)、模式識別等等。
但在AI領(lǐng)域浸淫了十多年的陳建文看來,事實(shí)卻并非如此,他似乎有著自己獨(dú)特的判斷。
科幻電影也是技術(shù)突破的動力
“人工智能之所以會長盛不衰,或是能夠不斷的復(fù)興,首先是因?yàn)樗俏磥淼内厔?,是科技發(fā)展的大勢所趨,這個誰也抗拒不了。
“就像我們在70年代、80年代看的科幻片,到零幾年的《阿凡達(dá)》,甚至是近幾年的《星際迷航》、《駭客帝國》。基本上,大家看到的未來幾乎都差不多,大同小異。”
除此之外,陳建文認(rèn)為,只有一個原因,那就是人類對未來的向往。正是這種向往,才推動著技術(shù)的不斷進(jìn)步。
“想象一下,在未來,會有機(jī)器人跟你說話,陪你做各種事情——你看今天我們看到的科幻片,很多地方都描繪了這樣一幅令人向往的畫面。
“我昨天下午在四川參加了一場AI的學(xué)術(shù)會議,會議上一個參會者說:我們以前讀比爾蓋茨,他講的未來和他描述的東西,當(dāng)時覺得像科幻片,但今天看上去,很多都已經(jīng)實(shí)現(xiàn)了。
“所以我覺得,在眼下這個時間點(diǎn)看AI的未來,不管是三起兩落還是螺旋式上升,都是有跡可循的。”
技術(shù)的發(fā)展往往有自己的軌跡和規(guī)律,每個時間點(diǎn)都會有不同的技術(shù)出來,隨著計算能力、硬件條件等各方面的東西越來越完善,每個時間點(diǎn)的技術(shù)成就都不一樣。
“就像幾年前、十年前我們講模式識別,后面又說機(jī)器學(xué)習(xí),這些其實(shí)都是隨著計算能力的增長,隨著算法的突破,而自然逐步出現(xiàn)和逐步實(shí)現(xiàn)的。例如神經(jīng)網(wǎng)絡(luò)已經(jīng)被用于解決各種各樣的問題,例如機(jī)器視覺和語音識別。這些問題都是很難被傳統(tǒng)基于規(guī)則的編程所解決的。
因此在陳建文看來,AI的復(fù)興并不僅僅得益于一兩個關(guān)鍵性技術(shù)的延續(xù)和突破,它更大的原因其實(shí)是人類對未來的向往。
而人類對未來的美好向往和心里的渴望,這些都在支撐著AI技術(shù)和各種應(yīng)用場景的深入發(fā)展。
整個《哆啦A夢》就是一場虛擬世界的直播交互
說到直播和交互,就不能不提到虛擬世界和現(xiàn)實(shí)世界的差距和界限。而在這里,我們會發(fā)現(xiàn)一個非常有趣的現(xiàn)象。
就像很多70后、80后最喜歡看的一部日本動畫片《機(jī)器貓》(現(xiàn)在叫《哆啦A夢》),最終的結(jié)局什么?就是主角某一天大夢初醒,發(fā)現(xiàn)頭上插了個東西。而劇中所謂的康夫、小靜等所有的人其實(shí)都是在一個虛擬世界里的虛擬人物。
他們可以在天上飛來飛去,可以打開一個任意門,穿梭到另外一個地方去。這跟我們看到的magic(就是駭客帝國里面看到的,躺在床上忽然就到了一個虛擬空間),和我們看到的《盜夢空間》、《阿凡達(dá)》所描繪的場景,有本質(zhì)區(qū)別嗎?
似乎并沒有。
“所以在我看來,多年以后甚至未來的100年,技術(shù)都是會一直演進(jìn)的,唯一不變的是人類對想象中的未來的向往。而這種向往讓所有的研究員、工程師、博士、資本趨之若鶩,都在往這個方向去努力。
“大家覺得這就是未來,我們就要達(dá)到那個目標(biāo)。至于說要怎么達(dá)到這個目標(biāo),這就是算法要解決的問題。所以我跟朋友們講,看待現(xiàn)在的直播,你應(yīng)該反過來想一個問題。
舉個例子,我在上海,你在南京,只要我們倆一直播一連線,我就可以看到你我在旁邊了,這是視頻直播;如果是VR直播呢?你會感覺到我就在你旁邊,但是那是另外一種截然不同的形態(tài);而如果未來是全息的直播呢?又會是另一幅畫面了。
因此陳建文認(rèn)為,視頻直播技術(shù)也是虛擬現(xiàn)實(shí)一種階段性的技術(shù)。從廣義來講,所有的AR/VR都屬于人工智能范疇,它們的核心技術(shù)也都是AI技術(shù)。虛擬現(xiàn)實(shí)完成的是AI的視覺應(yīng)用場景和用戶接口。這也是為什么Facebook扎克伯格認(rèn)為,VR應(yīng)用還需要至少十年以上時間才能進(jìn)入普通人的生活,但是依舊在重兵押寶這個領(lǐng)域。
“2015年業(yè)內(nèi)講直播視頻,2016年講VR,未來可能會講的更多。像很多科幻片里的場景一樣,按鍵一按,我就“嗖”的一聲出現(xiàn)在你房間里,而且就在你旁邊。
“然后等聊天結(jié)束了,‘哥們,我回上海了’,我一按,又回來了。
“其實(shí),傳輸?shù)氖侨藛??不見得是人,而有可能是我的影像,在你那邊呈現(xiàn)出來而已。”
未來,智能家居、音箱等產(chǎn)品一定是家里的標(biāo)配
時光放到30年前,人們對智能家居、智能音箱還沒有一個成熟的概念,或者說不會奢望這些將會出現(xiàn)在日常生活中。但現(xiàn)在,情況顯然發(fā)生了變化。
對于家庭生活的智能化產(chǎn)品,陳建文一直持積極態(tài)度。他認(rèn)為,在未來的場景下,智能家居、智能音箱等必然會成為家里的標(biāo)配。
中國的智能家居太獨(dú)立,背后沒有完整產(chǎn)業(yè)鏈
“當(dāng)我們還小的時候,當(dāng)時都不敢想象家里會有汽車,而現(xiàn)在,我們的兒女一出生,往往家里就已經(jīng)有了一輛或幾輛車了!智能家居產(chǎn)品也是一樣,雖然目前還未普及,但未來一定會是家里的標(biāo)配。
“從算法、環(huán)境等因素來看,智能家居、智能音箱它都屬于接口設(shè)備,它未來可能不一定會是我們目前所熟知的這個形態(tài)。”
關(guān)于這一點(diǎn),業(yè)內(nèi)其實(shí)有很大的想象空間。智能家居、智能音箱等,可能會是音箱的形態(tài),也可能只是個貼在墻上的按鈕,甚至可能是個機(jī)器人、虛擬人。
“想象一下,你在家里只要往那兒一站,旁邊就會出現(xiàn)一個標(biāo)準(zhǔn)的全息美女。她就跟你問好、陪你聊天、聽你指揮,那也是智能家居啊,對不?單單是她跟你說話,就意味著已經(jīng)把音箱和家居給全部做到一起了。”
對現(xiàn)在市場上大行其道的智能音箱產(chǎn)品,如亞馬遜的Echo、谷歌的Google Home、蘋果的HomePod、還有小米的小愛同學(xué)、阿里的天貓精靈X1等,陳建文認(rèn)為,它們是一場革命,一場針對傳統(tǒng)音箱和家居市場和理念的革命。
有句話叫做:只要方向是對的,就不怕道路有多遙遠(yuǎn)。這其中的核心點(diǎn)就是商業(yè)化的技術(shù)和應(yīng)用場景,陳建文認(rèn)為,智能音箱的應(yīng)用場景將會非常的廣、非常的大。
但是它爆發(fā)的時間點(diǎn),或者說它在什么時間里被需要,將是另外一大課題。
“在目前看來,中國的智能家居、智能音箱還都太獨(dú)立,背后沒有形成一個產(chǎn)業(yè)鏈。這樣的話,到最后,整合市場就依然還是巨鱷的事,只有它們才有對應(yīng)的體量和實(shí)力。
“今后,哪個公司能完全以智能音箱為接口,整合家居里面所有的東西,那么它就是未來。”
智能家居的核心是有什么用,而不是長什么樣
陳建文認(rèn)為AI,更多的是一個工具,比如怎么幫助盲人看到路,怎么幫助別人快速的找到一個東西。
AI,也包括AR/VR,它不應(yīng)該是一種玩具,它應(yīng)該多一些工具的屬性。相應(yīng)的,應(yīng)用到家居領(lǐng)域的智能家居和智能音箱等,它的核心只能是工具性,而不在于外在的形態(tài)。
“智能家居、智能音箱的行業(yè)背景和應(yīng)用場景很大,商業(yè)化技術(shù)需要過程,需要時間去形成一個完整的產(chǎn)業(yè)鏈,形成完整的東西的,我覺得這是一個很好的點(diǎn)。
“現(xiàn)在的音箱還是有固定形態(tài)的,而理想中的,或者說在未來,它應(yīng)該是沒有固定形態(tài)的。它可能只是貼在墻上的一個danse,你在房間里面說一句話,比如說music,它就開始放音樂。
“這個東西它可能跟音箱這個形態(tài)完全沒關(guān)系(它屬于語音識別的一部分),它僅僅是一個傳感器。但遺憾的是,我們現(xiàn)在這個階段,中國的房子里還沒有把這種傳感器做進(jìn)去。
“所以,國內(nèi)老講智能家居,某種程度上太概念化太虛了。我在美國的家里面,衛(wèi)生間里面,買這個房子的時候,人家就已經(jīng)提前安裝濕度檢測器、溫度檢測器,甚至語音識別設(shè)備等等。當(dāng)你洗完澡之后,從來就不用管家里所有的濕度、溫度等的調(diào)節(jié),全部都是自動的。那你說,這個是不是智能家居呢?
“現(xiàn)在國內(nèi)怎么干呢,就是買一個加濕器放在那,就算了事兒。而歐美國家早就已經(jīng)把智能這塊固化在墻壁里面的傳感器中了。”
所以說,目前所謂的智能音箱等只是階段性的產(chǎn)品。在人工智能大數(shù)據(jù)、云計算、智能算法的加持下,這種階段性的產(chǎn)品也將很快會迎來更大的發(fā)展契機(jī)。
沒有完美的大數(shù)據(jù),現(xiàn)實(shí)世界都是小數(shù)據(jù)
研究AI的人都知道一個基本的原則:數(shù)據(jù)越大越全面,輸出的結(jié)果就越精準(zhǔn)。
但問題是,我們始終找不到理論上完整的大數(shù)據(jù),所以業(yè)內(nèi)有小數(shù)據(jù)和小樣本學(xué)習(xí),即推理和規(guī)則體序。而這二者的結(jié)合,似乎就是AI未來的重心所在。
“務(wù)實(shí)一點(diǎn)說,我們很多人,甚至包括一些professer,對大數(shù)據(jù)的理解是錯誤的。我在很多會議上都說過,這個大數(shù)據(jù)的大是什么意思呢?不是說數(shù)據(jù)有多大,也不是說數(shù)據(jù)有多么海量。
“我曾經(jīng)跟一個教授談,他就說,我們是做三維全息的,我一秒鐘幾個G的數(shù)據(jù),你看我數(shù)據(jù)大不大?還有人說,我一天采集了很多很多東西,我的這個sense很多很多......
“其實(shí),按照學(xué)術(shù)界的說法,大數(shù)據(jù)我們更多講的是數(shù)據(jù)的維度。”
一個人,如果說只有一個維度,不管你再大,你就是一個人。只有當(dāng)你具備很多不同維度的時候,你才是一個豐富的人,精彩的人。
實(shí)際上,數(shù)據(jù)永遠(yuǎn)不可能是完整的。
“舉個例子來說吧:你想要了解我,因此你去搜了一下,搜到了一些信息。但是,你搜到的一定是一個子集。然后另外一個人也去搜,他搜到的也是一個子集。你們搜的都是一個子集,都是不完整的。
“但是有一千個人搜的數(shù)據(jù)合在一起的時候,我根據(jù)這一千個人的數(shù)據(jù),我基本上可以斷定這個人的基本情況了。
“所以你看,越多個不完整的子集,就越接近事實(shí)真相。但是,核心的點(diǎn)是你永遠(yuǎn)不可能拿到完整的數(shù)據(jù),這個世界上又有什么數(shù)據(jù)是完整的嗎?怎么會有完整的數(shù)據(jù)呢?
“任何一件事情,你往深的挖,它都是不完整的。中國古語也有云,‘大道五十,天衍四九’,也有一點(diǎn)這么個意思。”
大數(shù)據(jù)的意義在于,數(shù)據(jù)的維度要很多。如果這個數(shù)據(jù)本身就沒有什么維度,就是個一維、二維或者三維的東西,那大數(shù)據(jù)也就沒有意義了。
當(dāng)數(shù)據(jù)采集的維度很多、角度更多、采集的源泉更多的時候,日積月累,我們往往就能從統(tǒng)計意義上得到一個概念。
這是第一層,獨(dú)立數(shù)據(jù)的結(jié)果。
“還有另外一個情況,你從網(wǎng)上整理了很多信息,另外一個人也整理了很多信息,你們只是把信息匯總在了一起,最后得出一個結(jié)論,這是第一步;第二步呢,基于這個信息你要去做預(yù)測和分析。根據(jù)你喜歡吃辣椒、喜歡踢足球等特征,從而預(yù)測出這個人性格應(yīng)該是什么樣子的,你就又往前走了一步。”
就像人們常說的的小樣本、小數(shù)據(jù)、大數(shù)據(jù)的學(xué)習(xí),就我看到的所有的樣本,光靠采樣是永遠(yuǎn)不可能采全的。
千人千面,任何的樣本,都是小樣本,任何的數(shù)據(jù),都是小數(shù)據(jù)。
我們現(xiàn)在看到的所有互聯(lián)網(wǎng)上的數(shù)據(jù),都是小數(shù)據(jù)集合成的大數(shù)據(jù),小數(shù)據(jù)的內(nèi)容聚合成一個大數(shù)據(jù)的整合。
對單獨(dú)的樣本來說,數(shù)據(jù)都是小數(shù)據(jù),沒有所謂的大數(shù)據(jù),完整的數(shù)據(jù)只存在于理論當(dāng)中。在研究采集中,我們所得到的永遠(yuǎn)只是一部分。從這個層面來講,它是屬于小數(shù)據(jù)和小樣本。
小數(shù)據(jù)多了之后,它會形成一個大數(shù)據(jù),再通過梳理、預(yù)測,算法,它會得出一定的結(jié)論。
這個能力是目前我們講的大數(shù)據(jù)里最大的行業(yè)應(yīng)用,就是規(guī)則推理。
“真實(shí)世界里沒有大數(shù)據(jù),你看到這個人,你描述他,十個詞、二十個詞,都是小數(shù)據(jù)。但是,你站在宏觀上,不去測量這一個獨(dú)立人,而是去描述這一類人的時候,它就是大數(shù)據(jù)了。
“所有的東西都是這樣,你測量的時候,獲取、真實(shí)的采集這個數(shù)據(jù)的時候,這個數(shù)據(jù)就已經(jīng)被你固定成小數(shù)據(jù)、小樣本了。”
解決好多維度、多任務(wù)的學(xué)習(xí),AI才有大未來
目前人工智能技術(shù),不可能是最終形態(tài)。那么在現(xiàn)階段,它的技術(shù)缺陷在哪些方面?
“我覺得是這樣的,就像《機(jī)器貓》那個愿景一樣,我們所說的AI第一大缺陷是:不管你今天看到的所有的場景,所有的東西,你依然不會覺得它跟你的人是完全一樣的。”
就像你跟機(jī)器人談話,你能感覺到他是假的;你跟AlphaGo下棋,你也能感覺到它只是一臺機(jī)器。
“想要解決這個問題,實(shí)際上有兩種不同的途徑,一種是我們把這個算法干的更牛,我要有大量的數(shù)據(jù),然后我給你反饋,這是一種人類不斷去逼近的方式。
“目前人工智能的另一大缺陷,是在單維度方面取得了長足的進(jìn)展,但是在多維度、真實(shí)的場景里面的技術(shù)潛力,還有很遙遠(yuǎn)的路要走。
“比如說,我們希望這個機(jī)器人又有語音識別,又有圖像識別,又有各種各樣的東西的,包括業(yè)務(wù)邏輯、語義識別等。但是,目前的狀態(tài)卻是,多維人工智能領(lǐng)域的發(fā)展還很差,基本上目前還沒有看到希望。”
以目前的技術(shù)階段來看,我們僅僅達(dá)到了通用型人工智能的初級水平而已。
自動駕駛領(lǐng)域的競爭結(jié)果,巨頭依然還是巨頭
智能家居、智能音箱市場的格局,跟現(xiàn)在的自動駕駛有很高的相似度。
在自動駕駛領(lǐng)域,我們看到特斯拉很牛。而實(shí)際上,那些大型的傳統(tǒng)主機(jī)廠,他們現(xiàn)在只是沒發(fā)聲而已,而并不是悶聲憋大招,更不是像很多人以為的無所作為。
智能家居也好,智能音箱也好,說到底,它還是一個傳統(tǒng)家居行業(yè)。我們能說智能家居是互聯(lián)網(wǎng)行業(yè)嗎?就像無人駕駛一樣,以后是什么情況,誰也不能妄下定論。
“只要能夠提供自動駕駛核心模塊的,就會有市場的一席之地,而并不會因?yàn)楫a(chǎn)品的差異化而導(dǎo)致競爭失敗。還是拿汽車舉例,我們說汽車很火、汽車市場足夠的大,但是也沒見到全世界的汽車發(fā)動機(jī)、變速箱都是一樣的。
“無人駕駛也有這樣的問題。無人駕駛是L1、L2、L3、L4,能提供L4的當(dāng)然牛??赡躄4的你要賣兩萬美金,那便宜點(diǎn)的我1000美金就能搞定,畢竟我只要可以上路就行了,甚至是可以半自動一點(diǎn)的。
“從這個意義上講,這個市場將是足夠大大,大到以后也不可能有哪一家能夠單獨(dú)吃得下。而一旦標(biāo)準(zhǔn)統(tǒng)一化之后,我們就會發(fā)現(xiàn),原有的巨頭依然還是巨頭。
“就像現(xiàn)在一年產(chǎn)千萬輛級別的主機(jī)廠,如豐田,它只是把它里面的一個元器件和電腦系統(tǒng)對接上去,換成自動駕駛的模塊就可以了。”
所以說這就回答了很多人疑問:
既然百度要做無人駕駛了,為什么很多人還要投自動駕駛呢,就不怕被無情的碾壓嗎?
“思維邏輯就是這樣。雖然已有科技巨頭押寶自動駕駛,但這卻并不妨礙,依然有層出不窮的自動駕駛創(chuàng)業(yè)企業(yè)獲得投資就是這個原因。”
虛擬重建和情緒感知,將對Live直播帶來劃時代的改變
未來的世界,不管科技怎么改變,一定還是“以人為本”的。針對于人的人工智能技術(shù)才是核心關(guān)鍵。 把人重建進(jìn)一個虛擬的世界中,如何讓這個虛擬的世界真實(shí)起來呢? 人最基本的情感是必須有的,但是這個問題要怎么解決呢?
一個是重建,另一個是情感的感知。
“你現(xiàn)在打游戲可能感覺不到,但是我要是講旁邊站了個范冰冰,你就需要她跟你交互,跟你說話,跟你有眼神的互動,等等。
“那么,這就是帶來另一個問題,我們需要準(zhǔn)確的識別動作和人臉及情緒,才能實(shí)現(xiàn)真正的交互。
“也就是說,我不僅要識別你的臉,還要識別你的情緒感知,把這些東西全部放進(jìn)去,你才能跟范冰冰愉快的玩耍。
“這也是我們易聯(lián)視訊現(xiàn)在在干的事。”
想要在虛擬的世界里,把真正的“人”裝進(jìn)去,就是要做到兩個點(diǎn):第一是把人重建進(jìn)去,第二是讓人的情緒、動作、表情、神態(tài)等全部跟著本人同步而動。
如果可以完成這兩件事,就將是一個劃時代的改變。
“因?yàn)槟莻€時候你會發(fā)現(xiàn),一回家你就可以跟別人約會去了,都是真人,絕對不是假人。能看到人,外形也能感知到情緒,就是心靈交互。
“這種情況下,你今天看到的場景,包括視頻會議,都將發(fā)生巨大的改變。這也是我覺得人工智能在短期內(nèi)可以預(yù)期的一個點(diǎn)。”
在陳建文看來,AI在每一個垂直點(diǎn)上,機(jī)會都是有的,而且很大。
舉例一下:可以預(yù)見的是,AI技術(shù)一旦實(shí)現(xiàn)實(shí)質(zhì)性突破,現(xiàn)在的這些社交、醫(yī)療、教育等,都不再是在線教育,而是真實(shí)教育、智能教育。
“你按一下按鍵,就有老師教你家孩子彈鋼琴,而我只需要搞一架鋼琴就可以了。你家孩子坐在那,老師不用到你家里也可以指揮孩子手上的動作,就像真的在上鋼琴課。
“同樣的,上完鋼琴課,我們可以隨時更換課程,換成繪畫或者舞蹈。”
以上帝的視角來看AI的發(fā)展,陳建文認(rèn)為,這將是全人類的夢想所在。
“比較高興的消息是什么呢?谷歌告訴我們,到2030年我們就可以活一百歲了,然后大家就可以在我上面所描繪的愿景里,想干嘛就干嘛了。
“因此,對于AI這個產(chǎn)業(yè),我就是一句話:有的干!”
做AI,不幻想,不吆喝
我不希望變成資本方,一天到晚講人工智能馬上就能改變?nèi)祟?,那是不可能的?
資本可以去盡情吆喝,但做公司的人必須腳踏實(shí)地,一味的幻想反而不好。
陳建文和他那一句小小的“豪言壯志”
我曾經(jīng)看過一篇文章,說改變世界有兩種人:一種是科學(xué)家,一種是工程師。我在想,為什么科學(xué)家不能是工程師呢?這樣不就會更好的改變世界了嗎?
哈哈,我覺得我就是個科學(xué)家,還是個工程師!
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
