北航教授李波：說AI會有低潮就是胡扯，這是人類長期的追求

鎂客 8年前 (2017-09-28)

這一輪所謂人工智能的高潮，和以往的幾次都有所不同，那是因?yàn)槠涫艿搅水a(chǎn)業(yè)界的極大關(guān)注和參與。而以前并不是這樣。

當(dāng)今世界是一個高度信息化的世界，甚至我們有一只腳已經(jīng)踏入了智能化時(shí)代。而在我們?nèi)粘＝涣骱托畔⒒又?，迅速發(fā)展的多媒體技術(shù)起到了至關(guān)重要的作用。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

在日前結(jié)束的“2017中國多媒體大會”上，提出了“智能媒體，創(chuàng)新未來”的主題。會后，我們采訪了大會主席、北京航空航天大學(xué)教授李波，就當(dāng)前人工智能技術(shù)在多媒體中的應(yīng)用以及二者相互促進(jìn)展開對話。

多媒體（Multimedia）是數(shù)據(jù)的最主要的現(xiàn)形式。在計(jì)算機(jī)系統(tǒng)中，多媒體指文本、圖形、圖像、視頻、聲音、動畫和影片等，在實(shí)際應(yīng)用中，也可以多種媒體綜合使用。多媒體的應(yīng)用領(lǐng)域已涉足諸如安防、影視、娛樂、廣告、藝術(shù)、教育、工程、商業(yè)及科研等諸多行業(yè)。

AI熱起來，首先爆發(fā)在多媒體領(lǐng)域

多媒體技術(shù)是把信息技術(shù)與應(yīng)用結(jié)合起來的核心技術(shù)。很多信息在現(xiàn)實(shí)生產(chǎn)和生活中的使用，都會涉及到聲圖文視頻等，還有在我們常說的人機(jī)交互中，多媒體技術(shù)也都發(fā)揮著重要的作用。

當(dāng)前這一輪的人工智能熱起來，與多媒體關(guān)系很大，首先是深度學(xué)習(xí)用于語音識別，很大程度上提升了識別效果。其次是圖像分析，對圖像分類、人臉識別、以及圖像檢索等也有大幅度提升。這些都是AI與多媒體應(yīng)用結(jié)合的表現(xiàn)。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

另一方面，關(guān)于多媒體技術(shù)本身的發(fā)展。多媒體的數(shù)據(jù)量很大，其內(nèi)容豐富多彩，理解難度大，它本身的內(nèi)容分析就需要智能處理，目前多媒體處理正在朝著智能化方向發(fā)展。所以本次大會的主題里有一個叫做“智能媒體”，體現(xiàn)的就是這件事情。

關(guān)于主題中的“創(chuàng)新未來”，因?yàn)槎嗝襟w技術(shù)是一種與應(yīng)用結(jié)合十分緊密的技術(shù)，所以說它必將在各行各業(yè)、方方面面發(fā)揮越來越重要的作用。大家目前聽到的、看到的很多東西都是這樣，比如無人駕駛系統(tǒng)，它首先要感知周圍的場景，要有視覺技術(shù)支撐。又比如大家看到的機(jī)器人問詢系統(tǒng)，它的核心在于語音識別、自然語言理解，也是以模擬人的聽覺和語音處理來實(shí)現(xiàn)的。

所以說，多媒體技術(shù)的智能化對經(jīng)濟(jì)社會、生產(chǎn)生活的方方面面產(chǎn)生了重大影響，這也是另一個主題“創(chuàng)新未來”的由來。

圖像識別和語音識別之外，有更多的AI應(yīng)用在我們身邊

首先呢，我們要區(qū)分人工智能和深度學(xué)習(xí)。人工智能是一種跨學(xué)科的、多學(xué)科交叉的技術(shù)，它在不同的應(yīng)用行業(yè)對其的要求也有所區(qū)別。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

現(xiàn)在所說的深度學(xué)習(xí)影響很大，它最早是在語音和圖像識別取得突破。但是，深度學(xué)習(xí)只是其中一種技術(shù)，人工智能還有很多其他的技術(shù)，遠(yuǎn)遠(yuǎn)不只深度學(xué)習(xí)這種技術(shù)，例如數(shù)據(jù)分析、模式識別、智能控制等，也都是屬于人工智能技術(shù)的范疇。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

例如數(shù)據(jù)內(nèi)容分析方面的技術(shù)，在金融行業(yè)的風(fēng)控、在股票市場的監(jiān)管、在電信行業(yè)的反欺詐、在智慧物流的調(diào)度等方面，也都在發(fā)揮重要的智能作用。此外，在工業(yè)生產(chǎn)過程中，例如各種復(fù)雜調(diào)度、零件裝配、故障檢測等，也都用到很多人工智能技術(shù)做支撐。

AI技術(shù)本身并沒有落與不落，退潮之后也沒有裸泳者

常說人工智能有“三起兩落”，現(xiàn)在正處于第三次“起”的階段，那將來還會有第三次的“落”嗎？如果有，哪些技術(shù)和應(yīng)用會成為退潮之后的裸泳者？

人工智能為什么會有所謂的“三起兩落”？因?yàn)槿藖硪恢痹诓粩嗟赝卣棺约旱闹橇Γ谧非蟾吒蟮哪繕?biāo)，并用于方方面面。

人類發(fā)明了車輛，讓我們可以跑的更快；發(fā)明制造了飛機(jī)，讓我們可以飛上天空。

所以說，人工智能的起落過程并沒有什么值得擔(dān)憂的，它只是人來在追求更高目標(biāo)過程中正常的階段性體現(xiàn)。另外，落與不落，只是發(fā)展?fàn)顩r的一種相對說法。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

但是，這一輪所謂的人工智能高潮，和以往幾次都有所不同。為什么呢？因?yàn)楸据喌娜斯ぶ悄苤赃@么熱，那是因?yàn)槠渌幍沫h(huán)境有了本質(zhì)的變化，并受到產(chǎn)業(yè)界的極大關(guān)注和參與，而前兩輪并不是這樣。

雖然從第二輪開始，產(chǎn)業(yè)界對智能系統(tǒng)開始逐步重視，但相比這一輪來說，重視程度遠(yuǎn)遠(yuǎn)不及，并沒有現(xiàn)在的普及和全面，對普通老百姓的工作和生活的影響也遠(yuǎn)不如現(xiàn)在這么大。

原因是什么？首先是現(xiàn)在的環(huán)境不一樣了，現(xiàn)在是互聯(lián)網(wǎng)時(shí)代的快速發(fā)展，另外是在大數(shù)據(jù)的背景下，再加上計(jì)算系統(tǒng)的高性能化（現(xiàn)在普通手機(jī)的計(jì)算性能抵得上以前的一臺大型計(jì)算機(jī)），使得這一輪人工智能在某些應(yīng)用方面可以做的很實(shí)，真正體現(xiàn)較高的智能特征。

當(dāng)然，由于各個行業(yè)之間千差萬別，其對人工智能技術(shù)的需求不盡相同，所以也使得人工智能對具體行業(yè)的影響各有不同。比如說對我們的聽、說、寫等相關(guān)度比較高的，以及與大數(shù)據(jù)聯(lián)系緊密的行業(yè)，影響就非常大；而對于其他的行業(yè)（需要做綜合的決策，而數(shù)據(jù)量又不夠多），影響可能就會相對較小。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

但即使是人工智能不那么熱的時(shí)候，也不能說AI技術(shù)就沒用了。事實(shí)上，人工智能已經(jīng)悄然進(jìn)入我們生活的方方面面，在潛移默化中發(fā)揮作用并影響世界。

只要人類追求智能、追求更高目標(biāo)的決心不變，人工智能的高潮就會一直存在且持續(xù)下去。

數(shù)據(jù)驅(qū)動和知識驅(qū)動相結(jié)合的思維方式，是未來AI的目標(biāo)

人類思維是一種綜合的思維，來自兩個方面：一方面是來自數(shù)據(jù)驅(qū)動的學(xué)習(xí)，通過數(shù)據(jù)在人腦中的不斷抽象，就會形成高一層的語義。也就說，基于深度學(xué)習(xí)的智能，更多的就表現(xiàn)在這個方面。

另一方面，是知識驅(qū)動展現(xiàn)的智能。人類的思考是有目的的，在同樣條件下，出于不同的目的，思考的結(jié)論可能不同；所以在同一個場景里，今天和昨天可關(guān)注的事不同。

原因是什么？因?yàn)槲覀兊哪康牟灰粯?。也就是說，人類思考同樣存在至上而下的目標(biāo)驅(qū)動；在展現(xiàn)智能方面，也存在利用高層知識去影響分析理解，這就是所謂的知識驅(qū)動。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

在復(fù)雜的應(yīng)用中，數(shù)據(jù)驅(qū)動和知識驅(qū)動都會存在，這樣才能展現(xiàn)高水平的智能，所以說這兩方面都是需要的。在我們常說的小樣本分析，更需要知識驅(qū)動發(fā)揮作用。

在數(shù)據(jù)不足時(shí)，人類依靠經(jīng)驗(yàn)也能實(shí)現(xiàn)正確的判斷和思維；這說明機(jī)器也需要借鑒其他領(lǐng)域?qū)W習(xí)的知識，提高小數(shù)據(jù)或小樣本下的學(xué)習(xí)效果，目前在這方面還存在著很多不足和缺陷，需要深入系統(tǒng)的研究。

現(xiàn)在的攝像設(shè)備更多是在被動采圖，未來將要實(shí)現(xiàn)主動視覺

在視覺這件事情上，人類的視覺范疇比我們目前見到的圖像和視頻的范疇更加廣泛。人類的視覺能感受到客觀世界的方方面面，而我們在客觀世界里能見到的物理現(xiàn)象是很多的，有聲光電熱、位置、方向、速度等等。

但目前的攝像頭只能做到被動感知。直白的說，就是你讓攝像頭照什么，它就會照什么。而人類不是這樣，當(dāng)人類在思考需要什么之后，自己就會去主動獲取什么。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

舉個例子，在同一個場景里，人類看到了一輛汽車。如果他要想把車牌看清楚，他就會調(diào)整視覺到車牌的位置；如果他想把駕駛員看清楚，他就會調(diào)整視覺到駕駛員的位置。

而我們的攝像頭在這方面就做的比較差勁了，它并不會主動根據(jù)目標(biāo)而調(diào)整自己的拍攝視覺。在主動去感知周圍的場景和全方位、立體的感知周邊環(huán)境等方面，做得很不夠。

此外，現(xiàn)在大多用的是以光學(xué)攝像頭為主的設(shè)備，但上面也說到了客觀世界除了視覺還有很多方面，而這些僅憑光學(xué)攝像頭是根本無法完全收集到的。所以我們將來會需要像激光、紅外、雷達(dá)、GPS等結(jié)合起來的攝像設(shè)備。

將來計(jì)算機(jī)的感知系統(tǒng)應(yīng)該是用綜合型的視覺來完成，而不是現(xiàn)在被動式的采圖。將來的攝像頭也應(yīng)該是一雙很聰明的慧眼，類似甚至要超過人眼的功能。

未來的Tof深度相機(jī)需要把更多信息整合到一起

在說到深度相機(jī)和傳統(tǒng)相機(jī)區(qū)別的時(shí)候，首先要說一下我們的客觀世界。

眾所周知，我們的客觀世界是三維的，我們在認(rèn)識世界的時(shí)候，深度信息、位置信息等是非常重要的。傳統(tǒng)相機(jī)的成像也好、視頻也好，都是二維的信息，缺乏深度信息。

北航教授李波：AI沒有落與不落，“應(yīng)用”才是退潮后的裸泳者

而深度相機(jī)是在傳統(tǒng)相機(jī)的基礎(chǔ)上，加上了深度信息，使得機(jī)器在分析周圍場景的時(shí)候，多了一維信息，從而提高了分析的準(zhǔn)確性。

同時(shí)，由于客觀世界遠(yuǎn)遠(yuǎn)不止深度，還有很多像溫度、濕度、速度、方向等等，所以未來的深度相機(jī)應(yīng)該要把更多的信息也整合到一起。

不過，在深度信息的獲取方面，如在特定場景、遮擋、距離等的情況下，準(zhǔn)確感知深度就存在著較大的困難。

所以目前的應(yīng)用也相對有限，像只在室內(nèi)、倉庫、游戲交互等短距離的場景下，才能有理想的效果，而在其他場景則會大打折扣。

最后，記得關(guān)注微信公眾號：鎂客網(wǎng)（im2maker），更多干貨在等你！

鎂客網(wǎng)

科技 | 人文 | 行業(yè)

微信ID：im2maker

長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

国内精品久久影院综合日日,中文字幕乱码亚洲无线三区,欧美亚洲综合成人专区,51久久夜色精品国产水果派解说,国语自产精品视频在线第100页

北航教授李波：說AI會有低潮就是胡扯，這是人類長期的追求

AI熱起來，首先爆發(fā)在多媒體領(lǐng)域

圖像識別和語音識別之外，有更多的AI應(yīng)用在我們身邊

AI技術(shù)本身并沒有落與不落，退潮之后也沒有裸泳者

數(shù)據(jù)驅(qū)動和知識驅(qū)動相結(jié)合的思維方式，是未來AI的目標(biāo)

現(xiàn)在的攝像設(shè)備更多是在被動采圖，未來將要實(shí)現(xiàn)主動視覺

未來的Tof深度相機(jī)需要把更多信息整合到一起

最新文章

注冊

国内精品久久影院综合日日,中文字幕乱码亚洲无线三区,欧美亚洲综合成人专区,51久久夜色精品国产水果派解说,国语自产精品视频在线第100页

北航教授李波：說AI會有低潮就是胡扯，這是人類長期的追求

AI熱起來，首先爆發(fā)在多媒體領(lǐng)域

圖像識別和語音識別之外，有更多的AI應(yīng)用在我們身邊

AI技術(shù)本身并沒有落與不落，退潮之后也沒有裸泳者

數(shù)據(jù)驅(qū)動和知識驅(qū)動相結(jié)合的思維方式，是未來AI的目標(biāo)

現(xiàn)在的攝像設(shè)備更多是在被動采圖，未來將要實(shí)現(xiàn)主動視覺

未來的Tof深度相機(jī)需要把更多信息整合到一起

最新文章

登錄

注冊

AI熱起來，首先爆發(fā)在多媒體領(lǐng)域

圖像識別和語音識別之外，有更多的AI應(yīng)用在我們身邊

AI技術(shù)本身并沒有落與不落，退潮之后也沒有裸泳者

現(xiàn)在的攝像設(shè)備更多是在被動采圖，未來將要實(shí)現(xiàn)主動視覺