AI總會(huì)有低潮,但為什么科學(xué)家們一直有快感?
攻克技術(shù)難關(guān)本身就是一件很有成就感的事情,那當(dāng)然也是很有快感的事情。
自1956年,4位年輕的美國科學(xué)家提出“人工智能(AI)”的概念以來,在長達(dá)61年的發(fā)展中,AI更是歷經(jīng)了“三起兩落”的曲折歷程。
在這期間,有對(duì)技術(shù)盲目崇拜的瘋狂,也有對(duì)未來充滿疑惑的低潮。不過從總體上看,我們還是可以說人工智能一直在螺旋式上升的狀態(tài),其中有一些技術(shù)甚至對(duì)社會(huì)的很多相關(guān)行業(yè)都產(chǎn)生了重大影響和顛覆(具體請(qǐng)見文章:「深度」跨越一甲子的AI已在何處迎來爆發(fā)?16位頂級(jí)專家給出了答案)。
由此,也引發(fā)了業(yè)內(nèi)對(duì)人工智能的眾多思考和期待。
郭延文 南京大學(xué)計(jì)算機(jī)系教授
南京大學(xué)計(jì)算機(jī)技術(shù)與科學(xué)系教授、博士生導(dǎo)師,計(jì)算機(jī)軟件新技術(shù)國家重點(diǎn)實(shí)驗(yàn)室的郭延文,一直致力于計(jì)算機(jī)技術(shù)方面的研究,對(duì)目前最熱門的AI和VR相關(guān)領(lǐng)域有著深刻而獨(dú)到的見解。
郭延文認(rèn)為,終極狀態(tài)下的人工智能,借助VR的強(qiáng)力和全面加持,將會(huì)讓人類無所不能,甚至人們進(jìn)入虛擬現(xiàn)實(shí)也不再需要任何介質(zhì)。那時(shí),誰都可以隨時(shí)將自己置身于一個(gè)包括視覺、聽覺、觸感和嗅覺全體感的虛擬環(huán)境中,而不用借助人體器官的感覺。
做AI技術(shù)研究這么枯燥,科學(xué)家會(huì)有快感嗎?
據(jù)研究表明,人的感覺器官中接受信息最多的是視覺器官,視覺信息占大腦接受外部信息的80%,AI的研究是為了讓機(jī)器像人一樣智能,為了達(dá)到這個(gè)目標(biāo),讓機(jī)器能夠像人一樣通過眼睛觀察、理解和感知現(xiàn)實(shí)世界就尤為重要,這就是計(jì)算機(jī)視覺的研究范疇,是AI應(yīng)用的關(guān)鍵技術(shù)。
郭延文教授和他的技術(shù)團(tuán)隊(duì)一直以來都在做計(jì)算技術(shù)方面的研究,在常人眼里這是一份會(huì)枯燥而乏味的工作。自然,從事這項(xiàng)工作何來快感?
事實(shí)恰好相反,科學(xué)家的快感始終是滿滿到讓人羨慕的!
他們的快感來自于攻關(guān)克難的過程。
郭延文說:“在計(jì)算機(jī)科學(xué)領(lǐng)域,我做兩個(gè)方面的研究,一個(gè)是計(jì)算機(jī)圖形學(xué)與虛擬現(xiàn)實(shí),另一個(gè)是圖像視頻處理和計(jì)算機(jī)視覺。
“做圖形,就是在計(jì)算機(jī)中把我們看到的現(xiàn)實(shí)世界進(jìn)行建模,然后把它繪制出來,就像你打的計(jì)算機(jī)游戲、看的三維動(dòng)畫電影等,都是借助計(jì)算機(jī)圖形技術(shù)生成的;另外的圖像視頻處理和計(jì)算機(jī)視覺,作為人工智能技術(shù)重要的落地場(chǎng)景,比如說視頻里的人、車和物的檢測(cè)、家里門禁系統(tǒng)的人臉識(shí)別等,都非常具有現(xiàn)實(shí)應(yīng)用價(jià)值。”
從這個(gè)層面上看,在做這些工作,從過程到結(jié)果,相對(duì)于其他技術(shù)門類來說似乎顯得更形象、更直觀。但是,其中仍然不乏大量的枯燥內(nèi)容。
“話又說回來,這一領(lǐng)域里畢竟也有很多偏向于基礎(chǔ)理論方面的研究,比如說理論計(jì)算機(jī)科學(xué)、量子計(jì)算等等。我也有多位同事從事這方面的研究,在外人看來這多少略顯枯燥,然而專注于這方面的科研人員、科學(xué)家,他們對(duì)自身領(lǐng)域的感情,那絕對(duì)都是真愛!
“就像偉大的數(shù)學(xué)家發(fā)現(xiàn)數(shù)學(xué)之美,我們也能發(fā)現(xiàn)計(jì)算之美,大家都很享受研究的過程。另外,攻克技術(shù)難關(guān)本身就是一件很有成就感的事情,那當(dāng)然也是很有快感的事情。”
如果一項(xiàng)技術(shù)遲遲未能突破,科學(xué)家會(huì)鳴金收兵、偃旗息鼓嗎?
很顯然,這是個(gè)尷尬而難堪的話題。
數(shù)學(xué)史上最著名的“無解難題”之一、由法國數(shù)學(xué)家皮耶·德·費(fèi)瑪在17世紀(jì)30年代提出的“費(fèi)馬大定理”,就是一個(gè)典型的案例。這一定理在提出之后,憋死了無數(shù)英雄好漢!直到三百多年后的1995年,才被英國數(shù)學(xué)家安德魯·懷爾斯徹底證明。
幾乎在任何人的生活和工作中,失敗或是挫折總是不可避免的。對(duì)此,郭延文也有著自己的切身體會(huì):“說一個(gè)典型的例子吧。前年我們做了一個(gè)借助航空攝影進(jìn)行三維場(chǎng)景重建的科研項(xiàng)目,用無人機(jī)為城市、工廠和港口等做三維實(shí)景建模,我們研發(fā)了國內(nèi)第一個(gè)自帶操作系統(tǒng)的航空攝影器材。記得有一次進(jìn)行實(shí)驗(yàn)的時(shí)候,無人機(jī)在天上拍了一圈,落地后我們發(fā)現(xiàn),系統(tǒng)盤里竟然一張照片、一點(diǎn)數(shù)據(jù)都沒有!
“我現(xiàn)在還清楚的記得,當(dāng)時(shí)大家的看到之后,心都涼了......心想是不是系統(tǒng)設(shè)計(jì)方向錯(cuò)了、理論模型有缺陷?......那種蒼涼、失望,以至于懷疑人生的感覺,到現(xiàn)在仍然記憶猶新。”
不過,我們相信,在成功的解決了問題之后,那種絕望的經(jīng)歷就成了科學(xué)研究路上美麗的墊腳石。
因此說,做研究的很多時(shí)候很難設(shè)定一個(gè)時(shí)間表。但是研究也是有時(shí)效性的,如無人駕駛技術(shù),很多巨頭都在做,這里的各種研究大概都是有時(shí)間表的。如果說你慢了,就會(huì)被別人超越。
所以,這一般也是學(xué)術(shù)和產(chǎn)業(yè)的區(qū)別。
計(jì)算機(jī)視覺完全達(dá)到甚至超過人眼,我們還要等多久?
眾所周知的是,目前計(jì)算機(jī)視覺在一個(gè)特定場(chǎng)景下的特定任務(wù),已經(jīng)達(dá)到和超過人眼的水平。比如正面的人臉識(shí)別,已經(jīng)有一些較成熟的算法了。
不過在一般環(huán)境下的場(chǎng)景,計(jì)算機(jī)視覺技術(shù)距離人眼的認(rèn)知水平還有較大差距。
郭延文說:“計(jì)算機(jī)視覺跟人眼的差距主要在兩個(gè)方面。一個(gè)是信息的采集。人眼是天然感知深度的,對(duì)環(huán)境、光照等具有很好的魯棒性。但是計(jì)算機(jī)視覺是通過配備的攝像設(shè)備實(shí)現(xiàn)的,單目視覺對(duì)視點(diǎn)和光線等的變化以及復(fù)雜環(huán)境的魯棒性較差。”
“第二就是對(duì)信息的歸納和推理,雖然目前人工智能技術(shù)已經(jīng)有了很大發(fā)展,經(jīng)典學(xué)習(xí)理論和深度學(xué)習(xí)技術(shù)等也在不斷進(jìn)步,但相比人類歸納、聯(lián)想和推理的能力,還有很大的差距,從而也造成了計(jì)算機(jī)視覺和人眼認(rèn)知的較大差距。”
但是我們相信,隨著大數(shù)據(jù)、人工智能的發(fā)展,其距離人眼視覺的差距將會(huì)越來越小,并最終實(shí)現(xiàn)超越。
擴(kuò)展:自在特殊情況下,如強(qiáng)光、相似障礙物(如一群讓人眼花的斑馬)等,如何實(shí)現(xiàn)準(zhǔn)確的視覺識(shí)別與處理?
這兩個(gè)場(chǎng)景下的問題,是傳統(tǒng)的基于可見光的圖像處理領(lǐng)域,比較難以處理的問題。
不過現(xiàn)在的圖像處理技術(shù)已經(jīng)開始在做基于RGB-D的、含深度圖像的分析和理解。如強(qiáng)光或陰影環(huán)境下,如果沒有深度信息,計(jì)算機(jī)經(jīng)常就會(huì)識(shí)別不準(zhǔn)。但是如果有了深度信息,那計(jì)算機(jī)的各種算法、處理就會(huì)工作的更好。
另外對(duì)于相似障礙物,也是一樣的道理。
就像手機(jī)來說,以后大家的手機(jī)應(yīng)該會(huì)逐步標(biāo)配含有深度感知功能的攝像頭了。
在VR的加持下,終極的人工智能將會(huì)讓人類自由穿梭時(shí)空
計(jì)算機(jī)早期叫計(jì)算器、電腦、微機(jī)等,人工智能就是讓機(jī)器具有像人一樣的智能。近些年由于大數(shù)據(jù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等的興起和發(fā)展,計(jì)算機(jī)和人工智能都到了很高的水平。
“我所設(shè)想的,他們的最終形態(tài)應(yīng)該是計(jì)算機(jī)或者機(jī)器,具有像人一樣的智能,能夠用我們所能想到的各種方法,讓我們?nèi)祟惖纳罡篮?。再加上虛擬現(xiàn)實(shí),未來你想干什么、想要什么,計(jì)算機(jī)都能幫你實(shí)現(xiàn)。”郭延文說到。“人們進(jìn)入虛擬現(xiàn)實(shí)也不再需要任何介質(zhì),隨時(shí)可以將自己置身于一個(gè)包括視覺、聽覺、觸感和嗅覺全體感的虛擬環(huán)境中。最終讓人不想?yún)^(qū)分哪里是現(xiàn)實(shí)、哪里是虛幻,這種似夢(mèng)非夢(mèng)的感覺肯定會(huì)棒極了!”
由此再加以延伸的話,我們是不是可以這樣理解:在虛擬現(xiàn)實(shí)的加持下,終極的人工智能將會(huì)讓人類自由穿梭時(shí)空?
比如你要去火星又坐不起航天飛機(jī),那就來個(gè)虛擬現(xiàn)實(shí)吧,它會(huì)讓你“想到就到”。剛開始,你還想著動(dòng)動(dòng)手腳,走兩步或者觸摸個(gè)什么東西。到后來,如果加入腦神經(jīng)觸發(fā)等技術(shù),你根本不用動(dòng),就能完全實(shí)現(xiàn)諸如走動(dòng)、觸摸等各種由肢體或器官帶來的感覺。
到了那個(gè)時(shí)候,物質(zhì)的存在似乎就不那么重要了。
VR和AR是一對(duì)手足兄弟,誰也不會(huì)取代誰
近來,業(yè)內(nèi)一直有觀點(diǎn)稱,今后AR將取代或吞并VR,因?yàn)槿藗兏矚g在真實(shí)的場(chǎng)景中實(shí)現(xiàn)VR的各種效果。事實(shí)真的是這樣嗎?
對(duì)此,郭延文教授有自己的理解,“VR和AR各有各的用途。VR主要應(yīng)用領(lǐng)域包括文化教育、數(shù)字娛樂、醫(yī)療、科學(xué)仿真等等;對(duì)比來說,AR的話,看到現(xiàn)實(shí)場(chǎng)景,利用VR技術(shù),用虛擬物體去增強(qiáng)我們對(duì)現(xiàn)實(shí)世界的觀察和感知。它的意義不僅僅是對(duì)場(chǎng)景的顯示,更重要的是對(duì)現(xiàn)實(shí)世界更強(qiáng)化的理解和認(rèn)知。而要做到這種理解,就必須要用到人工智能技術(shù),如計(jì)算機(jī)視覺、圖形圖像識(shí)別等。”
這樣來看,我們很難斷定VR和AR誰會(huì)取代誰,只能說二者在未來會(huì)在各自特定的領(lǐng)域和行業(yè)內(nèi)實(shí)現(xiàn)越來越多的結(jié)合,從而獲得更大的發(fā)展。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
