AI總會有低潮,但為什么科學(xué)家們一直有快感?
攻克技術(shù)難關(guān)本身就是一件很有成就感的事情,那當(dāng)然也是很有快感的事情。
自1956年,4位年輕的美國科學(xué)家提出“人工智能(AI)”的概念以來,在長達(dá)61年的發(fā)展中,AI更是歷經(jīng)了“三起兩落”的曲折歷程。
在這期間,有對技術(shù)盲目崇拜的瘋狂,也有對未來充滿疑惑的低潮。不過從總體上看,我們還是可以說人工智能一直在螺旋式上升的狀態(tài),其中有一些技術(shù)甚至對社會的很多相關(guān)行業(yè)都產(chǎn)生了重大影響和顛覆(具體請見文章:「深度」跨越一甲子的AI已在何處迎來爆發(fā)?16位頂級專家給出了答案)。
由此,也引發(fā)了業(yè)內(nèi)對人工智能的眾多思考和期待。
郭延文 南京大學(xué)計算機系教授
南京大學(xué)計算機技術(shù)與科學(xué)系教授、博士生導(dǎo)師,計算機軟件新技術(shù)國家重點實驗室的郭延文,一直致力于計算機技術(shù)方面的研究,對目前最熱門的AI和VR相關(guān)領(lǐng)域有著深刻而獨到的見解。
郭延文認(rèn)為,終極狀態(tài)下的人工智能,借助VR的強力和全面加持,將會讓人類無所不能,甚至人們進入虛擬現(xiàn)實也不再需要任何介質(zhì)。那時,誰都可以隨時將自己置身于一個包括視覺、聽覺、觸感和嗅覺全體感的虛擬環(huán)境中,而不用借助人體器官的感覺。
做AI技術(shù)研究這么枯燥,科學(xué)家會有快感嗎?
據(jù)研究表明,人的感覺器官中接受信息最多的是視覺器官,視覺信息占大腦接受外部信息的80%,AI的研究是為了讓機器像人一樣智能,為了達(dá)到這個目標(biāo),讓機器能夠像人一樣通過眼睛觀察、理解和感知現(xiàn)實世界就尤為重要,這就是計算機視覺的研究范疇,是AI應(yīng)用的關(guān)鍵技術(shù)。
郭延文教授和他的技術(shù)團隊一直以來都在做計算技術(shù)方面的研究,在常人眼里這是一份會枯燥而乏味的工作。自然,從事這項工作何來快感?
事實恰好相反,科學(xué)家的快感始終是滿滿到讓人羨慕的!
他們的快感來自于攻關(guān)克難的過程。
郭延文說:“在計算機科學(xué)領(lǐng)域,我做兩個方面的研究,一個是計算機圖形學(xué)與虛擬現(xiàn)實,另一個是圖像視頻處理和計算機視覺。
“做圖形,就是在計算機中把我們看到的現(xiàn)實世界進行建模,然后把它繪制出來,就像你打的計算機游戲、看的三維動畫電影等,都是借助計算機圖形技術(shù)生成的;另外的圖像視頻處理和計算機視覺,作為人工智能技術(shù)重要的落地場景,比如說視頻里的人、車和物的檢測、家里門禁系統(tǒng)的人臉識別等,都非常具有現(xiàn)實應(yīng)用價值。”
從這個層面上看,在做這些工作,從過程到結(jié)果,相對于其他技術(shù)門類來說似乎顯得更形象、更直觀。但是,其中仍然不乏大量的枯燥內(nèi)容。
“話又說回來,這一領(lǐng)域里畢竟也有很多偏向于基礎(chǔ)理論方面的研究,比如說理論計算機科學(xué)、量子計算等等。我也有多位同事從事這方面的研究,在外人看來這多少略顯枯燥,然而專注于這方面的科研人員、科學(xué)家,他們對自身領(lǐng)域的感情,那絕對都是真愛!
“就像偉大的數(shù)學(xué)家發(fā)現(xiàn)數(shù)學(xué)之美,我們也能發(fā)現(xiàn)計算之美,大家都很享受研究的過程。另外,攻克技術(shù)難關(guān)本身就是一件很有成就感的事情,那當(dāng)然也是很有快感的事情。”
如果一項技術(shù)遲遲未能突破,科學(xué)家會鳴金收兵、偃旗息鼓嗎?
很顯然,這是個尷尬而難堪的話題。
數(shù)學(xué)史上最著名的“無解難題”之一、由法國數(shù)學(xué)家皮耶·德·費瑪在17世紀(jì)30年代提出的“費馬大定理”,就是一個典型的案例。這一定理在提出之后,憋死了無數(shù)英雄好漢!直到三百多年后的1995年,才被英國數(shù)學(xué)家安德魯·懷爾斯徹底證明。
幾乎在任何人的生活和工作中,失敗或是挫折總是不可避免的。對此,郭延文也有著自己的切身體會:“說一個典型的例子吧。前年我們做了一個借助航空攝影進行三維場景重建的科研項目,用無人機為城市、工廠和港口等做三維實景建模,我們研發(fā)了國內(nèi)第一個自帶操作系統(tǒng)的航空攝影器材。記得有一次進行實驗的時候,無人機在天上拍了一圈,落地后我們發(fā)現(xiàn),系統(tǒng)盤里竟然一張照片、一點數(shù)據(jù)都沒有!
“我現(xiàn)在還清楚的記得,當(dāng)時大家的看到之后,心都涼了......心想是不是系統(tǒng)設(shè)計方向錯了、理論模型有缺陷?......那種蒼涼、失望,以至于懷疑人生的感覺,到現(xiàn)在仍然記憶猶新。”
不過,我們相信,在成功的解決了問題之后,那種絕望的經(jīng)歷就成了科學(xué)研究路上美麗的墊腳石。
因此說,做研究的很多時候很難設(shè)定一個時間表。但是研究也是有時效性的,如無人駕駛技術(shù),很多巨頭都在做,這里的各種研究大概都是有時間表的。如果說你慢了,就會被別人超越。
所以,這一般也是學(xué)術(shù)和產(chǎn)業(yè)的區(qū)別。
計算機視覺完全達(dá)到甚至超過人眼,我們還要等多久?
眾所周知的是,目前計算機視覺在一個特定場景下的特定任務(wù),已經(jīng)達(dá)到和超過人眼的水平。比如正面的人臉識別,已經(jīng)有一些較成熟的算法了。
不過在一般環(huán)境下的場景,計算機視覺技術(shù)距離人眼的認(rèn)知水平還有較大差距。
郭延文說:“計算機視覺跟人眼的差距主要在兩個方面。一個是信息的采集。人眼是天然感知深度的,對環(huán)境、光照等具有很好的魯棒性。但是計算機視覺是通過配備的攝像設(shè)備實現(xiàn)的,單目視覺對視點和光線等的變化以及復(fù)雜環(huán)境的魯棒性較差。”
“第二就是對信息的歸納和推理,雖然目前人工智能技術(shù)已經(jīng)有了很大發(fā)展,經(jīng)典學(xué)習(xí)理論和深度學(xué)習(xí)技術(shù)等也在不斷進步,但相比人類歸納、聯(lián)想和推理的能力,還有很大的差距,從而也造成了計算機視覺和人眼認(rèn)知的較大差距。”
但是我們相信,隨著大數(shù)據(jù)、人工智能的發(fā)展,其距離人眼視覺的差距將會越來越小,并最終實現(xiàn)超越。
擴展:自在特殊情況下,如強光、相似障礙物(如一群讓人眼花的斑馬)等,如何實現(xiàn)準(zhǔn)確的視覺識別與處理?
這兩個場景下的問題,是傳統(tǒng)的基于可見光的圖像處理領(lǐng)域,比較難以處理的問題。
不過現(xiàn)在的圖像處理技術(shù)已經(jīng)開始在做基于RGB-D的、含深度圖像的分析和理解。如強光或陰影環(huán)境下,如果沒有深度信息,計算機經(jīng)常就會識別不準(zhǔn)。但是如果有了深度信息,那計算機的各種算法、處理就會工作的更好。
另外對于相似障礙物,也是一樣的道理。
就像手機來說,以后大家的手機應(yīng)該會逐步標(biāo)配含有深度感知功能的攝像頭了。
在VR的加持下,終極的人工智能將會讓人類自由穿梭時空
計算機早期叫計算器、電腦、微機等,人工智能就是讓機器具有像人一樣的智能。近些年由于大數(shù)據(jù)、機器學(xué)習(xí)、深度學(xué)習(xí)等的興起和發(fā)展,計算機和人工智能都到了很高的水平。
“我所設(shè)想的,他們的最終形態(tài)應(yīng)該是計算機或者機器,具有像人一樣的智能,能夠用我們所能想到的各種方法,讓我們?nèi)祟惖纳罡篮谩T偌由咸摂M現(xiàn)實,未來你想干什么、想要什么,計算機都能幫你實現(xiàn)。”郭延文說到。“人們進入虛擬現(xiàn)實也不再需要任何介質(zhì),隨時可以將自己置身于一個包括視覺、聽覺、觸感和嗅覺全體感的虛擬環(huán)境中。最終讓人不想?yún)^(qū)分哪里是現(xiàn)實、哪里是虛幻,這種似夢非夢的感覺肯定會棒極了!”
由此再加以延伸的話,我們是不是可以這樣理解:在虛擬現(xiàn)實的加持下,終極的人工智能將會讓人類自由穿梭時空?
比如你要去火星又坐不起航天飛機,那就來個虛擬現(xiàn)實吧,它會讓你“想到就到”。剛開始,你還想著動動手腳,走兩步或者觸摸個什么東西。到后來,如果加入腦神經(jīng)觸發(fā)等技術(shù),你根本不用動,就能完全實現(xiàn)諸如走動、觸摸等各種由肢體或器官帶來的感覺。
到了那個時候,物質(zhì)的存在似乎就不那么重要了。
VR和AR是一對手足兄弟,誰也不會取代誰
近來,業(yè)內(nèi)一直有觀點稱,今后AR將取代或吞并VR,因為人們更喜歡在真實的場景中實現(xiàn)VR的各種效果。事實真的是這樣嗎?
對此,郭延文教授有自己的理解,“VR和AR各有各的用途。VR主要應(yīng)用領(lǐng)域包括文化教育、數(shù)字娛樂、醫(yī)療、科學(xué)仿真等等;對比來說,AR的話,看到現(xiàn)實場景,利用VR技術(shù),用虛擬物體去增強我們對現(xiàn)實世界的觀察和感知。它的意義不僅僅是對場景的顯示,更重要的是對現(xiàn)實世界更強化的理解和認(rèn)知。而要做到這種理解,就必須要用到人工智能技術(shù),如計算機視覺、圖形圖像識別等。”
這樣來看,我們很難斷定VR和AR誰會取代誰,只能說二者在未來會在各自特定的領(lǐng)域和行業(yè)內(nèi)實現(xiàn)越來越多的結(jié)合,從而獲得更大的發(fā)展。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
