吳恩達(dá)談深度學(xué)習(xí)局限:AI 經(jīng)濟(jì)價(jià)值目前僅來(lái)自監(jiān)督學(xué)習(xí)
《財(cái)富》刊登吳恩達(dá)專訪,吳恩達(dá)介紹了百度內(nèi)部深度學(xué)習(xí)平臺(tái)等人工智能應(yīng)用。
《財(cái)富》近日刊登吳恩達(dá)專訪,吳恩達(dá)介紹了百度內(nèi)部深度學(xué)習(xí)平臺(tái)等人工智能應(yīng)用。吳恩達(dá)還指出,近年來(lái) AI 發(fā)展主要得益于數(shù)據(jù)(燃料)和計(jì)算力(引擎)的發(fā)展,眼下數(shù)據(jù)比計(jì)算力發(fā)展稍快(給引擎的燃料還夠),但硬件發(fā)展日益加快,在某些領(lǐng)域甚至超過(guò)了數(shù)據(jù)(給引擎的燃料不夠),要努力保持兩者同步發(fā)展 AI 才能繼續(xù)往前。
2016 年 5 月 23 日,《財(cái)富》網(wǎng)站刊登了對(duì)吳恩達(dá)在加州森尼韋爾的百度人工智能實(shí)驗(yàn)室接受了《財(cái)富》雜志的專訪,他談了幾個(gè)問(wèn)題:(1)為什么現(xiàn)在人工智能這么火;(2)企業(yè)是如何利用人工智能來(lái)賺錢;(3)為什么人工智能滅世論嚴(yán)重夸大。
目前 AI 創(chuàng)造的經(jīng)濟(jì)價(jià)值幾乎全部來(lái)自監(jiān)督學(xué)習(xí)
Fortune:你將如何定義人工智能,或者說(shuō)商業(yè)上可行的人工智能?
吳恩達(dá):我們?cè)谶^(guò)去幾年中看到,計(jì)算機(jī)在處理數(shù)據(jù)以進(jìn)行預(yù)測(cè)這方面做得越來(lái)越好了。這既包括預(yù)測(cè)用戶最有可能點(diǎn)擊什么樣的廣告,也包括在圖片中識(shí)別出人、預(yù)測(cè)哪些網(wǎng)頁(yè)最符合你的搜索查詢需求——以及數(shù)百個(gè)其他的諸如此類的例子。許多這樣的應(yīng)用可以讓用戶的數(shù)字體驗(yàn)變得更美好,而有些時(shí)候這些改變也提高了企業(yè)的技術(shù)最低門檻。
Fortune:是否可以說(shuō),目前主流的人工智能主要關(guān)心從數(shù)據(jù)中識(shí)別出模式,而不太關(guān)心建造出能像人類一樣思考的計(jì)算機(jī)?
吳恩達(dá):盡管人工智能常常被過(guò)度宣傳,我仍認(rèn)為人工智能的進(jìn)展程度已遠(yuǎn)遠(yuǎn)超出了許多人的想象。目前,幾乎所有由人工智能創(chuàng)造的經(jīng)濟(jì)價(jià)值都來(lái)自監(jiān)督學(xué)習(xí)技術(shù)。監(jiān)督學(xué)習(xí)的意思是,基于系統(tǒng)曾經(jīng)接受過(guò)的其他實(shí)例的輸入,來(lái)學(xué)習(xí)對(duì)結(jié)果進(jìn)行預(yù)測(cè)或?qū)|西進(jìn)行分類。這些任務(wù)可以是:“給你一幅圖片,請(qǐng)把那個(gè)人從圖里找出來(lái)”,“給你一個(gè)網(wǎng)頁(yè),請(qǐng)預(yù)測(cè)用戶是否會(huì)點(diǎn)擊這個(gè)網(wǎng)頁(yè)”或者“給你一封電子郵件,請(qǐng)判斷它是否是垃圾郵件。”
語(yǔ)音識(shí)別是這方面的另一個(gè)例子,在語(yǔ)音識(shí)別中輸入的是音頻剪輯,而輸出是音頻內(nèi)容轉(zhuǎn)換成的文本。
機(jī)器學(xué)習(xí)這幾年之間發(fā)生了什么
Fortune:由于蘋果 Siri 提供的新功能,語(yǔ)音識(shí)別最近比較火。下一步怎樣才能讓智能助理型的應(yīng)用更加有用呢?
吳恩達(dá):我們想要追求的目標(biāo)是,讓與計(jì)算機(jī)交談變得像與人交談一樣自然。這是一個(gè)遠(yuǎn)期目標(biāo),我們短期內(nèi)不能實(shí)現(xiàn)它,但當(dāng)我們實(shí)現(xiàn)這個(gè)目標(biāo)后,就會(huì)有更多的用戶想使用它。目前,很大程度上只是一些技術(shù)熱衷者在使用語(yǔ)音功能。世界上的大部分人并不使用語(yǔ)音來(lái)與電腦互動(dòng)。
與機(jī)器交談的感覺(jué)仍然和與人交談的感覺(jué)非常不同:你只能夠交談某些方面的東西,你不能在交談中打斷機(jī)器人。有些時(shí)候,機(jī)器人的回應(yīng)會(huì)比較慢。有些時(shí)候,你說(shuō)的東西會(huì)令機(jī)器非常困惑。比方說(shuō),如果我對(duì)計(jì)算機(jī)說(shuō),“請(qǐng)打電話給卡洛,號(hào)碼 555-1000……不,等等,1005”,計(jì)算機(jī)就很難理解我的話,也很難采取正確的行動(dòng)。
Fortune:幾年之前,沒(méi)有幾家人工智能是面向消費(fèi)者的,而今天像語(yǔ)音識(shí)別和能理解照片的算法這樣的技術(shù)已很普遍。這幾年之間發(fā)生了什么?
吳恩達(dá):機(jī)器學(xué)習(xí)方面的大量進(jìn)展是由計(jì)算能力的提高和數(shù)據(jù)的增長(zhǎng)所驅(qū)動(dòng)的——不過(guò)我這個(gè)觀點(diǎn)在學(xué)界可能不太受歡迎。我們可以把它類比于建造太空火箭:你需要大功率火箭發(fā)動(dòng)機(jī),你也需要大量的燃料。如果你有許多燃料但只擁有小功率發(fā)動(dòng)機(jī),你的火箭大概無(wú)法飛離地面。如果你擁有大功率發(fā)動(dòng)機(jī)但只有一點(diǎn)點(diǎn)燃料,你的火箭即使飛上天也無(wú)法進(jìn)入軌道。
只有當(dāng)你同時(shí)具有了大功率發(fā)動(dòng)機(jī)和大量燃料時(shí)你才能去探索太空中的奇妙之地。作為類比,大型電腦相當(dāng)于火箭發(fā)動(dòng)機(jī)(在百度我們已經(jīng)可以建造超級(jí)電腦了),而大規(guī)模數(shù)據(jù)則相當(dāng)于火箭燃料。
在過(guò)去十年中,數(shù)據(jù)的增長(zhǎng)或者說(shuō)火箭燃料的增長(zhǎng)略微超出了我們建造火箭發(fā)動(dòng)機(jī)以利用燃料的能力。不過(guò)目前,我們?cè)跀U(kuò)增火箭發(fā)動(dòng)機(jī)方面的能力已經(jīng)追了上來(lái),在有些時(shí)候甚至反過(guò)來(lái)超過(guò)了我們提供火箭燃料的能力。我們必須努力工作才能同時(shí)擴(kuò)展這兩種能力。
Fortune:好像現(xiàn)在每當(dāng)深度學(xué)習(xí)被應(yīng)用于某個(gè)任務(wù)時(shí),它都能為那個(gè)任務(wù)產(chǎn)生最佳結(jié)果。我們是否也能夠把深度學(xué)習(xí)應(yīng)用于企業(yè)銷售數(shù)據(jù),從而比傳統(tǒng)企業(yè)軟件或流行的“大數(shù)據(jù)”工具更快地找到有意義的商業(yè)洞見(jiàn)?
吳恩達(dá):深度學(xué)習(xí)的一大局限是,它所創(chuàng)造的幾乎所有價(jià)值都來(lái)自“從輸入到輸出的映射”的方法。比方說(shuō)你有一些企業(yè)數(shù)據(jù),其中 X 或許是用戶在亞馬遜上的帳號(hào),而 Y 是“用戶是否進(jìn)行了購(gòu)物?”這樣一個(gè)問(wèn)題。如果你擁有關(guān)于 X-Y 配對(duì)的大量數(shù)據(jù),那么你就能夠利用深度學(xué)習(xí)來(lái)進(jìn)行預(yù)測(cè)。然而,如果讓電腦自己在數(shù)據(jù)中進(jìn)行探索和發(fā)現(xiàn),這方面的算法在很大程度上尚處于搖籃期。
正因?yàn)槿绱?,那些關(guān)于人工智能邪惡殺人機(jī)器人和超級(jí)智能的宣傳都是嚴(yán)重夸大的。上面提到的 “從 X 到 Y 的映射”只是一種很狹窄的學(xué)習(xí)方式。而人類可以以多得多的方式來(lái)學(xué)習(xí)。這種“從 X 到 Y 的映射”方法在技術(shù)上被稱為監(jiān)督學(xué)習(xí)。我認(rèn)為,關(guān)于監(jiān)督學(xué)習(xí)之外的其他學(xué)習(xí)方式,我們?nèi)匀粵](méi)有找到正確的思路。
中國(guó)市場(chǎng)上的人工智能
Fortune:在美國(guó)谷歌和 Facebook 的工作引人矚目。能否告訴我們,百度用人工智能做了些什么?
吳恩達(dá):百度有一件事情做的很不錯(cuò),它創(chuàng)造了一個(gè)機(jī)器學(xué)習(xí)內(nèi)部平臺(tái)。這個(gè)平臺(tái)能夠讓全公司的工程師、包括那些不研究人工智能的人都能以各種創(chuàng)造性的方式來(lái)利用深度學(xué)習(xí)——他們會(huì)用深度學(xué)習(xí)創(chuàng)造出一些像我這樣的人工智能研究者從未想到過(guò)的東西。除了我們核心的網(wǎng)絡(luò)搜索、圖像搜索和廣告業(yè)務(wù)外,深度學(xué)習(xí)還支持著大量的創(chuàng)意產(chǎn)品,這些創(chuàng)意產(chǎn)品構(gòu)成一條非常長(zhǎng)的長(zhǎng)尾。
例如,我們的電腦安全產(chǎn)品使用深度學(xué)習(xí)來(lái)識(shí)別安全威脅。我從未想過(guò)深度學(xué)習(xí)可以做這個(gè),也不知道該怎么做。我們也使用深度學(xué)習(xí)來(lái)提前預(yù)測(cè)一個(gè)硬盤何時(shí)會(huì)崩潰,而這就既增加了系統(tǒng)的可靠性,也降低了數(shù)據(jù)中心的成本。
Fortune:百度也制造了類似谷歌眼鏡的產(chǎn)品,還制造了數(shù)字助理,甚至智能自行車。這些產(chǎn)品有市場(chǎng)嗎?還是說(shuō)它們目前只是一些有趣的實(shí)驗(yàn)而已?
吳恩達(dá):我認(rèn)為這些目前還屬于研究性探索。不過(guò),通過(guò)我們從社區(qū)中獲得的反饋,我們了解到對(duì)智能自行車和可穿戴攝像機(jī)的需求是確實(shí)存在的。
實(shí)際上幾周之前,我們剛剛在中國(guó)發(fā)布一個(gè)名叫 Dulife 的新產(chǎn)品的 demo,該產(chǎn)品使用計(jì)算視覺(jué)和自然語(yǔ)言處理技術(shù)來(lái)告訴盲人其面前有什么東西。比方說(shuō),在中國(guó),有好幾種面值不同的鈔票大小相同,而盲人必須通過(guò)觸摸才能知道它們哪里不一樣。然而,當(dāng)鈔票被反復(fù)使用后,它的盲文部分會(huì)磨損,這樣盲人就很難辨別其面值。在這種情境中,計(jì)算機(jī)視覺(jué)可以告訴盲人,這是一張 20 元的紙幣,還是一張 50 元的紙幣。這種產(chǎn)品是盲人十分需要的。
Fortune:在這些移動(dòng)和可穿戴設(shè)備方面,中國(guó)市場(chǎng)是否與美國(guó)市場(chǎng)以及其他市場(chǎng)有什么不同呢?
吳恩達(dá):中國(guó)市場(chǎng)非常不一樣。其中一個(gè)差異是,中國(guó)目前最大、最熱的技術(shù)趨勢(shì)是 O2O,即從線上到線下。 O2O 的概念指的是,用你的移動(dòng)設(shè)備把你周圍的外在服務(wù)連接起來(lái),無(wú)論這些服務(wù)是洗車、送餐、尋找附近的打折電影、美甲還是雇傭私家廚師。在美國(guó)也有這些東西,不過(guò)中國(guó)巨大的人口密度使得 O2O 可以迅速成長(zhǎng)。
還有,在中國(guó)許多用戶的第一件計(jì)算性設(shè)備是智能手機(jī)。當(dāng)你的第一件計(jì)算性設(shè)備是手機(jī)的時(shí)候,你就會(huì)學(xué)習(xí)用最有效的方式來(lái)使用手機(jī)做事,而不一定會(huì)改為使用電腦。
我們可能正在接近 AI 期望值的頂點(diǎn)
Fortune:什么時(shí)候我們會(huì)不再把人工智能當(dāng)成新鮮事物來(lái)看待,而是像對(duì)待許多其他技術(shù)一樣把它視為理所當(dāng)然呢?
吳恩達(dá):我想,就像在 Gartner 公司的技術(shù)成熟曲線(Gartner Hype Cycle)上,我們可能正在接近人工智能期望值的頂點(diǎn)。我認(rèn)為,對(duì)人工智能超級(jí)智能的恐懼曾經(jīng)達(dá)到過(guò)頂點(diǎn),而如今這種恐懼的高潮已經(jīng)過(guò)去了。很難講,或許我是錯(cuò)的,但我希望的是這樣一個(gè)未來(lái):到那時(shí),我們將不再夸大人工智能,而是集中精力去探索人工智能的進(jìn)步。
Fortune:這么說(shuō),我們近期是不是還達(dá)不到這樣的水平:我們的設(shè)備或應(yīng)用程序能識(shí)別出我們或我們周圍的東西,而我們對(duì)此能習(xí)以為常?
吳恩達(dá):我認(rèn)為,在計(jì)算視覺(jué)方面還要等很久,因?yàn)槟壳坝?jì)算視覺(jué)的產(chǎn)品并不多。不過(guò)我可以分享一個(gè)盈利很好的計(jì)算視覺(jué)產(chǎn)品。
在百度的廣告系統(tǒng)中,如果你向用戶展示一段文本,這沒(méi)問(wèn)題。運(yùn)用我們的深度學(xué)習(xí)技術(shù),我們可以幫助廣告商選擇一個(gè)小圖片,這個(gè)小圖片可以與文本并列放置。這樣,你不僅會(huì)讀到一小段關(guān)于在巴厘島度假的廣告,還會(huì)看到一幅巴厘島的小圖片,而你只需要幾分之一秒的時(shí)間就能理解它。這一服務(wù)能讓用戶更快地明白某個(gè)廣告是關(guān)于什么的,它極大的促進(jìn)了我們?cè)跍贤ㄓ脩襞c廣告商方面的能力。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
