深度學(xué)習(xí)應(yīng)用系統(tǒng)分析:應(yīng)用組合和形態(tài)矩陣找到正確路徑
對深度學(xué)習(xí)研究和應(yīng)用的興趣從未這么熱過。深度學(xué)習(xí)最迷人的地方是,神經(jīng)網(wǎng)絡(luò)似乎能夠解決以前只能用定制方法解決的各種問題。
【導(dǎo)讀】本文收錄了arXiv.org上關(guān)于深度學(xué)習(xí)的一些最新的研究論文,列出了這些文章的內(nèi)容,包括“深度學(xué)習(xí)八大靈感應(yīng)用”、“深度學(xué)習(xí)用例”、“科學(xué)與工程中的深度學(xué)習(xí)應(yīng)用”、“深度學(xué)習(xí)應(yīng)用程序的下一次浪潮”等。針對這些文章缺乏系統(tǒng)方法的問題,提出了具體的組合矩陣、形態(tài)矩陣解決方案,并給出了預(yù)測示例。
隱藏的潛力
對深度學(xué)習(xí)研究和應(yīng)用的興趣從未這么熱過。幾乎每天都可以在arXiv.org找到無數(shù)的新研究論文。這些論文為我們描述了新的方法,人工神經(jīng)網(wǎng)絡(luò)可以靠這些方法應(yīng)用于我們?nèi)粘I畹母鱾€(gè)領(lǐng)域。深度學(xué)習(xí)最迷人的地方是,神經(jīng)網(wǎng)絡(luò)似乎能夠解決以前只能用定制方法解決的各種問題。
此外,每天都會(huì)出現(xiàn)新的文章或博客,告訴我們更多奇特的應(yīng)用深度學(xué)習(xí)的方式。這些文章、博客甚至?xí)膯栴}是,它們不對神經(jīng)網(wǎng)絡(luò)應(yīng)用程序進(jìn)行系統(tǒng)性的處理。至少到目前為止,我還沒有看到有人這么做。如果你知道有人這么做過,請告訴我。
最先進(jìn)的方法
在搜索這篇文章的材料時(shí),我發(fā)現(xiàn)了一些總結(jié)深度學(xué)習(xí)應(yīng)用程序的文章。下面是來自那些文章的許多引用與相關(guān)鏈接。
1.第一篇文章是 Jason Brownlee 發(fā)表的深度學(xué)習(xí)八大靈感應(yīng)用”,來自博客 Machine Learning Mastery。
下面是這些應(yīng)用的列表:
1. 黑白圖像的著色。
2. 添加聲音到無聲電影。
3. 自動(dòng)機(jī)器翻譯。
4. 照片中的對象分類。
5. 自動(dòng)手寫生成。
6. 字符文本生成。
7. 圖像字幕生成。
8. 自動(dòng)游戲。
正如上表所列的,這些應(yīng)用都可以歸到聽覺、視覺和空間這幾種感覺模態(tài),這些模態(tài)也是人工智能研究最初得到應(yīng)用的地方。
2 ,第二篇文章名為“深度學(xué)習(xí)用例”,來自專門用于Java的Deeplearning4j 機(jī)器學(xué)習(xí)庫網(wǎng)站。
和上一篇一樣,我們可以將這里的所有應(yīng)用程序歸類為聽覺,視覺和空間三種模態(tài)。其實(shí)并不存在空間模態(tài),但出于一般性的考慮,我用“空間模態(tài)”來指代對序列的處理。
3 下一篇是為John Murphy的“科學(xué)與工程中的深度學(xué)習(xí)應(yīng)用”。本文介紹了和前面幾篇類似的深度學(xué)習(xí)應(yīng)用,但也提供了另外一些奇特的應(yīng)用,例如科學(xué)實(shí)驗(yàn)設(shè)計(jì)、高能物理和藥物發(fā)現(xiàn)方面的應(yīng)用。
4.此外,我想提及“深度學(xué)習(xí)應(yīng)用程序的下一次浪潮”這篇文章。文中充滿各種最奇異的、你可能聞所未聞的應(yīng)用程序。例如:天氣預(yù)報(bào)和事件檢測、用于腦癌檢測的神經(jīng)網(wǎng)絡(luò)。
5,最后一篇文章來自 Quora,是關(guān)于深度學(xué)習(xí)應(yīng)用程序的一組問答。
上面所有這些文章缺乏的是系統(tǒng)方法。這種系統(tǒng)方法不僅描述深度學(xué)習(xí)的當(dāng)前應(yīng)用,而且能夠預(yù)測未來的可能應(yīng)用。
組合矩陣
我建議使用組合矩陣:所有當(dāng)前的深度學(xué)習(xí)應(yīng)用程序可以從矩陣中推導(dǎo)出來,該矩陣還具有提示未來應(yīng)用程序的優(yōu)點(diǎn)。
在該矩陣中,每一行和每一列都枚舉出了各種類型的感覺模態(tài),這樣,我們可以在矩陣中找到任意兩個(gè)感覺模態(tài)配對后的選項(xiàng)對,例如,語音 - 圖像識(shí)別便是一個(gè)這樣的選項(xiàng)對。矩陣中的每一個(gè)選項(xiàng)對都可以根據(jù)當(dāng)前或未來可能的深度學(xué)習(xí)應(yīng)用來解釋。
預(yù)測示例
如果我們看第4行、第B列,將找到來自音頻模態(tài)的“語音識(shí)別器 - >語音生成器”選項(xiàng)對,這可以被解釋為從語言到語言的翻譯應(yīng)用,例如Google翻譯。此外,如果我們選擇第6行,第D列,將找到“圖像識(shí)別器 - >圖像生成器”,這正是arXiv.org上的深度卷積逆向圖形網(wǎng)絡(luò)論文背后的想法。
可以看出,該矩陣中的可能選項(xiàng)對的總數(shù)是 12 *(12-1)= 132。一般而言,選項(xiàng)對總數(shù)為 N *(N-1)。
如果我們想要構(gòu)思一個(gè)新的應(yīng)用程序,我們可以系統(tǒng)性地遍歷矩陣并尋找新的選項(xiàng)對,或選擇一個(gè)隨機(jī)的選項(xiàng)對,例如第4行和第H列,將得到“圖像識(shí)別器 - >自然語言生成器”。它可能是這樣一個(gè)應(yīng)用:讀取對著手機(jī)攝像頭說話的人的唇語,并生成文本發(fā)送到另一應(yīng)用。當(dāng)身處嘈雜環(huán)境時(shí),這個(gè)應(yīng)用程序會(huì)很有用。(想法來自這鏈接)。
注意,我這樣組織這個(gè)矩陣,只是為了舉例子方便。也可以用其他方式來組織矩陣,那樣就會(huì)產(chǎn)生其他的深度學(xué)習(xí)應(yīng)用的可能組合。此外,該矩陣可以是多維的,以便考慮各種參數(shù)組合。
形態(tài)矩陣
嘗試預(yù)測深度學(xué)習(xí)應(yīng)用的另外一種方法是,使用由加州理工學(xué)院的瑞士天體物理學(xué)家 Fritz Zwicky 開發(fā)的形態(tài)矩陣法。順便說一句,這種方法已經(jīng)成功地用于預(yù)測中子星的存在。在瑞典形態(tài)學(xué)學(xué)會(huì)的網(wǎng)站上,可以找到關(guān)于形態(tài)矩陣及其應(yīng)用的詳細(xì)解釋?,F(xiàn)在,我們只需知道,該矩陣是以這樣的方式構(gòu)成:其第一行具有各種感覺模態(tài),例如聽覺,視覺,觸覺等,其余的行則為這些模態(tài)提供可能的選項(xiàng)。下面的屏幕截圖將有助于澄清這一點(diǎn)。
預(yù)測示例
既然我們有了形態(tài)矩陣,我們就可以把深度學(xué)習(xí)應(yīng)用看作一個(gè)模態(tài)選項(xiàng)的集合。例如,當(dāng)我們從表格中鎖定“語音識(shí)別/生成和圖像識(shí)別”這個(gè)選項(xiàng)后,我們就可以理解 2016年11用 16日剛剛提交到 arXiv.org 的《在野外環(huán)境讀取唇語》這篇最新的深度學(xué)習(xí)應(yīng)用論文的本質(zhì)。
請注意,此矩陣可以以其他方式組合,以產(chǎn)生深度學(xué)習(xí)可能應(yīng)用的不同組合。
結(jié)論
正如本文所示,通過組合和形態(tài)矩陣來系統(tǒng)地尋找深度學(xué)習(xí)以及一般意義上的機(jī)器學(xué)習(xí)應(yīng)用,這是可能和有效的。
【編者按】本文轉(zhuǎn)自新智元。文章來源:gettocode,作者:Andrei Cheremskoy。編譯:朱煥
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
