深度學(xué)習(xí)應(yīng)用系統(tǒng)分析:應(yīng)用組合和形態(tài)矩陣找到正確路徑

鎂客 9年前 (2016-11-28)

對深度學(xué)習(xí)研究和應(yīng)用的興趣從未這么熱過。深度學(xué)習(xí)最迷人的地方是,神經(jīng)網(wǎng)絡(luò)似乎能夠解決以前只能用定制方法解決的各種問題。

深度學(xué)習(xí)應(yīng)用系統(tǒng)分析:應(yīng)用組合和形態(tài)矩陣找到正確路徑

【導(dǎo)讀】本文收錄了arXiv.org上關(guān)于深度學(xué)習(xí)的一些最新的研究論文,列出了這些文章的內(nèi)容,包括“深度學(xué)習(xí)八大靈感應(yīng)用”、“深度學(xué)習(xí)用例”、“科學(xué)與工程中的深度學(xué)習(xí)應(yīng)用”、“深度學(xué)習(xí)應(yīng)用程序的下一次浪潮”等。針對這些文章缺乏系統(tǒng)方法的問題,提出了具體的組合矩陣、形態(tài)矩陣解決方案,并給出了預(yù)測示例。

隱藏的潛力

對深度學(xué)習(xí)研究和應(yīng)用的興趣從未這么熱過。幾乎每天都可以在arXiv.org找到無數(shù)的新研究論文。這些論文為我們描述了新的方法,人工神經(jīng)網(wǎng)絡(luò)可以靠這些方法應(yīng)用于我們?nèi)粘I畹母鱾€(gè)領(lǐng)域。深度學(xué)習(xí)最迷人的地方是,神經(jīng)網(wǎng)絡(luò)似乎能夠解決以前只能用定制方法解決的各種問題。

此外,每天都會(huì)出現(xiàn)新的文章或博客,告訴我們更多奇特的應(yīng)用深度學(xué)習(xí)的方式。這些文章、博客甚至?xí)膯栴}是,它們不對神經(jīng)網(wǎng)絡(luò)應(yīng)用程序進(jìn)行系統(tǒng)性的處理。至少到目前為止,我還沒有看到有人這么做。如果你知道有人這么做過,請告訴我。

最先進(jìn)的方法

在搜索這篇文章的材料時(shí),我發(fā)現(xiàn)了一些總結(jié)深度學(xué)習(xí)應(yīng)用程序的文章。下面是來自那些文章的許多引用與相關(guān)鏈接。

1.第一篇文章是 Jason Brownlee 發(fā)表的深度學(xué)習(xí)八大靈感應(yīng)用”,來自博客 Machine Learning Mastery。

下面是這些應(yīng)用的列表:

1. 黑白圖像的著色。

2. 添加聲音到無聲電影。

3. 自動(dòng)機(jī)器翻譯。

4. 照片中的對象分類。

5. 自動(dòng)手寫生成。

6. 字符文本生成。

7. 圖像字幕生成。

8. 自動(dòng)游戲。

正如上表所列的,這些應(yīng)用都可以歸到聽覺、視覺和空間這幾種感覺模態(tài),這些模態(tài)也是人工智能研究最初得到應(yīng)用的地方。

2 ,第二篇文章名為“深度學(xué)習(xí)用例”,來自專門用于Java的Deeplearning4j 機(jī)器學(xué)習(xí)庫網(wǎng)站。

深度學(xué)習(xí)應(yīng)用系統(tǒng)分析:應(yīng)用組合和形態(tài)矩陣找到正確路徑

和上一篇一樣,我們可以將這里的所有應(yīng)用程序歸類為聽覺,視覺和空間三種模態(tài)。其實(shí)并不存在空間模態(tài),但出于一般性的考慮,我用“空間模態(tài)”來指代對序列的處理。

3 下一篇是為John Murphy的“科學(xué)與工程中的深度學(xué)習(xí)應(yīng)用”。本文介紹了和前面幾篇類似的深度學(xué)習(xí)應(yīng)用,但也提供了另外一些奇特的應(yīng)用,例如科學(xué)實(shí)驗(yàn)設(shè)計(jì)、高能物理和藥物發(fā)現(xiàn)方面的應(yīng)用。

4.此外,我想提及“深度學(xué)習(xí)應(yīng)用程序的下一次浪潮”這篇文章。文中充滿各種最奇異的、你可能聞所未聞的應(yīng)用程序。例如:天氣預(yù)報(bào)和事件檢測、用于腦癌檢測的神經(jīng)網(wǎng)絡(luò)。

5,最后一篇文章來自 Quora,是關(guān)于深度學(xué)習(xí)應(yīng)用程序的一組問答。

上面所有這些文章缺乏的是系統(tǒng)方法。這種系統(tǒng)方法不僅描述深度學(xué)習(xí)的當(dāng)前應(yīng)用,而且能夠預(yù)測未來的可能應(yīng)用。

組合矩陣

我建議使用組合矩陣:所有當(dāng)前的深度學(xué)習(xí)應(yīng)用程序可以從矩陣中推導(dǎo)出來,該矩陣還具有提示未來應(yīng)用程序的優(yōu)點(diǎn)。

在該矩陣中,每一行和每一列都枚舉出了各種類型的感覺模態(tài),這樣,我們可以在矩陣中找到任意兩個(gè)感覺模態(tài)配對后的選項(xiàng)對,例如,語音 - 圖像識(shí)別便是一個(gè)這樣的選項(xiàng)對。矩陣中的每一個(gè)選項(xiàng)對都可以根據(jù)當(dāng)前或未來可能的深度學(xué)習(xí)應(yīng)用來解釋。

深度學(xué)習(xí)應(yīng)用系統(tǒng)分析:應(yīng)用組合和形態(tài)矩陣找到正確路徑

預(yù)測示例

如果我們看第4行、第B列,將找到來自音頻模態(tài)的“語音識(shí)別器 - >語音生成器”選項(xiàng)對,這可以被解釋為從語言到語言的翻譯應(yīng)用,例如Google翻譯。此外,如果我們選擇第6行,第D列,將找到“圖像識(shí)別器 - >圖像生成器”,這正是arXiv.org上的深度卷積逆向圖形網(wǎng)絡(luò)論文背后的想法。

可以看出,該矩陣中的可能選項(xiàng)對的總數(shù)是 12 *(12-1)= 132。一般而言,選項(xiàng)對總數(shù)為 N *(N-1)。

如果我們想要構(gòu)思一個(gè)新的應(yīng)用程序,我們可以系統(tǒng)性地遍歷矩陣并尋找新的選項(xiàng)對,或選擇一個(gè)隨機(jī)的選項(xiàng)對,例如第4行和第H列,將得到“圖像識(shí)別器 - >自然語言生成器”。它可能是這樣一個(gè)應(yīng)用:讀取對著手機(jī)攝像頭說話的人的唇語,并生成文本發(fā)送到另一應(yīng)用。當(dāng)身處嘈雜環(huán)境時(shí),這個(gè)應(yīng)用程序會(huì)很有用。(想法來自這鏈接)。

注意,我這樣組織這個(gè)矩陣,只是為了舉例子方便。也可以用其他方式來組織矩陣,那樣就會(huì)產(chǎn)生其他的深度學(xué)習(xí)應(yīng)用的可能組合。此外,該矩陣可以是多維的,以便考慮各種參數(shù)組合。

形態(tài)矩陣

嘗試預(yù)測深度學(xué)習(xí)應(yīng)用的另外一種方法是,使用由加州理工學(xué)院的瑞士天體物理學(xué)家 Fritz Zwicky 開發(fā)的形態(tài)矩陣法。順便說一句,這種方法已經(jīng)成功地用于預(yù)測中子星的存在。在瑞典形態(tài)學(xué)學(xué)會(huì)的網(wǎng)站上,可以找到關(guān)于形態(tài)矩陣及其應(yīng)用的詳細(xì)解釋?,F(xiàn)在,我們只需知道,該矩陣是以這樣的方式構(gòu)成:其第一行具有各種感覺模態(tài),例如聽覺,視覺,觸覺等,其余的行則為這些模態(tài)提供可能的選項(xiàng)。下面的屏幕截圖將有助于澄清這一點(diǎn)。

深度學(xué)習(xí)應(yīng)用系統(tǒng)分析:應(yīng)用組合和形態(tài)矩陣找到正確路徑

預(yù)測示例

既然我們有了形態(tài)矩陣,我們就可以把深度學(xué)習(xí)應(yīng)用看作一個(gè)模態(tài)選項(xiàng)的集合。例如,當(dāng)我們從表格中鎖定“語音識(shí)別/生成和圖像識(shí)別”這個(gè)選項(xiàng)后,我們就可以理解 2016年11用 16日剛剛提交到 arXiv.org 的《在野外環(huán)境讀取唇語》這篇最新的深度學(xué)習(xí)應(yīng)用論文的本質(zhì)。

請注意,此矩陣可以以其他方式組合,以產(chǎn)生深度學(xué)習(xí)可能應(yīng)用的不同組合。

結(jié)論

正如本文所示,通過組合和形態(tài)矩陣來系統(tǒng)地尋找深度學(xué)習(xí)以及一般意義上的機(jī)器學(xué)習(xí)應(yīng)用,這是可能和有效的。

【編者按】本文轉(zhuǎn)自新智元。文章來源:gettocode,作者:Andrei Cheremskoy。編譯:朱煥

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到