谷歌Waymo與DeepMind合作,開發(fā)出新訓(xùn)練方法提高自動(dòng)駕駛訓(xùn)練質(zhì)量和效率

溫暖 6年前 (2019-07-27)

兩家公司最終希望訓(xùn)練出一個(gè)能夠保持99%以上的總體障礙物識(shí)別率,并且減少誤報(bào)的AI模型。

Alphabet旗下的兩家公司終于合作了。

日前據(jù)媒體報(bào)道,Alphabet旗下的Waymo公司和DeepMind公司進(jìn)行了合作,他們開發(fā)出一種模擬進(jìn)化論的新訓(xùn)練方法,以此提高訓(xùn)效率和質(zhì)量。

首先要知道一個(gè)AI算法模型是通過成千上萬次的實(shí)驗(yàn)來自我改進(jìn)的。通常工程師會(huì)給一個(gè)模型制定一個(gè)任務(wù),模型通過多次實(shí)驗(yàn)以及收到的反饋來進(jìn)行調(diào)整,然后學(xué)習(xí)并執(zhí)行任務(wù)。執(zhí)行任務(wù)的表現(xiàn)主要依賴于訓(xùn)練方案,因此對(duì)于研究人員和工程師來說,尋找最合適的訓(xùn)練方案是其主要工作。他們會(huì)精心挑選接受培訓(xùn)的AI模型,將表現(xiàn)差的模型剔除并釋放資源,然后從零開始訓(xùn)練新算法,這需要消耗研究人員和工程師的大量精力與時(shí)間。

據(jù)悉DeepMind基于PBT(基于人口的訓(xùn)練)中設(shè)計(jì)出了一種勞動(dòng)密集度低的方法,該法法從隨機(jī)變量生成的多個(gè)機(jī)器學(xué)習(xí)模型開始。模型會(huì)被定期評(píng)估,多個(gè)機(jī)器學(xué)習(xí)模型之間則會(huì)以進(jìn)化的方式互相競爭,表現(xiàn)不佳的模型會(huì)被“進(jìn)化”更好的、表現(xiàn)更好的模型副本取代,這個(gè)副本則被稱為“后代”。每個(gè)后代會(huì)繼承父網(wǎng)絡(luò)的狀態(tài),因此PBT也就不需要從零開始重新訓(xùn)練,而整個(gè)訓(xùn)練過程中,后代將會(huì)積極更新超參數(shù)?;诖?,最終PBT可以將其大量的資源用來訓(xùn)練“好的”超參數(shù)值。

不過PBT也并不完美,這種方法側(cè)重于短期、當(dāng)前的優(yōu)化,但并不是從長期出發(fā),因此不利于后期發(fā)展的AI模型。為了解決這種情況,DeepMind的研究人員又培育了大量模型(人口),并創(chuàng)建名為“利基”的子人口,算法只會(huì)和其自己子群中的模型競爭。

目前,DeepMind和Waymo已經(jīng)將PBT應(yīng)用到AI對(duì)行人、自行車和摩托車的識(shí)別任務(wù),希望以此來檢驗(yàn)算法是否能夠得到進(jìn)一步提升。對(duì)于測(cè)試結(jié)果,Waymo表示PBT算法的精度更好,與手工調(diào)整的等效物相比,誤報(bào)率能夠減少24%,并且識(shí)別率仍然能夠維持比較高的水平,此外該算法還能夠節(jié)省時(shí)間和資源。Waymo稱,已經(jīng)將PBT納入了Waymo的技術(shù)基礎(chǔ)架構(gòu),公司的研究人員可以通過點(diǎn)擊按鈕來應(yīng)用該算法。

兩家公司最終希望訓(xùn)練出一個(gè)能夠保持99%以上的總體障礙物識(shí)別率,并且減少誤報(bào)的AI模型。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到