揭秘Facebook的人工智能實驗室
Facebook是一個非常成功的社交網(wǎng)絡(luò)公司,而它在人工智能領(lǐng)域的成就同樣不能小看。
最近,中美互聯(lián)網(wǎng)論壇在西雅圖召開,對于Facebook是否能入華再次成為焦點。如今的Facebook已經(jīng)不僅僅是一個成功的社交網(wǎng)絡(luò)公司,近年來,它用無人機提供互聯(lián)網(wǎng)服務(wù)、收購Oculus發(fā)展虛擬現(xiàn)實、不斷探索人工智能,可以說Facebook已經(jīng)成為了世界上最先進的科技研究中心之一。
當(dāng)然現(xiàn)在包括谷歌、IBM等公司都對人工智能有強烈的興趣,而Facebook也加大了對這個領(lǐng)域的投入,希望解決模擬一般智力的問題——即讓計算機日漸脫離線性邏輯的機器的思考方式,而像我們自由形態(tài)的人類以多管齊下的方式來思考。下面我們就來深度解析下關(guān)于Facebook人工智能的那些事。
Facebook人工智能研究室
一切始于2013年,F(xiàn)acebook的巨大成功并沒有阻止創(chuàng)始人兼CEO Mark Zuckerberg對未來十年、二十年發(fā)展的探索。當(dāng)然,F(xiàn)acebook其實也已經(jīng)將機器學(xué)習(xí)運用到其流行的社交網(wǎng)絡(luò)中,比如說決定用戶會在News Feeds中看到什么內(nèi)容。不過相比起當(dāng)時前沿的神經(jīng)網(wǎng)絡(luò)成果,這不過是小兒科。一些Facebook工程師也一直在嘗試卷積神經(jīng)網(wǎng)絡(luò)(CNNs),這是一種非常強大的機器學(xué)習(xí),現(xiàn)在普遍被用于圖像識別。 即便人工智能還處于發(fā)展初期,Zuckerberg對它的潛力依然非??春茫虼私M建一支最好的人工智能研究實驗室的想法就出現(xiàn)了。
他從谷歌大腦(Google Brain)挖了一位叫做Marc Aurelio Ranzato的工程師。然后追本溯源找到了卷積神經(jīng)網(wǎng)絡(luò)的發(fā)明者——Yann LeCun作為人工智能實驗室的負責(zé)人。Yann LeCun是人工智能界的一個傳奇,卷積神經(jīng)網(wǎng)絡(luò)是他職業(yè)生涯的巔峰之作。你是否曾經(jīng)好奇過ATM怎么能識別你的支票?這就得益于 LeCun負責(zé)的「SN」的神經(jīng)網(wǎng)路模擬器的早期研究,于1996年被采用。
作為人工智能實驗室負責(zé)人Yann LeCun被Zuckerberg授予了完全的信任,而他對研究室也有自己的看法,如果你想要吸引頂尖人才,你得有一個雄心勃勃的研究室,和一個雄心勃勃的長期目標(biāo)。然后你還得給他們工作上的自由權(quán),同時對你的研究你必須持有非常開放的態(tài)度。這和Facebook一貫開放到理念也是不謀而合的。
這個肩負著Facebook的未來的團隊規(guī)模很小,由大約 30個研究科學(xué)家和15名工程師組成。團隊有三個分支:由LeCun管理著一個由20名工程師和研究人員組成的團隊。Menlo Park的是一個同等規(guī)模的分支。六月,F(xiàn)AIR又在巴黎設(shè)立了一個更小的5人組,還有很多在Facebook其他部門一起合作致力于人工智能發(fā)展的團隊。
這些研究人員和工程師來自科技領(lǐng)域的各個層面,同時當(dāng)中很多人都曾與Lecun合作過。比如負責(zé)領(lǐng)導(dǎo)語言研究子群的Leon Bottou,是LeCun的一個老同事,他們曾一同研發(fā)了神經(jīng)網(wǎng)絡(luò)模擬器;他們的團隊顧問 Vladimir Vapnik,曾和Lecun一起在貝爾實驗室工作,發(fā)表了關(guān)于機器學(xué)習(xí)的形成性研究,其中包括一項測量機器學(xué)習(xí)能力的技術(shù),他也是統(tǒng)計學(xué)習(xí)理論之父。
Facebook對人工智能的探索
迄今,最好的人工智能系統(tǒng)也是愚鈍的,因為它們沒有常識?,F(xiàn)在對于機器如何學(xué)習(xí)簡單的推理能力,人工智能領(lǐng)域的專家知道得并不多。而Facebook也正致力于制造能足夠好地學(xué)習(xí)已知世界的機器。
「記憶網(wǎng)絡(luò)」
LeCun將記憶網(wǎng)絡(luò)的工作整合進卷積神經(jīng)網(wǎng)絡(luò),并使它們獲得記憶保持的能力。LeCun把這個新的記憶模型比作大腦中的分別由海馬體和大腦皮層控制的短期記憶和長期記憶。而記憶單元允許研究者向該「記憶網(wǎng)絡(luò)」講說一個故事,隨后使該網(wǎng)絡(luò)回答關(guān)于這個故事的問題。
比如我們把《指環(huán)王》一書的主要情節(jié)簡短概述給「記憶網(wǎng)絡(luò)」,當(dāng)被問及在書中某一具體情節(jié)中魔戒在哪里,這個「記憶網(wǎng)絡(luò)」能做出簡短正確的回答。這意味著它理解書中事物與時間的關(guān)系,而不是從全書中做簡單的搜索。
「嵌入世界」
為了能搭建出一個系統(tǒng),確保讓所有人可以把時間花在他們真正關(guān)心的事情上,F(xiàn)AIR團隊開發(fā)了一個被稱為「嵌入世界」的項目。
在嵌入世界項目中開發(fā)的人工神經(jīng)網(wǎng)絡(luò)能夠根據(jù)視覺相似性將在同一地點拍攝的兩張不同照片連接起來,并能指出文字描述是否符合場景。它重建了現(xiàn)實的一種虛擬記憶,并將之在其他地方和事件的背景下進行聚類。它甚至能根據(jù)一個人之前的喜好,興趣以及數(shù)字經(jīng)歷「虛擬地表示這個人」。雖然這還只是帶有實驗性質(zhì)的,但是對Facebook的新聞流呈現(xiàn)具有很大的影響,在跟蹤標(biāo)簽上也進行了一定的使用。
另外,F(xiàn)acebook的人臉識別技術(shù)已達到世界第一,通過DeepFace這項技術(shù),F(xiàn)acebook的人臉識別已達到97%的準(zhǔn)確率。
「計算機視覺」
Rob Fergus領(lǐng)導(dǎo)著有關(guān)計算機視覺的AI團隊,他們已經(jīng)在自動標(biāo)記相片上得到使用,接下來將被用于標(biāo)記視頻。大量視頻因為缺乏元數(shù)據(jù),或者沒有任何描述性文本,而被淹沒于噪聲中。AI將會能夠觀看視頻,并將它們大致分類。
這對Facebook阻止那些不想被上傳到他們服務(wù)器上的內(nèi)容具有巨大的意義—例如色情照片,版權(quán)問題或者其他違反他們使用條款的任何內(nèi)容。它也能鑒別新聞事件,對不同類型的視頻進行管理。Facebook此前一直將這些任務(wù)劃分給外包公司,當(dāng)這項技術(shù)穩(wěn)定后,F(xiàn)acebook就能降低這部分的人工成本。
在目前的測試中,人工智能表現(xiàn)得很有希望。給它播放一段正在進行的體育視頻,比如冰球、籃球或乒乓球,人工智能能夠準(zhǔn)確地識別出這個體育項目。并且還可以區(qū)分壘球和棒球,漂流和皮劃艇,以及籃球和街球這些類似的運動。
「語言科技」
Facebook本著讓世界更開放更連通的宗旨,因此語言服務(wù)是它的重點,因為超過一半以上的Facebook用戶不說英語,然而Facebook上大部分的內(nèi)容都是通過英語呈現(xiàn)的,因此如何能智能的翻譯也就是語言科技小組成立的原因。
我們知道過去Google翻譯那種直接逐詞翻譯有很大的缺陷,因為一些語法、俚語的原因?qū)е路g的不準(zhǔn)確,而Facebook在翻譯里面加入了人工智能的元素,讓翻譯更精確。比如:約有三億三千萬用戶經(jīng)常點擊「見翻譯」按鈕使用這些翻譯服務(wù)。如下圖所示:
如果你是第一個點擊翻譯按鈕的人,恭喜,你已經(jīng)開始操作人工智能了。人工智能本身具有適應(yīng)性,經(jīng)過訓(xùn)練后便可以很快掌握俚語。語言科技小組最近發(fā)現(xiàn)法國球迷在用一個新俚語表達「wow」,人工智能在接受那部分公用數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練以后,現(xiàn)在能夠可靠地將文本翻譯出來。他們通過每天對人工智能進行新數(shù)據(jù)的訓(xùn)練擴展Facebook的詞庫,不過所有語言的詞庫正在按月更新。
「Facebook M」
我們已經(jīng)習(xí)慣于個人數(shù)字助理,比如Siri、Cortana,以及Google Now。但Facebook選擇了一條不同的道路,其名為「M」的新型個人AI助理擁有超越手機界限處理復(fù)雜事物的能力。比如Siri可以發(fā)短信,而M可以預(yù)定航班或制定旅行計劃。
Facebook M的主干來自于今年早些時候收購的一家創(chuàng)業(yè)公司:Wit.ia。人工智能不僅幫助M更好地完成一般的任務(wù),也能完成有一些特殊情況的任務(wù)。并且Facebook設(shè)立了「AI訓(xùn)練者」,主要可以讓M從人類訓(xùn)練者身上學(xué)到應(yīng)該怎么做,并應(yīng)用到之后的任務(wù)中,這其實更像是人類學(xué)習(xí)的過程。
Facebook在人工智能團體中的角色
“我們的研究項目都是完全公開的。幾乎我們做的每件事都會發(fā)布,大部分的代碼也都是開源的。” LeCun 說道。“你可以在 Facebook 的研究網(wǎng)站上和 ArXiv——一個收納電腦科學(xué)、數(shù)學(xué)及物理研究的圖書館,找到這些出版物。”這其實就能看出Facebook整個團隊的態(tài)度,研究固然對他們的用戶很重要,但它的核心價值更佳體現(xiàn)在讓人類對如何更好地用機器來模仿智能的知識。
也是人工智能的研究本來就是最復(fù)雜的科學(xué)挑戰(zhàn)之一,不可能憑借某個人或者某個公司自己解決,它需要集體的力量,我們也希望Facebook的人工智能會帶給我們更多的驚喜。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動創(chuàng)新
