深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

鎂客 10年前 (2016-06-07)

去年開(kāi)始,谷歌使用以深度學(xué)習(xí)為基礎(chǔ)的人工智能核心搜索算法RankBrain,用越來(lái)越“類人化”的算法個(gè)性定制每個(gè)搜索結(jié)果。

【編者按】本文由新智元編譯,來(lái)源:techcrunch,作者:John Rampton,譯者:朱煥 胡祥杰

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

【導(dǎo)讀】想在谷歌或百度等搜索結(jié)果中排名靠前,除了廣告(給錢),你還可以選擇SEO(搜索引擎優(yōu)化):讓網(wǎng)站符合算法的規(guī)則,提升在搜索引擎內(nèi)的自然排名。但去年開(kāi)始,谷歌使用以深度學(xué)習(xí)為基礎(chǔ)的人工智能核心搜索算法RankBrain,本文認(rèn)為這種越來(lái)越“類人化”的算法個(gè)性定制每個(gè)搜索結(jié)果,每個(gè)網(wǎng)站的排名都變得看似更加隨機(jī),在搜索引擎中“鉆空子”難度將越來(lái)越大,SEO將持續(xù)極端技術(shù)化,只有把握好分析和大數(shù)據(jù)做SEO,才有望獲得巨大收益。

RankBrain還是一種弱人工智能

如今,每個(gè)人都聽(tīng)說(shuō)過(guò)谷歌的 RankBrain 算法了。這個(gè)新型人工智能機(jī)器學(xué)習(xí)算法是從加州山景城谷歌總部誕生出的最新、最重大的算法。然而,讀者中的許多人大概還沒(méi)意識(shí)到,RankBrain 將引起 SEO(搜索引擎優(yōu)化)行業(yè)的快速轉(zhuǎn)變。在本文中,我將帶你去了解一些鮮明的事例,讓你明白 SEO 的不少舊規(guī)則都不再適用了,并讓你知道,要想領(lǐng)先于潮流以繼續(xù)為你的業(yè)務(wù)提供 SEO 服務(wù),你需要做什么。

那么,什么是人工智能呢?

一般來(lái)說(shuō)有三種類型的人工智能:

1,弱人工智能: 這是為某個(gè)特殊目的服務(wù)的人工智能(例如,用于擊敗國(guó)際象棋世界冠軍的人工智能)

2,強(qiáng)人工智能:這是那種任何事情都能做的人工智能。一旦人工智能能像人類一樣行動(dòng),我們就認(rèn)為它具有了強(qiáng)人工智能。

3,超人工智能(Artificial Superintelligence):人工智能在做所有事情時(shí)都具有極高的水平(例如,具有超越單個(gè)人類的水平)。

當(dāng)我們談?wù)摴雀璧?RankBrain,以及談?wù)摴雀枘壳罢谶\(yùn)行的那些機(jī)器學(xué)習(xí)算法時(shí),我們談的是弱人工智能。實(shí)際上,弱人工智能已經(jīng)存在了一段時(shí)間了。你是否想過(guò)你的電子郵件服務(wù)中的垃圾過(guò)濾器是怎么工作的?是的,那就是弱人工智能的一種體現(xiàn)。我最喜歡的弱人工智能項(xiàng)目還有:谷歌翻譯,IBM Watson,亞馬遜的自動(dòng)產(chǎn)品推薦,自動(dòng)駕駛汽車以及我們親愛(ài)的谷歌 RankBrain.

在弱人工智能界,有多種不同的實(shí)現(xiàn)方式。Pedro Domingos 曾在 MasterAlgorithm 一書(shū)中明確指出,那些試圖實(shí)現(xiàn)完美人工智能的數(shù)據(jù)科學(xué)家可以被分為五個(gè)“派別”,它們是:

• 符號(hào)主義者

• 聯(lián)結(jié)主義者

• 進(jìn)化主義者

• 貝葉斯主義者

• 行為類比主義者(Analogizers)

谷歌的 RankBrain 屬于聯(lián)結(jié)主義派。聯(lián)結(jié)主義者相信,我們所有的知識(shí)都被編碼為我們大腦中的神經(jīng)元聯(lián)結(jié)。而 RankBrain 使用的具體方法是一種被專家稱為“反向傳播”的技術(shù),這一路方法后來(lái)也被人們稱之為深度學(xué)習(xí)。

聯(lián)結(jié)主義者宣稱,該方法能從原始數(shù)據(jù)中學(xué)習(xí)任何東西,因此它最終能夠?qū)崿F(xiàn)知識(shí)發(fā)現(xiàn)的自動(dòng)化。谷歌顯然也相信這一點(diǎn)。2014年 1月 26日,谷歌宣布收購(gòu) 深度學(xué)習(xí)公司Deepmind,顯露了在這領(lǐng)域的雄心。

因此,當(dāng)我們談?wù)?RankBrain 時(shí),我們可以說(shuō)它使用的是弱人工智能中的深度學(xué)習(xí)技術(shù)。那么,該領(lǐng)域目前發(fā)展如何呢?以及更重要的,它正在如何改變 SEO 業(yè)務(wù)呢?

2025 年左右實(shí)現(xiàn)強(qiáng)人工智能?

WaitButWhy.com 的 Tim Urban 在其文章《AI 革命: 通向超級(jí)人工智能之路》中比任何人都更清楚地解釋了這一技術(shù)的增長(zhǎng)。

當(dāng)你回顧歷史時(shí),該技術(shù)的進(jìn)展是這樣的:

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

不過(guò),正如 Urban 所指出的,在現(xiàn)實(shí)中,你其實(shí)看不見(jiàn)你自己位置的右側(cè)(即你的未來(lái))。因此,當(dāng)你站在圖表的當(dāng)下位置是,這是你實(shí)際感受到的樣子:

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

這一圖表所展現(xiàn)是的,當(dāng)人類試圖預(yù)測(cè)歷史時(shí),他們常常會(huì)低估未來(lái)的趨勢(shì)。這是因?yàn)樗麄兛偸侨タ次挥趫D的左側(cè)的過(guò)去,而不是位于圖的右側(cè)的未來(lái)。

然而,現(xiàn)實(shí)是,隨著時(shí)間演化,人類進(jìn)步正在越來(lái)越快。Ray Kurzweil 將這稱之為“加速循環(huán)定律”。Kurzweil 的理論背后的科學(xué)理由是:與過(guò)去的不夠先進(jìn)的社會(huì)相比,未來(lái)的更先進(jìn)的社會(huì)有能力以更快的速度進(jìn)步——因?yàn)槟菚r(shí)的社會(huì)更先進(jìn)。這一推理也可以運(yùn)用到人工智能以及技術(shù)進(jìn)步的增長(zhǎng)速度方面。

在計(jì)算資源方面,我們已經(jīng)看到了這一點(diǎn)。下面的圖標(biāo)可以讓你看看,由于“加速循環(huán)定律”,事情進(jìn)展得有多快:

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

正如你所看到的和我們都直觀感受到的,處理器和計(jì)算機(jī)技術(shù)的增長(zhǎng)都獲益于加速循環(huán)定律。另一件令人震驚的事是:未來(lái)的某一天,一臺(tái)簡(jiǎn)易電腦的處理能力將不僅超過(guò)單個(gè)的人,而且超過(guò)所有人類的總和。

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

實(shí)際上,看起來(lái)我們將在 2025 年左右實(shí)現(xiàn)強(qiáng)人工智能。技術(shù)顯然正在越來(lái)越快地?cái)U(kuò)張,這想必會(huì)讓我們大多數(shù)人感到驚訝。

從傻瓜到愛(ài)因斯坦

正如我上面解釋的,谷歌的 RankBrain 只是弱人工智能的一個(gè)例子。這意味著,RankBrain 可以在某個(gè)特定領(lǐng)域中比一個(gè)人做得更好,但也僅此而已:它只是一種相對(duì)較弱形式的人工智能。然而,哪怕是這種“弱”人工智能,也會(huì)飛快地變成一種我們不知該怎么對(duì)付的東西。

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

你可以清楚地看到,谷歌的 RankBrain 盡管在特定任務(wù)上極其聰明,但在通用的智力尺度上仍然是失敗的。然而,如果我們把加速循環(huán)定律應(yīng)用在人工智能領(lǐng)域,將會(huì)發(fā)生什么呢?Tim Urban 進(jìn)行了這樣一個(gè)思想實(shí)驗(yàn):

“當(dāng)人工智能的智力越來(lái)越接近我們時(shí),我們會(huì)看到它變得越來(lái)越聰明,像一個(gè)動(dòng)物一樣。之后,它將達(dá)到人類的最低水平——用 Nick Bostrom 的話說(shuō),是村里的傻瓜的水平——我們會(huì)說(shuō)‘ 哇奧,它看起來(lái)像個(gè)人類傻瓜,真可愛(ài)!' 然而重要的是,在所有智力水平構(gòu)成的譜系中,從傻瓜到愛(ài)因斯坦的所有人類都只占了一個(gè)很小的區(qū)域——因此,在人工智能實(shí)現(xiàn)‘村中傻瓜’水平并具有強(qiáng)人工智能之后,它將突然變得比愛(ài)因斯坦更聰明,而我們不會(huì)知道那將是什么樣。”

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

那么,這對(duì) SEO 業(yè)務(wù)以及我們目前的人工智能來(lái)說(shuō)意味著什么呢?

在我們?nèi)ヮA(yù)測(cè)未來(lái)之前,讓我們先看看 RankBrain 已經(jīng)怎樣改變了 SEO。我與卡耐基梅隆大學(xué)校友、Market Brew (一家為 Fortune 500 強(qiáng)的 SEO 團(tuán)隊(duì)提供搜索引擎模型的公司)的 CTO、聯(lián)合創(chuàng)始人 Scott Stouffer 就這一問(wèn)題進(jìn)行了交流。作為一名搜索工程師,Stouffer 對(duì)過(guò)去幾十年的發(fā)展具有一個(gè)大部分人都不具有的獨(dú)特視角。

谷歌開(kāi)始把主要精力放在人工智能后,SEO行業(yè)應(yīng)如何應(yīng)對(duì)?下面是他的一些建議。

回歸分析是有嚴(yán)重缺陷

這是 SEO 行業(yè)中當(dāng)前最大的缺陷。每當(dāng)谷歌的排名發(fā)生巨大變化時(shí),都會(huì)出現(xiàn)許多“大師”——來(lái)自本行業(yè)知名公司的一些數(shù)據(jù)科學(xué)家和 CTO 會(huì)宣稱,他們知道為什么谷歌最近排名指數(shù)發(fā)生了變化。其實(shí),他們最常用的方法是仔細(xì)分析幾個(gè)月以來(lái)的排名數(shù)據(jù),并去了解在所有類型的網(wǎng)站中排名情況是如何改變的。

按照目前的回歸分析方法,這些數(shù)據(jù)科學(xué)家會(huì)指出一些受到了(正面或負(fù)面)影響的特定類型的網(wǎng)站,并十分肯定地認(rèn)為谷歌最近的算法轉(zhuǎn)變是針對(duì)這些網(wǎng)站共有的某類算法(內(nèi)容或外鏈)而出現(xiàn)的。

然而,如今谷歌已經(jīng)不這么干了。谷歌的 RankBrain 采用機(jī)器學(xué)習(xí)/深度學(xué)習(xí)方法,它的工作方式與過(guò)去十分不一樣。

其實(shí),谷歌內(nèi)部已經(jīng)存在許多核心算法。RankBrain 的任務(wù)是去學(xué)習(xí)這些核心算法以何種方式混合起來(lái)才能最佳地應(yīng)用到每種類型的搜索結(jié)果中去。例如,在某些搜索結(jié)果中,RankBrain 可能學(xué)習(xí)到最關(guān)鍵的搜索信號(hào)是這些搜索結(jié)果中的元標(biāo)題(Meta Title)。

為那些元標(biāo)題匹配算法賦予更多的權(quán)重,這可能會(huì)帶來(lái)更好的搜索體驗(yàn)。但在另一個(gè)搜索結(jié)果中,同樣的元標(biāo)題信號(hào)與良好的搜索體驗(yàn)之間可能卻是負(fù)相關(guān)。因此,在那一類搜索中,諸如 PageRank 之類的其他算法可能會(huì)被賦予更多權(quán)重。

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

這意味著,在每個(gè)搜索結(jié)果中,谷歌都使用了完全不同的算法混合方式。現(xiàn)在,你就會(huì)明白,為什么“在缺乏搜索結(jié)果語(yǔ)境的情況下,對(duì)所有網(wǎng)站進(jìn)行回歸分析”這種方法是有嚴(yán)重缺陷的。

出于這些原因,現(xiàn)在的回歸分析必須根據(jù)每一次的特定搜索來(lái)進(jìn)行。Stouffer 最近談到了一種可以用來(lái)測(cè)量谷歌算法改變程度的搜索模型方法。

首先,你可以截一張圖,以確定搜索引擎模型在過(guò)去為某個(gè)具體關(guān)鍵詞搜索而被校準(zhǔn)到了什么程度。然后,當(dāng)探測(cè)到排名方式發(fā)生了改變之后,你可以對(duì)搜索引擎模型進(jìn)行重新校準(zhǔn),以展示出這兩種搜索引擎模型設(shè)置之間的差異。通過(guò)這一方法,在經(jīng)歷了排名方式變化之后,你就可以看出哪些特定算法被增加或減少了權(quán)重。

知道了這一點(diǎn)后,我們就可以聚焦于如何提升網(wǎng)站對(duì)這些特定搜索結(jié)果的 SEO。但同樣的方法并不適用于其他搜索結(jié)果。這是因?yàn)?RankBrain 是在搜索結(jié)果(或關(guān)鍵詞)的水平上進(jìn)行操作的。確切地說(shuō),RankBrain為每個(gè)搜索結(jié)果都進(jìn)行算法的個(gè)性定制。

把握細(xì)分領(lǐng)域,避免錯(cuò)誤分類

谷歌還發(fā)現(xiàn),他們可以讓 RankBrain 這個(gè)新型深度學(xué)習(xí)系統(tǒng)學(xué)會(huì),“好”網(wǎng)站長(zhǎng)什么樣,“壞”網(wǎng)站長(zhǎng)什么樣。就像他們?yōu)槊恳粋€(gè)搜索結(jié)果進(jìn)行不同的算法權(quán)重賦予一樣,他們也發(fā)現(xiàn)每個(gè)垂直領(lǐng)域都有不同的“好”網(wǎng)站和“壞”網(wǎng)站實(shí)例。這無(wú)疑是因?yàn)椴煌拇怪鳖I(lǐng)域具有不同的客戶關(guān)系管理方式,不同的模板和數(shù)據(jù)結(jié)構(gòu)類型。

當(dāng) RankBrain 運(yùn)行時(shí),它實(shí)際上在學(xué)習(xí)每種垂直環(huán)境中的正確“設(shè)定”是什么樣的。你或許已經(jīng)猜到,這些正確設(shè)定是什么完全取決于該設(shè)定所處于的垂直領(lǐng)域是什么樣的。例如,在醫(yī)療產(chǎn)業(yè)中,谷歌知道像 WebMD.com 這樣的網(wǎng)站聲譽(yù)良好,并會(huì)把這樣的網(wǎng)站放在其搜索索引的頂部位置。而任何結(jié)構(gòu)上與 WebMD 網(wǎng)站相似的網(wǎng)站也會(huì)被歸類到“好”網(wǎng)站的類別中。類似的,那些與已知的醫(yī)療領(lǐng)域垃圾網(wǎng)站結(jié)構(gòu)相似的網(wǎng)站則會(huì)被歸為“壞”網(wǎng)站的類別。

由于Rankbrain 使用深度學(xué)習(xí)能力同時(shí)對(duì)“好”網(wǎng)站和“壞”網(wǎng)站進(jìn)行歸類,如果你的網(wǎng)站中包含許多不同產(chǎn)業(yè)的信息,那將會(huì)怎樣呢?

深度學(xué)習(xí)驅(qū)動(dòng)智能搜索引擎,RankBrain革了SEO的命

首先,我們必須再多討論一下深度學(xué)習(xí)是如何工作的。在把所有網(wǎng)站都分為“好”“壞”兩組之前,RankBrain 必須首先決定每個(gè)網(wǎng)站分別屬于什么類別。像 Nike.com 和 WebMD.com 這樣的網(wǎng)站很好歸類。盡管這兩個(gè)網(wǎng)站上都有很多不同的子類別,但它們都具有單一的一般類別。這類網(wǎng)站很容易被分類。

然而,那些包含了許多不同類別的網(wǎng)站呢?這類網(wǎng)站中的一個(gè)很好的例子是那些 How-To 型網(wǎng)站。這些網(wǎng)站通常擁有許多通用類別。面臨這些網(wǎng)站,深度學(xué)習(xí)方法就會(huì)崩潰。那么,在面對(duì)這些網(wǎng)站時(shí),谷歌使用什么樣的訓(xùn)練數(shù)據(jù)呢?答案是:它可能是使用看起來(lái)隨機(jī)的數(shù)據(jù)。它可能從眾多類別中選擇這個(gè)類別,也可能選擇另一個(gè)類別。對(duì)于像 Wikipedia 這樣的著名網(wǎng)站來(lái)說(shuō),谷歌可能完全不采取任何分類過(guò)程,以確保深度學(xué)習(xí)過(guò)程不會(huì)打擾用戶既有的搜索體驗(yàn)(因?yàn)榫S基這樣的大網(wǎng)站不太可能產(chǎn)生壞網(wǎng)頁(yè)。)

然而,對(duì)那些不那么知名的網(wǎng)站來(lái)說(shuō),會(huì)發(fā)生什么呢?答案是,“誰(shuí)知道呢?”或許,這個(gè)機(jī)器學(xué)習(xí)過(guò)程能自動(dòng)地對(duì)每個(gè)網(wǎng)站進(jìn)行分類,在此之后才會(huì)把它與其他網(wǎng)站進(jìn)行比較。一個(gè) How-To 型網(wǎng)站也許看起來(lái)和 WebMed 網(wǎng)站一個(gè)樣。

如果系統(tǒng)的分類過(guò)程認(rèn)為這個(gè)網(wǎng)站是關(guān)于鞋的,那么它就會(huì)把該網(wǎng)站與 Nike 網(wǎng)站結(jié)構(gòu)進(jìn)行比較,而不是與 WebMD 進(jìn)行比較。也許,該網(wǎng)站的結(jié)構(gòu)很像一家鞋類垃圾網(wǎng)站,而不像聲譽(yù)良好的 WebMD 網(wǎng)站;如果是這樣,這個(gè)內(nèi)容過(guò)于一般化的網(wǎng)站就會(huì)被打上“垃圾”的標(biāo)簽。因此,如果這個(gè) How-To 型網(wǎng)站具有不同的子領(lǐng)域,最好讓每個(gè)子領(lǐng)域的樣子都類似于該領(lǐng)域的最好網(wǎng)站。要把握住這些細(xì)分領(lǐng)域。

能辨認(rèn)“好壞”的 RankBrain

讓我們?cè)倏纯催@將如何影響外鏈。基于上面提到的分類過(guò)程,下面這一點(diǎn)將變得前所未有的重要:堅(jiān)持只在你的鄰近領(lǐng)域中進(jìn)行外鏈。因?yàn)?RankBrain 能夠知道,你的某些外鏈?zhǔn)遣皇桥c你所在的垂直領(lǐng)域同類網(wǎng)站的外鏈特征不同。

讓我們?nèi)允褂脛偛诺睦?。一家公司有一個(gè)關(guān)于鞋的網(wǎng)站。我們知道 RankBrain 的深度學(xué)習(xí)過(guò)程會(huì)試圖把該網(wǎng)站的各個(gè)方面與鞋業(yè)領(lǐng)域的最佳和最差網(wǎng)站進(jìn)行比較。因此,該網(wǎng)站的外鏈特征也將用來(lái)與同類的最佳和最差網(wǎng)站的外鏈特征進(jìn)行比較。

假設(shè),一個(gè)典型的聲譽(yù)良好的鞋業(yè)網(wǎng)站擁有一下三個(gè)鄰近領(lǐng)域的外鏈:

運(yùn)動(dòng)

健康

時(shí)尚

現(xiàn)在,假設(shè)該公司的 SEO 團(tuán)隊(duì)決定從這三個(gè)鄰近領(lǐng)域中購(gòu)買外鏈;此外,由于公司 CEO 和汽車產(chǎn)業(yè)有一些聯(lián)系,他們決定使用汽車網(wǎng)站的免費(fèi)外鏈??雌饋?lái)這很“聰明”: 他們使用了交叉營(yíng)銷方法,在汽車網(wǎng)站上展示“租車就送免費(fèi)鞋”的頁(yè)面,而這些頁(yè)面將導(dǎo)向該公司的新鞋頁(yè)面??雌饋?lái)很不錯(cuò),不是嗎?

然而,RankBrain 會(huì)發(fā)現(xiàn)這一點(diǎn),并發(fā)現(xiàn)該網(wǎng)站的外鏈特征與鞋業(yè)好網(wǎng)站的特征十分不同。更糟的是,它發(fā)現(xiàn)許多鞋業(yè)垃圾網(wǎng)站也擁有來(lái)自汽車網(wǎng)站的外鏈特征。

這樣,盡管 RankBrain 并不知道什么是“正確”的外鏈特征,它卻察覺(jué)出了對(duì)它的搜索引擎結(jié)果而言什么是“好”網(wǎng)站,什么是“壞”網(wǎng)站。這家鞋業(yè)網(wǎng)站將會(huì)被標(biāo)記為“壞”,來(lái)自汽車網(wǎng)站的免費(fèi)外鏈帶來(lái)的將是訪問(wèn)量的暴跌。

你沒(méi)法再鉆空子了

從我們前面對(duì)加速循環(huán)定律的討論中可以知道,RankBrain和其他人工智能未來(lái)都將會(huì)超越人腦。此刻,沒(méi)有人知道這一技術(shù)將把我們帶向何方。

不過(guò),有一些事情是確定的:

每個(gè)有競(jìng)爭(zhēng)力的關(guān)鍵詞環(huán)境都需要被單獨(dú)檢驗(yàn)。

大多數(shù)網(wǎng)站都需要把握好對(duì)細(xì)分領(lǐng)域的處理。

每家網(wǎng)站都應(yīng)該模仿該領(lǐng)域中聲譽(yù)優(yōu)良的頂級(jí)網(wǎng)站的結(jié)構(gòu)和組成。

在某種意義上,深度學(xué)習(xí)的方法讓 SEO 業(yè)務(wù)變得更簡(jiǎn)單了。當(dāng)你知道 RankBrain 等類似技術(shù)已經(jīng)具有了與人類旗鼓相當(dāng)?shù)哪芰r(shí),你應(yīng)該遵循的原則就變得很清楚了:你沒(méi)法再鉆空子了。

在另一種意義上,事情變得更難了。SEO 領(lǐng)域?qū)⒗^續(xù)變得極端技術(shù)化。分析和大數(shù)據(jù)是今日的王道,那些對(duì)這些方法尚不熟悉的 SEO 必須盡快趕上。那些已經(jīng)擁有這些能力的 SEO 有希望未來(lái)獲得巨大收益。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到