那個(gè)唯一贏過AlphaGo的棋手,今天退役了

伶軒 6年前 (2019-11-20)

在技術(shù)的不斷突破極限的同時(shí),研發(fā)者們的工作重心也開始向商用轉(zhuǎn)移。

李世石宣布退役了,就此結(jié)束了在韓國棋院共計(jì)24年零7個(gè)月的職業(yè)圍棋生涯,而他也是迄今為止唯一戰(zhàn)勝過AlphaGo的棋手。

那個(gè)唯一贏過AlphaGo的棋手,今天退役了

“神之一手”,5番大戰(zhàn)的一次勝利,是人類棋手的“唯一”

2016年3月的那場(chǎng)“人機(jī)大戰(zhàn)”,各中精彩至今仍歷歷在目,而這場(chǎng)比賽也成就了李世石職業(yè)生涯最輝煌一戰(zhàn)——5番大戰(zhàn),李世石在第4局下出“神之一手”,取得人類棋手對(duì)陣AlphaGo正式比賽中的唯一一局勝利。

如果要用一個(gè)詞形容這場(chǎng)比賽,“盛況空前”再合適不過了,因?yàn)檫@場(chǎng)比賽在正式開始之前,就已獲得了全球范圍內(nèi)的關(guān)注。而當(dāng)時(shí)有關(guān)這場(chǎng)比賽最終勝負(fù)爭(zhēng)論的爭(zhēng)論,遠(yuǎn)勝于曾經(jīng)的“深藍(lán)”。

那個(gè)唯一贏過AlphaGo的棋手,今天退役了

實(shí)際上早在1997年,IBM就曾憑借“深藍(lán)”擊敗了等級(jí)分排名世界第一的棋手加里·卡斯帕羅夫,讓很多業(yè)內(nèi)人士認(rèn)識(shí)到了機(jī)器的強(qiáng)大。

可能正是因?yàn)橛辛诉@支“預(yù)防針”,面對(duì)AlphaGo大多數(shù)人不再自信和篤定認(rèn)為“人腦無敵”,反而更加期待機(jī)器的表現(xiàn)。而當(dāng)時(shí)已是世界冠軍、圍棋九段的李世石能夠接受邀約,不僅令人詫異也更加讓人期待,這場(chǎng)比賽也因此獲得了全球范圍內(nèi)極高的關(guān)注,更將人工智能和深度學(xué)習(xí)徹底地推到了大眾面前。

作為谷歌全力打造的人工智能程序,AlphaGo所依賴的是兩個(gè)不同神經(jīng)網(wǎng)絡(luò)“大腦”——監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)合作進(jìn)行下棋的,它們均由多層神經(jīng)網(wǎng)絡(luò)構(gòu)成,通過多層啟發(fā)式二維過濾器處理圍棋棋盤的定位,并通過十幾個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)層進(jìn)行信息分類和邏輯推理,產(chǎn)生局面判斷。

而相較于“深藍(lán)”觸及的國際象棋領(lǐng)域,圍棋的復(fù)雜程度遠(yuǎn)超想象。在共計(jì)361格的圍棋棋盤中,黑白棋子隨著戰(zhàn)局的不斷推進(jìn)越來越多,這也就意味著每多一顆棋子未知的可能就會(huì)有指數(shù)倍的增加,變化是無止盡的。甚至有人夸張的認(rèn)為,圍棋的復(fù)雜度數(shù)量遠(yuǎn)超于宇宙原子數(shù)量。

實(shí)際上在李世石之前,AlphaGo也曾與人類棋手對(duì)弈過。2015年10月,AlphaGo和當(dāng)時(shí)連任2013-2015年歐洲圍棋冠軍的樊麾進(jìn)行了5局無讓子比賽,獲得了“滿堂紅”。

在此之后,谷歌邀請(qǐng)樊麾加入了AlphaGo的研發(fā)工作中,這也是為什么在AlphaGO和李世石的比賽中,樊麾是總裁判長的主要原因。也正是因?yàn)橛辛藢I(yè)棋手的加入,才讓AlphaGo有了后面的“快速進(jìn)化”。

AlphaGo持續(xù)進(jìn)化,Master、Zero相繼登場(chǎng)

作為“教練”,在AlphaGO和李世石比賽之后,樊麾幾乎每個(gè)月都會(huì)分出一半的時(shí)間飛往DeepMind總部與AlphaGo對(duì)弈,檢驗(yàn)它的最新學(xué)習(xí)成果。到2016年7 月,AlphaGo出現(xiàn)在了世界圍棋排名網(wǎng)站Go Ratings排名首位,總積分超越柯潔,成為了第一個(gè)登上圍棋領(lǐng)域世界榜首的AI。

而就在很多人認(rèn)為AlphaGo熱度正在慢慢減退之時(shí),2016年12月29日到2017年1月4日,短短5天時(shí)間,棋手“Master”在網(wǎng)絡(luò)圍棋平臺(tái)橫掃眾多圍棋名將,在快棋對(duì)決中多次擊敗了包括聶衛(wèi)平、柯潔、樸廷桓、井山裕太在內(nèi)的數(shù)十位中日韓圍棋高手,創(chuàng)下了60局全勝的戰(zhàn)績。

就在大家對(duì)“Master”身份一籌莫展的時(shí)候,對(duì)戰(zhàn)最后一天它的“馬甲”終于掉了,谷歌自爆神秘賬號(hào)“Master”就是AlphaGo的最新版本。當(dāng)時(shí)聶衛(wèi)平給它的評(píng)價(jià)是,“Master技術(shù)全面,從來不犯錯(cuò),這一點(diǎn)是它最大的優(yōu)勢(shì)。”

2017年5月,在“萬眾期待”下人類排名第一的棋手柯潔與AlphaGo正式展開了對(duì)決。只是面對(duì)進(jìn)化了的AlphaGo,柯潔三局皆敗,然而這一切都并未結(jié)束。

那個(gè)唯一贏過AlphaGo的棋手,今天退役了

僅僅5個(gè)月后,Deepmind就重磅發(fā)布了“0基礎(chǔ)學(xué)習(xí)”的AlphaGo Zero,即“在沒有任何人類圍棋對(duì)弈數(shù)據(jù)的情況下,直接通過自我純強(qiáng)化學(xué)習(xí)”。更值得一提的是,AlphaGo Zero只自我訓(xùn)練了3天,就以100:0的戰(zhàn)績擊敗曾經(jīng)的AlphaGo。

面對(duì)這樣的強(qiáng)者,柯潔能表達(dá)的就只有這個(gè)了:

那個(gè)唯一贏過AlphaGo的棋手,今天退役了

但實(shí)際上,圍棋已經(jīng)“圍不住”AI和深度學(xué)習(xí)技術(shù)的發(fā)展了。

人機(jī)大戰(zhàn)領(lǐng)域擴(kuò)散,商用落地正在進(jìn)行時(shí)

可以看到,在AlphaGo于圍棋領(lǐng)域一戰(zhàn)成名后,德?lián)?、游戲甚至?ldquo;國粹”麻將,都被AI攻克了,如DeepStack成為首個(gè)在一對(duì)一無限注德?lián)渲袘?zhàn)勝人類玩家的人工智能、AlphaStar稱霸星際爭(zhēng)霸2、Suphx成為國際知名的專業(yè)麻將平臺(tái)“天鳳”第一個(gè)榮升十段的AI系統(tǒng)等,這也讓越來越多的人認(rèn)識(shí)到深度學(xué)習(xí)前景的可觀性。

IDC今年下半年發(fā)布的《中國深度學(xué)習(xí)平臺(tái)市場(chǎng)份額調(diào)研》的報(bào)告顯示,在AI技術(shù)使用方面,接受調(diào)研的企業(yè)和開發(fā)者中,86.2%選擇使用開源深度學(xué)習(xí)框架,在AI不斷走向產(chǎn)業(yè)化的過程中,深度學(xué)習(xí)平臺(tái)已經(jīng)成為企業(yè)和開發(fā)者應(yīng)用AI技術(shù)必備的助攻武器。而在技術(shù)的不斷突破極限的同時(shí),研發(fā)者們的工作重心也開始向商用轉(zhuǎn)移。

以AlphaGo為例,DeepMind CEO哈薩比斯就曾在被問及未來發(fā)展方向時(shí)表示,“AlphaGo是人工智能,會(huì)自己學(xué)習(xí),是可以‘移植’的,所以我們已經(jīng)開始將它和醫(yī)療、機(jī)器人等進(jìn)行結(jié)合了。”

當(dāng)前,除谷歌Facebook、百度、亞馬遜、阿里、騰訊等頭部廠商之外,包括科大訊飛、商湯、曠視、思必馳、地平線等創(chuàng)企均有深度學(xué)習(xí)相關(guān)產(chǎn)品推出,并在醫(yī)療、芯片、自動(dòng)駕駛、機(jī)器人、計(jì)算機(jī)視覺、語音識(shí)別等領(lǐng)域落地商用。可以預(yù)見,未來有關(guān)深度學(xué)習(xí)的市場(chǎng)規(guī)模將快速擴(kuò)展。

關(guān)于李世石

李世石,1983年生,韓國著名圍棋棋手,世界頂級(jí)圍棋棋手。

1995年入段,1998年二段,1999年三段,2003年因獲LG杯冠軍直接升為六段,2003年4月獲得韓國最大棋戰(zhàn)KT杯亞軍,升為七段,2003年7月獲第16屆富士通杯冠軍后直接升為九段,2006、2007、2008獲韓國圍棋大獎(jiǎng)最優(yōu)秀棋手大獎(jiǎng)(MVP)。

李世石屬于典型的力戰(zhàn)型棋風(fēng),善于敏銳地抓住對(duì)手的弱處主動(dòng)出擊,以強(qiáng)大的力量擊垮對(duì)手,他的攻擊可以用“穩(wěn),準(zhǔn),狠”來形容,經(jīng)常能在劣勢(shì)下完成逆轉(zhuǎn)。

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到