關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

巫盼 9年前 (2016-10-07)

打破媒體打造的AI神話,告訴你AI的真相到底是什么?

【編者按】:本文轉(zhuǎn)載自新智元,作者:Robin Bordoli,來(lái)源:crowdflower

如果你是一名企業(yè)主管(而不是數(shù)據(jù)科學(xué)家或機(jī)器學(xué)習(xí)專家),你可能已經(jīng)從主流媒體的報(bào)道中接觸過(guò)人工智能。你可能在《經(jīng)濟(jì)學(xué)人》和《名利場(chǎng)》讀過(guò)相關(guān)文章,或讀過(guò)有關(guān)Tesla 自動(dòng)駕駛的故事,或史蒂芬•霍金寫(xiě)AI對(duì)人類的威脅的文章,甚至還看過(guò)有關(guān)人工智能和人類智能的諷刺漫畫(huà)。

所以,如果你是關(guān)心你的企業(yè)發(fā)展的高管,這些有關(guān)AI的媒體報(bào)道可能會(huì)引出兩個(gè)惱人的問(wèn)題:

第一, AI的商業(yè)潛力是真是假?

第二, AI如何應(yīng)用于我的產(chǎn)品?

第一個(gè)問(wèn)題的答案是肯定的,AI具有商業(yè)潛力。今天,企業(yè)已經(jīng)能應(yīng)用AI改變需要人類智能的自動(dòng)作業(yè)流程。AI能讓人力密集型企業(yè)處理的工作量增加100倍,同時(shí)把單位經(jīng)濟(jì)效益降低90%。

回答第二個(gè)問(wèn)題需要多一點(diǎn)時(shí)間。首先,我們必須消除主流媒體宣傳的AI神話。只有消除這些誤解,你才能對(duì)怎樣應(yīng)用AI到你的業(yè)務(wù)中有一個(gè)框架。

神話1:AI是魔術(shù)

許多主流媒體把AI的描述得想魔術(shù)一般神奇,好像我們只需要對(duì)谷歌、Facebook、蘋(píng)果、亞馬遜和微軟這些大公司的高級(jí)魔術(shù)師使勁鼓掌。這種描述是幫倒忙。如果我們希望企業(yè)采用AI,那么我們就需要讓企業(yè)家們理解AI。AI并不是魔術(shù)。AI是數(shù)據(jù)、數(shù)學(xué)、模型以及迭代。要想讓AI為企業(yè)接受,我們需要更加透明,以下是3個(gè)有關(guān)AI的關(guān)鍵概念的解釋:

訓(xùn)練數(shù)據(jù)(TD):訓(xùn)練數(shù)據(jù)是機(jī)器學(xué)習(xí)的初始數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)包括輸入和預(yù)回答輸出,所以機(jī)器學(xué)習(xí)模型能夠?yàn)槿魏谓o定輸出尋找模式。例如,輸入可以是帶有客戶和企業(yè)支持代表(CSR)間的電子郵件線程的客戶支持ticket,輸出可以是基于企業(yè)特定分類定義的從1到5的分類標(biāo)簽。

機(jī)器學(xué)習(xí)(ML):機(jī)器學(xué)習(xí)是能從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)模式,并讓這些模式應(yīng)用于新的輸入數(shù)據(jù)的軟件。例如,接收到帶有客戶和CSR間的電子郵件線程的一個(gè)新的客戶支持ticket時(shí),機(jī)器學(xué)習(xí)模型能預(yù)測(cè)它的分類,并告訴你它對(duì)這個(gè)預(yù)測(cè)的置信度。機(jī)器學(xué)習(xí)的主要特點(diǎn)是它學(xué)習(xí)新的、而非適用固有的規(guī)則。因此,它能通過(guò)消化新的數(shù)據(jù)調(diào)整自己的規(guī)則。

Human-in-the-Loop(HITL):Human-in-the-Loop是AI的第三個(gè)核心要素。我們不能指望機(jī)器學(xué)習(xí)模型絕對(duì)可靠。一個(gè)好的機(jī)器學(xué)習(xí)模型可能只有70%的準(zhǔn)確率。因此,當(dāng)模型的置信度較低時(shí),就需要人使用Human-in-the-Loop作業(yè)流程。

所以,不要被AI是魔術(shù)的神話所迷惑。理解AI的基礎(chǔ)公式是:AI=TD+ML+HITL。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

神話2:AI只為技術(shù)精英專屬

媒體報(bào)道很容易讓人產(chǎn)生一種錯(cuò)覺(jué),就是AI只屬于技術(shù)精英——大公司例如Amazon,Apple,F(xiàn)acebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有它們能夠組建大型機(jī)器學(xué)習(xí)專家團(tuán)隊(duì),并獲得億美元級(jí)的投資。這種觀念是錯(cuò)的。

今天,不用10萬(wàn)美元就能著手應(yīng)用AI到你的業(yè)務(wù)中。所以,如果你是美國(guó)收益大于5000萬(wàn)美元的26000家企業(yè)之一,你就可以把收益的0.2%投資于AI應(yīng)用了。

所以,AI不是技術(shù)精英專屬。它屬于每個(gè)企業(yè)。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

神話3:AI只為解決十億美元級(jí)別的問(wèn)題

主流媒體的傾向于報(bào)道未來(lái)主義的事物,例如自動(dòng)駕駛汽車(chē)或用于運(yùn)送快遞的無(wú)人飛機(jī)。像Google,Tesla,Uber這些公司由于“贏者通吃”的心態(tài),為了搶占未來(lái)無(wú)人車(chē)市場(chǎng)的龍頭老大地位,已經(jīng)投資進(jìn)去數(shù)百億美元。這些給人的印象是AI只用于解決十億美元級(jí)別的新問(wèn)題。但這又是一個(gè)錯(cuò)誤。

AI也應(yīng)用于解決現(xiàn)存的較小的問(wèn)題,例如百萬(wàn)美元級(jí)別的問(wèn)題。讓我解釋一下:任何一個(gè)企業(yè)的核心需求都是理解客戶。從古希臘的agora市集和古羅馬的個(gè)人買(mǎi)賣(mài)廣場(chǎng)就是如此。今天也是如此,哪怕生意買(mǎi)賣(mài)爆發(fā)性地轉(zhuǎn)移到了互聯(lián)網(wǎng)上。許多企業(yè)坐擁來(lái)自客戶的非結(jié)構(gòu)化數(shù)據(jù)寶藏,這些數(shù)據(jù)來(lái)自電子郵件線程或Twitter評(píng)論。AI能應(yīng)用于這些分類支持ticket的挑戰(zhàn),或用于理解推文情緒。

所以,AI不僅能應(yīng)用于十億美元級(jí)別的令人興奮的新問(wèn)題,例如自動(dòng)駕駛汽車(chē)。AI也用于現(xiàn)存的“無(wú)趣”的小問(wèn)題,例如通過(guò)支持ticket分類或社交媒體情緒分析更好地理解客戶。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

神話4:算法比數(shù)據(jù)更重要

主流媒體中有關(guān)AI的報(bào)道傾向于認(rèn)為機(jī)器學(xué)習(xí)算法是最重要的要素。它們似乎把算法等同于人類大腦。它們暗示正是算法讓魔術(shù)發(fā)生作用,更精細(xì)復(fù)雜的算法能超越人類大腦。有關(guān)機(jī)器在國(guó)際圍棋和象棋中戰(zhàn)勝人類的報(bào)道就是例子。媒體關(guān)注的是“深度神經(jīng)網(wǎng)絡(luò)”、“深度學(xué)習(xí)”以及機(jī)器如何做決定。

這樣的報(bào)道可能帶給企業(yè)這樣的印象:想要應(yīng)用AI,他們得先聘請(qǐng)到機(jī)器學(xué)習(xí)專家來(lái)建一個(gè)完美的算法。但假如企業(yè)不考慮怎樣獲得更高質(zhì)量、更大量的定制訓(xùn)練數(shù)據(jù)以讓機(jī)器學(xué)習(xí)模型學(xué)習(xí),就算有了完美的算法也可能得不到理想的效果(“我們有超棒的算法”和“我們的模型只有60%的準(zhǔn)確率”間的落差)。

從Microsoft,Amazon和Google這些公司購(gòu)買(mǎi)商用機(jī)器學(xué)習(xí)服務(wù),卻沒(méi)有一個(gè)訓(xùn)練數(shù)據(jù)規(guī)劃或預(yù)算,就好比買(mǎi)了一輛汽車(chē),卻沒(méi)法到達(dá)加油站。你只是買(mǎi)了一大塊很貴的金屬而已。汽車(chē)和汽油的類比雖然不夠恰當(dāng),因?yàn)槿绻憬o機(jī)器學(xué)習(xí)模型補(bǔ)給越多的訓(xùn)練數(shù)據(jù),模型就能變得越好。這就像汽車(chē)每用完一箱汽油,積累的里程數(shù)越大。所以訓(xùn)練數(shù)據(jù)甚至比汽油更重要。

所以,訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量至少是與算法同等重要的。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

神話5:機(jī)器>人

過(guò)去30年來(lái),媒體一直喜歡把AI描述為比人類強(qiáng)大的機(jī)器,例如《終結(jié)者》的施瓦辛格和《Ex Machina》的Alicia Vikander。媒體這樣做也可以理解,因?yàn)槊襟w想建立起機(jī)器和人類之間誰(shuí)會(huì)贏的簡(jiǎn)單敘述結(jié)構(gòu)。但是,這和實(shí)際情況不符。

例如,最近Google的DeepMind/AlphaGo戰(zhàn)勝李世石的新聞被媒體簡(jiǎn)單描述成機(jī)器戰(zhàn)勝了人類。這是不準(zhǔn)確的,真實(shí)情況不是這樣簡(jiǎn)單。更準(zhǔn)確的描述應(yīng)該是“機(jī)器聯(lián)合許多人戰(zhàn)勝了一個(gè)人”。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

消除這種誤解的核心理由是機(jī)器和人類具有互補(bǔ)的能力。請(qǐng)看上圖。機(jī)器的特長(zhǎng)是處理結(jié)構(gòu)化計(jì)算,他們會(huì)在“找出特征矢量”任務(wù)上表現(xiàn)良好。而人類的特長(zhǎng)是理解意義和上下文,他們?cè)?ldquo;找出豹紋連衣裙”任務(wù)上表現(xiàn)良好,讓人類做“找出特征矢量”的任務(wù)就不那么容易了。

因此,對(duì)企業(yè)來(lái)說(shuō)正確的框架是實(shí)現(xiàn)機(jī)器和人的互補(bǔ),AI是機(jī)器和人的共同工作。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

神話6:AI就是機(jī)器取代人類

主流媒體喜歡描繪反烏托邦的未來(lái),因?yàn)樗鼈冋J(rèn)為這能吸引眼球。這樣或許確實(shí)能吸引讀者眼球,但是,它對(duì)真正理解機(jī)器和人類如何共同工作沒(méi)有一點(diǎn)幫助。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

例如,讓我們?cè)倩氐狡髽I(yè)分類支持ticket的業(yè)務(wù)上來(lái)。在現(xiàn)今的大多數(shù)企業(yè),這還是100%人工的過(guò)程。所以,這個(gè)過(guò)程又慢成本又高,能做的數(shù)量受到限制。假設(shè)你在分類了10000個(gè)支持ticket之后得到了一個(gè)準(zhǔn)確率為70%的模型。30%的時(shí)候結(jié)果錯(cuò)誤,但這時(shí)Human-in-the-loop就可以介入了。你可以把可接受置信度設(shè)置為95%,只接受置信度是95%或高于95%的輸出結(jié)果。那么機(jī)器學(xué)習(xí)模型最初就只能做一小部分工作,比如說(shuō)5%-10%。但是當(dāng)模型得到新的人工標(biāo)記數(shù)據(jù)時(shí),它就能學(xué)習(xí)、進(jìn)步。因此,隨著時(shí)間的推移,模型能處理更多的客戶支持ticket分類工作,企業(yè)也能大大增加分類的ticket量。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

所以,機(jī)器和人聯(lián)合可以增加工作量,同時(shí)保持質(zhì)量,降低重要業(yè)務(wù)的單位經(jīng)濟(jì)效益。這就消滅了機(jī)器取代人類的AI神話。真相是,AI是機(jī)器強(qiáng)化人類。

神話7:AI=ML

主流媒體有關(guān)AI的最后一個(gè)神話是把人工智能和機(jī)器學(xué)習(xí)當(dāng)做一回事了。這可能讓企業(yè)管理層以為只要買(mǎi)下Microsoft,Amazon或Google的某個(gè)商用機(jī)器學(xué)習(xí)服務(wù)就能把AI轉(zhuǎn)變?yōu)楫a(chǎn)品。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

實(shí)現(xiàn)一個(gè)AI解決方案,除了機(jī)器學(xué)習(xí),你還需要訓(xùn)練數(shù)據(jù),需要human-in-the-loop。缺了訓(xùn)練數(shù)據(jù)的機(jī)器學(xué)習(xí)就像沒(méi)汽油的汽車(chē),雖然很貴,但去不到任何地方。缺了human-in-the-loop的機(jī)器學(xué)習(xí)也會(huì)導(dǎo)致不良后果。你需要人去推翻機(jī)器學(xué)習(xí)模型低置信度的預(yù)測(cè)。

關(guān)于AI的7個(gè)誤解 | 人工智能核心概念對(duì)比

所以,如果你是想把AI應(yīng)用于你的業(yè)務(wù)的企業(yè)高管,那么你想在應(yīng)該有一個(gè)框架了。你可以用AI的7個(gè)真相代替AI的7個(gè)神話:

真相1:AI=TD+ML+HITL

真相2:AI適用所有企業(yè)。

真相3:AI適用現(xiàn)存的小問(wèn)題。

真相4:算法并不比訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量更重要。

真相5:機(jī)器和人類互補(bǔ)

真相6:AI是機(jī)器強(qiáng)化人類

真相7:AI=TD+ML+HITL

最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(zhǎng)按識(shí)別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新

分享到