發(fā)展至今的機器學習到底對我們的就業(yè)和社會產(chǎn)生了哪些影響?

Lynn 8年前 (2017-12-30)

本文基于大量的報告資料,揭示了機器學習對于就業(yè)和社會的具體影響。

本文編譯自《science》雜志中的一篇長文“What can machine learning do? Workforce implications”,作者為MIT教授、美國經(jīng)濟研究局研究員Erik Brynjolfsson和卡內(nèi)基梅隆大學教授Tom Mitchell,本文的參考資料多達23篇。

以下為正文:

在過去幾十年里,計算機已經(jīng)改變了幾乎所有的經(jīng)濟運作?,F(xiàn)在,因為機器學習(Machine Learning)的興起,自動化的程度和速度有了迅猛的增長。就像當年的蒸汽機和電力的誕生一樣,機器學習也是一種帶來巨大生產(chǎn)力的革命性技術(shù)。但是目前,在對于機器學習在應(yīng)用領(lǐng)域上的潛力,我們還沒有完全認識,也無法達成共識。因此,在當前這一階段,人們唯一的共識就是機器學習將會對生產(chǎn)力和經(jīng)濟產(chǎn)生巨大的影響。

本文,我們借鑒了與機器學習系統(tǒng)相關(guān)的報告資料,以探討我們所能夠看見的這一技術(shù)對生產(chǎn)力產(chǎn)生的關(guān)鍵性影響。我們發(fā)現(xiàn),有些工作是適合用機器學習系統(tǒng)替代來做的,有些工作采用機器學習是不適合的。因此,在討論機器學習對就業(yè)的影響時,就不是替代人類或是無法替代人類這么極端而簡單的問題了。雖然,目前機器學習對經(jīng)濟的影響還是有限的,我們也并沒有像宣稱的那樣面臨失業(yè),但其對于未來的經(jīng)濟和勞動力的影響還是很深遠的。

發(fā)展至今的機器學習到底對我們的就業(yè)和社會產(chǎn)生了哪些影響?

MIT數(shù)字經(jīng)濟學教授、美國經(jīng)濟研究局研究員Erik Brynjolfsson

我們需要認識到的是,創(chuàng)新對價值的創(chuàng)造和生活水平的提高都起到關(guān)鍵作用,所以機器學習誕生以來的信息技術(shù)系統(tǒng)就為人們創(chuàng)造了第一波價值(數(shù)萬億美元),對此,在美國國家科學、工程和醫(yī)學科學委員會提交的一份報告中就指出了其影響力“技術(shù)的進步導致了嚴重的工資不平等”。其實,因為技術(shù)的進度而帶來的不平等還有很多,如在經(jīng)濟全球化和近十年來技術(shù)巨變的雙項因素下,未來經(jīng)濟的影響將會具有高度破壞性,這也就意味著,即便你是贏家,賺了很多錢,但因為經(jīng)濟危機受牽連,你依然是失敗者。而這一問題,就需要制定政策的政府領(lǐng)導、商業(yè)領(lǐng)袖、技術(shù)人員和研究學者的高度重視。

不過盡管機器學習正在為我們帶來很多不良的影響,在談?wù)摍C器學習可以做什么,不可以做什么之前,我們?nèi)孕杳鞔_這兩點:1.離機器取代人類還有很長時間;2.機器不可能完全取代人類。

從價值層面來看,當機器執(zhí)行特定的作業(yè)或者某一部分任務(wù)時,剩下的非機器學習可以完成的任務(wù)就會變得更有價值。另一方面,機器將會增加人的生產(chǎn)力,使全新的產(chǎn)品、服務(wù)和工作流程的產(chǎn)生變?yōu)榭赡?。因此,在對勞動力需求的影響上,即便是對那種需要機器的工作崗位,機器學習帶來的影響可能是消極的,也可能是積極的。當機器學習系統(tǒng)接近于某些崗位的人類的能力時,作為這些系統(tǒng)的補充的職位就會出現(xiàn)。而當機器學習系統(tǒng)比人類更具成本效益時,企業(yè)家或商人就自然會采用機器來取代人類,以達到利潤最大化。進而,這樣將會提高生產(chǎn)力、降低價格、轉(zhuǎn)移勞動力需求并重組整個行業(yè)。

發(fā)展至今的機器學習到底對我們的就業(yè)和社會產(chǎn)生了哪些影響?

卡內(nèi)基梅隆大學深度學習領(lǐng)域教授Tom Mitchell

大數(shù)據(jù)等因素促進了機器學習的蓬勃

哲學家 Polanyi說過:We know more than we can tell. 人臉識別、騎自行車這個動作和對自然語言的理解是人類天生具備的能力,但是我們卻不知道我們自己是如何做到和學習的,有一個很大的原因在于我們沒有辦法輕松的處理一大堆數(shù)據(jù)并從中發(fā)現(xiàn)規(guī)律。因此,在機器學習時代到來之前,我們是很難通過計算機完成這么巨大的任務(wù)的。但今天,機器學習的算法已經(jīng)使計算機系統(tǒng)訓練過程比手動編程更有效。

近幾年,寫一段特定功能的程序都需要很多程序員來參與編寫,但逐漸,因為機器學習算法(神經(jīng)網(wǎng)絡(luò))的存在,寫程序也可以變成自動化過程,我們只要不斷的給數(shù)據(jù)對其進行訓練即可,無需再做大量的編程工作。

機器學習算法為編程領(lǐng)域帶來了兩項影響,一是通過對神經(jīng)網(wǎng)絡(luò)的訓練就可以得到比程序員編程編出的程序更精確的算法(如人臉識別);二,這種模式大大降低了創(chuàng)建和維護新軟件的成本。

過去6到8年間,機器學習的發(fā)展十分迅速,很大程度上是因為我們擁有關(guān)于某項領(lǐng)域的大量的數(shù)據(jù),通過對這些數(shù)據(jù)進行訓練和分析,我們會發(fā)現(xiàn)很多此前沒有發(fā)現(xiàn)的規(guī)律和價值,或者換句話說,是機器學習通過其類似于人的分析能力讓我們看見了數(shù)據(jù)的潛在價值。當我們有足夠多的數(shù)據(jù)時,機器學習就可以很好的完成我們的任務(wù)要求。

當然,除了大數(shù)據(jù),其他很多方面的發(fā)展也是促進機器學習發(fā)展的關(guān)鍵因素,如毫米波的改進、深度神經(jīng)網(wǎng)絡(luò)(DNN)的出現(xiàn)和計算機硬件的發(fā)展。如現(xiàn)在,F(xiàn)acebook每天將超過45億的短語翻譯模式轉(zhuǎn)換到DNN模式;同時DNN也用于ImageNet中的圖像識別等;此外,因為DNN的運用,其語音識別的錯誤率已經(jīng)從2010年的30%降低到2016年的3%。值得指出的是,圖像識別和語音識別的錯誤率閾值是5%,因為這是人類犯錯的概率值。

新型自動化模式:學習

發(fā)展至今的機器學習到底對我們的就業(yè)和社會產(chǎn)生了哪些影響?

 

但是要用機器學習來完成一項任務(wù)或者解決一個問題,我們必須讓機器弄明白這項任務(wù)的要求,即性能指標。目前在實際應(yīng)用中,大多數(shù)學習都是指向目標函數(shù)的,即目標的輸入應(yīng)對應(yīng)于特定的輸出數(shù)據(jù)。如自動駕駛車輛傳感器測試到的輸入數(shù)據(jù)應(yīng)該直接指向下一個對應(yīng)的輸出指令。

但是在某些領(lǐng)域,想要獲得貼近于事實的輸出(目標函數(shù))是很困難的事情,如精神病的診斷、人力資源決策方面和處理法律案件,因為它們沒有固定的輸出模式。

所以想要成功的將機器學習商業(yè)化,其關(guān)鍵步驟是:明確機器學習的任務(wù);能夠收集到用于訓練的高質(zhì)量數(shù)據(jù);數(shù)據(jù)能夠為工程師所用并有助于預(yù)測目標輸出;能夠收集到新的數(shù)據(jù)以彌補原始數(shù)據(jù)的不足;要嘗試不同的算法和參數(shù)設(shè)置,以優(yōu)化學習分類器的準確性;最后將其嵌入到日常應(yīng)用中,從而提高生產(chǎn)力。

由機器學習發(fā)展而來的一種未來自動化模式就是學習人類,其中人工智能(AI)就是通過模仿和學習人類的很多行為來實現(xiàn)這種最新的自動化模式的,這也導致了新的商業(yè)模式。

發(fā)展至今的機器學習到底對我們的就業(yè)和社會產(chǎn)生了哪些影響?

八項判別準則,揭示機器學習的特征

盡管目前的機器學習系統(tǒng)的能力讓人驚艷,但是它們并不是適用于所有的任務(wù)?,F(xiàn)有的機器學習的能力很大程度上取決于深度神經(jīng)網(wǎng)絡(luò)。在有些方面,它們確實比人都要厲害,但是它們的決策能力比人的能力要弱太多。當然,機器學習系統(tǒng)還在進步中,后面可能適用于更多的工作?;谀壳暗陌l(fā)展情況來看,我們給出了8個關(guān)鍵的判別標準,以此可以區(qū)別某一項任務(wù)適不適合利用機器學習系統(tǒng)去做。

1.明確的輸入必須映射到明確的輸出,以構(gòu)成明確的函數(shù)

這一準則也適用于分類(如根據(jù)品種來標記狗的照片)和預(yù)測(如通過分析貸款申請來預(yù)測未來缺省的情況)。不過雖然機器學習系統(tǒng)可以根據(jù)統(tǒng)計意義上的相關(guān)性來預(yù)測與輸入(X)有最大關(guān)聯(lián)的輸出(Y),但是它可能無法學習到如何判斷因果關(guān)系。

2.大數(shù)據(jù)中必須存在成輸入-輸出關(guān)系的數(shù)據(jù)對

根據(jù)系統(tǒng)的需求,想要有效的訓練深度神經(jīng)網(wǎng)絡(luò),提高其準確度,越多的數(shù)據(jù)對越好。盡管深度神經(jīng)網(wǎng)絡(luò)就像一個“黑盒子”,原則上可以表征任意函數(shù),但是計算機很容易模仿并不斷訓練存在偏差的函數(shù),這樣就不利于找出數(shù)據(jù)的規(guī)律。所以這就需要專人來對數(shù)據(jù)進行明確的標記和梳理。

3.這項任務(wù)有明確的目標和參數(shù)來對學習的效果進行明確的反饋

雖然通過機器學習不是總能很好的得到目標輸出,但是至少機器學習系統(tǒng)可以很好的描述我們想要的目標輸出。這就像早期的自動化系統(tǒng),它們可以通過輸入輸出來模仿任務(wù),但可能不會是最佳的逼近實際系統(tǒng)。因此,明確一個衡量系統(tǒng)性能的指標是一條黃金準則。依據(jù)這條準則,系統(tǒng)在訓練過程就會不斷自我修正,從而達到最佳的性能表現(xiàn)。

4.無需很長的邏輯和推理鏈

機器學習系統(tǒng)非常善于分析數(shù)據(jù)的關(guān)聯(lián)性,但是一旦邏輯鏈過長,后面的學習效率就會降低。但是像Alpha Go這樣的非物理類的游戲,因為可以自動收集數(shù)百萬個典型訓練數(shù)據(jù)案例,所以可以很好的模擬。但在現(xiàn)實世界中,我們就很難做到這樣完美的模擬。

5.我們不知道也無需知道系統(tǒng)是怎樣做出這樣的決定的

大型的神經(jīng)網(wǎng)絡(luò)可以通過數(shù)以萬計的數(shù)字權(quán)重來做出最后的抉擇,這些數(shù)字權(quán)重就是人造神經(jīng)元。但是其中的邏輯還是很難解釋的,目前對于這方面的研究也比較缺乏。

6.任務(wù)的容錯能力較強,無需最佳的解決方案

幾乎所有的機器學習算法都是基于統(tǒng)計概率來給出最后的輸出的,因此很難將其訓練到100%的準確度。即便是人,也會犯錯。

7.所學的功能不會隨著時間的推移而快速變化

通常來說,當需要處理的數(shù)據(jù)和訓練的數(shù)據(jù)分布是類似的結(jié)構(gòu)時,機器學習算法才能很好地工作。如果新的數(shù)據(jù)分布發(fā)生變化,系統(tǒng)就需要重新訓練。

8.缺乏靈活性、物理上的操作和移動能力

在處理非結(jié)構(gòu)化環(huán)境和任務(wù)中的物理操作時,機器人和人類相比仍然很笨。這不是機器學習的缺點,而是現(xiàn)有機械技術(shù)的缺陷。

機器學習到底適用于哪些性質(zhì)的工作?

此前,機器學習對于就業(yè)的影響主要在一些結(jié)構(gòu)化和重復(fù)性的工作上。但是未來,其他很多工作將會被機器取代,那么我們?nèi)绾伪嬲J出這些工作呢。

一項工作通常包含許多不同但相互關(guān)聯(lián)的分工。在大多數(shù)情況下,這些分工中總有部分適用于機器學習,比如,我們可以通過訓練一個機器學習系統(tǒng)來幫助律師對案件的潛在相關(guān)文件進行分類,但是當面對潛在證人或者想辦法讓證人提供有效證詞時,機器學習就完全失去了作用;類似的,機器學習系統(tǒng)可以用于閱讀醫(yī)學影像,但與其他醫(yī)生的交流,包括與患者的交流,這些都是非結(jié)構(gòu)化的任務(wù),不適合采用機器學習系統(tǒng)。

但這不代表,所有需要交流的任務(wù)機器學習系統(tǒng)都無法勝任,比如銷售人員與客戶之間的很多聊天內(nèi)容和任務(wù),聊天機器人都可以勝任;還有視頻中人臉面部的一些情緒表現(xiàn),機器學習系統(tǒng)也可以識別出。

除了上面提到的情形,對于機器在創(chuàng)造性任務(wù)上的表現(xiàn),我們的認識也需改觀。傳統(tǒng)意義上,機器是按照人們設(shè)定好的方式來一步一步完成任務(wù)的,沒有任何“創(chuàng)造性”空間。但是機器學習系統(tǒng)是專門為找出解決辦法而設(shè)計的系統(tǒng),我們對其的設(shè)定只是目標和參數(shù),沒有明確規(guī)定該怎么去解決。舉例來看,以前人類設(shè)計復(fù)雜設(shè)備的能力遠遠超過機器和計算機,但是現(xiàn)在根據(jù)要求,利用機器學習系統(tǒng)生成的設(shè)計比任何人設(shè)計的都好。

從機器學習的層面來看,這又不是“創(chuàng)意”,因為能不能設(shè)計出好的設(shè)備完全取決于人們在最初設(shè)定的參數(shù)。所以未來,這種看似是創(chuàng)造性的工作將會被機器學習取代,而同時更為重要的是人們在選擇參數(shù)和設(shè)定目標的能力上。這也就意味著,無論是科學家,還是企業(yè)家,能夠準確描述出問題這一能力將變得越來越重要。

發(fā)展至今的機器學習到底對我們的就業(yè)和社會產(chǎn)生了哪些影響?

 

從六項經(jīng)濟因素看機器學習對社會的影響

有許多非技術(shù)因素會反映機器學習對于就業(yè)的影響,換句話說,機器學習對于就業(yè)的整體影響可以轉(zhuǎn)化為六項經(jīng)濟因素。

1.代換

融入機器學習的計算機系統(tǒng)將會直接取代部分人力,并減少產(chǎn)出部分的勞動力需求。

2.價格彈性

通過機器學習實現(xiàn)的自動化生產(chǎn)將會導致完成一項任務(wù)的成本降低,但總的消耗增加或減少取決于需求的價格彈性因素。如果彈性小于-1,則價格下降導致購買數(shù)量的增加,那么整個成本就會增加。1903年以后,由于技術(shù)降低了航空的價格,需求就增加了,在航空方面所花費的反而增多,就業(yè)也自然變多。

3.互補性

工作A是自動化的工種,而非自動化的任務(wù)B對A來說又是不可或缺的,那么隨著A的成本降低,對B的需求自然會增加。類比來看,隨著計算機的普及,程序員的需求不斷增加;人際交往能力和分析能力之間也是一種互補。

4.收入彈性

自動化的程度是可以改變社會的總收入的。如果一個商品的收入彈性不為零,這又會改變對某些商品類型的需求以及生產(chǎn)這些商品所需工作的派生需求。類比來看,隨著總收入的增加,美國人已經(jīng)把更多的收入用于餐飲。

5.勞動力供給的彈性

隨著工資的變化,從事某項工作的人們會給出一定反饋。如果有許多人具備了該必要的技能,那么供給就會有彈性,即使需求會增加(下降)很多,工資也不會上漲(下降)很多。相反,如果這項技能很難修煉,比如成為數(shù)學家,那么需求的變化將主要體現(xiàn)在工資而不是就業(yè)上。

6.業(yè)務(wù)流程重新設(shè)計

給定的勞動力的數(shù)量和類型不同、資本和其他投入、產(chǎn)出不同,與之相關(guān)的生產(chǎn)函數(shù)也是不同的。所以其中任何一項因素改變,管理人員就要重新建造相關(guān)流程。而新技術(shù)會改變生產(chǎn)過程,所以他們需要找出最有效的方式和生產(chǎn)流程。這些變化會需要一段時間,但它往往能夠節(jié)省成本和投入,增加需求彈性。隨著時間的推移,個人可以通過學習新技能或換新工作,來表示對于高工資的認可和回應(yīng),這樣會增加相關(guān)的供給彈性。

因此,根據(jù)Le Chatelier準則,隨著固定因素的調(diào)整,長期來看,供需彈性比短期更大。由于生產(chǎn)流程、組織設(shè)計、商業(yè)模式、供應(yīng)鏈、法律約束甚至文化期望都需要改變,所以一項技術(shù)的采用和推廣往往需要幾年或幾十年的時間。因此為了加快技術(shù)的推廣,往往我們需要在社會方面也采取一定的措施。

隨著時間的推移,新的產(chǎn)品、服務(wù)、分工和工作流程被創(chuàng)造出,從而致使新的工作產(chǎn)生。從歷史層面來看,隨著一些工作任務(wù)趨于自動化,釋放的勞動力已經(jīng)重新部署到生產(chǎn)新的商品上。這種創(chuàng)新比增加資本、勞動力或資源投入更能提高人們的整體收入和生活水平。

結(jié)語

機器學習發(fā)展到最終,其范圍和規(guī)??赡軙^電力技術(shù)。該技術(shù)帶來的進步不僅直接提高了生產(chǎn)力,而且更重要的是,引發(fā)了機器、商業(yè)組織乃至整個經(jīng)濟的互補性創(chuàng)新浪潮。未來,在技能、資源和基礎(chǔ)設(shè)施等方面做出正確的互補性投資的個人、企業(yè)和社會將會得到蓬勃發(fā)展,而另一些沒有參與進來的人,在某些情況下將會更糟糕。因此,更好的理解機器學習的具體適用場景和工作任務(wù),對于理解其對經(jīng)濟的影響也是至關(guān)重要。

原文鏈接:http://science.sciencemag.org/content/358/6370/1530.full

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅(qū)動創(chuàng)新

分享到