數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的區(qū)別是什么?
數(shù)據(jù)挖掘側(cè)發(fā)現(xiàn)知識(shí),機(jī)器學(xué)習(xí)側(cè)重認(rèn)識(shí)事物,兩者相輔相成。
數(shù)據(jù)挖據(jù)和機(jī)器學(xué)習(xí)是處理數(shù)據(jù)的兩個(gè)步驟。
數(shù)據(jù)挖據(jù)提供數(shù)據(jù)管理技術(shù),機(jī)器學(xué)習(xí)提供數(shù)據(jù)分析處理技術(shù)。
舉個(gè)簡(jiǎn)單的例子,馬云想知道在淘寶里什么用戶(hù)喜歡買(mǎi)些什么。
首先分析這個(gè)問(wèn)題,要分用戶(hù)、類(lèi)別產(chǎn)品類(lèi)別進(jìn)行信息采集。并不是所有的淘寶購(gòu)買(mǎi)信息都要,只要用戶(hù)的年齡、性別和購(gòu)買(mǎi)物品的類(lèi)別以及收藏欄和購(gòu)物車(chē)這些信息。那么這時(shí),用戶(hù)購(gòu)買(mǎi)的時(shí)間、用戶(hù)購(gòu)買(mǎi)時(shí)付的費(fèi)用這些都是無(wú)關(guān)數(shù)據(jù)。
這時(shí)候就要用到數(shù)據(jù)挖掘技術(shù)了,常用的數(shù)據(jù)挖據(jù)方法是爬蟲(chóng)(這里提醒廣大用戶(hù),爬蟲(chóng)需要兼顧道德和法律責(zé)任,酌情使用)。淘寶自己則不用爬蟲(chóng),直接運(yùn)用數(shù)據(jù)挖掘技術(shù)在海量的數(shù)據(jù)里提取上文說(shuō)的所需要的信息,這是一個(gè)復(fù)雜并且漫長(zhǎng)的過(guò)程。
當(dāng)所需要的年齡、性別、以及購(gòu)物類(lèi)別數(shù)據(jù)采集完成并分類(lèi)完成。這時(shí)候就需要神經(jīng)網(wǎng)絡(luò)來(lái)工作了,根據(jù)數(shù)據(jù)分類(lèi)選擇神經(jīng)網(wǎng)絡(luò)的種類(lèi),并優(yōu)選網(wǎng)絡(luò)節(jié)點(diǎn)、函數(shù),設(shè)定閾值,最后開(kāi)始訓(xùn)練。最后就得到馬云想知道的東西了。
綜上所述,數(shù)據(jù)挖掘側(cè)發(fā)現(xiàn)知識(shí),機(jī)器學(xué)習(xí)側(cè)重認(rèn)識(shí)事物,兩者相輔相成。
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
