數據挖掘與機器學習的區別是什麼?
科技
08-25
數據挖據和機器學習是處理數據的兩個步驟。
數據挖據提供數據管理技術,機器學習提供數據分析處理技術。
舉個簡單的例子,馬雲想知道在淘寶里什麼用戶喜歡買些什麼。
首先分析這個問題,要分用戶、類別產品類別進行信息採集。並不是所有的淘寶購買信息都要,只要用戶的年齡、性別和購買物品的類別以及收藏欄和購物車這些信息。那麼這時,用戶購買的時間、用戶購買時付的費用這些都是無關數據。
這時候就要用到數據挖掘技術了,常用的數據挖據方法是爬蟲(這裡提醒廣大用戶,爬蟲需要兼顧道德和法律責任,酌情使用)。淘寶自己則不用爬蟲,直接運用數據挖掘技術在海量的數據里提取上文說的所需要的信息,這是一個複雜並且漫長的過程。
當所需要的年齡、性別、以及購物類別數據採集完成並分類完成。這時候就需要神經網路來工作了,根據數據分類選擇神經網路的種類,並優選網路節點、函數,設定閾值,最後開始訓練。最後就得到馬雲想知道的東西了。
綜上所述,數據挖掘側發現知識,機器學習側重認識事物,兩者相輔相成。


※蘋果新專利曝光,用iPhone當做身份證
※「缺芯少屏」局面將緩解!力壓三星、LG,柔性屏之戰中國公司再下一城
TAG:鎂客網 |