極簡機器學習講義
最新
03-07
學習機器學習已經有近半年時間了,從最初的數據統計,到數據分析,再到數據挖掘,再到機器學習,感覺一直在不斷積累和深入。再次回過頭來看時,似乎一切都沒有想像的那麼困難,技術本身都是比較簡單的,難的是應用現有技術解決定向的問題,所以真正去講解機器學習,可以用非常簡要的方法來介紹。
大數據,數據挖掘,機器學習,深度學習其實是被大眾喊爛的概念,不同的領域,不同知識儲備的人會有不同的認知,有一張圖能夠戲劇性的解釋這個現象:
通常解決定向問題,我們要做的就是利用現有成熟的機器學習庫,簡要編程語法,來進行計算訓練,最終得出比較適用的模型來解決問題。那麼通常我們機器學習所解決的問題類型分為分類問題、回歸問題、聚類問題以及降維問題,這些問題我們可以利用scikit learn庫來非常簡單的完成,如下圖:
根據不同的樣本數量以及不同的數據特徵,我們應用不同的模型演算法來進行樣本訓練,通常我們的前輩已經有過N次試驗,總結出許許多多場景和演算法的最優配對,我們其實需要分析定向問題屬於哪些場景,最終套用這些模型演算法進行應用,從中省去了大量試錯和訓練的時間,比如下面論文中幾種演算法的實驗結論分析:
當然,如果我們需要進行科研分析,或者遇到了一個非常特殊的場景,或者已有的資源和實驗結論不能夠滿足解決當前問題場景,我們需要對於各個模型演算法以及演算法參數和超參數有足夠的認識,並且需要大量大量大量的時間和實驗去不斷的調優,最紅解決我們當前的問題。關於特徵工程以及模型演算法調優,超參數調優話題都是一個非常有深度的話題,後期我們會逐個進行極簡介紹。


※谷歌推出新在線課程 免費教授AI和機器學習
※寫給小白的人工智慧之機器學習指南
TAG:機器學習 |