機器學習演算法總覽
前面,我們介紹了2種典型的機器學習演算法:樸素貝葉斯和線性回歸,並介紹了他們在文本分類和量化交易中的一些應用。本期內容,將會對機器學習的整個領域做一個概覽,會討論一下幾個問題:
什麼是機器學習
機器學習演算法種類
機器學習演算法概覽與分類
機器學習一般步驟
1
什麼是機器學習
簡單的說,機器學習就是把海量的無序數據轉換成對決策有用的信息。這種讓計算機可以自己學習的一大類演算法,統稱為機器學習。運用機器學習的技術,人們可以解決很多看似不可思議的任務,比如我們前面提到的垃圾郵件分類,股市的預測,天氣預報,人臉識別,自動駕駛,聊天機器人等等,很多非常前沿的科學研究和工業生產,都或多或少的運用到了機器學習的技術。
2
機器學習主要類別
根據處理數據的種類不同可分為三個類別,有監督學習,無監督學習,強化學習。
3
機器學習可以解決什麼樣的問題
4
開發機器學習應用的一般步驟
5
萬變不離其宗
上面這麼多的類別和任務,都是在表面上對機器學習中一些演算法進行了簡單的區分。而所有演算法模型的底層思想,其實只有兩種:生成模型和判別模型。生成模型是直接對聯合分布進行建模,而判別模型則是對條件分布進行建模。(不理解沒關係,後續會展開討論,其實這也是學習的一大竅門,不懂就先放下,繼續向後看...),之前我們介紹過的樸素貝葉斯就是生成模型的典型代表,而下一期要介紹的邏輯回歸是pa在學術界,也是基於這兩種思想分成了量大陣營,一直爭論不休...
預告
因為機器學習這幾年的蓬勃發展,將人類從很多重複單調的工作中解放出來,所以也有越來越多的人想投身這一領域。但是很多機器學習的演算法,尤其是近年來的深度學習演算法都涉及和藉助了高級的數學方法,對於初涉這一領域的研究人員和立志轉行的朋友存在很多困難。然而大部分的機器學習的演算法都是在一些最經典的思想上演化而來的,只要深刻掌握了其中幾個,融會貫通,即可掌握大多數機器學習的演算法。筆者接下來的幾期文章將分別介紹幾個經典的演算法,以及他們如何進行應用,令會附上偽代碼的邏輯實現
本文作者才疏學淺,如有不對之處,歡迎大家批評指正,交流討論。
鳶尾花與鬱金香
機器學習與量化交易領域的知識分享
(每周一更新)
TAG:機器學習 |