當前位置:
首頁 > 最新 > 第二章 機器學習中的數學基礎

第二章 機器學習中的數學基礎

在機器學習的開頭,因為機器學習涉及到很多數學的東西,很多基礎的理論都來至於數學的推導,很多人都會在問,需不需要很高的數學基礎,在這裡我想說一下我對這個問題的看法。

在我看來,在機器學習領域中有這三部分人,第一部分是對機器學習有了較多的了解,知道機器學習中所用到的各種演算法,並能很清楚的知道這些演算法用在哪個領域下,例如文章分類可以使用貝葉斯演算法,流量點擊可以使用邏輯分類,等等。現在又有著非常多的關於機器學習的各種使用庫,能夠輕鬆的駕馭他們,我們不需要自己編寫更多的演算法和代碼,只要能夠知道這些演算法的使用場景和機器學習庫的使用方法,就能勝任大部分關於機器學習的工作任務,這一部分的人,完全可以對機器學習的數學基礎可以完全不在乎,有什麼樣的問題,就採用什麼樣的演算法庫,屬於實用派的人。

第二部分的人員對演算法有較高的興趣,想知道演算法到底是怎樣工作的,演算法的理論基礎在哪裡,是如何通過一步一步的推導出來這一套計算過程的,這部分人員在了解公式推導的過程中,就必須對數學有較深的底子,才能看懂過程的每一步。通過對過程的推導了解了演算法的原理,想對演算法的過程進行參數的優化,提高演算法。

第三部分人,對數學本來就非常的精通,對演算法也非常的精通,自己就能夠創建演算法的人。

如果你對數學並不是太了解,或者對一大堆的數學公式非常的懼怕,你可以跳過數學相關的內容,直接看如何使用這些結果來解決相關的問題。

在這裡也不會使用太多數學的專有名詞,希望能夠對問題一個一個進行相應的解決,這裡我們看一些在機器學習公式推導的過程中,經常碰到的幾個相通的問題。

評價函數

評價函數 是最優化理論裡面的專業名詞,我們可以這樣來理解他,對於一件事情,如何去做,做得好不好,我們總有一個理論一個檢驗的標準,這個標準就是 評價函數 。在現實生活問題,經常需要把它轉換為數學問題,需要使用數學公式對問題進行描述,綜合出問題的一個表達形式,是 評價函數 的表現形式。

比如,開車去某個地方,需要評價怎麼樣的路徑最為省油,這時需要需要得出油耗的評價函數 ,這個函數描述了油耗和哪些參數有關係,比如選擇的道路距離,道路擁擠程度等。

得到了評價函數 以後,能夠通過函數求導, 得出極值這可能是我們要的解了。如果對求導 還沒有印象的話,這裡給出一個簡單的例子。

求解:

x3-x2-x+1的極值情況:

先畫出這個函數的圖形來:

如圖:

可以簡單的理解為,極值點為 和曲線相切的切線的斜率為0的,也就是對曲線求導,導數為0的時候。

在概率分布中,有一種管用的關於評價函數的一般形式,而且這種評價函數較為常見,在預估統計參數時,基本使用的就是它,它就是 極大似然估計。

極大似然估計

極大似然估計 是統計學的一個概率,講的是我們做出的估計需要滿足我們所觀察的現象,比如一個同學和一個超有經驗的獵人出去打獵,在森林裡看到了一隻兔子,而後聽到了三聲槍聲,兔子倒下了,這裡讓你估計這是誰開的槍,是你同學還是這位獵人。

我們的估計要最大條件的滿足我們所觀察到的現象,也就是三聲槍聲,兔子倒下了,這裡假設如果是獵人開的槍,獵人是一個超有經驗的槍手,只要開始一槍估計就能打中這隻兔子,而現在開了 三槍,比較有可能的是你這位同學開的槍。

這就是極大似然估計的思想,在以後我們會用具體的數學公式進行表達。

雖然是關於機器學習的數學基礎,但是並沒有涉及太多的公式,只是不想一開始把機器學習搞得太過的高深,讓人望而卻步,機器學習是通過數學的基礎為理論來解決現實中的問題,問題找到了,我們的求解過程就不會太難懂。

轉載請標明來之:http://www.bugingcode.com//

更多教程:阿貓學編程

更多課程和文章盡在微信號:

「datartisan數據工匠」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

微軟宣布下一代Windows10內置Windows ML機器學習平台

TAG:機器學習 |