第二章機器學習中的數學基礎

最新 04-08

在機器學習的開頭，因為機器學習涉及到很多數學的東西，很多基礎的理論都來至於數學的推導，很多人都會在問，需不需要很高的數學基礎，在這裡我想說一下我對這個問題的看法。

在我看來，在機器學習領域中有這三部分人，第一部分是對機器學習有了較多的了解，知道機器學習中所用到的各種演算法，並能很清楚的知道這些演算法用在哪個領域下，例如文章分類可以使用貝葉斯演算法，流量點擊可以使用邏輯分類，等等。現在又有著非常多的關於機器學習的各種使用庫，能夠輕鬆的駕馭他們，我們不需要自己編寫更多的演算法和代碼，只要能夠知道這些演算法的使用場景和機器學習庫的使用方法，就能勝任大部分關於機器學習的工作任務，這一部分的人，完全可以對機器學習的數學基礎可以完全不在乎，有什麼樣的問題，就採用什麼樣的演算法庫，屬於實用派的人。

第二部分的人員對演算法有較高的興趣，想知道演算法到底是怎樣工作的，演算法的理論基礎在哪裡，是如何通過一步一步的推導出來這一套計算過程的，這部分人員在了解公式推導的過程中，就必須對數學有較深的底子，才能看懂過程的每一步。通過對過程的推導了解了演算法的原理，想對演算法的過程進行參數的優化，提高演算法。

第三部分人，對數學本來就非常的精通，對演算法也非常的精通，自己就能夠創建演算法的人。

如果你對數學並不是太了解，或者對一大堆的數學公式非常的懼怕，你可以跳過數學相關的內容，直接看如何使用這些結果來解決相關的問題。

在這裡也不會使用太多數學的專有名詞，希望能夠對問題一個一個進行相應的解決，這裡我們看一些在機器學習公式推導的過程中，經常碰到的幾個相通的問題。

評價函數

評價函數是最優化理論裡面的專業名詞，我們可以這樣來理解他，對於一件事情，如何去做，做得好不好，我們總有一個理論一個檢驗的標準，這個標準就是評價函數。在現實生活問題，經常需要把它轉換為數學問題，需要使用數學公式對問題進行描述，綜合出問題的一個表達形式，是評價函數的表現形式。

比如，開車去某個地方，需要評價怎麼樣的路徑最為省油，這時需要需要得出油耗的評價函數，這個函數描述了油耗和哪些參數有關係，比如選擇的道路距離，道路擁擠程度等。

得到了評價函數以後，能夠通過函數求導，得出極值這可能是我們要的解了。如果對求導還沒有印象的話，這裡給出一個簡單的例子。

求解:

x3-x2-x+1的極值情況：

先畫出這個函數的圖形來：