機器學習（4）之線性判別式（附Python源碼）

知識 07-12

微信公眾號

關鍵字全網搜索最新排名

【機器學習演算法】：排名第一

【機器學習】：排名第二

【Python】：排名第三

【演算法】：排名第四

LDA是什麼？

線性判別式分析（Linear Discriminant Analysis），簡稱為LDA。也稱為Fisher線性判別（Fisher Linear Discriminant，FLD），是模式識別的經典演算法，在1996年由Belhumeur引入模式識別和人工智慧領域。

LDA的思想還是很簡單的：給定訓練樣本，設法將樣本投影到一條直線或者一張超平面上，使得同類樣例點的投影儘可能的接近，異類樣本點的投影儘可能遠離；在對新的樣本點進行分類時，將其投影到上述確定的這條直線上，再根據投影點的位置來確定新樣本的類別，如下圖所示（為方便可視化，以二維數據為例）

該圖來源於《機器學習》

如圖所示，可以看到兩個類別，一個

黑點

類別，一個

黑×

類別。現在要求將數據從二維降維到一維。直接投影到x1軸或者x2軸，不同類別之間會有重複，導致分類效果下降。圖中所示直線就是用LDA方法計算得到的，可以看到，黑點類別和黑×類別在映射之後之間的距離是最大的，而且每個類別內部點的離散程度是最小的（或者說聚集程度是最大的）。

LDA數學理論

在上一小節我們以語言的形式描述了LDA的原理。並以機器學習中的圖為例說明了為什麼這種方法在分類時會有比較好的效果。現在，我們從理論上證明這種方法的可行性，並為接下來的演算法實現鋪墊基礎。

在正式推導公式之前我們需要理解兩件事情：

1、為了實現投影后的兩個類別的距離較遠，用映射後兩個類別的均值差的絕對值來度量。

2、為了實現投影后，每個類內部數據點比較聚集，用投影后每個類別的方差來度量。

因為在公眾號的排版中不能書寫公式，我了方便起見，這兒直接以《機器學習》中的內容為主，假如您覺得影響閱讀效果的話可以直接參考《機器學習》的第三章第四節或者加入

機器學習交流群（429055771，或者掃面文末二維碼）

下載電子版，有任何問題我們可以一起討論。

Python實現

源代碼下載請在後台回復關鍵詞：

LDA，或者加入機器學習交流2群（634808033）在文件區中下載。

參考：

1. 周志華《機器學習》

2. Duanxx的博客：http://blog.csdn.net/daunxx/article/details/51881956

3. 艷光普照的博客：http://blog.csdn.net/szv123_rier/article/details/8766538

4. porly的博客：http://blog.csdn.net/porly/article/details/8020696

招募志願者

廣告、商業合作

請發郵件：357062955@qq.com

喜歡，別忘關注~

幫助你在AI領域更好的發展，期待與你相遇！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器學習 的精彩文章:

您可能感興趣