當前位置:
首頁 > 知識 > 基礎 | 10幅圖解釋機器學習中的基本概念

基礎 | 10幅圖解釋機器學習中的基本概念


微信公眾號


關鍵字全網搜索最新排名


【機器學習演算法】:排名第一


【機器學習】:排名第二


【Python】:排名第三


【演算法】:排名第四


以下

的幾幅圖

是我認為

在解釋機器學習基本概念時

最有啟發性的條目列表。





1.

Test and training error: 

為什麼低訓練誤差並不總是一件好的事情呢:以模型複雜度為變數的測試及訓練錯誤函數。





2.

Under and overfitting:

 低度擬合或者過度擬合的例子。多項式曲線有各種各樣的命令M,以紅色曲線表示,由綠色曲線適應數據集後生成。





3.

Occam』s razor:

為什麼貝葉斯推理可以具體化奧卡姆剃刀原理。這張圖給了為什麼複雜模型原來是小概率事件這個問題一個基本的直觀的解釋。水平軸代表了可能的數據集D空間。貝葉斯定理以他們預測的數據出現的程度成比例地反饋模型。這些預測被數據D上歸一化概率分布量化。數據的概率給出了一種模型Hi,P(D|Hi)被稱作支持Hi模型的證據。一個簡單的模型H1僅可以做到一種有限預測,以P(D|H1)展示;一個更加強大的模型H2,舉例來說,可以比模型H1擁有更加自由的參數,可以預測更多種類的數據集。這也表明,無論如何,H2在C1域中對數據集的預測做不到像H1那樣強大。假設相等的先驗概率被分配給這兩種模型,之後數據集落在C1區域,不那麼強大的模型H1將會是更加合適的模型。




4. Feature combinations:

(1)為什麼集體相關的特徵單獨來看時無關緊要,這也是(2)線性方法可能會失敗的原因。





5. Irrelevant features:

為什麼無關緊要的特徵會損害KNN,聚類,以及其它以相似點聚集的方法。左右的圖展示了兩類數據很好地被分離在縱軸上。右圖添加了一條不切題的橫軸,它破壞了分組,並且使得許多點成為相反類的近鄰。





6. Basis functions:

非線性的基礎函數是如何使一個低維度的非線性邊界的分類問題,轉變為一個高維度的線性邊界問題。Andrew Moore的支持向量機SVM(Support Vector Machine)教程幻燈片中有:一個單維度的非線性帶有輸入x的分類問題轉化為一個2維的線性可分的z=(x,x^2)問題。





7. Discriminative vs. Generative:

為什麼判別式學習比產生式更加簡單:兩類方法的分類條件的密度舉例,有一個單一的輸入變數x(左圖),連同相應的後驗概率(右圖)。注意到左側的分類條件密度p(x|C1)的模式,在左圖中以藍色線條表示,對後驗概率沒有影響。右圖中垂直的綠線展示了x中的決策邊界,它給出了最小的誤判率。





8. Loss functions:

學習演算法可以被視作優化不同的損失函數:應用於支持向量機中的「鉸鏈」錯誤函數圖形,以藍色線條表示,為了邏輯回歸,隨著錯誤函數被因子1/ln(2)重新調整,它通過點(0,1),以紅色線條表示。黑色線條表示誤分,均方誤差以綠色線條表示。





9. Geometry of least squares:

帶有兩個預測的最小二乘回歸的N維幾何圖形。結果向量y正交投影到被輸入向量x1和x2所跨越的超平面。投影y^代表了最小二乘預測的向量。




10. Sparsity:

為什麼Lasso演算法(L1正規化或者拉普拉斯先驗)給出了稀疏的解決方案(比如:帶更多0的加權向量):lasso演算法的估算圖像(左)以及嶺回歸演算法的估算圖像(右)。展示了錯誤的等值線以及約束函數。分別的,當紅色橢圓是最小二乘誤差函數的等高線時,實心的藍色區域是約束區域|β1| + |β2| ≤ t以及β12 + β22 ≤ t2。


招募 志願者


廣告、商業合作


請發郵件:357062955@qq.com


喜歡,別忘關注~


幫助你在AI領域更好的發展,期待與你相遇!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

谷歌開源機器學習可視化工具 Facets:從全新角度觀察數據
機器學習演算法實踐:決策樹 (Decision Tree)
讓您的 iOS 應用加入到機器學習的浪潮中
谷歌宣布將使用機器學習來檢測商店裡的惡意程序

TAG:機器學習 |

您可能感興趣

10個科學無法解釋的問題
2分鐘論文 | 用 谷歌「AI可解釋性」 看懂機器學習
科學家發現「天文計算機」,距今2100年歷史,科學家作出解釋
設計師解釋:9.10版本部分英雄的可能性改動
數學中最優雅的歐拉公式——更好的解釋(數學篇)11
《刺激戰場》最靈異的4件事:圖1看到「UFO」,圖5科學解釋不了!
科學無法解釋的10個現象
最最基礎的100個佛教名詞解釋
190402 王源最剛=無欲則剛 源哥開闢成語新解釋
美軍18年計劃,調查1.2萬UFO事件,700起科學無法解釋
第1期——基礎名詞解釋
世界4大「未解之謎」:圖1科學家已破解,圖4至今無法解釋!
熱獻之熱分析基礎知識 其八:150個高分子化學基礎名詞的解釋
Gartner 2019年「數據和分析技術」領域的十大趨勢:增強型分析、持續型智能、可解釋型AI、圖形分析、數據結構等
科學至今無法解釋的20大世界謎團
CL 2018:斯坦福大學:用自然語言解釋訓練分類器
日本30分鐘2次地震,是否與4.7米「地震魚」有關?科學解釋過
IBM NeurIPS 2018 poster:把深度學習模型的表現遷移到傳統機器學習模型獲得高可解釋性
微軟發布機器學習框架,以PFI技術增加模型可解釋性
17秒一次!每次20分鐘,科學發現印度洋神秘「震動」無法解釋