使用「假設工具」來研究機器學習模型

知識 07-12

原標題 |Using the 『What-If Tool』 to investigate Machine Learning models.

作者 |Parul Pandey

譯者 | 汪鵬（重慶郵電大學）、魯昂（高級開發工程師）

好的從業者都像偵探一樣，探尋如何更好地理解他們所構建的模型。

在可解釋機器學習領域，不能僅僅滿足於簡單地訓練模型獲得預測。為了工作能更有意義並或得更好的結果，我們應該深入探尋和研究我們的模型。除此之外，演算法的約束條件和偏置在也能在後續操作模型時得到清晰的認識。

審查模型時需要提出很多問題，我們需要具有敏銳的探索精神，並查找模型的一些問題和不一致性。通常，這樣的任務往往比較複雜，需要寫下很多常規代碼。幸運的是「What-If」工具被設計用來處理上面描述的問題，他能簡單去檢查，評估以及調試，同時精準度比較高。

What-If 工具(WIT)

What-If Tool 是一個互動式可視化工具用於研究機器學習模型（WIT）。他通過輔助檢查、評估和對比學習模型來幫助我們理解分類或回歸問題。由於他友好的介面設計以及很少涉及複雜的編碼，開發者、產品經理、研究者或學生都可以輕鬆使用。

WIT 是一個開源的可視化工具，由谷歌release 在PAIR(People AI Research) 中。PAIR 通過谷歌將將研究者彙集在一起學習和重新設計與AI的交互方式。

這個系統工具可以通過TensorBoard、Juypter拓展介面或Colab接入。

優點

這個工具的目的是提供一種簡單、直觀、強有力的可視化介面去與訓練機器學習模型和數據交互。下面是WIT的主要優點：

我們怎麼使用WIT？

在一個工作流中比較多個模型

可視化預測結果

通過相似性排列數據點

編輯數據點並觀察模型的輸出

比較反現實的數據點

使用特徵值

實驗中使用混淆矩陣或ROC曲線

測試演算法的約束限制

我們將從上面的幾點分別展開。

Demos

為了更好地顯示WIF的功能，PAIR小組發布了一組使用預先訓練訓練模型的demos。你可以通過notebook或直接通過網站來運行demo。

簡單使用一下WIT

使用

WIT可以被嵌入在 Jupyter、Colab 或 TensorBoard中。這個被清晰地在文稿中指明了，我強烈建議你去通讀這個，在這片短文中詳細解釋並不現實。

完整的想法是首先訓練一個模型，然後使用WIT可視化訓練的分類器在測試數據上的結果。

使用在TensorBoard上

為了使用在TensorBoard中使用WIT，模型需要在通過ensorFlow Model Server部署，被分析的數據需要存儲在TFRecords中並能訪問到。更多詳細信息請通過原文查看 documentation。

使用Notebook中的WIT

為了通過notebook中訪問WIT，需要WitConfigBuilder 來制定數據之後才能分析模型。documentation中提供了在notebook中使用WIT的詳細步驟。

你還可以使用 demo notebook 來編輯自己的數據集中的代碼

詳細解釋

下面使用一個例子來詳細解釋WIT的可用性。例子源自網站傻姑娘提供的demo：收入分類用來基於人口普查信息預測一個人的年收入是否超過50k。數據集源自 UCI Census dataset ，它的特徵包括：年齡、身份、受教育水平等。

總覽

首先做一些數據集上的探討。下面的鏈接link指示了demo：

https://pair-code.github.io/what-if-tool/uci.html

WIT包括兩個主面板，右邊的面板包括：載入數據集合的數據點。

在這個例子中，藍色的表示通過模型預測的年收入低於50k的數據，紅點表示高於50k的數據。默認情況下，WIT使用了0.5的positive classification threshold。如果預測分大於等於0.5，數據點將被預測成正例：高收入者。

簡單介紹一下Facets Dive工具，可視化後的結果比較有趣。Facets Dive 是被PAIR團隊開發的一個FACETS工具，用於幫助理解和探索數據的多特徵。如果你不熟悉的話可以參考我之前寫的文章

使用谷歌的FACETS 來可視化機器學習數據集。Visualising Machine Learning Datasets with Google』s FACETS.

An open source tool from Google to easily learn patterns from large amounts of data 一個開源的工具用來簡單的學習大量數據的模式。

他可以多種不同方式來組織數據包括：混淆矩陣，散點圖、條形圖以及下拉菜單中指定域的點圖。下面呈現了一些例子：

左邊的面板中包含了三個tab，分別是數據點編輯器、性能、特徵。

1.數據點編輯器選項卡

數據點編輯器通過以下方式幫助執行數據分析：

查看和編輯數據點的詳細信息

它允許選定數據點，並在右側面板上以黃色突出顯示。讓我們嘗試將年齡從53更改為58，然後單擊「運行推理」按鈕以查看它對模型性能的影響。

通過簡單地改變這個人的年齡，該模型現在預測該人屬於高收入類別。對於這個數據點，早期陽性（高收入）類的推理得分為0.473，陰性（低收入）類的得分為0.529。但是，通過改變年齡，積極的班級分數變為0.503。

尋找最近的反事實

理解模型行為的另一種方法是查看哪些小的變化可以導致模型顛倒其決策，這被稱為反事實。只需單擊一下，我們就可以看到最相似的反事實（以綠色突出顯示）到我們選定的數據點。在數據點編輯器選項卡中，我們現在還可以看到原始數據點的特徵值旁邊的反事實的特徵值。綠色文本表示兩個數據點不同的功能。WIT使用L1和L2距離來計算數據點之間的相似性。

在這種情況下，最近的反事實稍微更老並且具有不同的職業和資本收益，但在其他方面是相同的。

我們還可以使用「顯示與所選數據點的相似性」按鈕來查看所選點與其他點之間的相似性。WIT測量從選定點到每個其他數據點的距離。讓我們改變我們的X軸散射，以顯示到所選數據點的L1距離。

分析部分相關圖

部分相關圖(簡稱PDP或PD圖)顯示了一個或兩個特徵對機器學習模型預測結果的邊際效應(J. H. Friedman 2001)。

年齡和教育數據點的PDP（分析部分相關圖）如下：

上圖顯示：

該模型已經了解了年齡與收入之間的正相關關係

更高級的學位使模型對更高的收入更有信心。

高資本收益是高收入的一個非常有力的指標，遠遠超過任何其他單一特徵。

2.性能與公平選項卡

此選項卡允許我們使用混淆矩陣和ROC曲線查看整體模型性能。

模型性能分析

為了分析模型的性能，我們需要告訴工具什麼是基本事實特徵，即模型試圖預測哪個特徵是「超過50K」。

我們可以看到，在默認閾值為0.5時，我們的模型在大約15％的時間內是不正確的，大約5％的時間是誤報，10％的時間是假陰性。更改閾值以查看其對模型準確性的影響。

還有一個「成本比」設置和一個「優化閾值」按鈕，也可以調整。

機器學習的公平性

機器學習的公平性與模型構建和預測結果同樣重要。訓練數據中的任何偏差都將反映在訓練模型中，如果部署了這樣的模型，結果輸出也會有偏差。WIT可以通過幾種不同的方式幫助調查公平問題。我們可以設置用於切片數據的輸入要素（或一組要素）。例如，讓我們看看性別對模型性能的影響。

性別對模型表現的影響

我們可以看到該模型對女性的準確性高於男性。此外，該模型預測女性的高收入遠低於男性（女性佔9.3％，男性佔28.6％）。一個可能的原因可能是由於數據集中女性代表性不足，我們將在下一節中探討。

此外，該工具可以最佳地設置兩個子集的決策閾值，同時考慮與演算法公平性相關的許多約束中的任何一個，例如人口統計或機會均等。

3.功能選項卡

「功能」選項卡提供數據集中每個要素的摘要統計信息，包括直方圖，分位數圖表，條形圖等。該選項卡還可以查看數據集中每個要素的值分布。例如，讓我們探討性別，資本收益和種族特徵。

我們推斷資本收益非常不均勻，大多數數據點都設置為0。

原住民的分配 || 性別分布

同樣，大多數數據點都屬於美國，而女性在數據集中沒有很好地表示。由於數據存在偏差，因此其預測僅針對一組是很自然的。畢竟，模型從提供的數據中學習，如果數據源是傾斜的，那麼結果就是如此。機器學習已經在很多應用和領域得到了證明。然而，機器學習模型的工業應用的關鍵障礙之一是確定用於訓練模型的原始輸入數據是否包含歧視性偏差。

結論

這只是一些假設工具功能的快速瀏覽。WIT是一個非常方便的工具，它能夠探測模型，掌握最重要的人的手中。簡單地創建和訓練模型不是機器學習的目的，但理解模型的原因和方式才是真正意義上的機器學習。

參考資料：

The What-If Tool: Code-Free Probing of Machine Learning Models

https://pair-code.github.io/what-if-tool/walkthrough.html

https://github.com/tensorflow/tensorboard/tree/master/tensorboard/plugins/interactive_inference

本文編輯：王立魚

英文原文：

https://towardsdatascience.com/using-what-if-tool-to-investigate-machine-learning-models-913c7d4118f

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！