當前位置:
首頁 > 知識 > Metropolis-Hastings 演算法和 Gibbs sampling 演算法

Metropolis-Hastings 演算法和 Gibbs sampling 演算法

我們有一個概率分布(pi)


,需要生成滿足這個分布的樣本。 如果樣本維度很低,只有一兩維,我們可以用反切法、拒絕採樣和重要性採樣等方法。 但是樣本維度很高,成千上百,這些方法就不適用了。這時我們就要使用一些高檔的演算法,比如下面要介紹的 Metropolis-Hasting 演算法和 Gibbs sampling 演算法。


Metropolis-Hasting 演算法和 Gibbs sampling 演算法是馬爾科夫鏈蒙特卡洛(Markov Chain Mento Carlo, MCMC)方法。我們先介紹 MCMC 方法。

1. 馬爾科夫蒙特卡洛方法


MCMC 方法是用蒙特卡洛方法去體現馬爾科夫鏈的方法。馬爾科夫鏈是狀態空間的轉換關係,下一個狀態只和當前的狀態有關。比如下圖就是一個馬爾科夫鏈的示意圖。

Metropolis-Hastings 演算法和 Gibbs sampling 演算法


圖中轉移關係可以用一個概率轉換矩陣 p 表示,


egin


P = egin


0 &1 &0 \


0&0.1 &0.9 \

0.6 &0.4 &0


end


如果當前狀態分布為(u(x) = (0.3,0.2,0.5))


, 那麼下一個矩陣的狀態就是( u(x)p ), 再下一個就是(u(x)p^2),... 最後會收斂到一個平穩分布(pi)。這個平穩分布(pi)只和概率轉移矩陣 p 有關,而和初始狀態分布 u 是什麼沒有關係。


如何判斷一個馬爾科夫鏈是否能收斂到平穩分布,以及如何判斷一個狀態分布是不是一個馬爾科夫鏈的平穩分布呢?我們有下面定理。

細緻平衡條件: 已知各態歷經的的馬爾科夫鏈有概率轉移矩陣(p)


,以及已知狀態分布(pi)。如果對於任意兩個狀態 i 和 j,下面公式成立,則馬爾科夫鏈能夠收斂到(pi)。


pi(i) p(j|i) = pi(j) p(i|j) onumber


這裡的各態歷經是指任意兩個狀態之間可以通過有限步到達。

怎麼證明細緻平衡條件呢?我也不知道啊。


MCMC 方法的基本原理是利用細緻平衡條件構建一個概率轉移矩陣,使得目標概率就是概率轉移矩陣的平穩分布。怎麼構建這樣一個概率轉移矩陣呢? Metropolis-Hasting 和 Gibbs sampling 演算法本質上就是構建概率轉移矩陣的不同方法。


2. Metropolis-Hastings 演算法


Metropolis-Hastings 演算法先提出一個可能不符合條件的概率轉移矩陣 q, 然後再進行調整。比如我們提出的 q 是均勻概率,即從任意狀態到任意狀態的概率是相等的。顯然在絕大部分情況下,q 的穩定概率不是目標概率(pi)


,即不滿足細緻平衡條件。


pi(i) q(j|i) e pi(j)q(i|j) onumber


如何讓這個不等式轉變成等式呢?根據對稱性,我們容易得到下面的等式。


label


pi(i) q(j|i) pi(j)q(i|j) = pi(j)q(i|j) pi(i)q(j|i)


這時整個概率轉移矩陣滿足細緻平衡條件。從 i 狀態轉到 j 狀態的概率是(q(j|i) pi(j)q(i|j))


,實現這個轉移概率的方式是 i 狀態以 q(j|i) 概率跳轉到 j 狀態,然後以(pi(j)q(i|j))接受跳轉 (拒絕跳轉就退回 i 狀態)。這樣整個 Metropolis-Hasting 演算法的框架就建立起來了。


這個原始的 Metropoli-Hasting 演算法的有一個小問題。 跳轉接受概率(pi(j)q(i|j))


和(pi(i)q(j|i))的值很小,演算法進行過程充斥著跳轉拒絕。為了改進這點,Metropoli-Hasting 演算法的方法是公式兩邊同時乘以一個係數,使得(pi(j)q(i|j))和(pi(i)q(j|i))中大的一項 scale 到 1,得到下面的公式。


pi(i) q(j|i) frac{pi(j)q(i|j)}{pi(i)q(j|i)} &=& pi(j)q(i|j) ;; when ;; pi(i)q(j|i) > pi(j)q(i|j) onumber \


oronumber \


pi(i) q(j|i) &=& pi(j)q(i|j)frac{pi(i)q(j|i)}{pi(j)q(i|j)} ;; when ;; pi(i)q(j|i) le pi(j)q(i|j) onumber \


這個公式可以進一步簡化為公式 2


pi(i) q(j|i) a(j|i) &=& pi(j)q(i|j) a(i|j) onumber \


a(j|i) &=& min{frac{pi(j)q(i|j)}{pi(i)q(j|i)},1} onumber \


a(i|j) &=& min{frac{pi(i)q(j|i)}{pi(j)q(i|j)},1}


根據上面的推導,我們容易得到 Metropolis-Hasting 演算法的流程。

Metropolis-Hastings 演算法和 Gibbs sampling 演算法



3. Gibbs sampling 演算法


Gibbs sampling 演算法是 Metropolis-Hasting 演算法的一個特例。很雞賊的一個特例。m 維的一個樣本跳轉到另一個樣本的過程,可以拆解為 m 個子過程,每一個子過程對應一個維度。這時概率轉移矩陣可以看成是 m 個子概率轉移矩陣之積,即(p = prod_^ p_k )


其中(p_k)


表示第 k 維的變化概率。在(p_k)中,兩個狀態之間只有 k 維不同,其跳轉概率如下所示;不然為 0。


p_k(pmb_{dashv k, k=v_2}|pmb_{dashv k, k=v_1}) = frac{pi(pmb_{dashv k, k=v_2})}{sum_pi(pmb_{dashv k, k=v})} onumber


其中(pmb_{dashv k, k=v_2})


表示樣本第 k 維數據為(v_2),其他沒有變化。這時候我們發現如下公式


&& pi(pmb_{dashv k, k=v_1}) p(pmb_{dashv k, k=v_2}|pmb_{dashv k, k=v_1}) onumber \


&=& pi(pmb_{dashv k, k=v_1}) frac{pi(pmb_{dashv k, k=v_2})}{sum_pi(pmb_{dashv k, k=v})} onumber \


&=& pi(pmb_{dashv k, k=v_2}) frac{pi(pmb_{dashv k, k=v_1})}{sum_pi(pmb_{dashv k, k=v})} onumber \


&=& pi(pmb_{dashv k, k=v_2}) p(pmb_{dashv k, k=v_1}|pmb_{dashv k, k=v_2}) onumber \


即(p_k)


和(pi)滿足細緻平衡條件的等式。那麼(p_k)就是我們要構建的概率轉移矩陣嘛?答案是否定的。因為完整的細緻平衡條件需要各態歷經,而一個狀態在概率轉移矩陣(p_k)下永遠不能到達另一個第 k-1 維數據不同的狀態。我們最終構建的概率轉移矩陣


p = prod_^ p_k


我們很容易證明(p)


依然滿足細緻平衡條件中的等式,同時還滿足各態歷經。根據這些推理,我們得到 Gibbs sampling 的演算法過程。

Metropolis-Hastings 演算法和 Gibbs sampling 演算法



3. 總結


請您繼續閱讀更多來自 推酷 的精彩文章:

獨家解密:探月「網紅」兔背後的推手
海報設計靈感:簡約獨特的圖形圖案排版 by Quim Marin
量子通信衛星上天,VR遊戲時代的黎明也快到了?
廣告人挖腦溝想創意,有人成就經典,有人只是挖溝
5G關鍵技術之波束成型

TAG:推酷 |

您可能感興趣

Bridge to the digital world——AR演算法技術分享
資深演算法工程師眼中的深度學習:Ian Goodfellow 和Yoshua Bengio的「Deep Learning」讀書分享
標籤傳播演算法(Label Propagation)及 Python 實現
谷歌投資「演算法商店」 Algorithmia ,要打造AI版的Play Store?
TensorFlow Agents日前開源,輕鬆在TensorFlow中構建並行強化學習演算法
Facebook開源Zstandard新型壓縮演算法代替Zlib 簡單使用
解析Monte-Carlo演算法
《Alteration》:這部 VR 電影用上了 Facebook 的風格轉移演算法
神奇的HyperLogLog演算法
MetaTrader 5 演算法交易
Science專訪谷歌Magenta負責人:AI創作焦點是機器學習演算法
SlopOne推薦演算法(附Python源碼)
機器學習演算法實踐:決策樹 (Decision Tree)
DeepMind提出Rainbow:整合DQN演算法中的六種變體
Nutella生產商Ferrero用一種演算法來設計包裝
Facebook研製新工具,Google演算法則可能推送假新聞
常見的排序演算法總結(JavaScript)
「解密阿老師」從 AlphaGo 到Master,最大優勢是通用演算法
遞歸演算法中一種不可忽略的技術(Memoization)