當前位置:
首頁 > 新聞 > Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

雷鋒網按:上個月(2月23日),Facebook開源了一款基於 Python 和 R 語言的數據預測工具——「Prophet」。本文則詳細介紹了Prophet的貝葉斯推理實踐,具體展示了研究人員把兩個數據集用在Prophet上的運行效果。

如今,市面上已經許多Python 和 R語言可適用的時間序列預測模型了,那麼Facehook的Prophet在這一領域又有什麼優勢呢?

Prophet在進行預測,其後端系統是一個概率程序語言Stan,這代表Prophet能發揮出很多貝葉斯演算法的優勢,比如說:


  • 使模型具有簡單、易解釋的周期性結構;

  • 預測結果包括才完全後驗分布中導出的置信區間,即Prophet提供的是一個數據驅動的風險估計。

在下面研究中,研究者讓Prophet對兩組數據進行預測,在後端使用概率程序語言,讀者可以藉此看到使用Stan的一些工作細節。

Prophet使用了一種通用時間序列模型,這種模型可適用於Facebook上的數據,並且具有分段走向(piecewise trends)、多周期及彈性假期(floating holiday)三種特性。

Prophet的把時間序列預測問題轉變成了一個曲線擬合練習(exercise)。在這個曲線中,因變數是增長、周期和holiday的總體表現。


  • 增長(growth)

    這一部分採用一個隨時間變化的邏輯增長模型,屬於非線性增長,所以,要用簡單的分段常數函數來模擬線性增長。

    用比率調整向量模擬分段點,每個分段點都對應一個具體的時間點。用拉普拉斯分布(Laplace distribution)模擬比率調整變數,位置參數(location parameter)設定為0。

  • Prophet 模型周期(periodic seasonality)

    採用標準傅里葉級數。年、周的周期性(seasonality)近似值分別為20和6,周期性成分(seasonal component)在正常情況下是平滑狀態。

  • 假期(Holiday)

    用一個指標函數來模擬。

使用者可以調節擴散參數(spread parameter),以模擬未來會有多少歷史季節性變化(historical seasonal variation)。

Prophet的使用

用戶在用Prophet時,不需要了解Stan代碼,僅僅使用大家熟知的Python 或 R編程語言即可。

下面,研究者讓它在一個周期性極強的數據集上運行(運行過程如下圖所示)。

該數據集為摩納哥夏威夷火山上測量的大氣二氧化碳含量。

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

設置好程序後,只用了幾秒鐘,模型就給出了下圖所示的預測結果:

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

Prophet很容易就探測到該數據以年為周期,並且長期增長的趨勢。在這裡要提一下,Prophet自帶數據驅動的置信區間,這是概率編程系統的一個重要優點。

另外,Prophet也為時間序列的組成部分(例如一周中某天、或一年中的某天)提供了簡單、易解釋的預測結果,如下圖所示:

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

這裡要注意的是,以周為單位的預測數據要比其他兩個的數據小得多,而且噪點也更大。知道這一點非常有意義:這表明,在全球範圍內,大氣中化學物質的含量並不是以周為周期變化的;另外,年數據也顯示出北半球植被對二氧化碳含量的影響:夏天過後含量降低,冬天過後含量升高。

出生數據

下面,研究人員讓Prophet對一組更具挑戰性的數據集(美國年出生人數)進行預測。

該數據集用高斯過程(雷鋒網註:也叫正態隨機過程)進行分析,它同時具有周期性和「假期效果」。

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

Prophet能夠通過調整轉折點平滑參數自動探測到轉折點。研究者把轉折點平滑參數設為0.1,而不是默認的0.05。這可使預測結果更靈活,更少平滑,但也更容易顯示噪點。

Prophet用了大概1分鐘來理解這些數據集下圖中的黑點),然後給出了預測結果(下圖中的藍線)。

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

Prophet預測出,出生率會在每年的八月到十月有所提高。

從下圖中能看出,新年期間出生人數較少,而情人節期間則偏高。Prophet通過定義指示變數系列(indicator variable series),把這種一年某些天數據猛然增高的現象自動看做「holidays」,這個指示變數系列能說明(或預測)該點的數據是不是(或是否將是)一個假期。

Facebook的數據預測工具Prophet有何優勢?用貝葉斯推理一探究竟

總結

以上概率程序報告中展示了Prophet在貝葉斯演算法中的實踐效果,結果發現:


  • 開發者和數據員們能通過概率編程語言(例如Stan和pymc3),更容易地量化所有結果的概率值,而不僅僅是選出最有可能性的那一個;

  • 在做預測時,它能為通用時間序列模擬合適的函數。但在模擬函數時,為了達到Prophet用戶想要的效果,可能會犧牲一些靈活性;

  • Prophet使研究人員能更簡單、快捷地運行Stan,省掉了使用Python和R的複雜;

  • Prophet的魯棒性良好,作為一個概率程序產品,用戶很容易就能上手。

via:fastforwardlabs

相關文章,請參看雷鋒網此前報道:

Cloudera 發布自助式數據科學開發環境 原生支持 R、Python、Scala 和各大開源框架

谷歌開源 Python Fire;一張圖讀懂 Python、R 的大數據應用等 | AI 開發者頭條

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

ABB收購B&R,重金補課「叫板」西門子
狼人殺要做社交,繞不開音視頻連麥 | 深度
真「偷到」激光雷達技術了嗎?數據顯示Waymo的自動駕駛技術比Uber強5000多倍
三年內讓自動駕駛計程車上路?戴姆勒的步子邁的可真不小
一開始就選擇Hard模式,奧比中光在國內唯一量產結構光3D攝像頭

TAG:雷鋒網 |

您可能感興趣

Bigcommerce和shopify的區別是什麼?Bigcommerce和shopify哪個建站更有優勢?
亞馬遜Coupons、Promotion是什麼?亞馬遜Coupons和Promotion的優勢和區別是什麼
IBM通過Project Dabater展示人工智慧優勢
華為mate20Pro對比iPhone XS Max優勢明顯,iPhone機皇地位不保?
兩大優勢贏新AirPods 蘋果Powerbeats Pro開售
多僱主共保池:主要優勢、過往表現、加入要求 Multi-Client Pool Solution
史詩級對攻戰!Tottenham Hotspur 憑藉客場進球優勢淘汰歐冠熱門 Manchester City
Coleman答記者問第二季:Infor Coleman的競爭優勢
面對oppo find x,vivo NEX的競爭優勢在哪裡?
關於Battle Royale的十一篇探討:規則優勢和規則弊端
Oculus Quest對比Oculus Rift:融合多項優勢的全新體
Wish ProductBoost智能版全面解析:旺季PB,認準這17種優勢產品
TCL新款智能手機BlackBerry Key2,它與KeyOne相比有哪些優勢
Loup Ventures:Siri最大的優勢在於能夠回答與音樂相關的問題
波蘭allegro有什麼優勢?allegro電商入駐開店條件費用詳解
比華為gt,多六個優勢的三星watch active是垃圾嗎
華為Mate 20系列這些優勢力壓iPhone XS
選擇你的課Instagram群控的方式以及優勢!
次世代主機之爭Xbox Scarlett和PS5誰先發售誰有優勢
沒錯,華為MateBook X Pro因這些優勢叫板蘋果