當前位置:
首頁 > 新聞 > KDD Cup 2019 啟動報名,一起來 AutoML 吧

KDD Cup 2019 啟動報名,一起來 AutoML 吧

KDD Cup 2019 啟動報名,一起來 AutoML 吧

雷鋒網 AI 科技評論消息,KDD 2019 將於今年 8 月 4 日—8 日在美國阿拉斯加州安克雷奇市舉行,隨著投稿的結束,會議的臨近,一年一度的 KDD Cup 也開始啟動報名啦。

不同於去年的單項賽事,今年共分為三項比賽:

  • 常規機器學習挑戰賽(Regular ML Track)

  • 自動機器學習挑戰賽(Auto-ML Track)

  • 以人為本的強化學習挑戰賽(Humanity RL Track)

目前,Auto-ML 挑戰賽已經進入比賽階段,冠軍將獲得 15000 美元獎金,亞軍將獲得 10000 美元獎金,季軍將獲得 5000 美元獎金。值得一提的是,今年賽事的主辦權,又一次花落中國,第四範式、ChaLearn 和微軟將聯合主辦此次 Auto-ML 挑戰賽。

競賽者需要利用時序關係數據,設計一個能夠自主(無人為干預)實現監督學習的 AutoML 計算機程序。此次比賽將聚焦在二分類問題,且時序關係數據均來自實際業務場景。根據大多數實際應用的時間屬性,數據集按時間順序劃分為訓練集和測試集。訓練集和測試集都由一個主表、一組相關表和一個關係圖組成:

  • 主表包含帶有樣本標記、部分特徵和時序標籤的實例,用於二分類;

  • 相關表包含了主表中實例的重要輔助信息,可用於提高預測效果。相關表中的欄位可能含有時間標籤,意味著該表中的信息與時間有關;

  • 不同表中數據之間的關係用關係圖描述。需要注意的是,任何兩個表(主表或相關表)都可以有一個關係,任何一對錶最多只能有一個關係。主辦方保證訓練集和測試集的關係圖是相同的。

參賽者需要提交通過主表、相關表和關係圖自動構建機器學習模型的 AutoML 方案。一旦經過訓練,模型將以測試主表(不包括樣本標記)、相關表和關係圖作為輸入,並預測測試集的樣本標記。參賽者提交的方案將在受限制的計算資源和時間內進行測試。

為了讓參賽者能夠更好的開發並評估方案,主辦方提供了 10 個時序關係數據集,包括 5 個公共數據集,5 個私有數據集。

比賽共分為三個階段:

  • Feedback 階段:反饋階段。在此階段,參賽者可以在五個公共數據集上進行訓練,開發 AutoML 方案。參賽者可以進行有限數量的提交,並獲得作為反饋的所有五個公共數據集的測試數據的性能。參賽者可以下載有標記的訓練數據集和未標記的測試數據集。因此,參賽者可以在線下準備他們的代碼並提交。該階段最後的代碼提交將最終作為下一階段進行盲測的代碼。

  • Check 階段:校驗階段。該階段將在五個私有數據集上對第一階段的最後一次提交的代碼進行盲測,確保提交的方案順利運行,不會出現例如超時或者內存溢出等問題,但參賽者無法看到具體的結果,所有小組具備一次更新代碼的機會,以保證在最終階段正確的運行自己的代碼。

  • AutoML 階段:即盲試階段。該階段將測試方案在私有數據集上的性能。參賽者的代碼將在無需人為干預情況下完成訓練和預測。AUC 作為評價指標,最終將根據五個私有數據集的平均排名進行評分。若最終比分相同,則優先考慮可解釋性更好的方案,可解釋性將由專家團隊評審。

以上三個階段的計算及內存資源均有所限制,因此方案應兼顧效果及效率。

時間軸如下:


  • 2019 年 4 月 1 日:比賽開始,發布公共數據集。參與者可以開始提交代碼並在排行榜上獲得即時反饋信息。

  • 2019 年 6 月 27 日:Feedback 階段結束,Feedback 階段的代碼自動遷移到 Test 階段。

  • 2019 年 7 月 7 日:Check 階段結束,主辦方開始代碼驗證。

  • 2019 年 7 月 11 日:提交報告截止。

  • 2019 年 7 月 16 日:AutoML 階段結束,開始評審流程。

  • 2019 年 7 月 20 日:宣布 KDD Cup 冠軍。

  • 2019 年 8 月 4 日:舉辦頒獎儀式

大賽官網:https://www.4paradigm.com/competition/kddcup2019

報名地址:https://competitions.codalab.org/competitions/21948

雷鋒網雷鋒網

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

為對抗來自東方的神秘力量,Intel著手打造百億億次級超算Aurora

TAG:雷鋒網 |