當前位置:
首頁 > 最新 > AAAI2018五個論文獎全部揭曉,「記憶增強的蒙特卡洛樹搜索」獲傑出論文

AAAI2018五個論文獎全部揭曉,「記憶增強的蒙特卡洛樹搜索」獲傑出論文

雷鋒網 AI 科技評論消息,第 32 屆 AAAI 大會(AAAI 2018)日前在美國新奧爾良拉開帷幕,會議時間為 2 月 2 日至 7 日。

作為人工智慧領域最悠久、涵蓋內容最廣泛的學術會議之一,歷屆 AAAI 都吸引了全世界的人工智慧相關領域的研究者參與,會議的論文內容也豐富多彩。近年來參加 AAAI 的中國學者和以及投稿 AAAI 的中國論文也都有明顯增加,這也印證了 AAAI 對中國學者們的吸引力。實際上,來自中國的論文投遞數在 2017 年為 785 篇,僅以微弱優勢超越美國,但在今年實現了 58%的驚人提升,以 1242 篇論文當仁不讓地成為 AAAI 2018 的「學術論文第一產地」。但從錄用論文的數量來說,中美兩國仍然不相上下,均有 260 余篇論文被收錄,可見來自中國的投稿數雖然有了大幅提升,但在質量上仍然有進步的空間。

AAAI 2018 今年共收到論文投稿 3808 篇,接受論文 938 篇,接受率 24%。大會評出傑出論文、傑出學生論文各一篇,傑出論文提名、傑出學生論文提名各一篇,以及經典論文一篇。儘管《Memory-Augmented Monte Carlo Tree Search》獲得傑出論文的消息早已傳播開來,但論文內容還是直到上周末才公開發表;另外,這篇來自阿爾伯塔大學的論文的三位作者中也有兩位是華人。


傑出論文 Outstanding Paper:《Memory-Augmented Monte Carlo Tree Search》

記憶增強的蒙特卡洛樹搜索

論文摘要:這篇論文提出並評估了記憶增強蒙特卡洛樹搜索(M-MCTS),這一方法為在線實時搜索提出了一種新的利用泛化性的方式。記憶增強蒙特卡洛樹搜索的關鍵思路是把蒙特卡洛樹搜索和一個記憶結構組合起來,記憶結構中的每個存儲位置都可以包含某個特定狀態的信息。通過綜合類似的狀態的估計結果,這些記憶可以生成逼近的估計值。作者們展示了,在隨機情況下,基於記憶的逼近值有更高可能性比原始的蒙特卡洛樹搜索表現更好。作者們也在圍棋遊戲中評估了記憶增強蒙特卡洛樹搜索,實驗結果表明,在同樣的模擬步數下記憶增強蒙特卡洛樹搜索也比原始版本有更好的表現。

論文地址:https://webdocs.cs.ualberta.ca/~mmueller/ps/2018/Chenjun-Xiao-M-MCTS-aaai18-final.pdf

傑出學生論文 Outstanding Student Paper:《 Counterfactual Multi-Agent Policy Gradients》

反事實多智能體策略梯度

論文摘要:許多現實世界中的問題,比如網路數據包的路由,或者自動駕駛汽車之間的協調,都可以很自然地看作合作性的多智能體系統問題來建模。這就對新的強化學習方法提出了強烈的需求,以便為這些系統高效地學習到區中心化的運行策略。出於這個目的,作者們提出了一種新的多智能體的「執行者-批評者」方法:反事實多智能體策略梯度(COMA)。COMA 中使用一個中心化的批評者估計Q函數和區中心化的執行者,從而優化智能體的運行策略。除此之外,為了解決多智能體間互相建立信任的問題,它使用了一個會把單個智能體的動作邊緣化的反事實基準線,同時還能保證其它智能體的動作不變。COMA 中使用了一個批評式的表徵,從而使得這個反事實基準線可以在單個前饋流程中進行高效的計算。作者們在星際爭霸遊戲的單位控制測試環境中評估了 COMA 的表現,使用了非常便於分別觀察的去中心化變數。與這個環境下的其它多智能體執行者-批評者方法相比,COMA 的平均表現有顯著提高,而且 COMA 得到的最好的智能體的表現可以和頂尖的具有全狀態數據的中心化控制方法相提並論。

論文地址:https://arxiv.org/abs/1705.08926

傑出論文提名 Outstanding Paper, Honorable Mention:《Generalized Adjustment Under Confounding and Selection Biases》

對選擇偏倚和混雜偏倚的泛化調節處理方法

論文摘要:選擇偏倚和混雜偏倚是限制常見推理方法在大尺度環境下使用的最常見的兩個障礙。在這篇論文中,作者們泛化了後門調節的想法,以便同時處理這兩種偏倚,並且在不引入選擇偏倚的情況下利用可能的外部數據(比如來自人口調查的數據)。作者們介紹了調節對(adjustment pair)的思路,並展示了通過調節方法識別因果關係的完整圖形條件。作者們還進一步設計了一個演算法,以多項式形式列出所有可以處理的調節對,對於希望評估以部分可處理的調節對的特定屬性(常見屬性包括開銷、變化、測量難度)的研究人員來說這會很有用。最後,作者們描述了一種統計性的估計過程,一旦確認了某個設置是可以處理的就可以執行這個過程;它可以用來處理有限樣本中的多種問題。

論文地址:https://pdfs.semanticscholar.org/023a/a92487c037a7557b9b74e894003725afd00a.pdf

傑出學生論文提名 Outstanding Student Paper, Honorable Mention:《Adapting a Kidney Exchange Algorithm to Align with Human Values》

改造出和人類的價值一致的腎臟分配演算法

論文摘要:如何高效分配有限的資源是經濟學和計算機科學兩個領域共有的經典問題。對於腎臟移植手術來說,通常會由一個中央市場把一切正常的腎臟捐贈者分配給等待腎臟的病人。在腎臟分配中,病人和捐贈者首先由委員會通過特設的權重決定優先順序,然後輸入一個分配演算法,由它決定哪個病人會分配到哪個捐贈者 —— 以及決定哪個病人分配不到捐贈者。在這篇論文中,作者們提出了一種端到端的方法用於在腎臟分配中根據每個病人的檔案估計權重。作者們首先從人類被試者獲取了一組他們認為可以用於決定病人優先順序的屬性(比如醫療特徵,生活方式等等)。然後作者們根據不同病人的檔案向被試者提問對比問題,並根據他們的回答嚴格地計算出各個屬性的權重。作者們展示了如何在腎臟分配市場的分配演算法中使用這些權重。作者們接著在模擬環境下評估了這些權重的影響,發現他們算出的權重的精確值其實影響很小,實際上需要的只是由權重計算出的檔案的排序。不過,與完全不給病人排優先順序的情況相比,帶有權重的演算法還是取得了更好的表現,確實有部分類別的病人從前述的測試者的價值評價中獲得了優先匹配(或者延後匹配)。

論文地址:https://users.cs.duke.edu/~conitzer/kidneyAAAI18.pdf

經典論文 Classic Paper:《Algorithm and Tool for Automated Ontology Merging and Alignment》

自動本體合併和對齊的演算法及工具

這篇論文來自 2000 年的第 17 屆 AAAI 大會。這次頒獎是為了表彰這篇論文在本體匹配和集成研究方面的先驅性貢獻,論文中分析了這個問題的具體情況,並提出了首個創新的解決方案。

論文地址:https://www.aaai.org/Papers/AAAI/2000/AAAI00-069.pdf

論文作者 Natasha Fridman Noy 應邀在會議上進行了演講,介紹了論文內容以及這個問題研究的後續變遷,雷鋒網 AI 科技評論也將為大家整理呈現演講內容。請期待後續報道。

雷鋒網 AI 科技評論報道


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 小兮聊情感 的精彩文章:

TAG:小兮聊情感 |