「人工智慧的數理基礎」主題論壇，五位學者從數學角度解決AI問題

科技 05-10

智東西（公眾號：zhidxcom）文| 王小溪

導語：來自北京大學的五位學者參加了「人工智慧的數理基礎」主題論壇，他們從數學、統計和計算的角度做了學術報告。

智東西5月9日消息，圍繞當前人工智慧面臨的可計算性、可解釋性、泛化性、穩定性的重大理論挑戰，北京智源人工智慧研究院從數學、統計和計算的角度，發起了「人工智慧的數理基礎」主題論壇，並將邀請眾多學者將分享他們在這一領域的研究經驗。本次論壇由北京大學數學科學學院夏壁燦主持。

在本次論壇上做學習報告的學者有：北京大學國際數學研究中心長聘副教授、主任助理，北京大數據研究院深度學習實驗室研究員、生物醫學影像分析實驗室副主任董彬、北京大學數學科學學院及統計科學中心研究員林偉、北京大學數學科學學院副教授邵嗣烘、北京大學數學科學學院及統計科學中心研究員王涵以及北京大學數學科學學院統計學長聘教授、大數據研究中心數據科學教授張志華。這五位學者也都是首批智源學者候選人。

智源學者計劃是由智源人工智慧研究院為選拔和培養一批人工智慧人才而提出的。首批智源學者中，「人工智慧數理基礎」研究方向首席科學家由中國科學院院士、北京大學數學科學學院張平文教授擔任，夏壁燦教授擔任智能研究項目經理。

下文將簡要介紹五位學者在此次主題論壇上的報告。

一、董璇：用微分方程來指導深層神經網路構架設計

董斌今天的報告主題是《Bridging Deep Neural Networks and Differential Equations for Image Analysis and Beyond》。

他在報告中展示了自己將兩大類數學方法小波和PDE方法相聯繫，證明了常用的小波模型可以漸進逼近各類變分和PDE模型，該研究既為小波方法注入了幾何直觀，也賦予了PDE方法稀疏逼近的解釋，讓其設計出結合兩類方法優點的新模型。

他介紹了他們團隊將PDE和深度學習建立起聯繫，率先提出以數值（偏）微分方程離散格式為指導的深層神經網路構架設計的新思想，為圖像處理、圖像識別、未知物理模型反衍、模型約簡等重要問題設計全新、精簡、高效的深層神經網路。

二、林偉：維數不只是詛咒，還應該是祝福

林偉的報告題目是《破解機器學習中的維數災難：從可辨識性談起》。

他在報告中指出，近年來，以深度學習為代表的「黑箱」機器學習演算法在應用中獲得了巨大成功，但缺乏可解釋性和嚴格的理論基礎。深度神經網路可被視為一類過參數化模型，與經典統計模型存在很大差別。

他認為，可辨識性和維數災難是從統計學角度理解機器學習的關鍵。他從統計模型的可辨識性談起，簡要介紹了高維統計中克服維數災難的主要方法，及其對解釋深度神經網路泛化能力的有益啟示。

他說：「維數不只是詛咒，還應該是祝福。」

三、邵嗣烘：通過連續問題發展高效演算法

邵嗣烘帶來了《面向智能的數學》為題的報告，他用人類的終結問題——人從哪來要到哪去，人如何意識到自己是自己本身來引出自己的報告。

人類智能的物質基礎是由約1000億個神經元組成的腦神經網路，該網路如何產生智能一直以來都是懸而未決的終極問題，因為追蹤其中任何兩個神經元之間的連接或關聯無論對數學理論還是演算法設計而言都是巨大的挑戰。

為了在腦神經網路上建立合適的數學模型來刻畫由物質世界的物理定律演變成思想世界的意識智能的過程，他的項目將從兩個角度在這個方向上開展探索。一方面，基於量子力學的維格納函數描述，他和團隊將試圖在腦神經網路上運行維格納量子動力學來計算不同神經元間的量子關聯；另一方面，作為更基礎的部分，需要發展網路或圖上的數學，他們將通過建立和離散問題等價的連續問題發展高效的演算法，同時在網路上引入更多現代數學的概念。

四、王涵：基於深度學習的分子動力學數字方法

王涵的報告題目為《Deep Learning for Multiscale Molecular Modeling》。

王涵介紹了他和合作者發展的基於深度學習的原子間相互作用建模方法——深度勢能。這種通過模型一致性估計深度勢能模型誤差的方法，從本質上改善了原子間相互作用的建模精度。

他們的研究成果被英國皇家學會外籍院士Parrinello所發展應用在研究硅的熔化上，克服了傳統原子間相互作用模型無法同時精確刻畫硅的固相和液相的困難。王涵還介紹，他們的成果也被背景師範大學的崔剛龍教授所擴展，用於對非絕熱激發態分子動力學建模，克服了傳統方法在能量面交接錐處模型精度低的難題。

五、張志華：機器學習是解決人工智慧的王者之道

張志華的報告題目為《數學工程——理解機器學習的一種角度》。他介紹了機器學習的現狀和技術路線。

機器學習是從數據中挖掘出有價值的信息。數據本身是無意識的，它不能自動呈現出有用的信息。怎樣才能找出有價值的東西呢？第一步要給數據一個抽象的表示；接著基於表示進行建模；然後估計模型的參數，也就是計算。

張志華認為機器學習的第一個階層是基於規則的學習，這個階段的歷程比較成熟，它的目的就是規則，用規則去做預測。代表的形態有專家系統和句法模式識別。

後來，研究人員慢慢發現要做到從數據到表示牽涉深入的領域背景知識。比如，自然語言處理需要生活與的語言學背景，視覺或圖像則需要通過認知、神經科學等來獲取表示。

研究人員也慢慢發現，基於規則去學習出現了一些問題，比如，基於規則的模型對於淺層推理有效，但沒法用來進行深層次的推理。如果規則過多，要做到在規則裡面進行搜索，就容易出現維數災難的問題。

為了解決這個問題，一個簡單的思路是弱化從數據到表示的環節，基於這樣的理論，機器學習進入了第二個階段，即統計推理學習。

從1995年到2005年的十年，是統計機器學習黃金髮展的十年。我們看到的應用領域，比如計算機識別、語音識別，他們的核心方法是統計方法。

統計學習是統計建模和演算法計算的結合。神經網路在這個時期表現的並不是很好，處於低落階段。

但當統計學習發展到一定階段，人們發現數據到表示這件事情還是無法繞過。研究人員就順其自然地想要讓機器通過學習，也就是通過一個自動化的方式去解決表示問題。

所以機器學習進入了第三個階段即基於深度表示的學習。在這個時期，大模型大數據大計算使得這個思路變得可行。

張志華認為機器學習的關鍵在於表示學習，表示需要適合預測和適合計算。深度表示目前遇到的挑戰在於，由於大數據的需要可能導致過參數化，並且由於多層的表示，導致問題高度非凸化。

機器學習的基礎原則是可預測性、可計算性以及穩定性。

張教授也介紹了機器學習的關鍵技術思路：深度表示、規範技術、平均化技術。其中，規範技術用來處理過擬合、病態、非穩定性的問題。

張志華最後總結到，統計為解決問題提供了數據驅動的建模途徑，概率論、隨機分析、微分方程、微分流形等工具可以引入來研究AI的數學機理。無論從統計角度還是數學角度來研究AI，其實際性能最後都要通過計算呈現出來。

在回答現場觀眾的問題時，張志華說機器學習是現代統計學，機器學習是解決人工智慧的王者之道。

結語：智源學者計劃支持人工智慧數理基礎學者勇闖AI「無人區」

據北京智源人工智慧研究院副院長劉江介紹，此次論壇為智源的首次論壇。他認為，我國現在對於人工智慧的研究還算不錯，但相比與美國還存在很大差距。而智源想要把北京市真正有能力的科學家組織起來，支持他們勇闖人工智慧「無人區」。

今天論壇上做學術報告的五位學者從數學、統計和及計算的角度，為迎接人工智當下面對的挑戰做出了自己的努力。學界優秀的學者將會推進我國智能研究的進一步發展。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 智東西 的精彩文章:

※政策加碼，巨頭湧入，AI時代最後一座金礦！
※AI早報：清華車輛與運載學院成立廣汽新能源Aion S開賣

TAG:智東西 |