當前位置:
首頁 > 最新 > 測度論與概率論公理化

測度論與概率論公理化

物理學的公理化?

——希爾伯特第六問題

我在山東大學數學學院念書的時候,聽過最多的外國數學家名字就是,柯爾莫哥洛夫(Andreyii Nikolaevich Kolmogorov,1903-1987)。這也許與當時所學專業有關,但客觀地講,柯爾莫哥洛夫在眾多領域都有開創性的研究,經常聽到他的名字並不奇怪:實變函數論、數學基礎論、拓撲空間論、泛函分析、概率論、動態系統、統計力學、數理統計、資訊理論等多個分支,絕對的「全才數學家」,以致於1963年在第比利斯(現為喬治亞首都)召開概率統計會議時,美國統計學家沃爾夫維茨(J. Wolfowitz,1910-1981)說 「我來蘇聯的一個特別的目的是確定柯爾莫哥洛夫到底是一個人呢,還是一所研究機構」。

圖片:Kolmogorov works on his talk

僅就概率論這一門課程來說,我在大二的時候學過好多以「柯爾莫哥洛夫」命名的概念:柯爾莫哥洛夫強大數定律、柯爾莫哥洛夫不等式等等,柯爾莫哥洛夫個人更是被稱為「現代概率論之父」。由於柯爾莫哥洛夫長期在莫斯科大學學習(先學歷史學,後來轉學數學)工作,使得莫斯科大學成為我心中的三大學術聖地之一(其餘兩地是普林斯頓高等研究院、巴黎高師)。

當然,這篇文章的目的不在寫柯神的傳記(由於名字太長,加之敬仰心情,「柯爾莫哥洛夫」以下簡稱「柯神」),所以對柯神個人的描寫到此結束。對於想了解柯神更多的讀者,我強烈推薦日本數學家、「現代隨機分析之父」伊藤清(It^o Kiyoshi,1915-2008)所寫的紀念文章(傳送門:柯爾莫哥洛夫的數學觀與業績)。

回歸正題。1900年巴黎數學家大會上,德國數學家希爾伯特(David Hilbert,1862-1943)提出了23個最重要的問題供二十世紀的數學家們去研究,其中第六問題是「物理學的公理化」。希爾伯特建議用數學的公理化方法推演出全部物理學,首先是概率和力學。最開始的突破來自柯神1933年的工作:把測度論應用到概率論的方法,第一個把概率論建立在堅固的數學基礎上。可以這樣講,從此概率論真正意義上成為數學的一支,是柯神為概率論注入了嚴密性。

那麼,什麼是測度論?測度論與概率論有怎樣的關係?

1

柯神之前的概率論

對於沒有測度論和有測度論的概率論的區別,有一個簡單的類比,我覺得很有道理:就像微積分和數學分析的主要區別,是有沒有定義實數的完備性那樣。所以數學分析一定有講區間套定理、聚點定理、有限覆蓋定理,而微積分就不會講這些。

為了解柯神之前的概率論,即沒有測度論的概率論,有必要先來簡單梳理一下概率論的發展史

歷史

1494年,盧卡·帕喬利(Luca Pacioli,1445-1517)在《算術、幾何、比及比例概要》中提出遊戲中斷後如何分配賭金的問題;

1526年,卡爾達諾(Girolamo Cardano,1501-1576)在《機遇遊戲》中提出,兩個獨立事件同時出現的概率等於它們各自出現的概率之積;

1645年,帕斯卡(Blaise Pascal,1623-1662)和費馬(Pierre de Fermat,1601-1665)就分賭金問題的通信,標誌著概率論的正式誕生;

1656年,惠更斯(Christiaan Huygens,1629-1695)發表了帕斯卡的解法,引入了「期望值」的概念;

1713年,雅各布·伯努利(Jakob Bernoulli,1654-1705)的遺著《猜度術》出版,這是第一部概率論著作,提出大數定律;

1761年,托馬斯·貝葉斯(Thomas Bayes,約1701-1761)的遺著《機遇理論中一個問題的解》出版,提出貝葉斯公式;

1777年,蒲豐伯爵喬治·路易斯·勒克萊爾(Georges-Louis Leclerc De Buffon,1707-1788)進行了投針試驗,首次應用了後來稱為蒙特卡羅方法的思路:為了計算某個常數的值,首先證明它等於某一事件的理論概率,然後通過試驗多次模擬這一事件;

1809年,高斯(Johann Carl Friedrich Gauss,1777-1855)在研究測量誤差時發現正態曲線;在此之前,正態曲線最早由棣莫弗(Abraham De Moivre,1667-1754)在求二項分布的漸近公式時得到;

1812年,拉普拉斯(Pierre-Simon Laplace,1749-1827)出版《概率分析理論》,將一個事件的概率定義為有利結果數與所有可能結果數之比;

1828年,布朗(Robert Brown,1773-1858)發表了他對水中花粉的觀察結果,微粒在水中的隨機移動即「布朗運動」,開啟了隨機過程研究的先河。

1837年,泊松(Simeon-Denis Poisson,1781-1840)發表《刑事、民事判決中的概率研究》,提出泊松分布;

在概率論的發展史上,曾有過概率的古典定義、幾何定義、頻率定義、主觀定義(貝葉斯學派),各適用於特定的隨機現象。概率的古典定義、幾何定義、頻率定義面對現實世界裡不能重複或不大量重複的隨機現象是無力的,而概率的主觀定義卻需要當事人對所考察的事件有透徹的了解和豐富的經驗,都不能給出適合一切隨機現象的概率最一般的定義。

而且在使用「隨機」、「等可能」、「均勻分布」等術語時,因術語的含義或試驗的不同,往往造成概率計算的差異,「貝特朗奇論」就是其中最有力的批評:

悖論

在一個半徑為1的圓周上隨機地任取一條弦,求其長度大於內接等邊三角形邊長的概率?

在這個問題中,隨機性至少有三種理解:

1. 先在圓周上取定一點A,然後再在圓周上隨機地取一個點B,連接A與B成為弦;

2. 取定一條直徑,然後在該直徑上隨機地取一個點B,作一條過B與直徑垂直的弦;

3. 以圓內的任何點作為中點的弦是唯一決定的,隨機地取一條弦就等同於隨機地在圓內取一點B;

圖片:Bertrand奇論

來源:李賢平,概率論基礎,高等教育出版社,第36頁

上述三種情況下,概率分別為1/3,1/2,1/4,出現了悖論

概率論等待著那個能夠「一統江湖」的人出現,給出適合一切隨機現象的概率的最一般的定義。這也是希爾伯特第六問題的使命:以最少的幾條本質特性出發去刻畫概率的概念,即,公理化概率論。

2

引入測度論

剛剛我們提到了概率論公理化的必要性:數學家從公理推導出定理,定理是公理的邏輯推論。數學是演繹學科,即數學家從一般原理推導出特殊的邏輯結論;而數學裡每一條正確的敘述,都來自公理的邏輯結果。概率論公理化的意義在於,所用認同概率論公理框架的數學家們,都能夠嚴格地推導出概率論的定理。

數學上任何里程碑式的突破,往往建築在所處時代能夠擁有的數學知識之上,所謂時勢造英雄;英雄亦造時勢,但很難超越時代。當柯神開始研究概率論的時候,博雷爾(Borel,1871-1956)和勒貝格(Henri Léon Lebesgue,1875-1941)的基礎性工作基本完成,1933年,柯神正是基於勒貝格測度,提出了概率的公理化定義,這個定義既概括了歷史上幾種概率定義的共同特性,又避免了各自的局限性和含糊之處。不管什麼隨機現象,只有滿足定義中的三條公理,才能說它是概率。這一公理化體系迅速獲得舉世公認,是概率論發展的里程碑。

測度,即measure,從歐幾里得(Euclid,前330-前275)時代起,人們就在思考幾何圖形的面積及其測度。歐幾里得時代的成果告訴我們:相等的「曲面」具有相等的面積(不變性);由有限多「曲面」「加」在一起得到的面積等於這些面積之和(有限可加性);一個包含在另一「曲面」之內的「曲面」,其面積小於或等於後者的面積(單調性)。由此我們可以計算任何多邊形的面積,例如,首先定義三角形面積的計算公式,再把多邊形分解成三角形,把它們的面積相加。計算面積的方法繼續發展,我們現在知道,利用黎曼積分我們可以計算任何由連續函數構成邊界圍成的曲面的面積。

1823年,柯西(Augustin Louis Cauchy,1789-1857)把面積定義為積分本身。這引出一個問題:什麼樣的曲面具有面積,什麼樣的函數具有積分?19世紀末,黎曼(Georg Friedrich Bernhard Riemann,1826-1866)意義下的不可積函數大量出現,對不連續點的集合能定義一個測度就顯得十分必要,這樣我們才能把可積函數和不可積函數區分開。

勒貝格測度很好地解決了這個問題:如果一個曲面由可數個曲面「加」在一起構成,則該曲面面積等於這些曲面面積之和。勒貝格測度的思想本質,就是從歐幾里得的有限可加性向可數可加性的轉變。所以,勒貝格給出的答案可以這樣理解:如果一個曲面的面積在勒貝格意義下是可測的,該曲面被認為具有面積。勒貝格證明了,一個函數在黎曼意義下可積,當且僅當其不連續點的集合具有測度0。

在把積分推廣到任意的集合的過程中,數學家發展了「測度」的概念:測度對一個給定集合的某些子集指定一個數,這個數可以比作大小、體積等等。

現在,我們要考慮如何把測度同概率聯繫起來。

我們知道,可以把事件看作樣本空間的某個子集。在古典概型中,樣本空間的所有子集都可看作為事件。但在幾何概型中,由於計算概率需要幾何圖形的測度,因此不能把不可測集看作為是事件,即不能把樣本空間的所有子集都可看作為事件;根據測度論,樣本空間中的集合分成兩種:可測的和不可測的。我們只對可測集賦予測度或者說概率。需要注意的是,測度為零的集合也是可測的,叫做零測集

柯神的思路是:

定義集合Ω,表示某一過程所有可能發生的事件。它由一切可能的樣本點組成,因此一定發生。即有P(Ω)=1;即,可定義Ω的測度等於1

Ω的子集的測度不可能大於Ω的測度:部分永遠不能比整體大,所以一個事件的概率不可能大於1;如果事件A和B是Ω的兩個不相交子集,那麼事件A發生或事件B發生的概率等於A的測度加上B的測度:從幾何上表示,就是兩個集合的大小。即事件A和B同時發生的概率,就是兩個集合交集的大小。

同樣的,如果把Ω的子集A看作是事件,那麼它的補集也應該看作事件,因為它表示事件A不發生;如果A1、A2、A3……是一列事件,那麼它們的並集也應該是事件,因為它表示它們中至少有一個發生。

下面定義事件域,即滿足以下3條規定的子集類:

事件域又稱「σ域」或「σ代數」,於是我們就有了可測空間(Ω,F),我們只需對F中的集合(事件)定義概率。由於概率是描述事件發生可能性大小的量,是定義在事件域上的集函數,概率必須滿足如下3條性質:

3

概率空間

由以上3條性質定義了概率,我們就可以從概率空間出發討論各種問題:我們稱三元總體(Ω,F,P)為概率空間。其中Ω是樣本空間,F是事件域,P是概率。我們可以定義據此有限概率空間和離散概率空間:

【有限概率空間】設Ω=,此時一般把Ω的任意子集看成是事件,Ω是事件域。每個樣本點作為單點集也是事件,在這種樣本空間中引進概率,只需要對每個樣本點定義概率就可以了,記之為P(ωi),它是非負的,而且滿足P(ω1)+P(ω2)+…+P(ωn)=1;至於P(ωi)的具體數值,要根據隨機現象的特點而定。例拋擲均勻的骰子是古典概型問題,P(ωi)=1/n;但拋擲不均勻的骰子就不是古典概型問題,此時P(ωi)必須定義其他的數值。

【離散概率空間】設Ω=,此時也一般把Ω的任意子集看成是事件,Ω是事件域。每個樣本點作為單點集也是事件,在這種樣本空間中引進概率,只需要對每個樣本點定義概率就可以了,記之為P(ωi),它是非負的,而且滿足∑P(ωi)=1;至於P(ωi)的具體數值,要根據隨機現象的特點而定。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 公共管理定量方法學習 的精彩文章:

趣味學編程│MATLAB表白教程

TAG:公共管理定量方法學習 |