當前位置:
首頁 > 科技 > 概率的意義:隨機世界與大數法則

概率的意義:隨機世界與大數法則

摘要:今日統計學家,當然已完全弄懂信賴區問的意義。對不同的參數,不同的分布,可有不同的信賴區間;即使同一參數且同一分布,也可以不同的方法,得到不同的信賴區間。有時因條件不足,或計算複雜等原因,只好退而求其次 ...

導語

1987年,是印度傳奇數學家拉曼努揚(SrinivasaRamanujan,1887-1920)的百年誕辰。為了紀念他,有一系列的活動。當代著名統計學者, 出生於印度的勞氏(C. Radhakrishna Rao,1920),也應邀做了三場演講。之後,印度統計學研究所(IndianStatistical Institute)基於勞氏的演講稿,於1989年,為他出版了統計與真理一書。此書於1997年發行第二版。

在第一版的序文中,勞氏提到:

學生時代,我主修數學一種從給定前提下演繹結果的邏輯。後來我念統計學一種從經驗中學習的理性方法,及從給定的結果驗證前提的邏輯。我已認識到數學及統計,在人類為提昇自然知識,及有效管理日常事務所做的一切努力中,佔有重要性。

我相信:

在最終的分析中,所有知識皆為歷史。

在抽象的意義下,所有科學皆為數學。

在理性的世界裡,所有判斷皆為統計。

這一段話,大致說明數學及統計的重要性,及其各自的內涵。

翻開統計史,信賴區間,是另一著名統計學者,出生於波蘭,1938年才移民至美國的奈曼(JerzyNeyman,1894-1981),於1934年演講中首度提出。他的演講結束後,大會主席包雷(Arthur Lyon Bowley, 1869-1957)於致詞中提到,「我不很確定此信心不是一信心戲法」。要知奈曼信賴區間的概念剛提出時,大部分的統計學者,包括被視為是現代統計學之創始者,英國的費雪(Sir Ronald Aylmer Fisher, 1890-1962,常以R.A.Fisher稱之)均難以接受。在所謂95%信賴區間中,那95%究竟是指什麼?是概率嗎?如果是,那又是什麼的概率?雖奈曼取巧地以信賴區間,來稱呼此一他創造出來的東西,而避用概率一詞。但包雷及其同行,當然一眼便看穿這個手法。這段過程,可參考Salsburg(2001)Chapter12(但該書中的A.L.Bowley應該是G.M.Bowley),及Sawilowsky(2003)一文。

歲月匆匆,七十多年過去了,今日統計學家,當然已完全弄懂信賴區問的意義。對不同的參數,不同的分布,可有不同的信賴區間;即使同一參數且同一分布,也可以不同的方法,得到不同的信賴區間。有時因條件不足,或計算複雜等原因,只好退而求其次,得到近似的信賴區間。當然這時需要一些條件,及利用一些定理。信賴區間亦可比較優劣。要知統計里有各種推論方法,但因處理的是隨機現象,少有「倚天既出,誰與爭鋒」的方法。而評比時,也要訂出評比準則。否則就像有個停止不動的鐘,及一每日慢1分鐘的鐘,如何判定何者較准?前者可是每日皆有完全準確的時刻,後者卻是每1440天(一天有1440分),才有一完全準確的時刻。不講清楚如何評比,將會各說各話。

追根究底,還是不少學習者,未能正確了解概率的涵意。

概率的意義

一骰子有6個面,一擲之下,會得到偶數之概率為何?骰子看起來沒有異樣,就假設每個面出現的概率皆相同,即均為1/6。而偶數面有2,4,及6等3個。因此所求之概率為3/6。這就是所謂古典的概率,基本假設是「相同的可能性」。先求出觀測的現象共有幾種可能,再求出其中有幾件是我們有興趣的。將後者除以前者,即為所要的概率。雖說是「古典」,這種概率的意義,至今仍處處可見。採用的範圍包含諸如抽籤、玩撲克牌,及玩樂透彩等。又如某項工作徵才,報名的有82人,錄取5人。若沒有什麼特別的資訊,便只能假設每人被錄取的概率皆相同,即皆為5/82。

2009年7月底8月初,世界高爾夫球王老虎伍茲(TigerWoods),參加在美國密西根州舉行的別克公開賽(Buick Open)。第1輪打完,落後領先者多達8桿,排名並列95。引發他可能難逃職業生涯,首次連續2場比賽(前一場是英國公開賽(The Open Championship,在英國之外常稱為BritishOpen)),提前被淘汰的話題。不過老虎畢竟不能小覷,打完前3輪後,伍茲躍居首位。

這時大家看法丕變,一致認為這座冠軍盃,幾乎可說是他的囊中物了。因過去的紀錄顯示,伍茲如能帶著54洞領先進入決賽圈,戰績是35勝1敗。你要不要猜後來他贏了沒有?運動比賽,往往有過去資料可參考,此時相同的可能性便不宜用了。36次中成功35次,「相對頻率」為35/36(約0.972)。這種以相對頻率來解釋概率,是常有的作法。適用能重複觀測的現象。會不會有爆出冷門的時候?當然有。只是對一特定事件,用過去多次同樣情況下,該事件發生的相對頻率,來估計下一次事件發生的概率,乃是在沒有更多資訊下,常被認為一屬於客觀的辦法。

某君看上一女孩,驚為天人,覺得這是他今生的新娘。評估後信心滿滿,自認追上的機會有8成。旁人卻都不看好,問他8成這一數字,是如何冒出來的?該君舉證歷歷,一個又一個的跡象,顯示那女孩對他很有好感。這個0.8的概率,就是所謂主觀概率。主觀概率當然也可基於過認識概率35去一些客觀的事實。只是即使面對同樣的資料,不同的人,可能有不同的判定,因而給出不同的主觀概率(看過他其實沒那麼喜歡你(He』s Just Not That Into You)嗎?片中那個叫Gigi的女孩,便常誤解男生所透露的訊息)。有些現象就是不能重複觀測。如核能電廠的意外,及彗星撞地球等。以追女孩為例,大約少有女孩,會讓你做實驗,反覆地追,然後數一數其中成功幾次,來定下她會被你追上的概率。對這類無法重複觀測的現象,在談概率時,主觀概率就常派上用場。每天早上出門,我們不是慣於抬頭看天,判斷一下今天下雨的概率有幾成?只是往往父母認為的概率會大些,該帶傘,而小孩所認為的下雨概率會小些。

雖說「主觀」,但仍要合理。例如,考試有及格與不及格。若認為會及格的概率為0.9,這沒問題,人總要有點自信,但若又同時擔心有0.8的概率會不及格,那就不行了。各種可能性發生概率相加要為1。即使是主觀,可以獨排眾議,仍須自圓其說。不能說,既然是主觀,便可以任意自定各事件之概率。因此不論是那一種對概率的解釋,都自然地,或說必須要滿足一些共同的規則。這點大家應能理解。

上述三種是常見對概率的解釋,大抵也就是人們評估事件發生可能性之大小的幾種思維。雖是針對不同的情況,但常能交互著運用。大家都聽過曾參殺人的典故吧!有個與曾子同名的人殺人,好心者告訴曾母「曾參殺人」。曾母說「吾子不殺人」,繼續織布。過一會兒,又有人來說「曾參殺人」。曾母仍繼續織她的布,這麼好的兒子怎可能殺人?但當第三人跑來說「曾參殺人」,曾母就害怕了,丟掉織布器具翻牆而逃。所謂「其母懼,投杼踰牆而走」。這故事出自戰國策秦策二。因此當拿到一銅板,可主觀地認為,政府發行不該會有偏差,兩面出現的概率,應皆為1/2(這也可以是基於相同可能性之想法)。若投擲10次,正面出現8次,可能覺得有些奇怪。若繼續投擲,結果100次中,出現80個正面,這時相對頻率的觀點,很可能便將顯現。類如曾母,調整看法,不再認為此銅板公正。

當然,你可以不信邪,不論投擲的結果如何,皆認為那只是短暫的情況,意志堅定地認為這是一公正的銅板。這並沒有不行,就像會有母親,即使再多的人證,只要她沒親眼看到,她就不信兒子會殺人。要知隨機現象,事件只要概率為正,不論概率值多小,便皆可能發生。畢竟銅板正面出現的概率為何,只有天曉得。但引進概率與統計,乃為了協助我們做決策可以更精準。而決策可以與時推移,並非不能更改。有如氣象局對颱風會帶來多少雨量,須密切掌握新的動向,而隨時修正。要有隨機的思維,如前言中勞氏所說的,從給定的結果,驗證前提。因此針對100次投擲,出現80個正面,多數人面對此結果,還是會認為0.8的正面出現概率,較0.5的概率可信。稍後我們會再來看,10次中的8次,與100次中的80次,相對頻率同為0.8,但提供的資訊,是否有異?

雖然已有上述三種對概率的解釋,也涵蓋了不少實際生活中所遇到的情況,數學家當然不會在此止步。他們喜歡抽象化,及一般化。像解方程式,會尋求公式,以表示出某類方程式的解,而非只滿足於求出一個個的特例之解。又如當完全了解實數系統後,便會以公理化的方式,定義實數系統。即給一集合,沒說是數字的集合,對其中的元素定義二運算,並給出10條遵循的公理(axiom,規則)。你好奇該二運算是否一為加法,一為乘法?而怎麼沒有減法與除法?名可名,非常名,數學家不認為你提出的是重要的問題。但用心體會後,你終於發現原來二運算,其一等同於加法,其二等同於乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1。數學家對你的洞察力,仍不以為意,但同意你可以這樣想。

什麼叫以公理化的方式,來引進概率?先要有一個集合,稱做樣本空間,當做某一觀測之所有可能結果的集合。可以真的有這一觀測,或只是虛擬的。樣本空間的某些子集合,是我們有興趣的,這些就是一個個的事件。所有事件也構成一集合。最後定出一概率函數,即對每一事件,給一介於0,1間的值,為該事件之概率。樣本空間、事件的集合,及概率函數,三者便構成概率空間(probability space)。這其中對樣本空間沒有太大要求,但不可以是空集合。而事件的集合,要滿足若干條件。簡單講,就是你有興趣的事件不能太少。譬如說,不能只對某事件A發生有興趣,卻對A不發生沒興趣。因此事件的集合要夠大,至少該有的都得納入。這有點像婚宴前擬賓客名單。可以請很少人,如只有雙方家長。而一旦多列了某人,與他同樣親近的人便也要一併請。所以每多列1人,將不只是增加1人而已,而會隨之增加幾位。又概率函數,既然以概率之名,當然要符合過去大家對概率的認知,滿足一些基本的條件。

在概率空間的架構下,不論採用何種方式解釋概率的人,都可各自表述,找到他所以為的概率意義。但因抽象化後,不再局限於銅板、骰子,及撲克牌等,便能討論較一般的問題,有夠多的理論可挖掘。

與數學的其他領域相比,概率論的發展是較晚的。但公理化後,概率論便快速地有了深而遠的發展,並成為數學中一重要的領域。這都要歸功於二十世紀那位重要的概率學家,俄國的科莫果洛夫(Andrey Nikolaevich Kolmogorov,1903-1987),於他1933年出版,那本不到100頁的小書概率論的基礎(Foundationsof the Theory of Probability)中所奠定。在此書中,他說:

概率論作為數學學科,可以而且應該從公理開始發展,就如同幾何、代數一樣(Thetheory of probability as mathematical discipline can and shouldbe developed from axioms in exactly the same way as Geometry and Algebra)。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大數據實驗室 的精彩文章:

斯坦福經濟學家告訴你:民工的孩子還是民工的真相
不懂構建知識體系,你遲早被信息洪水淹死

TAG:大數據實驗室 |