當前位置:
首頁 > 最新 > 葉曉明新測量學中的概念誤解及澄清

葉曉明新測量學中的概念誤解及澄清

擊上方「純科學」關注我們

什麼是科學?

《實驗、測量與科學》

給出有史以來最科學的答案!

?

內容摘要

測量學是一切科學的基礎,深刻理解測量學對科學素養的提升是至關重要的。

1. 葉曉明先生的確充分地提出了對測量學最基本概念的深刻思考,並作了很深入的分析研究。

2. 他對系統誤差並沒有給予最精確的解釋。他認為應當取消系統誤差的觀點,正是從他一再強調的認識論哲學層面來說不能成立。

3. 測量學對系統誤差、隨機誤差、相同測量條件(或等精度多餘測量)等概念的確在過去沒有給予最嚴格的描述,葉曉明先生的研究對澄清這些基本概念有非常重要的價值。

本文通過對系統誤差的最嚴格定義和分析,澄清了葉曉明先生所提出的所有針對測量學的挑戰。

?

關鍵詞:系統誤差的定義,第一類與第二類系統誤差,等精度多餘測量,準確度,誤差的分布。

通過與葉曉明先生的反覆交流③④,以及更多詳細閱讀他的相關文獻,我們基本可以確認充分理解了葉曉明先生的新測量學思想是如何形成,以及他的新測量學詳細的內涵。並可確信得出本文的結論。

在科學網上有葉曉明先生講解他新測量學的視頻①。建議讀者參考這個視頻,以及在科學網可下載的他介紹自己新測量學基本概念的論文②。

系統誤差的最嚴格定義

圖1葉曉明先生視頻講解中解釋測量學教科書的截圖。

圖1直接去理解其實是存在問題的。葉曉明先生的「誤解」產生的根源並不在於誤差和測量結果,而在於認識論上什麼是真值?從認識論上說,真值原則上是不可能完全精確獲得的,它是測量學的一個最基本理論假設。既然我們不能絕對精確地獲得真值,那麼從認識論上說,我們測量的結果(事實上最好的假設只能是數學期望)就有可能存在一個與真值之間的偏差。這個偏差並不能完全以「準確度」來表達。無論「精密度」「準確度」還是「不確定度」,事實上並不是「完全沒有任何確定」,這一點非常重要。通過均方差以及對誤差分布的研究給出一個精密度、準確度或葉曉明先生所說的「不確定度」,事實上還是有一個「度」。這樣從認識論的哲學上說就不是絕對未知。真正完全未知的系統誤差,是根本就沒有「度」,是真的完全不知道的,無法給出任何「不確定度」評估。

以我在文章③中所舉碳14測年法為例,最初在假設大氣中碳14含量水量歷史上完全一致前提下,對某個文物的一系列測年結果,可以進行隨機誤差的統計處理,從而得出一個數學期望和均方差,從而可以對其測量誤差進行評估。但是,因為不知道歷史上各個年份大氣中的碳14初始含量,會導致這樣測量出來的年份存在一個不知道的系統誤差。但是,當後來人們通過樹木年輪獲得了歷史上各個年份的碳14大氣含量後,就可以此對原來碳14測年法測量結果中的系統誤差進行扣除。

從以上案例中我們可以得出系統誤差最精確含義的嚴格定義和理解。

系統誤差是相對於特定測量系統,在特定歷史條件下存在的,最佳測量結果與真值之間顯著超出隨機誤差置信區間範圍的,暫時未知的偏差。

這個定義中讀者一定要清楚系統誤差的這樣幾個基本特點:

它是最佳測量結果與真值之間的偏差。因此一定要從真值的角度來理解系統誤差。

暫時未知,就是不代表永遠未知。

一定要相對於特定的測量系統來理解。

測量系統不同,系統誤差也就不同,從而會使系統誤差在不同測量系統中呈現出不同的性質。這一特性事實上可利用來作為發現系統誤差,並借用隨機誤差的處理方法來處理系統誤差。這正是很容易讓人產生概念混亂的根源所在,也是葉曉明先生誤解的根源所在

系統誤差的偏差水平要顯著超出隨機誤差的置信區間範圍。因此,嚴格來說,系統誤差並不是簡單地數學期望與真值之間的偏差,而是造成系統誤差的因素引起的偏差量大於數學期望與置信區間的差值,從而導致實際測量結果與真值之間的偏差顯著偏離出置信區間。如果真值數學期望之間的偏差在置信區間之內,可認為沒有系統誤差。

以上對系統誤差的最嚴格定義可發現一個非常顯著的特點,就是它依賴於真值和隨機誤差兩個概念為基礎來定義。而隨機誤差可以只依賴於真值和數學分布來定義。數學期望與真值之間的偏差一般來說是隨機誤差,而不是系統誤差。因此,真正的理解應當是圖2與圖3所示的那樣,它們簡要顯示了存在系統誤差和沒有系統誤差兩種情況。所以,不能簡單地說數學期望與真值之間的偏差就一定是系統誤差。並且存在系統誤差也不一定就能用「準確度」來表達。

為什麼真值落在置信區間內就不認為有系統誤差呢?因為從本質上講,一切不可控制的因素都會產生誤差。但是,如果大量的誤差因素導致的影響都相對較小,只減少其中任何一個,對總的誤差影響也非常小,此時就用隨機誤差將它們放在一個統一的框架內來考慮。但是,如果有某一個或若干個因素導致的誤差比較顯著,並且未知,就會對測量結果產生顯著超出以隨機誤差方法進行的置信區間估計範圍。當我們發現了該誤差後,對它進行控制並消除,就可以使測量結果出現顯著的,超過原來置信區間的測量有效值數據修正。如果某個因素導致的誤差遠小於置信區間值,將其消除後對測量結果的有效值和置信區間評估幾乎不會發生變化。此時就統一按隨機誤差進行處理。

圖2有系統誤差情況

圖3沒有系統誤差的情況

以上我們說到系統誤差的「暫時未知」,可能是由兩種原因引起的。

一是從科學研究上來說,在某個歷史階段,人類最高水平的研究結果也無法發現的某些系統誤差。隨著科學研究的不斷進步,在一定歷史時期科學研究暫時未知的偏差,到後來就被發現並消除了。在不同歷史時期,人類對宇宙年齡,宇宙尺度,地球上各個地層的年代等數據不斷進行大幅度地修正,這就表明隨著科學研究水平的不斷提升,在過去科學測量中存在的顯著系統誤差不斷獲得了發現並校正。

二是在測量實踐中,僅以特定測量系統角度來說,存在暫時未知的系統誤差。例如,只有某一台測量設備A,因該測量設備使用時間較長,出現漂移,這樣就出現一個系統誤差。如果僅僅從這台測量儀器本身來說,無論如何進行多餘測量,只能發現隨機偏差,而其本身存在的漂移導致的系統誤差是無法僅靠A自己發現的。但另一方面,這個系統誤差是相對的,只相對於測量系統A。因為相對於更高水平的計量儀器B來說,是可以測出A的系統偏差的。

圖4葉曉明視頻講解截圖,將已知系統誤差看作測量結果

葉曉明先生在這個PPT中所說的某測距儀的1mm加常數,顯然並不是這台測距儀本身自己測量到的,而是通過更高計量儀器的計量工作(葉曉明先生稱「上游測量」)才能發現並確定。因此,當我們要談到某個值到底是測量結果還是誤差時,一定要非常清楚它是相對於哪個「測量系統」來說的。

為什麼葉曉明先生髮現不了系統誤差?

前述的PPT中,葉曉明先生為什麼會認為「近20多年的不確定評定實踐也證......系統誤差從來沒有出現過」呢?因為我們前面說過,系統誤差一定要以真值為基礎來進行理解,而不是不確定度。系統誤差的存在是在科學研究水平的限制和特定測量系統的約束兩種情況下才會出現的。隨著今天科學研究水平在過去數百年甚至數千年的積累,葉曉明先生所做工作中涉及到的幾乎所有測量問題,科學界基本是有信心保證不會有科學研究水平決定的第一類系統誤差存在的。

圖5葉曉明先生視頻講解截圖,珠峰高程測量數據的案例

珠峰高程測量數據是葉曉明先生最喜歡在他的文章中引用的案例。為什麼這個案例中採用的是「精度」而不是說精確度?這個說法事實上是排除了存在系統誤差的問題。現在我們來假設,如果存在一種目前我們還不知道的某種物理學效應,比如說新的統一場論等,在所有珠峰測量中導致了還有一個與8844.43米之間0.75米的偏差,這就是系統誤差。但是,科學發展到今天,我們已經比較有信心認為不可能存在大到這種程度的系統偏差。的確有可能存在某種目前還不知道的物理學效應,但它有可能造成的偏差不會大到0.75米,而可能會是比如說0.01米。這種系統誤差遠小於測量精度,現有的科學測量技術根本無法發現。因此,就可以認為「沒有」系統誤差。這是很多嚴格的科學測量結果(包括珠峰高度測量結果)中對誤差的表述為什麼可以只稱為「精度」的合理原因所在。葉曉明先生認為,8844.43米與真值之間肯定存在唯一的一個恆定的偏差,為什麼這個偏差是隨機誤差,而不是系統誤差。這是因為:

一個完善的測量數據結果是有三個部分表達的:有效值,誤差,置信度。一般來說,誤差是採用均方差的2倍來確定,對應的置信度為95%。但要加上一個嚴格的前提,這個是針對誤差呈高斯分布情況來說的。上述珠峰測量數據有效值8844.43米後面跟著的正負0.21米是一個置信區間,最嚴格地來說並不是誤差。並且這個數據也沒有給出置信度的數據,一般情況下,如果沒給出置信度,就是按95%缺損值來確定的,也就是高斯分布前提下2倍均方差。這相當於這個測量結果的均方差為0.105米。但是,絕大多數情況下普通人看測量數據只看有效值,能加上誤差(置信區間)就不錯了。即使專業工程技術人員有時都會忽視置信度的問題。正負0.21米本來最嚴格地說應當是95%置信度前提下的置信區間。但如果老是這麼說的話,實在是在太拗口了,因此往往就不那麼嚴格地說正負0.21米就是「誤差」。這個一般稱作「絕對誤差」,如果用0.21/8844.43=0.00237%來表示就是「相對誤差」。

8844.43米的測量值與真值之間是存在一個偏差的,並且這個偏差我們也不能準確地知道。但為什麼我們將這個不知道的固定偏差歸為隨機誤差,而前面所說的暫時未知的偏差就是系統誤差呢?那是因為前面的誤差真的是連「不確定度」都完全不確定,是真的「一點兒都不知道」。而隨機誤差造成的測量有效值與真值之間的偏差雖然也不能絕對準確地知道,但好歹我們還是可以評估、甚至相當精密地評估出一個範圍的。在8844.43米這個有效值中,雖然從純理論上說也可能存在某種意義上第一類系統誤差,但我們今天的科學研究水平基本可以確定即使存在任何這類系統誤差,其大小也是顯著地小於隨機誤差的置信區間。這就是葉曉明先生20多年一直都發現不了系統誤差的原因所在。

但是,如果未來對珠峰的測量精度不斷提升,比如說達到了正負0.00043米,那麼前面所述的0.01米的誤差就會顯著地呈現出來,從而變成系統誤差了。由此就會明白,一切誤差影響首先都是誤差因素,只是因為其大小和人類控制發現誤差的能力差異,從而採用系統誤差和隨機誤差的不同方法加以處理的。

準確度是怎麼回事?

細心的讀者可能很快發現了,如果說第一類系統誤差是完全無法評估,是接近絕對地不知道,那就是連準確度也不應該有的。為什麼我們還會有系統誤差的準確度問題呢?前面我們說了,系統誤差還有更廣泛的第二類情況存在,就是雖然從全人類科學研究角度說不存在系統誤差,但如果只從特定的實際測量系統來說,還是可能存在系統誤差,並且這種系統誤差從超越這個特定實際測量系統層次看,又是可以進行評估的。

例如某廠生產了一種測距儀,它在市場上有大量銷售。在出廠之前,我們假設它都進行了嚴格的計量和校準,從而不存在系統誤差(請讀者一定注意,當我們說到不存在系統誤差的最嚴格含義,就是系統誤差顯著地小於隨機誤差,從而即不能被發現,也沒有發現的必要)。但是,隨著這批測距儀在市場上大量不同地方實際運行一段時間以後,因為環境的不同影響,它們各自向不同方向產生漂移,導致出現各種不同程度的系統誤差。

從單一的某一個測距儀來說,它的系統誤差是固定的某一個值。但對於該廠家的大批測距儀來說,它們向不同方向偏離的系統誤差又會呈現一個隨機分布。它們的不確定度是根據對大量不同測距儀系統誤差的統計處理才會出現的。

因此,第一類系統誤差是完全未知的,連準確度也無法評估。但第二類經常遇到的特定測量儀器的系統誤差,卻可以進行準確度的計算。甚至這些系統誤差的分布也很可能呈現高斯分布,從而其誤差處理也完全以隨機誤差的方法來進行。

圖6葉曉明先生視頻講解截圖,用不確定度合成隨機誤差不確定度與系統誤差不確定度

圖7葉曉明論文截圖,他的新測量理論概念邏輯

葉曉明先生的新測量理論認為「一切誤差全都只是一個不確定度的問題,未知系統誤差與隨機誤差實際沒有區別,都可以統一用不確定度來進行處理。已知系統誤差本質上並不是誤差,而是測量結果」。必須要注意,用不確定度統一系統誤差和隨機誤差只在系統誤差的第二類情況下才是有可能的,第一類系統誤差根本就不可能有任何「不確定度」,更談不讓如何去合成了,從認識論的哲學上說是純粹的未知。這與隨機誤差性質完全不同,因此,說未知系統誤差與隨機誤差之間沒有區別顯然是不能成立的。另一方面也一定要注意,即使在可以統一用不確定度來處理的第二類系統誤差情況下,也必須區分不同測量系統情況下系統誤差意義的不同。

圖8葉曉明先生視頻講解截圖,事實上是第二類系統誤差案例

在這個PPT中,「水準網」和網上的「每個水準路徑」是兩個完全不同的測量系統。單個水準路徑存在的系統誤差,從水準網的測量系統角度看,大量不同水準路徑的系統誤差就會呈現隨機分布。之所以會有這種變化,是因為系統誤差必須是針對特定測量系統來說的。

為什麼系統誤差概念不能廢除?

正是從葉曉明先生一再強調的認識論的哲學角度來說,系統誤差代表了科學認識中未知的部分,如果消除了系統誤差,就消除了科學認識論中非常重要的一環。儘管科學對世界的認識越來越精確,但永遠不能說絕對不再存在第一類系統誤差了。

在第二類系統誤差情況里,保留系統誤差這個概念對理解誤差依然是有重要價值的。其原因在於,雖然從整個人類科學研究的水平來說,某一物理量的測量可以認為不再存在系統誤差了,但對於特定的某個人或群體採用某特定測量手段進行的測量過程來說,他們能夠利用的測量資源是有限的。有可能因其存在的漂移、特定的顯著干擾、特定測量系統差錯造成的顯著原理誤差等,還是有可能產生他們暫時不能發現(只是他們暫時不能發現)的系統誤差。因此,意識到有系統誤差存在的可能,將會避免他們完全盲目依據葉曉明先生所提供的方法計算出的不確定度,就絕對相信該測量數據去作出決策。能夠計算出不確定度,事實上就是在一定程度上已經「確定了」誤差在一定的置信度前提下不會超過一定範圍,這顯然是不合適的。

再論系統誤差的定義

可能有讀者會更進一步較真:憑什麼你就說偏差小到低於隨機誤差的置信區間就不再是系統誤差,而大於這個置信區間就成系統誤差了?這不是自己想怎麼定義就怎麼定義嗎?這麼定義的更嚴格依據是什麼?

如果真有讀者這麼較真是正確的,我之所以這麼定義是依據更基本的科學原理,就是:一切科學的概念必須都是「可測量」的。即使研究測量學本身,所有的概念也都必須建立在可測量的前提之上。如果系統誤差不能顯著地超出隨機誤差置信區間,它就無法被測量到。一個不能被測量到的值不是科學定義的概念。我們將系統誤差定義為數量大小上與真值的偏差超出隨機誤差置信區間,原因就在於這樣定義的系統誤差是可測量的。

如何理解真值?

這裡又涉及一個測量學最基本的概念,就是真值。因為真值是無法準確獲得的,那我們怎麼理解真值呢?一般情況下,更高精度計量儀器的存在,是我們理解真值的一個有效途徑。精度越來越高,置信區間越來越小,會使我們「感受到」測量數據更加趨近真值。真值本身是測量最基本的,它本身是不定義的概念,其它的概念都是在它基礎上進行定義的。

什麼是「相同測量條件」或「等精度多餘測量」?

葉曉明先生對「相同測量條件」概念的批判是很有道理的,但一定程度上也有些自己設目標自已攻擊的意味,因為對「相同測量條件」從來不可能會有任何人做葉曉明先生設立的那種理解。從認識論的哲學上說,如果真的是絕對相同的測量條件,測量的結果的確應該完全相同,而不會出現離散。這樣說真的有點「太較真」了,但在測量學上特別地較真不能說沒道理。的確絕大多數人對「等精度多餘測量」這個前提到底是什麼含義沒有進行最深入地思考。因此,在這一點上我們認為葉曉明先生所進行的概念追究和較真是有價值的。

圖9葉曉明先生視頻講解截圖,對相同測量條件的絕對理解

多餘」這個很好理解,就是測量的次數不止一個。相同測量條件里的「相同」,或等精度多餘測量中的「等」顯然都是相對的說法。但這個「相對」該怎麼來最嚴格準確地理解呢?如果不能給予非常嚴格地定義,的確就會出現葉曉明先生所提到的問題。科學的測量是對誤差因素盡最大努力控制條件下進行的。對誤差的控制不可能意味著沒有誤差。測不準原理就是否定這一點的理論依據之一。事實上一切測量都是測不準的,都存在誤差。我更傾向於採用「等精度」這個概念。因為這個概念本身就否定了哲學上「測量條件絕對相同」的說法,它是指在特定測量技術條件下,盡最大控制能力所能達到的對誤差控制的程度。

既然是一種對誤差的控制,就不是絕對不變地「相同條件」,而是盡最大可能地使誤差呈現對稱性和抵償性地離散分布。這樣在進行大量測量數據平均後,其誤差可相互抵消,從而可獲得較好的測量數據。因此,如果一定要用「相同條件」這個概念和辭彙,其中的「條件」一詞應當說是指對誤差控制能力相同,但卻不意味著說什麼都不動,什麼都不變。既然我們是要獲得誤差分布儘可能是對稱和具有抵償性的分布,因此不僅是不變,而且會在實際測量中如葉曉明先生所提到的儘可能調整測量系統使其誤差分布更加對稱和具有抵償性。這才是對「等精度」的準確理解。因此,葉曉明先生用了一個本身不夠嚴格的通俗辭彙——「相同條件」,又將其立為目標進行攻擊。如果採用更嚴格的「等精度」概念,其實就不會有這個問題。

圖10葉曉明先生視頻講解截圖,同樣承認系統誤差,只是它不是終身的

事實上,葉曉明先生還是無法脫離系統和隨機這些概念。但他強調不能用影響性質來對誤差進行「終身」分類。事實上也從來就沒有任何人認為系統誤差是絕對和終身的,最多可以說是沒有用最清晰的概念定義來明確這一點。

誤差的分布問題

圖11葉曉明先生視頻講解截圖,幾個規律誤差因素導致的誤差分布案例

葉曉明先生討論了很多種有規律誤差因素作用下會形成隨機分布的案例。但是,科學研究必須從數學上完備地考慮「一切可能的情況」。如果幹擾是呈單調上升的函數類型,顯然就不可能呈對稱型的隨機分布。葉曉明先生在上圖中提到的前三種非高斯分布的類型都具有對稱性,但是否具有很好的抵償性是存在問題的。具有較好抵償性的隨機分布是呈現較小誤差值出現概率較高,較大誤差值出現概念較低這樣一種形態。如高斯分布和葉曉明先生沒有提到的三角形分布。

圖12葉曉明先生視頻講解截圖,測量條件不同,相同規律誤差的分布完全不同

但葉曉明先生討論這個問題並不是要說明以上情況,而是要通過枚舉這幾個案例來證明這樣一個結論:規律性的誤差因素形成的誤差是固定誤差還是離散性的誤差不是絕對的,完全取決於特定的測量條件。但是,這只是說明了系統誤差的高度複雜性,而不能以此否認系統誤差這個概念的價值。系統誤差與隨機誤差的區別是一個量的問題。如果其影響大小超出除此之外其他誤差因素的置信區間,它就需要被當作系統誤差來看待。如果其影響小於除此之外的其他誤差置信區間,它就需要被當成隨機誤差來看待。

本文最終結論

沒有任何人認為系統誤差是絕對的,它是相對的,只是過去人們不太能清楚地說明它的相對性該如何理解。總結起來,系統誤差的相對性,就是相對於誤差量的大小,相對於測量系統,相對於科學研究的歷史水平和階段。葉曉明先生所作的研究,有助於人們深刻理解系統誤差的相對性,但顯然完全不能達到消除系統誤差這個概念的程度。本文通過與葉曉明先生的討論,反而是更加明確了系統誤差的價值、概念定義和意義。在此也向葉曉明先生深表謝意!

參考文獻:

①葉曉明:視頻講解:測量誤差理論的新概念

②《The new concepts ofmeasurement error theory》中文版。

③汪濤,關於葉曉明先生「新測量學理論」的專業解釋。

④汪濤,與葉曉明教授就測量問題的相關討論。

作者簡介

汪濤

獨立學者

人類第三次科學革命倡導者,純科學理論體系創始人

雲鋁股份(000807)獨立董事

浙江宇視科技 顧問

上海析易船舶 聯合創始人、總經理

中央民族大學中俄能源研究院 客座教授

中關村長風聯盟 國際化導師

中國農投會、中關村京港澳青年創新中心等創業導師

曾為中興通訊(000063)國際市場管理體系的奠基人

著 作:

《通播網宣言》

《生態社會人口論》

《超越戰爭論——戰爭與和平的數學原理》

《實驗、測量與科學》

《即將來臨的糧食世界大戰》(即將出版)

《純電動:一統天下》(即將重新出版)

《科學經濟學——看見看不見的手》(即將出版)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 純科學 的精彩文章:

為什麼我認為中醫是「前科學」?

TAG:純科學 |