小白學統計兩樣本估計和假設檢驗基礎

知識 10-11

基礎準備

估計和假設檢驗根據樣本數的不同，分為：單樣本估計和假設檢驗；兩樣本估計和假設檢驗；多樣本估計和假設檢驗。

前面討論了單樣本參數推斷性統計：總體參數的估計和參數的假設檢驗。

通過前面的學習可以發現，推斷性統計的基礎是樣本的抽樣分布。不同的總體分布情況，總體均值、方差和標準差的情況，樣本容量的大小適用不同的抽樣分布（統計量），然後才能得到準確或近似的總體參數的區間估計和假設檢驗結果。單樣本估計和假設檢驗如此，兩樣本和多樣本估計和假設檢驗也是如此。

兩樣本估計和假設檢驗的作用和統計量

單樣本估計和假設檢驗是用單個樣本的參數來估計總體的參數，用單個樣本的參數對總體參數進行檢驗。那麼兩樣本估計和假設檢驗的作用是什麼呢？作用就是通過從兩個總體中抽取樣本，然後用它們估計和檢驗兩個總體同個類型未知參數的差別（關係）。

為了達成上面的目的，需要選取合適的統計量。對於兩總體均值的差別，通過統計量兩總體均值差(μ1-μ2)來考量；對於兩總體方差的差別，通過方差比考量。

兩樣本類型

兩個樣本根據抽樣類型的不同可以分為：獨立樣本和成對樣本。獨立樣本：若從一個樣本中選取的觀測值，無論怎樣都不會影響從另一個樣本中選取的觀測值概率，則稱樣本為獨立樣本；成對樣本：若從一個樣本中選取的觀測值，以某種方式決定了另一個樣本中選取的觀測值，則稱樣本為成對樣本或配對樣本。

例如：某種新型眼藥水的檢驗問題，廠家聲稱它比傳統的眼藥水見效快，檢驗這個說法可以用獨立樣本或成對樣本。在獨立樣本情況中，隨機選取兩組不同的測試者，其中一組用傳統眼藥水，另一組用新型眼藥水；在成對樣本情況中，只選一組測試者，並讓每個人左眼使用傳統麻醉劑，有眼使用新型麻醉劑。

通常獨立樣本是唯一選擇，因為很多時候兩個樣本都是隨機確定的，所以獨立樣本是唯一可能的情況。而成對樣本能夠較好的控制外部變數，例如兩種藥水試驗，將兩種藥水用於同一人可以控制樣本間關於個體在年齡、健康狀況或其他可能影響眼藥水反映的外部變數間的隨機差別；此外成對樣本在兩樣本估計和假設檢驗問題上的置信區間更精確，檢驗功效更強（見後面推導）。

均值差兩總體均值差的最優估計

樣本均值抽樣分布的均值是總體均值的最優無偏估計，可以擴展到兩樣本情形：來自兩個總體的樣本均值抽樣分布的均值差是兩個總體均值差的最優無偏估計，任何特定的兩樣本均值差是兩總體均值差的一個點估計。

均值差的理論抽樣分布

一個離散的或連續的概率分布，若它對兩樣本統計量：均值差的所有可能值指定了概率或密度，則稱這個概率分布為均值差的理論抽樣分布。該抽樣分布有以下結論：

通過均值差的抽樣分布(正態分布或t分布)可以把樣本均值差和總體均值差聯繫起來，從而進行兩總體均值差的估計和假設檢驗，如下圖所示：

小白學統計兩樣本估計和假設檢驗基礎