統計學(9)
Adrian Chen

推理統計實際上是群體的參數未知,使用樣本統計量來推理群體參數的方法。推理統計分為估計和檢定。

這篇文章介紹估計。估計分為點估計和區間估計。

點估計

定義:一個群體參數之點估計式或估計量(estimator)是一個法則(rule)或公式(formula),利用此法則或公式可以由樣本資料中計算出一個單一數值(single number)以估計群體參數。由點估計式所得之單一數值稱為該參數之估計值(estimate)。

例如,的估計值是的估計值是的估計值是

區間估計

定義:一個群體參數之區間估計式(interval estimator)是一個法則(rule),利用此法則可以由樣本資料中計算出兩個數字(two numbers)或一個區間之上、下限以估計群體參數,並指出該區間包含群體參數的機率。

信賴係數:信賴係數(或信賴度)是指區間估計式之上下限,包含群體參數之機率或信心。

信賴區間的意義:我們有的信心認為統計量會落在計算出的區間內。

的區間估計

大樣本(large sample)

根據中央極限定理,服從常態分配:

的信賴區間:已知)、未知)

稱信賴係數;稱信賴水準。一般使用95%。

小樣本(small sample)

前提:群體假定接近常態分配。

的信賴區間:

的區間估計

適用於大樣本()的信賴區間:

的區間估計

前提:假定群體服從近似常態分佈。

信賴區間:

變異數

選擇樣本數以估計群體參數值

的選擇

我們期望:得到一個樣本數量n,使得的估計值同真實值的誤差不超過E個單位的機率為

如果未知,則使用代替。

P的選擇

我們期望:得到一個樣本數量n,使得P的估計值同真實值的誤差不超過E個單位的機率為

此公式中的p和q可以使用過去資料來估計。

兩個群體參數差異之區間估計

獨立樣本的平均數差異()區間估計

大樣本:,如果未知,使用代替(t分佈和z分佈接近)。

  • 如果,群體參數
  • 如果,群體參數
  • 如果,群體參數沒有辦法推論是有差異的。(注意!不是沒有差異,是沒有辦法證明有差異)

小樣本,均未知,但假定,則有:

  • 判斷方法:如果,則一般認為兩個沒有差。

小樣本:均未知,但,則有:

配對樣本的平均數差異()區間估計

的信賴區間估計:

大樣本:

小樣本:

例:某健身中心針對欲減重者提供減肥運動計畫,並隨機抽取12位欲減重者參加此減肥運動計畫。兩個月後量測每位欲減重者之體重(以公斤為單位),減肥前後資料如下表所示。請找出減肥前後體重差異的95%信賴區間。請問減肥運動計畫是否有效?
表

解決如下:
解決

獨立樣本的比例差差異()區間估計

條件:大樣本(

獨立樣本的變異數比的差異()區間估計

選擇樣本大小(n)以估計兩群體參數差異