統計學(5)
這篇文章介紹隨機變數及離散型機率分佈。
隨機變數
- 定義:隨機變數是一個隨機實驗(random experiment)之結果(outcome)依其某種特質以數值之方式表現。
- 分類
- 離散型:離散型隨機變數是指一個隨機變數其所有可能值之個數是有限的或個數無限但可數;即若一個隨機變數X之值域是一個離散集合,則X是一個離散型之隨機變數。
- 連續型:連續型隨機變數是指一個隨機變數其所有可能值之個數為無限或不可數;另連續型之隨機變數可能之值域為一個區間(interval)。
離散型隨機變數之機率分佈
定義:離散型隨機變數之機率分佈,是以圖或表來表示隨機變數X的每一可能值之相關機率。
特性:
期望值
變異數和標準差
例:擲一枚銅板三次,令X表銅板出現人頭(正面)的次數,X之機率分佈為:
|x|p|
|—|—|
|0|1/8|
|1|3/8|
|2|3/8|
|3|1/8|求:
1)出現正面的期望次數,Exp(x)。
2)變異數與標準差。
解題如下:
- 變異數:
標準差:
定理
- 常數定理:設X為一隨機變數(離散或連續),則:
,其中C為一常數
- 若
和 存在且 ,其中a和b為任意常數,則:
常用之離散型機率分佈
二項分佈
- 二項實驗:一個實驗必須滿足以下四個條件,才能稱為二項實驗:
- 此一實驗獨立、重複的試行n次。
- 每一試行均產生兩結果:成功(Success)或失敗(Failure)。
- 每一試行成功的機率均為p,失敗的機率為(1-p)或q。
- 我們對試行n次中,成功X次之機率有興趣。
- 二項隨機變數:在二項實驗試行中,X表示成功發生的次數,稱X為二項隨機變數。
- 二項分佈:在n次獨立二項實驗試行中,二項隨機變數的機率為:
- 平均數:
- 變異數:
白努力分佈
- 當X服從(n=1,P)之二項分佈,則X稱為白努力(Bernoulli)隨機變數。
- 白努力分佈:
- 一個服從二項分佈
之隨機變數Y是n個白努力隨機變數之和。
超幾何分佈
- 超幾何實驗:一個實驗必須滿足以下三個條件,才能稱為超幾何實驗:
- 此實驗是在一個有N個元素之集合中,以取後不放回(without replacement)的方式隨機抽取n個元素。
- N個元素中包含兩個類別,一類為「成功」(以S表之),共包含a個元素;另一類為「失敗」(以F表之),共包含N-a個元素。
- 我們對在n個元素中,「成功」出現x次之機率有興趣。
- 超幾何隨機變數:X表示成功的個數。
- 超幾何分佈:
- 平均數:
,變異數 - 超幾何分佈和二項分佈之近似
- 當
的時候,可以證明超幾何分佈和二項分佈 非常近似。 - 當N很大,且
時,可以利用二項分佈 來近似超幾何分佈之機率。
- 當
波瓦松分佈
波瓦松分佈是用來形容在某一特定時間或面積內稀有事件發生之機率。
- 定義:假設事件是隨機且彼此獨立的發生,其單位時間或面積的平均次數為
,令X表示一段特定時間(或面積)內事件發生的次數,則波瓦松機率函數如下: - 平均數:
,變異數: - 波瓦松分佈與二項分佈之近似:二項分佈當n很大且p很小(或
)時,可以利用波瓦松分佈來近似二項分佈。