[統計]離散型(Discrete)隨機變數與其機率分佈(1)

這一系列我是以 Wackerley, Mendenhall and Scheaffer 的
Mathematical Statistics with Applications, 7th edition 這本書為主,
有些名詞與定理解釋會再參考其他書籍與網路作為輔助(下方有參考連結)。

這篇內容為書中的 3.1 與 3.2。


在開始前,何謂「隨機變數」?

隨機變數 Random Variable

定義 Definition

  • 隨機變數 \(X\) 是一個以樣本空間 \(S\) 為定義域(Domain)的實數值函數。 Source
  • A random variable \(X\) is a funcion from sample space to real number. Source

\( X: S \to {\Bbb R}, \ S \ is \ sample \ space \)
\( i.e. \ \forall \ s \in S, \ X(s) \in {\Bbb R} \)

Example:

擲兩枚硬幣,其樣本空間為 \( R = \{HH, HT, TH, TT\} \),共有 \(2^2\) 種可能。
若將 H 定義為 1,T 定義為 0,則其隨機變數 \(X\) 的值為 \( \{0, 1, 2\}\)

而隨機變數又分為 1. 離散型 與 2. 連續型,這一章節我們只會討論離散型。


離散型隨機變數 Discrete Random Variable

定義 Definition

  • A random variable \(Y\) is said to be discrete if it can assume only a finite or countably infinite number of distinct values. (DEFINITION 3.1)
  • \(X\) is a discrete random variable, if its range is countable. Source

根據定義,離散型隨機變數(Discrete Random Variable)必須為可數(countable)。

所以像是擲銅板或是擲骰子就會是離散型隨機變數。

以擲一顆骰子一次為例,其可能值為 \(\{1, 2, 3, 4, 5, 6\}\), 我們用 \(X\)來表示其隨機變數,
但因為隨機變數為 function,所以我們可以用 \(R_X\)來表示它的範圍,

\( Range(X) = R_X = \{1, 2, 3, 4, 5, 6\} \)


機率質量函數 Probability Mass Function (PMF)

定義 Definition

  • Let \(X\) be a discrete random variable with range \(R_X = \{ x_1, x_2, x_3,… \} \) (finite or countably infinite). The function
\[P_X(x_k) = P(X=x_k),\; for \; k = 1, 2, 3,...\]
  • is called the probability mass function (PMF) of \(X\). Source

機率質量函數 Probability Mass Function (PMF) 可以用來表達樣本空間中某事件的機率。

譬如說,擲一顆公平的骰子,骰子點數為 1 的機率我們可以這樣表示,

\( P(X = 1) = 1/6 \)

另外,\( P_X(x) \)還有兩個很重要的性質 Source

  • \( 0 \leqslant P_X(x) \leqslant 1 , \forall x \)
  • \( \sum_{\substack{x \in R_X}}P_X(x) = 1 \)

簡單來說就是,

  1. 任何事件發生的機率都只會介於 0 和 1 之間
  2. 所有事件機率總和等於 1

離散型 PMF 圖

擲兩枚硬幣,出現 head 為 1,tail 為 0 ,其 PMF 函數為

\[P_X(x) = \left\{ \begin{array}{rcl} 1/4,& \;for\; x = 0 \\ 1/2,& \;for\; x = 1 \\ 1/4,& \;for\; x = 2 \\ 0,& otherwise \\ \end{array}\right.\]

函數圖為,

PMF_two coins.png


參考: