【数理統計学入門】事象と確率の性質【データサイエンス・機械学習】

こんにちはたくまろです。第2回では条件付き分布とベイズの定理について説明しています。条件付き分布って考え方が難しいですよね。今回は例題を用いて簡単に使い方を紹介します。

2.1 条件付き確率

定義2.1
確率空間\( (\Omega, \mathcal{A}, P)\)において, \( A,B \in \mathcal{A}\), \(P(B)>0\)とする.事象\(B\)のもと事象\(A\)が起こる条件付き確率\(A|B\)を以下で定義する.
$$P(A|B)=P(A\cap B)/P(B)$$

注意

\(P(B)=0\)のとき, 事象\(B\)は起こらないと考えれば、\(P(A|B)=P(A)\)と定義できます.
\(P(A|B)=0\)ではないので、間違えなく!!

MEMO

条件付き確率は基本的に、連続で起きる事象を扱っています. 例えば、サイコロを1回振って\(A\)を2の倍数が出る事象として,\(B\)を3の倍数が出る事象とします.この時\(B|A\)などは考えることが出来なですよね.なぜならば, AとBの事象はサイコロ1回振って与えられるので, 同時に観測されるものだからです. なので, Aという条件に関係なくBの結果は変わらないです.
逆に, サイコロを2回振って\(A\)を1回目に2の倍数が出る事象として, \(B\)を2回目に3の倍数が出る事象としたら,1回目に出る目によって, 2回目に出る目の確率が変わるので条件付き確率が意味をもちます.

例2.1

箱の中に100個の玉を入れる.(赤:5, 青:15, 黄:30, 白:50) 玉を戻さず2回連続で引く. このとき,どちらも青を引く確率を求めたい. \(A_1\):一回目に青を引く事象. \(A_2\):二回目に青を引く事象.

$$P(A_1)=15/100, P(A_2|A_1)=14/99$$

なので,2個とも青を引く確率\(P(A_2\cap A_1)\)は,

$$P(A_2\cap A_1)=P(A_1)P(A_2|A_1)=7/330$$

2.2 事象の独立性

定義2.2
事象\(A,B \in \mathcal{A}\)について, $$P(A\cap B)=P(A)P(B)$$が成り立つとき, \( (A,B \)は互いに独立(independent)である. 一般に\( A_i \in \mathcal{A}\ (i=1,…,n)\)について,任意の部分列\(A_{i_1},…,A_{i_k}\ (1\leq i_1<…<i_k \leq n)\)$$P(A_{i_1}\cap …\cap A_{i_k})=P(A_{i_1})…P(A_{i_k})$$が成り立つとき, 互いに独立である.

注意

\(P(A_{1}\cap …\cap A_{n})=P(A_{1})…P(A_{n})\)だけでは, \( A_i \in \mathcal{A}\ (i=1,…,n)\)の独立性は成立しない.

2.3ベイズの定理

条件付き確率の場合,1段階目の事象が1つの場合の時しか考えていなかったが,複数個ある場合はどうなるでしょう. 複数の事象を同時に考えるときにはベイズの定理が必要になります。

定理2.3(ベイズ(Bayes)の定理)
標本空間\(\Omega\)の\(n\)個の事象\(A_1,…,A_n\)は互いに排反で,それらの和集合が\(\Omega\)である, すなわち\(\Omega=\bigcup_{i=1}^{n}A_i\)とする. このとき, \(B\)を\(\Omega\)のある事象とし, \(P(B)>0\)とするとき,

$$P(A_i|B)=\frac{P(B|A_i)P(A_i)}{\sum_{k=1}^{n}P(B|A_k)P(A_k)}$$

が成り立つ. ただし, \(P(A_i) > 0(i=1,..,n)\)とする.

例2.3
前期と後期でテストを行う. 前期のテストでA, B, C, Dをとる確率はそれぞれ\(0.2, 0.3, 0.4, 0.1\)とする.前期のテストでA, B, C, Dの人が後期のテストで合格する割合はそれぞれ\(0.9, 0.8, 0.6, 0.5\)とする. 後期のテストで合格した人が前期のテストの結果がDであった確率はいくらだろう.
前期のテストの事象: \(A, B, C, D\)
後期のテストの事象: \(pass, failed\)

\(P(D|pass)\)

\(=\frac{P(pass|D)P(D)}{P(pass|A)P(A)+P(pass|B)P(B)+P(pass|C)P(C)+P(pass|D)P(D)}\)

\(=\frac{0.5\times 0.1}{0.9\times 0.2+0.8\times 0.3+0.6\times 0.4+0.5\times 0.1}\approx0.07\)

前期でDだった人が合格している確率は0.5だが, 実際に後期試験で合格した人の中で, Dであったひとは10%にも満たない. なので, コツコツ日頃から努力しましょう.

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です