2 項分布と応用 - 美添泰人のホームページ

コンピュータによる統計分析
2014 年度 美添泰人
10/21 : 確率変数の和,大数の法則,2 項分布と応用
(Reading Assignment: 統計入門 V.3, V.4)
2 変数の確率変数
参考:統計学基礎 第 3 章
(1) 結果 ω ∈ Ω に実数を対応させる関数 X(ω ), Y (ω ) を考える.F(x, y) = Pr{X <
= x,Y <
= y} を
同時分布 (joint distribution) の分布関数という.同時分布が与えられれば,X, Y の分布 p(x),
p(y) が定められる.それを周辺分布 (marginal distribution) という.たとえば X の分布関数は
F(x) = Pr{X <
= x,Y <
= ∞} = F(x, ∞) となる.
確率関数または確率密度関数 p(x, y) については,離散形の場合は
p(x) = ∑y p(x, y), p(y) =
∫
∑x p(x, y).連続形の場合は和の代わりに積分を用いて p(x) =
∞
−∞
p(x, y) dy とする.
(2) 離散形の場合の度数分布表から p(x) = ∑y p(x, y), p(y) = ∑x p(x, y) の関係を理解すること.
(3) 独立性: Ax = {ω : X(ω ) <
= x}, By = {ω : Y (ω ) <
= y} とする.任意の実数 (x, y) に対して Ax と By
が独立となるとき,二つの確率変数 X と Y は独立という.
Pr{Ax ∩ By } = Pr{Ax } Pr{By }
すなわち
F(x, y) = F(x)F(y) (∀x, y)
物理的な発生メカニズムが無関係であれば,独立と考えられる.同時分布と周辺分布の確率
(密度)関数を用いた p(x, y) = p(x)p(y) という条件も同等である.講義では(誤解がない限り)
確率変数を小文字で表すことにする.
(4) x, y の関数 u = g(x, y) の期待値は u の確率関数 p(u) を用いて E(u) = ∑ up(u) と定義される
が,E(u) = E[g(x, y)] = ∑x ∑y g(x, y) p(x, y) として求めることができる(離散形の場合.連続形
なら積分).特別な場合として x だけの関数 u = g(x) の場合には E[g(x)] = ∑x ∑y g(x)p(x, y) =
∑x g(x)p(x) と変形される.すなわち周辺分布から求めた期待値に一致する.
(5) 和に関して E[g(x) + h(y)] = E[g(x)] + E[h(y)] が成り立つ.特に E(x + y) = E(x) + E(y) である.
(6) 積に関して,一般には E[g(x)h(y)] ̸= E[g(x)]E[h(y)] であるが,独立の場合には等号 E[g(x)h(y)] =
E[g(x)]E[h(y)] が成り立つことに注意.
[
]
(7) 2 つの確率変数 x と y の共分散は cov(x, y) = E (x − µx )(y − µy ) と定義される.x と y が独立
のとき cov(x, y) = 0 となる.
1
コンピュータによる統計分析
2014 年度 美添泰人
確率変数の和(平均と分散),Bernoulli 試行列と二項分布,大数の法則
(Reading Assignment: 統計入門 V 章 3 節,4 節,VI 章 1 節,6 節;2, 3 節)
参考:統計学基礎 第 3 章
必要に応じて復習・解説する
(1) ベイズの定理:Quiz の解説.期待値:賭け(くじ)の問題から一般の問題へ
(2) 確率:コイン投げとカード・つぼのモデル
(3) 確率変数の分散 var(X)
(4) チェビシェフの不等式(意味と使い方)
(5) 2 変数の確率変数(同時分布・周辺分布)
2 変数・多変数の期待値
(1) 2 つの確率変数 x と y について,E(x) = µx , var(x) = σx2 , E(y) = µy , var(y) = σy2 とする.x と y
の共分散は σxy = cov(x, y) = E(x − µx )(y − µy ) と定義される.
(2) x と y が独立のとき,共分散 σxy は 0 となる.
(3) 分散,共分散の変形
]
[
var(x) = E (x − µx )2 = E(x2 ) − µx2 ,
cov(x, y) = E(x − µx )(y − µy ) = E(xy) − µx µy
(4) 確率分布のイメージを描く.149 ページ(離散形),153 ページ(連続形)の図,または等高
線のイメージ.
(5) x の分散は「 x と x の共分散」と形式的にみなすことができる.そのため分散を表す記号とし
て var(x) = σxx を用いることもある.
(6) (理論的な)相関係数は ρ (x, y) =
σxy
と定義される.ρ (x, y)2 <
= 1 となることも,標本の場合
σx σy
と同様にして確かめられる.
(7) 確率変数 x と y の和 x + y の平均と分散は,次のようになる(重要).
E(x + y) = µx + µy ,
var(x + y) = σx2 + σy2 + 2cov(x, y)
(8) 特に独立のときは,期待値も分散も和になる.
E(x + y) = µx + µy ,
var(x + y) = σx2 + σy2
x − y の期待値は E(x − y) = µx − µy . 分散 var(x − y) はどうなるか?
{
}
{
}
var(x−y) = E [(x−y)−(µx − µy )]2 = E [(x− µx )−(y− µy )]2 =
(9) 3 つ以上の確率変数の場合にも同様な性質が成り立つ.x1 , · · · , xn について E(xi ) = µi , var(xi ) =
σi2 ,cov(xi , x j ) = E(xi − µi )(x j − µ j ) = σi j (i, j = 1, · · · , n) と書く.特に i = j のときは var(xi ) = σii
となる.
1
(10) 確率変数の和 S = ∑ni=1 xi の期待値と分散は,次のようになる.
n
n
var(S) = ∑ σi2 + 2
E(S) = ∑ µi ,
i=1
i=1
n−1
n
∑ ∑
σi j
i=1 j=i+1
n
(11) もう少し一般的に ai を定数とするとき xi の 1 次式 S = ∑ ai xi の期待値と分散は,次のように
i=1
なる.
n
n
n
i=1
i=1
i=1
n
S − E(S) = ∑ ai (xi − µi )
E(S) = ∑ E(ai xi ) = ∑ ai E(xi ) = ∑ ai µi ,
var(S) = E
i=1
[{
[{ n
}2 ]
[{ n
}{ n
}]
}2 ]
S − E(S)
= E ∑ ai (xi − µi )
= E ∑ ai (xi − µi ) ∑ a j (x j − µ j )
[
i=1
i=1
j=1
]
n n
n n
= E ∑ ∑ ai a j (xi − µi )(x j − µ j ) = ∑ ∑ ai a j E(xi − µi )(x j − µ j ) = ∑ ∑ ai a j σi j
n
n
i=1 j=1
i=1 j=1
i=1 j=1
二項分布
(1) Bernoulli 試行列と二項分布
例:成功と失敗,歪んだコイン,つぼの中の玉など,独立に同一条件の実験を繰り返す.
(2) コイン投げのモデル:二項分布.n 回投げて,x 回表が出る確率.記号では x ∼ B(n, p) (q = 1 − p)
または x ∼ B(n, θ ) (0 < θ < 1) と表わす.
( )
n x n−x
Pr(X = x) = p(x) =
p q ,
x
( )
n x
p(x) =
θ (1 − θ )n−x
x
(3) x ∼ B(1, p) の期待値と分散.
x
0
1
計
p(x)
q
p
1
xp(x)
0
p
p
x2 p(x)
0
p
p
左の表から E(x) = p, E(x2 ) = p が明らかであり,こ
れから
var(x) = E(x2 ) − E(x)2 = p − p2 = p(1 − p) = pq
が簡単に導かれる.
¯ = q = 1 − p で生じる実験を
(4) 一般にある事象 A とその余事象 A¯ が,それぞれ Pr{A} = p, Pr{A}
¯
繰り返す.1 回の実験で事象 A がおきたときは x = 1, 事象 A がおきたときは x = 0 を取る確率
変数の確率関数(密度関数) p(x) = Pr{x˜ = x} (x = 0, 1) は,次のように書ける.
p(0) = px q1−x ,
(x = 0, 1) すなわち p(0) = q, p(1) = p である.
また,その期待値と分散は前項のように容易に求められる.
(5) この実験を i = 1, 2, · · · , n 回繰り返すとき,第 i 回の結果を xi = 0 または xi = 1 で表わす確率変
数を考える.当然,各 xi は独立である.
(6) 上記の実験を n 回繰り返したとき,事象 A が x 回生じるとき,x は二項分布にしたがう,ある
いは x ∼ B(n, p) と表わす.その確率関数は次の式で与えられる.
p(x) = nCx px qn−x ,
2
(x = 0, · · · , n)
(7) 二項定理から,確率の和は 1 になることが確かめられる.
n
∑
x=0
n
p(x) =
∑ nCx px qn−x = (p + q)n = 1
x=0
また,多少の手間をかければ E(x), E[x(x − 1)], E[x(x − 1)(x − 2)] などを評価することができる.
これから,期待値と分散が求められる.E(x) = np, var(x) = npq = np(1 − p)
(8) xi ∼ B(1, p) (i = 1, · · · , n) の意味を考えると x1 + · · · + xn = ∑ni=1 xi は二項分布 B(n, p) に従うこ
とが明らかである.独立な確率変数の和に関して,期待値と分散が和で与えられるという性質
を用いれば,x ∼ B(n, p) の平均,分散は B(1, p) の n 倍となることは直ちに導かれる.
(9) 二項分布のグラフ p(x) を n, p をさまざまに変えて描き,その中心の位置,散らばり,歪みな
どを比較する.特に n が大きいとき(かつ p も q も 0 に近くないとき)には,二項分布は左
右対称なベル型の分布になることを確かめる(中心極限定理, CLT)
簡単な確率の練習問題
(1) 歪んだコインで表が出る事象を A として,その確率を Pr(A) = θ (0 < θ < 1) とする.
(i) r 回目に初めて表が出る確率 : 幾何分布 r ∼ G(θ )
(ii) n 回投げたとき,表が r 回出る確率 : 二項分布 r ∼ B(n, θ )
(iii) 表が r 回出るまで投げ続けて,n 回で終了する確率 : 負の二項分布 n ∼ NB(r, θ )
(2) つぼのモデル:赤い玉が R 個,黒い玉が B 個,合計で N = R + B 個入っている.よくかき混ぜ
て,玉を取り出す問題
(i) 毎回元に戻しながら n 個の玉を取り出す(復元抽出 with replacement).赤玉の数 r はコ
イン投げと同じ確率モデルになる.θ = R/N として r ∼ B(n, θ )
(ii) 元に戻さずに玉を取り出す(非復元抽出 without replacement).
( )(
)/( )
R
B
N
p(r) =
r
n−r
n
(3) (条件付確率を考える問題)A, B, C のいずれかとなる実験を繰り返すとき,事象 B が出る前
に事象 A が出る確率はいくらか.ただし Pr(A) = a, Pr(B) = b, Pr(C) = c とする (a + b + c = 1).
簡単な解答は
Pr(A)
a
Pr{A ∩ (A ∪ B)}
=
=
Pr(A | A ∪ B) =
Pr(A ∪ B)
Pr(A ∪ B) a + b
(4) ベイズの定理の応用例:3つの箱(Bertrand の問題)
箱 B1 , B2 , B3 があり,それぞれの中身は B1 : (G, G), B2 : (S, S), B3 : (G, S) とする.ただし,G,
S は,それぞれ金貨および銀貨を表す.いま,1 つの箱をでたらめに選んだとき,1 枚目が金
貨だったとすると,2 枚目も金貨である確率はいくらか.
大数の法則
(lln.R)
(1) x1 , · · · , xn を無作為標本,すなわち,独立に同じ分布に従う確率変数とする(任意の分布).以下,
xi の共通の期待値を µ ,分散を σ 2 とする.このとき和 S = ∑ni=1 xi の期待値と分散は E(S) = nµ ,
¯ = µ , var(x)
¯ = σ 2 /n となる.
var(S) = nσ 2 となる.また標本平均 x¯ = S/n の期待値と分散は E(x)
3
(2) 大数の法則 (LLN: Law of Large Numbers) は n が大きくなると x¯ は母集団の平均である µ に
近づくというものである.LLN には同一分布でない場合や独立でない場合などいくつかの命
題があるが,最も簡単な大数の法則は無作為標本 (independently, identically distributed sample,
iid) に関する以下の形である.
Pr{|x¯ − µ | > ε } → 0
(n → ∞)
ここで ε > 0 は任意の数である.
(3) 図による大数の法則の理解:1 点に集中すること.
(4) 大数の法則は「どのような分布であっても成立する」点が重要である.ただし,平均や分散に
関する条件は必要である.大数の法則が成立しない確率変数の例は,余裕があれば紹介する.
(5) コンピュータによるシミュレーションで,適当な確率変数を多数発生させて,その算術平均の
分布が次第に 1 点に集中していくことを観測する.
コンピュータによる演習
(1) 確率分布の比較
(i) 主要な確率分布のグラフを描く
(ii) 主要な確率分布について,平均,標準偏差(分散)の意味を simulation を通じて理解する.
二項分布・コイン投げ
(binom-ex1.R)
(1) 表が出る確率が p のコインを n 回投げて,表が r 回出る確率 : dbinom(r,n,p)
(2) p = 0.5 のコインを n = 5 回投げて,表が r = 0, · · · , 5 回出る確率 :dbinom(0:5,5,0.5)
(3) p = 0.3 のコインを n = 100 回投げて,表が r = 35 回以下になる確率 :
cpbinom(35,100,0.3) は sum(dbinom(0:35,100,0.3)) に等しい.
(4) p = 0.5 のコインを n = 5 回投げて,表が何回出るかの実験
rbinom(1,5,0.5) 実験を 1 回だけ(コイン投げは 5 回)
rbinom(20,5,0.5) 実験を 20 回(コイン投げは 5 × 20 = 100 回)
(5) 二項分布の確率のグラフを描く: barplot 関数の利用
正規分布
(normal-ex1.R)
(1) ある集団の身長は平均が 170cm,標準偏差が 10cm の正規分布で近似されるとき,無作為に選
ばれた人の身長が 180cm を超える確率 : 1-pnorm(180,mean=170,sd=10)
(2) ある試験の得点は正規分布で近似され,その平均は 500 点,標準偏差は 100 点である.800 点
を超える受験生の割合はいくらか : pnorm(800, 500,100)
(3) 前問の試験で,上位 10%, 5%, 1% の受験生はそれぞれ何点を取っているか :
qnorm( c(0.9,0.95,0.99), 500,100)
(4) 正規分布の密度関数を描く.平均と標準偏差を変えて,形を比較する :
dnorm(x, mean=0, sd=1)
4
コンピュータによる統計分析
2014 年度 美添泰人
3つの箱(Bertrand の問題)への解答
問題: 箱 B1 , B2 , B3 があり,それぞれの中身は B1 : (G, G), B2 : (S, S), B3 : (G, S) とする.ただし,
G, S は,それぞれ金貨および銀貨を表す.いま,1 つの箱をでたらめに選んだとき,1 枚目が金貨
だったとすると,2 枚目も金貨である確率はいくらか.
解答: ベイズの定理を形式的に適用する.以下のような事前分布と,金貨が観測される確率を
想定することに対しては,ほとんどの人の同意を得られるであろう.
P {B1 } = P {B2 } = P {B3 } =
P {G | B1 } = 1,
P {G | B2 } = 0,
1
3
P {G | B3 } =
1
2
これから,事後確率は
P {B1 | G} =
P {G | B1 } P {B1 }
1 · (1/3)
2
=
=
P {G}
1 · (1/3) + 0 · (1/3) + (1/2) · (1/3) 3
と求められる.
相対度数の極限では解釈が困難であることを確認する.