Download Report

コンピュータによる統計分析
2014 年度美添泰人
10/21 : 確率変数の和，大数の法則，2 項分布と応用
（Reading Assignment: 統計入門 V.3, V.4）
2 変数の確率変数
参考：統計学基礎第 3 章
(1) 結果 ω ∈ Ω に実数を対応させる関数 X(ω ), Y (ω ) を考える．F(x, y) = Pr{X <
= x,Y <
= y} を
同時分布 (joint distribution) の分布関数という．同時分布が与えられれば，X, Y の分布 p(x),
p(y) が定められる．それを周辺分布 (marginal distribution) という．たとえば X の分布関数は
F(x) = Pr{X <
= x,Y <
= ∞} = F(x, ∞) となる．
確率関数または確率密度関数 p(x, y) については，離散形の場合は
p(x) = ∑y p(x, y)， p(y) =
∫
∑x p(x, y)．連続形の場合は和の代わりに積分を用いて p(x) =
∞
−∞
p(x, y) dy とする．
(2) 離散形の場合の度数分布表から p(x) = ∑y p(x, y)， p(y) = ∑x p(x, y) の関係を理解すること．
(3) 独立性: Ax = {ω : X(ω ) <
= x}, By = {ω : Y (ω ) <
= y} とする．任意の実数 (x, y) に対して Ax と By
が独立となるとき，二つの確率変数 X と Y は独立という．
Pr{Ax ∩ By } = Pr{Ax } Pr{By }
すなわち
F(x, y) = F(x)F(y) (∀x, y)
物理的な発生メカニズムが無関係であれば，独立と考えられる．同時分布と周辺分布の確率
（密度）関数を用いた p(x, y) = p(x)p(y) という条件も同等である．講義では（誤解がない限り）
確率変数を小文字で表すことにする．
(4) x, y の関数 u = g(x, y) の期待値は u の確率関数 p(u) を用いて E(u) = ∑ up(u) と定義される
が，E(u) = E[g(x, y)] = ∑x ∑y g(x, y) p(x, y) として求めることができる（離散形の場合．連続形
なら積分）．特別な場合として x だけの関数 u = g(x) の場合には E[g(x)] = ∑x ∑y g(x)p(x, y) =
∑x g(x)p(x) と変形される．すなわち周辺分布から求めた期待値に一致する．
(5) 和に関して E[g(x) + h(y)] = E[g(x)] + E[h(y)] が成り立つ．特に E(x + y) = E(x) + E(y) である．
(6) 積に関して，一般には E[g(x)h(y)] ̸= E[g(x)]E[h(y)] であるが，独立の場合には等号 E[g(x)h(y)] =
E[g(x)]E[h(y)] が成り立つことに注意．
[
]
(7) 2 つの確率変数 x と y の共分散は cov(x, y) = E (x − µx )(y − µy ) と定義される．x と y が独立
のとき cov(x, y) = 0 となる．
1
コンピュータによる統計分析
2014 年度美添泰人
確率変数の和（平均と分散），Bernoulli 試行列と二項分布，大数の法則
（Reading Assignment: 統計入門 V 章 3 節，4 節，VI 章 1 節，6 節；2, 3 節）
参考：統計学基礎第 3 章
必要に応じて復習・解説する
(1) ベイズの定理：Quiz の解説．期待値：賭け（くじ）の問題から一般の問題へ
(2) 確率：コイン投げとカード・つぼのモデル
(3) 確率変数の分散 var(X)
(4) チェビシェフの不等式（意味と使い方）
(5) 2 変数の確率変数（同時分布・周辺分布）
2 変数・多変数の期待値
(1) 2 つの確率変数 x と y について，E(x) = µx , var(x) = σx2 , E(y) = µy , var(y) = σy2 とする．x と y
の共分散は σxy = cov(x, y) = E(x − µx )(y − µy ) と定義される．
(2) x と y が独立のとき，共分散 σxy は 0 となる．
(3) 分散，共分散の変形
]
[
var(x) = E (x − µx )2 = E(x2 ) − µx2 ,
cov(x, y) = E(x − µx )(y − µy ) = E(xy) − µx µy
(4) 確率分布のイメージを描く．149 ページ（離散形），153 ページ（連続形）の図，または等高
線のイメージ．
(5) x の分散は「 x と x の共分散」と形式的にみなすことができる．そのため分散を表す記号とし
て var(x) = σxx を用いることもある．
(6) （理論的な）相関係数は ρ (x, y) =
σxy
と定義される．ρ (x, y)2 <
= 1 となることも，標本の場合
σx σy
と同様にして確かめられる．
(7) 確率変数 x と y の和 x + y の平均と分散は，次のようになる（重要）．
E(x + y) = µx + µy ,
var(x + y) = σx2 + σy2 + 2cov(x, y)
(8) 特に独立のときは，期待値も分散も和になる．
E(x + y) = µx + µy ,
var(x + y) = σx2 + σy2
x − y の期待値は E(x − y) = µx − µy . 分散 var(x − y) はどうなるか?
{
}
{
}
var(x−y) = E [(x−y)−(µx − µy )]2 = E [(x− µx )−(y− µy )]2 =
(9) 3 つ以上の確率変数の場合にも同様な性質が成り立つ．x1 , · · · , xn について E(xi ) = µi , var(xi ) =
σi2 ，cov(xi , x j ) = E(xi − µi )(x j − µ j ) = σi j (i, j = 1, · · · , n) と書く．特に i = j のときは var(xi ) = σii
となる．
1
(10) 確率変数の和 S = ∑ni=1 xi の期待値と分散は，次のようになる．
n
n
var(S) = ∑ σi2 + 2
E(S) = ∑ µi ,
i=1
i=1
n−1
n
∑ ∑
σi j
i=1 j=i+1
n
(11) もう少し一般的に ai を定数とするとき xi の 1 次式 S = ∑ ai xi の期待値と分散は，次のように
i=1
なる．
n
n
n
i=1
i=1
i=1
n
S − E(S) = ∑ ai (xi − µi )
E(S) = ∑ E(ai xi ) = ∑ ai E(xi ) = ∑ ai µi ,
var(S) = E
i=1
[{
[{ n
}2 ]
[{ n
}{ n
}]
}2 ]
S − E(S)
= E ∑ ai (xi − µi )
= E ∑ ai (xi − µi ) ∑ a j (x j − µ j )
[
i=1
i=1
j=1
]
n n
n n
= E ∑ ∑ ai a j (xi − µi )(x j − µ j ) = ∑ ∑ ai a j E(xi − µi )(x j − µ j ) = ∑ ∑ ai a j σi j
n
n
i=1 j=1
i=1 j=1
i=1 j=1
二項分布
(1) Bernoulli 試行列と二項分布
例：成功と失敗，歪んだコイン，つぼの中の玉など，独立に同一条件の実験を繰り返す．
(2) コイン投げのモデル：二項分布．n 回投げて，x 回表が出る確率．記号では x ∼ B(n, p) (q = 1 − p)
または x ∼ B(n, θ ) (0 < θ < 1) と表わす．
( )
n x n−x
Pr(X = x) = p(x) =
p q ,
x
( )
n x
p(x) =
θ (1 − θ )n−x
x
(3) x ∼ B(1, p) の期待値と分散．
x
0
1
計
p(x)
q
p
1
xp(x)
0
p
p
x2 p(x)
0
p
p
左の表から E(x) = p, E(x2 ) = p が明らかであり，こ
れから
var(x) = E(x2 ) − E(x)2 = p − p2 = p(1 − p) = pq
が簡単に導かれる．
¯ = q = 1 − p で生じる実験を
(4) 一般にある事象 A とその余事象 A¯ が，それぞれ Pr{A} = p, Pr{A}
¯
繰り返す．1 回の実験で事象 A がおきたときは x = 1, 事象 A がおきたときは x = 0 を取る確率
変数の確率関数（密度関数） p(x) = Pr{x˜ = x} (x = 0, 1) は，次のように書ける．
p(0) = px q1−x ,
(x = 0, 1) すなわち p(0) = q, p(1) = p である．
また，その期待値と分散は前項のように容易に求められる．
(5) この実験を i = 1, 2, · · · , n 回繰り返すとき，第 i 回の結果を xi = 0 または xi = 1 で表わす確率変
数を考える．当然，各 xi は独立である．
(6) 上記の実験を n 回繰り返したとき，事象 A が x 回生じるとき，x は二項分布にしたがう，ある
いは x ∼ B(n, p) と表わす．その確率関数は次の式で与えられる．
p(x) = nCx px qn−x ,
2
(x = 0, · · · , n)
(7) 二項定理から，確率の和は 1 になることが確かめられる．
n
∑
x=0
n
p(x) =
∑ nCx px qn−x = (p + q)n = 1
x=0
また，多少の手間をかければ E(x), E[x(x − 1)], E[x(x − 1)(x − 2)] などを評価することができる．
これから，期待値と分散が求められる．E(x) = np, var(x) = npq = np(1 − p)
(8) xi ∼ B(1, p) (i = 1, · · · , n) の意味を考えると x1 + · · · + xn = ∑ni=1 xi は二項分布 B(n, p) に従うこ
とが明らかである．独立な確率変数の和に関して，期待値と分散が和で与えられるという性質
を用いれば，x ∼ B(n, p) の平均，分散は B(1, p) の n 倍となることは直ちに導かれる．
(9) 二項分布のグラフ p(x) を n, p をさまざまに変えて描き，その中心の位置，散らばり，歪みな
どを比較する．特に n が大きいとき（かつ p も q も 0 に近くないとき）には，二項分布は左
右対称なベル型の分布になることを確かめる（中心極限定理, CLT）
簡単な確率の練習問題
(1) 歪んだコインで表が出る事象を A として，その確率を Pr(A) = θ (0 < θ < 1) とする．
(i) r 回目に初めて表が出る確率 : 幾何分布 r ∼ G(θ )
(ii) n 回投げたとき，表が r 回出る確率 : 二項分布 r ∼ B(n, θ )
(iii) 表が r 回出るまで投げ続けて，n 回で終了する確率 : 負の二項分布 n ∼ NB(r, θ )
(2) つぼのモデル：赤い玉が R 個，黒い玉が B 個，合計で N = R + B 個入っている．よくかき混ぜ
て，玉を取り出す問題
(i) 毎回元に戻しながら n 個の玉を取り出す（復元抽出 with replacement）．赤玉の数 r はコ
イン投げと同じ確率モデルになる．θ = R/N として r ∼ B(n, θ )
(ii) 元に戻さずに玉を取り出す（非復元抽出 without replacement）．
( )(
)/( )
R
B
N
p(r) =
r
n−r
n
(3) （条件付確率を考える問題）A, B, C のいずれかとなる実験を繰り返すとき，事象 B が出る前
に事象 A が出る確率はいくらか．ただし Pr(A) = a, Pr(B) = b, Pr(C) = c とする (a + b + c = 1)．
簡単な解答は
Pr(A)
a
Pr{A ∩ (A ∪ B)}
=
=
Pr(A | A ∪ B) =
Pr(A ∪ B)
Pr(A ∪ B) a + b
(4) ベイズの定理の応用例：３つの箱（Bertrand の問題）
箱 B1 , B2 , B3 があり，それぞれの中身は B1 : (G, G), B2 : (S, S), B3 : (G, S) とする．ただし，G,
S は，それぞれ金貨および銀貨を表す．いま，1 つの箱をでたらめに選んだとき，1 枚目が金
貨だったとすると，2 枚目も金貨である確率はいくらか．
大数の法則
(lln.R)
(1) x1 , · · · , xn を無作為標本，すなわち，独立に同じ分布に従う確率変数とする（任意の分布）．以下，
xi の共通の期待値を µ ，分散を σ 2 とする．このとき和 S = ∑ni=1 xi の期待値と分散は E(S) = nµ ,
¯ = µ , var(x)
¯ = σ 2 /n となる．
var(S) = nσ 2 となる．また標本平均 x¯ = S/n の期待値と分散は E(x)
3
(2) 大数の法則 (LLN: Law of Large Numbers) は n が大きくなると x¯ は母集団の平均である µ に
近づくというものである．LLN には同一分布でない場合や独立でない場合などいくつかの命
題があるが，最も簡単な大数の法則は無作為標本 (independently, identically distributed sample,
iid) に関する以下の形である．
Pr{|x¯ − µ | > ε } → 0
(n → ∞)
ここで ε > 0 は任意の数である．
(3) 図による大数の法則の理解：1 点に集中すること．
(4) 大数の法則は「どのような分布であっても成立する」点が重要である．ただし，平均や分散に
関する条件は必要である．大数の法則が成立しない確率変数の例は，余裕があれば紹介する．
(5) コンピュータによるシミュレーションで，適当な確率変数を多数発生させて，その算術平均の
分布が次第に 1 点に集中していくことを観測する．
コンピュータによる演習
(1) 確率分布の比較
(i) 主要な確率分布のグラフを描く
(ii) 主要な確率分布について，平均，標準偏差（分散）の意味を simulation を通じて理解する．
二項分布・コイン投げ
(binom-ex1.R)
(1) 表が出る確率が p のコインを n 回投げて，表が r 回出る確率 : dbinom(r,n,p)
(2) p = 0.5 のコインを n = 5 回投げて，表が r = 0, · · · , 5 回出る確率 :dbinom(0:5,5,0.5)
(3) p = 0.3 のコインを n = 100 回投げて，表が r = 35 回以下になる確率 :
cpbinom(35,100,0.3) は sum(dbinom(0:35,100,0.3)) に等しい．
(4) p = 0.5 のコインを n = 5 回投げて，表が何回出るかの実験
rbinom(1,5,0.5) 実験を 1 回だけ（コイン投げは 5 回）
rbinom(20,5,0.5) 実験を 20 回（コイン投げは 5 × 20 = 100 回）
(5) 二項分布の確率のグラフを描く： barplot 関数の利用
正規分布
(normal-ex1.R)
(1) ある集団の身長は平均が 170cm，標準偏差が 10cm の正規分布で近似されるとき，無作為に選
ばれた人の身長が 180cm を超える確率 : 1-pnorm(180,mean=170,sd=10)
(2) ある試験の得点は正規分布で近似され，その平均は 500 点，標準偏差は 100 点である．800 点
を超える受験生の割合はいくらか : pnorm(800, 500,100)
(3) 前問の試験で，上位 10%, 5%, 1% の受験生はそれぞれ何点を取っているか :
qnorm( c(0.9,0.95,0.99), 500,100)
(4) 正規分布の密度関数を描く．平均と標準偏差を変えて，形を比較する :
dnorm(x, mean=0, sd=1)
4
コンピュータによる統計分析
2014 年度美添泰人
３つの箱（Bertrand の問題）への解答
問題：箱 B1 , B2 , B3 があり，それぞれの中身は B1 : (G, G), B2 : (S, S), B3 : (G, S) とする．ただし，
G, S は，それぞれ金貨および銀貨を表す．いま，1 つの箱をでたらめに選んだとき，1 枚目が金貨
だったとすると，2 枚目も金貨である確率はいくらか．
解答：ベイズの定理を形式的に適用する．以下のような事前分布と，金貨が観測される確率を
想定することに対しては，ほとんどの人の同意を得られるであろう．
P {B1 } = P {B2 } = P {B3 } =
P {G | B1 } = 1,
P {G | B2 } = 0,
1
3
P {G | B3 } =
1
2
これから，事後確率は
P {B1 | G} =
P {G | B1 } P {B1 }
1 · (1/3)
2
=
=
P {G}
1 · (1/3) + 0 · (1/3) + (1/2) · (1/3) 3
と求められる．
相対度数の極限では解釈が困難であることを確認する．

2 項分布と応用 - 美添泰人のホームページ

アブストラクト

JaDocz.com