1 目次 第 1 章 離散型確率分布 4 1.1 1.2 1.3 確率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 1.5 共分散,相関係数 . . . . . . . . . . . . . . . . . . . . . . . . . 12 多変数の確率分布 . . . . . . . . . . . . . . . . . . . . . . . . . 期待値と分散 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 6 9 モーメント毋関数 . . . . . . . . . . . . . . . . . . . . . . . . . 13 第 2 章 連続型確率分布 2.1 19 密度関数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2 2.3 2.4 高次元の密度関数 . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.5 2.6 その他の連続型確率分布 . . . . . . . . . . . . . . . . . . . . . 35 Γ 関数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.7 B 関数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2 2.7.1 e−x の積分 . . . . . . . . . . . . . . . . . . . . . . . . 41 精密法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.8 期待値と分散 . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 モーメント毋関数 . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.8.1 2.8.2 2.9 ポアソン分布の精密法 . . . . . . . . . . . . . . . . . . 46 2 項分布の精密法 . . . . . . . . . . . . . . . . . . . . . 48 その他,統計に現れる確率分布 . . . . . . . . . . . . . . . . . 50 2.9.1 ガンマ分布,ベータ分布と他の確率分布の間の関係 . . 51 第 3 章 条件付き確率,条件付き期待値 3.1 52 条件付き確率 . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.1.1 離散型 . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.1.2 3.1.3 連続型 . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 離散型と連続型の場合 . . . . . . . . . . . . . . . . . . 59 3.2 3.1.4 条件付き確率の性質 . . . . . . . . . . . . . . . . . . . 60 3.1.5 最良推定値 . . . . . . . . . . . . . . . . . . . . . . . . 62 Bayes の話 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 3.3 3.4 Markov 連鎖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 極限定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.5 吸収壁ランダムウォーク . . . . . . . . . . . . . . . . . . . . . 68 2 3.6 反射壁ランダムウォーク . . . . . . . . . . . . . . . . . . . . . 70 3.7 3.6.1 エーレンフェストの壷 . . . . . . . . . . . . . . . . . . 70 ランダムウォーク . . . . . . . . . . . . . . . . . . . . . . . . . 74 第 4 章 極限定理 4.1 77 大数の法則 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 4.2 4.3 Weierstrass の多項式近似定理 . . . . . . . . . . . . . . . . . . 79 ポアソンの小数の法則 . . . . . . . . . . . . . . . . . . . . . . 80 4.4 4.5 L´evy の反転公式 . . . . . . . . . . . . . . . . . . . . . . . . . 81 中心極限定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 第 5 章 推定,検定 5.1 5.2 84 導入 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 用語 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 5.3 推定,検定 5.3.1 5.3.2 5.3.3 5.3.4 5.4 5.5 5.6 5.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 母集団 . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 必要なこと . . . . . . . . . . . . . . . . . . . . . . . . 87 推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 X ∑ 2 1 Xi . . . . . . . . . . . . . . . . . . . . . . . . . . 89 n 5.3.5 検定方程式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 5.4.1 5.4.2 5.4.3 最尤法 . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 5.4.4 5.4.5 平均の推定,検定 . . . . . . . . . . . . . . . . . . . . . 92 5.4.6 5.4.7 5.4.8 分散の推定,検定 . . . . . . . . . . . . . . . . . . . . . 93 推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 平均値の差の推定,検定 . . . . . . . . . . . . . . . . . 92 分散の比の検定 . . . . . . . . . . . . . . . . . . . . . . 93 精密法 . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 分散分析他 . . . . . . . 5.5.1 適合度検定 . . . 5.5.2 一元配置法 . . . 回帰分析 . . . . . . . . . 5.6.1 重回帰分析 . . . . . . . . . . . . . . . . . . . . . . . . 98 . . . . . . . . . . . . . . . . . . . . . 98 . . . . . . . . . . . . . . . . . . . . . 98 . . . . . . . . . . . . . . . . . . . . . 99 . . . . . . . . . . . . . . . . . . . . . 100 5.6.2 時系列解析 . . . . . . . . . . . . . . . . . . . . . . . . 101 シミュレーション . . . . . . . . . . . . . . . . . . . . . . . . . 102 5.7.1 逆関数法 . . . . . . . . . . . . . . . . . . . . . . . . . . 102 5.7.2 5.7.3 棄却法 . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 合成法 . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 3 第 6 章 その他 6.1 108 ジニ係数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4 第1章 1.1 離散型確率分布 確率分布 S を有限または可算集合とする.各 xi ∈ S に確率 pi を表にする. 値 x1 x2 ··· p1 p2 · · · ∑ pi ≥ 0 と i pi = 1 をみたすとする. 確率 これを確率分布とよぶ.とくに S が離散集合であるので,離散型確率分布 とよぶ. S は有限もしくは可算集合,確率分布は • pi ≥ 0 ∑ • i pi = 1 をみたす. 例 1 (等確率型) #S = n, pi = 1 n 例 2 (二項分布) B(n, p) とも表す (0 < p < 1),また q = 1 − p を表す. S = {0, 1, 2, . . . , n}, pi = n Ci pi q n−i 例 3 (幾何分布) Ge(p) とも表す (0 < p < 1),また q = 1 − p を表す. S = {0, 1, 2, . . .}, pi = pi q 例 4 (ポアソン分布) Po(λ) とも表す (λ > 0) S = {0, 1, 2, . . .}, pi = e−λ λr r! 例 5 (負の 2 項分布) NB(n, p) とも表す (0 < p < 1),また q = 1 − p を 表す. pk = n+k−1 Ck pn q k 始めて n 回目の失敗をするまでの成功の回数 k を表す.NB(1, p) は幾何分布 になる. 1.1. 確率分布 5 問題 1 負の 2 項分布は P (X = k) = ( ) −n k pn (−q)k と表すことができることを示し,さらに全体の確率が 1 に等しいことを示し てください. 解. n k n+k−1 Ck p q ここで (n + k − 1)! n k p q k!(n − 1)! (n + k − 1)(n + k − 2) · · · n n k = p q k! (−n)(−n − 1) · · · (−n − k + 1) = (−1)k pn q k k! ( ) −n n = p (−q)k k = ( ) ∞ ∑ −n k k=0 pn (−q)k = pn (1 − q)−n = 1 数学的に厳密な概念ではないが,R に値をとる変数 X を確率変数という. pi = P (X = xi ) により,事象 xi が起きる確率 pi を定めると,xi 全体の集合 S の上の確率分 布が定まる. 問題 2 X が次の式をみたすとき定数 C, D を求めてください. (1) P (X = k) = n Ck pk × C n−k , (0 ≤ k ≤ n) (2) P (X = k) = Cpq k + D, (k ≥ 0) (3) P (X = k) = C 問題 3 X −1 確率 1 6 0 λk , k! (k ≥ 0) 1 1 2 をみたすとき,空欄を埋め,2X − 1,X 2 ,tX ,etX の確率分布を求めてく ださい. 第 1 章 離散型確率分布 6 解. X −1 0 1 確率 1 6 1 3 1 2 2X − 1 −3 −1 1 確率 1 6 1 3 1 2 1 t 1 6 tX 確率 1 t etX 1 3 1 2 確率 X2 0 1 確率 1 3 2 3 1 et 1 6 1 et 1 3 1 2 多変数の確率分布 1.2 X\Y y1 y2 ··· 和 x1 x2 .. . p11 p21 .. . p12 p22 .. . ··· ··· .. . pX 1 pX 2 .. . 和 pY1 pY2 ··· 1 ここで pX i = P (X = xi ) = ∑ pij , pYj = P (Y = yj ) = j ∑ pij i これらにより,X と Y の確率分布が定まる.これを周辺分布という. X x1 x2 ··· 確率 pX 1 pX 2 ··· Y y1 y2 ··· 確率 pY1 pY2 ··· 問題 4 X, Y が確率分布 X\Y 0 1 2 和 0 1 2 和 1 24 1 6 1 3 1 12 1 8 7 24 5 24 にしたがうとき,まず穴を埋め,X + Y ,XY ,max{X, Y },min{X, Y } の確率分布を定めてください. 解. 1.2. 多変数の確率分布 7 X\Y 0 1 2 和 0 3 24 1 12 1 8 8 24 1 24 1 12 1 12 5 24 1 6 5 24 1 12 11 24 1 3 9 24 7 24 1 2 和 X +Y 0 1 2 3 4 XY 0 1 2 4 確率 3 24 3 24 9 24 7 24 2 24 確率 13 24 2 24 7 24 2 24 max{X, Y } 0 1 2 確率 3 24 5 24 16 24 min{X, Y } 0 1 2 確率 13 24 9 24 2 24 問題 5 0 < p1 , . . . , pn < 1,p1 + · · · + pn = 1 について,X1 , . . . , Xn の確率 分布が P (X1 = k1 , . . . , Xn = kn ) = n! pk1 · · · pknn k1 ! · · · kn ! 1 (k1 , . . . , kn ≥ 0, k1 +· · ·+kn = n) をみたすとき,多項分布という.これが確率分布になっていることを確かめ てください. 解. ∑ k1 ,...,kn : k1 +···+kn =n n! pk1 · · · pknn = (p1 + · · · + pn )n = 1 k1 ! · · · kn ! 1 Y pij = pX i × pj をすべての i, j についてみたすとき,X と Y は独立であるという.言い換え れば, P (X = xi , Y = yj ) = P (X = xi ) × P (Y = yj ) が成り立つとき独立である.2 つ以上の確率変数の場合にも, P (X = xi , Y = yj , Z = zk ) = P (X = xi ) × P (Y = yj ) × P (Z = zk ) などと積となるとき独立という.無限個の確率変数 X1 , X2 , . . . のときには, 任意の有限個を取り出すとき,それらが独立なとき,独立であるという. 問題 6 X と Y ,Y と Z ,Z と X はそれぞれ独立なのに X, Y, Z が独立でな い例を作ってください. 第 1 章 離散型確率分布 8 解. 1 , P (X = 1, Y = 0, Z = 0) = 9 1 P (X = 1, Y = 0, Z = 1) = , P (X = 0, Y = 1, Z = 0) = 9 1 P (X = 0, Y = 1, Z = 1) = , P (X = 0, Y = 0, Z = 1) = 9 1 P (X = Y = Z = 0) = 3 P (X = 1, Y = 1, Z = 0) = 1 , 9 1 , 9 1 , 9 (1) X と Y が以下の表をみたすとき空欄を埋め,さらに max{X, Y } の確率分布を求めてください. 問題 7 X\Y 0 0 1 1 24 1 和 1 6 1 8 和 (2) X と Y が独立なとき空欄を埋め,さらに X + Y の確率分布を求めて てください. X\Y 0 0 1 1 24 1 和 1 6 和 解. (1) X\Y 0 1 和 0 1 24 11 24 18 24 3 24 3 24 6 24 1 6 20 24 X\Y 0 1 和 0 1 24 5 24 6 24 3 24 15 24 18 24 4 24 20 24 1 和 (2) 1 和 max{X, Y } 0 1 確率 1 24 23 24 X +Y 0 1 2 確率 1 24 8 24 15 24 1.3. 期待値と分散 問題 8 9 (1) X1 , . . . , Xn が独立ならば,そのうちの任意の有限個の確率変数 も独立であることを示してください. (2) 任意の X1 , X2 , . . . , Xn が独立ならば,X1 , X2 , . . . も独立であることを 示してください. 解. (1) X1 , . . . , Xn−1 が独立なことを示せば,後はその繰り返しで示せる. (2) 上の主張より明らか 1.3 期待値と分散 確率変数 X の期待値 (平均) とは E(X) = ∑ xi p i i 問題 9 xi に確率 pi の錘りを置いたとき,回転モーメントが 0 に等しくなる 点が期待値であることを示してください. 期待値の性質 (1) E(X + Y ) = E(X) + E(Y ) (2) E(aX + b) = aE(X) + b (3) X と Y が独立ならば,E(XY ) = E(X) × E(Y ) 分散とは V (X) = E[(X − E(X))2 ] = ∑ (xi − E(X))2 pi i また,標準偏差とは σ(X) = √ V (X) 分散の性質 (1) V (aX + b) = a2 V (X) (2) V (X) = E(X 2 ) − (E(X))2 (3) X と Y が独立ならば,V (X + Y ) = V (X) + V (Y ) 第 1 章 離散型確率分布 10 問題 10 サイコロ 2 個 X, Y を投げるとき,合計の目に対応する確率変数 X + Y ,大きい方の目に対応する確率変数 max{X, Y }, min{X, Y } の期待値 と分散を求めてください. 解. E(X) = E(Y ) = 72 ,V (X) = V (Y ) = 35 12 で独立である. E(X + Y ) = E(X) + E(Y ) = 7 35 V (X + Y ) = V (X) + V (Y ) = 6 x について P (max{X, Y } ≤ x) = P (X ≤ x, Y ≤ x) = P (X ≤ x) × P (Y ≤ x) なので 1 36 1 9 1 4 4 9 25 36 1 P (max{X, Y } ≤ 1) = P (max{X, Y } ≤ 2) = P (max{X, Y } ≤ 3) = P (max{X, Y } ≤ 4) = P (max{X, Y } ≤ 5) = P (max{X, Y } ≤ 6) = max{X, Y } 1 2 3 4 5 6 確率 1 36 1 12 5 36 7 36 1 4 11 36 E(max{X, Y }) = V (max{X, Y }) = 161 36 2555 1296 x について P (min{X, Y } ≥ x) = P (X ≥ x, Y ≥ x) = P (X ≥ x) × P (Y ≥ x) なので P (min{X, Y } ≥ 1) = P (min{X, Y } ≥ 2) = P (min{X, Y } ≥ 3) = P (min{X, Y } ≥ 4) = P (min{X, Y } ≥ 5) = P (min{X, Y } ≥ 6) = 1 25 36 4 9 1 4 1 9 1 36 1.3. 期待値と分散 11 max{X, Y } 1 2 3 4 5 6 確率 11 36 1 4 7 36 5 36 1 12 1 36 ここで E(min{X, Y }) = 6 ∑ 6 ∑ kP (X = k) = k=1 P (X ≥ k) = k=1 91 36 と計算することもできる. E(min{X, Y }2 ) = 301 36 V (min{X, Y }) = 35 6 より 問題 11 10 種類のおまけが入っているお菓子がある.10 種類全部集めるの に必要な個数の期待値を求めてください.n 種類ならどうですか. 解. 1 種類目は 1 つ買えば必ず手に入る.2 種類目を得る確率は と 10 種類目を得る確率は 9 10 ,など 1 10 などの幾何分布になっているので,期待値は ( ) 10 10 1 1 1 1 1+ + ··· + = 10 + + ··· + + 9 1 1 2 9 10 n ならば ( n 1 1 1 + + ··· + 1 2 n γ + 0.57721 はオイラー定数 ( γ = lim n→∞ ) + n(log n + γ) n ∑ 1 − log n k ) k=1 問題 12 X − E(X) Y = √ V (X) とおくと,E(Y ) = 0 かつ V (Y ) = 1 問題 13 X1 , . . . , Xn は独立で,V (X1 ) = · · · = V (Xn ) = v ならば V( v X1 + · · · + Xn )= n n 第 1 章 離散型確率分布 12 1.4 共分散,相関係数 X と Y の共分散を Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))] で定義する.さらに Cov(X, Y ) ρ(X, Y ) = √ V (X)V (Y ) を相関係数という. ˆ = X−E(X) √ 問題 14 相関係数は X と Y を正規化した X , Yˆ = Y√−E(Y ) の共 V (X) V (Y ) ˆ Yˆ ) であることを確かめてください. 分散 ρ(X, Y ) = Cov(X, 問題 15 相関係数が次元によらないことを確かめてください. 解. ちょっと拡張して,a, c > 0 について ρ(aX + b, cY + d) = ρ(X, Y ) が容易に確かめられる. 問題 16 X と Y が独立ならば,Cov(X, Y ) = 0 をみたす.また,Cov(X, Y ) = 0 をみたしても,独立でない例を作ってください. 解. Cov(X, Y ) = E(XY ) − E(X)E(Y ) より,明らかである.また, −1 0 1 和 −1 0 0 0 1 0 1 9 7 9 1 9 和 1 9 1 9 5 9 1 9 7 9 X\Y 1 9 1 9 0 1 9 は独立ではないが,E(X) = E(Y ) = 0 かつ E(XY ) = 0 なので,Cov(X, Y ) = 0 1.5. モーメント毋関数 13 問題 17 |ρ(X, Y )| ≤ 1 であること,および ρ(X, Y ) = ±1 ならば,Y = aX +b をみたす a, b が存在することを示してください.また ρ(X, Y ) = 1 ⇒ a > 0. ρ(X, Y ) = −1 ⇒ a < 0 もみたす. 解. t ∈ R について, V (X + tY ) = V (X) + 2t Cov(X, Y ) + t2 V (Y ) t の 2 次式として常に非負であるので,その判別式 D/4 = (Cov(X, Y ))2 − V (X)V (Y ) ≤ 0 である.これより, (ρ(X, Y ))2 ≤ 1 が出る.また,ρ(X, Y ) = ∓1 ならば, √ t=± V (X) V (Y ) のときには,V (X + tY ) = 0 になる.すなわち √ V (X) X± Y = 定数 V (Y ) 1.5 モーメント毋関数 確率変数 X に対して, MX (t) = E[etX ] をモーメント毋関数という.他に,非負の整数値のみをとる確率変数につい ては PX (t) = E[tX ] を確率毋関数,モーメント毋関数は確率変数によっては収束する t に注意を 払わなければならないので ϕX (t) = E[eitX ] を特性関数という.数学的には特性関数がもっとも意味をもつ. 第 1 章 離散型確率分布 14 定理 1 ′ MX (0) = E(X), MX (0) = 1, ′′ MX (0) = E(X 2 ) 問題 18 X がそれぞれ 2 項分布 B(n, p),幾何分布 Ge(p),ポアソン分布 Po(λ), 負の 2 項分布 NB(n, p) の期待値と分散を計算してください.さらに,モーメ ント毋関数 E[etX ] を求めてください. 解. 幾何分布は直接計算すると大変でしょう. 期待値 分散 モーメント毋関数 B(n, p) Ge(p) np npq (et p + q)n p q p q2 Po(λ) λ λ q 1−et p t NB(n, p) np q np q2 exp[e λ − λ] ( )n q 1−et p 問題 19 X は非負の整数値をとる確率変数とする.このとき ∞ ∑ E(X) = P (X > k) k=0 をみたすことをチェックし,これを用いて,幾何分布 Ge(p) の期待値を求め てください. 解. ∞ ∑ P (X > k) = k=0 ∞ ∑ ∞ ∑ P (X = l) k=0 l=k+1 = = ∞ ∑ l−1 ∑ P (X = l) l=1 k=0 ∞ ∑ ∞ ∑ l=1 l=0 l P (X = l) = l P (X = l) = E(X) 幾何分布の場合 P (X > k) = ∞ ∑ pq l = pq k+1 l=k+1 したがって E(X) = ∞ ∑ k=0 q k+1 = q 1 = q k+1 1−q 1 q = 1−q p 1.5. モーメント毋関数 15 問題 20 X は値 0,1,2 の 3 つの値をとる確率変数で期待値が 76 ,分散が 17 36 の とき,X の確率分布を求めてください. 解. X の値 0 1 2 確率 1 6 1 2 1 3 問題 21 2 項分布 B(n, p),幾何分布 Ge(p),ポアソン分布 Po(λ) の期待値と 分散をモーメント毋関数を用いて計算してください. 解. 確率分布 M (t) M ′ (t) M ′′ (t) B(n, p) (et p + q)n npet (et p + q)n−1 npet (et np + q)(et p + q)n−2 Ge(p) Po(λ) p 1−et q t t exp[e λ − λ] e pq (1−et q)2 t t λe exp[λe − λ] et (1+et q)pq (1−et q)3 t λet (1 + λe ) exp[λet − λ] 定理 2 確率変数 X と Y が MX (t) = MY (t) をみたすならば,X と Y は同 分布である. 証明は L´evy の反転公式からしたがう. X, Y のモーメント毋関数は M(X,Y ) (t, s) = E[etX+sY ] 一般に X1 , . . . , Xn に対しては,t = (t1 , . . . , tn ) を用いて,X = (X1 , . . . , Xn ) MX (t) = E[etX ] により定義する.X1 , . . . , Xn が独立であることと MX (t) = n ∏ MXi (ti ) i=1 とは同値である. 問題 22 X1 , X2 , . . . を均等な硬貨投げとする. ¯ = X1 + · · · + Xn X n のモーメント毋関数を求めてください. 第 1 章 離散型確率分布 16 解. M1 (t) = E[etX1 ] = 1 + et 2 であるので, MX¯ (t) = = = = ¯ E[etX ] = E[e(tX1 +···+tXn )/n ] t t MX (( , . . . , )) n n n ∏ t MXi ( ) n i=1 ( )n 1 + et/n 2 この式をテイラー展開すると (1 + 右辺は,常に値 1 2 t + · · · )n → et/2 2n をとる確率変数 (といえるかな) に等しい.これは大数の法 則になっている. 問題 23 (2 項分布の再生性) X と Y がそれぞれ 2 項分布 B(n, p) と B(m, p) にしたがい,独立とする.このとき,X + Y は 2 項分布 B(n + m, p) にした がうことを示してください. 解. MX+Y (t) = E[et(X+Y ) ] = E[etX ] × E[etY ] = (et p + q)n (et p + q)m = (et p + q)n+m これを確率分布で求めるのはなかなか大変である. 問題 24 (Poisson 分布の再生性) X と Y がそれぞれポアソン分布 Po(λ) と Po(µ) にしたがい,独立とする.このとき,X + Y はポアソン分布 Po(λ + µ) にしたがうことを示してください. 解. MX+Y (t) = E[et(X+Y ) ] = E[etX ] × E[etY ] = exp[(et − 1)λ] × exp[(et − 1)µ] = exp[(et − 1)(λ + µ)] 1.5. モーメント毋関数 17 これは確率分布を用いても容易に示せる. k ∑ P (X + Y = k) = P (X = l) × P (Y = k − l) l=0 k ∑ = e−λ l=0 λk −µ µk−l e k! (k − l)! 1 ∑ l k−l k Cl λ µ k! k −(λ+µ) = e l=0 (λ + µ)k = e−(λ+µ) k! 問題 25 負の 2 項分布 NB(n, p) P (X = k) = n+k−1 Cn−1 pn q k は独立な幾何分布 Ge(p) にしたがう Y1 , . . . , Yn の和 X = Y1 + · · · + Yn の確 率分布であることを確かめてください. 解. 負の 2 項分布のモーメント毋関数は,負の 2 項展開を用いると MX (t) = E[etX ] = ∞ ∑ ekt n+k−1 Cn−1 pn q k k=0 = pn = pn = pn = pn = pn ∞ ∑ k=0 ∞ ∑ k=0 ∞ ∑ k=0 ∞ ∑ k=0 ∞ ∑ t k n+k−1 Cn−1 (e q) (n + k − 1)! t k (e q) k!(n − 1)! (n + k − 1) · · · n t k (e q) k! (−n)(−n − 1) · · · (−n − k + 1) (−et q)k k! t k −n Ck (−e q) k=0 = pn (1 − et q)−n 一方,幾何分布 Ge(p) のモーメント毋関数は MY (t) = E[etY ] = ∞ ∑ k=0 etk pq k = p 1 − et q 第 1 章 離散型確率分布 18 であるので,その積は MY1 +···+Yn (t) = pn (1 − et q)n またこのことから,幾何分布 Ge(p) は負の 2 項分布 NB(1, p) に等しいことが わかる. 問題 26 (負の 2 項分布の再生性) X, Y が独立で負の 2 項分布 NB(n, p), NB(m, p) にしたがうとき,X + Y は NB(n + m, p) にしたがうことを示してください. 解. ( MX (t) = p 1 − et q ( )n , MY (t) = p 1 − et q )m であるから ( MX+Y (t) = E[et(X+Y ) = E[etX ] × E[etY ] = p 1 − et q )n+m 19 第 2 章 連続型確率分布 2.1 密度関数 FX (x) = P (X ≤ x) を分布関数と言います. 分布関数の性質 (1) FX (x) は単調増加関数 (2) limx→−∞ FX (x) = 0, limx→∞ FX (x) = 1 離散型の場合には,分布関数は階段型 X の値 x1 x2 ··· X の確率 p1 p2 ··· ならば FX (x) = 0 p x < x1 x1 ≤ x < x2 1 p1 + p2 · · · x2 ≤ x < x2 ··· となります.それに対して,分布関数が微分可能な場合を連続型と言い, fX (x) = d FX (x) dx を密度関数と言います.したがって, ∫ a FX (a) = fX (x) dx −∞ をみたします.この場合, P (a < X ≤ b) = P (X ≤ b) − P (X ≤ a) = FX (a) − FX (b) であるので, ∫ P (a < X ≤ b) = b fX (x) dx a 第 2 章 連続型確率分布 20 をみたします.したがって, P (|X − a| < ε) → 0 となるので,1 点の確率は 0 になり,確率を確率分布表で与えることはでき ません. 密度関数の性質 (1) fX (x) ≥ 0 ∫∞ (2) −∞ fX (x) dx = 1 例 6 一様分布 U(a, b) f (x) = 1 b−a x ∈ (a, b) 例 7 指数分布 Exp(λ) f (x) = λe−λx x>0 例 8 正規分布 N(m, v) f (x) = √ 2 1 e−(x−m) /v 2πv 問題 27 X が正規分布 N (m, v) にしたがうとする.このとき,Y = X−m √ v は 標準正規分布にしたがうことを確かめてください. 解. 一般には √ ∫ P (Y ≤ y] = P (X ≤ y v + m) = において,s = x−m √ v √ y v+m −∞ √ 2 1 e−(x−m) /2v dx 2πv とおけばよい. MY (t) = E[etY ] = E[et(X−m)/ √ v √ ] = e−tm/sqrtv MX (t v) および MX (t) = emt+vt 2 /2 を用いてもよい. 問題 28 (1) 密度関数 1 |x − 2| 1 ≤ x ≤ 3 f (x) = 3 Cx2 −1 ≤ x < 1 をみたす C を求めてください. 2.1. 密度関数 21 (2) [0, π] の上の密度関数 C sin2 x とするとき,C を求めてください. 解. (1) 1, (2) 2 π 問題 29 連続型の確率変数 X について C − De−λx P (X ≤ x) = 0 x≥0 x<0 とするとき,C, D を定め,確率変数 X の密度関数を求めてください. 解. P [X < ∞] = 1 であることから,C = 1 でなければならない.または,連続型であるときより. lim P (X ≤ x) = 0 x↓0 を考えると,C = D をみたすことがわかる.x で微分することにより Dλe−λx x ≥ 0 fX (x) = 0 x<0 ∫∞ を得るが, 0 fX (x) dx = 1 より,D = 1 が出る. 問題 30 (対数正規分布) 正規分布 N(m, v) にしたがう確率変数 X について, eX の密度関数を求めてください. 解. a > 0 について FeX (a) = P (eX ≤ a) = P (X ≤ log a) ∫ log a 2 1 = √ e−(x−m) /2v dx 2πv −∞ したがって, feX (a) = √ 2 1 1 e−(log a−m) /2v a 2πv 第 2 章 連続型確率分布 22 問題 31 (自由度 1 の χ2 分布) 正規分布 N(0, 1) にしたがう確率変数 X に ついて,X 2 の密度関数を求めてください. 解. a > 0 について √ √ FX 2 (a) = P (X 2 ≤ a) = P (− a ≤ X ≤ a) √ ∫ a 2 1 = √ e−x /2 2π −√a 微分して fX 2 (a) = √ 1 e−a/2 2πa 2.2 高次元の密度関数 確率変数 X と Y の結合分布が ∫ P (a < X < b, c < Y < d) = f(X,Y ) (x, y) dxdy で与えられる.より,高次元の場合も考えられる.この場合,密度関数は高 次元の関数となる. (1) f(X,Y ) (x, y) ≥ 0 ∫ (2) f(X,Y ) (x, y) dxdy = 1 などとなる. 問題 32 D は [0, 1]2 の場合と (0, 0), (1, 0), (0, 1) を頂点とする三角形とする 場合に f (x, y) = Cx2 y をみたすとき,それぞれの C を求めてください. 解. D = [0, 1]2 のときには,C = 6,三角形のときには ∫ ∫ 1 0 であるから,C = 60 1−x x2 y dy = dx 0 1 60 2.2. 高次元の密度関数 23 問題 33 D は原点を中心とする半径 1 の円の第一象限にある 4 分円とする. f (x, y) = C √ x2 + y 2 とするとき C を求めてください. 解. dxdy = r drdθ より ∫ ∫ 1 π/2 r2 dθ = dr 0 より,C = 0 π 6 6 π X の密度関数を求めてみよう FX (a) = P (X < a) = P (X < a, −∞ < Y < ∞) ∫ a ∫ ∞ = dx f(X,Y ) (x, y) dxdy −∞ −∞ この式を a で微分すると X の密度関数 ∫ ∞ fX (a) = f(X,Y ) (a, y) dy −∞ を得る.同様に ∫ fY (b) = ∞ −∞ f(X,Y ) (x, b) dx 結合分布から周辺分布を導くことができる. X と Y が独立であるとは P (a < X < b, c < Y < d) = P (a < X < b) × P (c < Y < d) などと表されることを言う.3 つ以上の複数の確率変数の場合にも離散型と 同様に定義される.この場合,密度関数は ∫ ∫ b P (a < X < b, c < Y < d) = dx ∫ a d dyf(X,Y ) (x, y) c b P (a < X < b) × P (c < Y < d) = ∫ d fX (x) dx a fY (y) dy c がすべての a, b, c, d について成り立つのだから, f(X,Y ) (x, y) = fX (x) × fY (y) が成り立つ.離散型と同様に独立であれば,周辺分布から結合分布を導くこ とができる. 第 2 章 連続型確率分布 24 問題 34 D は [0, 1]2 のとき, f (x, y) = 6x2 y D が (0, 0), (1, 0), (0, 1) を頂点とする三角形とする場合に f (x, y) = 60x2 y をみたすとき,X と Y の密度関数を求めてください.X と Y は独立ですか. さらに P [X ≤ 21 ] を求めてください. 解. D = [0, 1]2 のときには ∫ fX (x) 1 6x2 y dy = 3x2 = 0 ∫ fY (y) 1 6x2 y dx = 2y = 0 この場合には独立で,P (X ≤ 1 2] = 1 8 三角形のときには ∫ 1−x 60x2 y dy = 30(x2 − 2x3 + x4 ) fX (x) = ∫ fY (y) 0 1−y 60x2 y dx = 20(1 − y)3 y = 0 独立ではない. P [X ≤ x] = 10x3 − 15x4 + 6x5 なので P (X ≤ 1 3, V (Y ) = 1 2] = 1 2 .この場合,E(X) = 1 2, V (X) = 2 63 1 28 ,E(Y ) = 問題 35 (X, Y ) の密度関数が f(X,Y ) で与えられているとき,X + Y の密度 関数を求めてください.とくに,X と Y が U(0, 1) にしたがい,独立なとき の密度関数を求めてください. 解. FX+Y (a) = P (X + Y < a) ∫ ∞ ∫ a−x = dx f(X,Y ) (x, y) dxdy −∞ −∞ したがって,a で微分すれば ∫ fX+Y (a) = ∞ −∞ f(X,Y ) (x, a − x) dx 2.2. 高次元の密度関数 25 とくに,X と Y が U(0, 1) にしたがい,独立なときには f(X,Y ) (x, y) = 1, 0 ≤ x, y ≤ 1 であるので,0 < a − x < 1 であることに注意すると ∫ a dx = a 0<a<1 fX+Y (a) = ∫01 dx = 2 − a 1 ≤ a < 2 a−1 問題 36 X, Y は U(0, 1) にしたがい独立なとき P (X 2 +Y 2 < a) と P (max{X, Y } < a),P (min{X, Y } < a) を求めてください. 解. f(X,Y ) (x, y) = 1 ((x, y) ∈ [0, 1]2 ) であるので, P (X 2 + Y 2 < a) = a2 π/4 P (max{X, Y } < a) = a2 P (min{X, Y } < a) = 1 − P (min{X, Y } ≥ a) = 1 − (1 − a)2 問題 37 X と Y がそれぞれ正規分布 N(m1 , v1 ) と N(m2 , v2 ) にしたがい独立 なとき,X + Y の確率分布を求めてください. 解. N(m1 + m2 , v1 + v2 ) 問題 38 X と Y が U(0, 1) にしたがい,独立なとき,Z = max{X, Y } の密 度関数を求めてください. 解. 0 < a < 1 について FZ (a) = P (max{X, Y } ≤ a) = P (X ≤ a, Y ≤ a) = P (X ≤ a) × P (Y ≤ a) = a2 したがって,密度関数 fZ (a) = 2a 第 2 章 連続型確率分布 26 問題 39 X,Y が独立で Exp(λ) にしたがうとき,Z = min{X, Y } の密度関 数を求めてください. 解. a > 0 について FZ (a) = P (min{X, Y } ≤ a) = 1 − P (min{X, Y } > a) = 1 − P (X > a, Y > a) = 1 − P (X > a) × P (Y > a) (∫ ∞ )2 = 1− λe−λx dx a ([ ]∞ )2 = 1 − −e−λx a = 1 − e−2λa したがって fZ (a) = 2λe−2λa と再び指数分布になるが,max{X, Y } は密度関数は 2λe−λa (1 − e−λa ) となり,指数分布にはならない. 問題 40 (順序統計量) X, Y, Z が U(0, 1) にしたがい独立なとき,順序を変 えて X (1) ≤ X (2) ≤ X (3) と表すとき,X (2) の密度関数を求めてください. 解. 0 < a < 1 について FX (2) (a) = P (X (2) ≤ a) = P (X, Y, Z ≤ a) + 3 C1 P (X > a, Y, Z ≤ a) = a3 + 3a2 (1 − a) したがって fZ (a) = 3a2 + 6a − 9a2 = 6a − 6a2 問題 41 (高次元の正規分布) k 次元のベクトル m と正定値 k × k 対称行列 V について,密度関数 √ 1 f (x) = ( 2π)k (det V )−1/2 exp[− t (x − m)V −1 (x − m)] 2 を高次元の正規分布という.これが密度関数であることを確かめてください. 2.3. 期待値と分散 27 解. V は対称行列なので,固有値はすべて実数である.また,正定値であ るとは,すべての固有値が正であることである.U −1 V U が対角行列になる ように選び,y = U −1 (x − m) とおくと, √ 1 f (x) = ( 2π)−k (det V )−1/2 exp[− t y(U −1 V U )−1 y] 2 √ λ1 , . . . , λk を固有値とし,zk = yk / λk とおくと ∫ √ ∫ 1 f (x) dx = ( 2π)−k (det V )−1/2 exp[− t y(U −1 V U )−1 y] dy 2 ∫ √ 1t −k = ( 2π) exp[− zz] dz 2 ∫ k ∏ √ 2 = ( 2π)−1 e−zi /2 dzi = 1 i=1 V は分散共分散行列である. ∫ ∫ √ 1 xt xf (x) dx = U y t yU −1 ( 2π)−k (det V )−1/2 exp[− t y(U −1 V U )−1 y] dy 2 √ λ1 z1 ∫ √ . √ 1 2 2 −1 . = U . ( λ1 z1 , . . . , λk zk ) exp[− 2 (z1 + · · · + zk )] dzU √ λk zk λ1 0 · · · 0 0 λ2 · · · 0 = U .. .. .. .. U . . . . 0 0 ··· λk = V 2.3 期待値と分散 密度関数 fX (x) をもつ確率分布にしたがう確率変数 X の期待値は ∫ E(X) = xfX (x) dx 分散は ∫ V (X) = E[(X − E(X))2 ] = (x − E(X))2 fX (x) dx 第 2 章 連続型確率分布 28 問題 42 X を (−∞, ∞) に値をとる確率変数で Aex+1 x < −1 fX (x) = Bx2 −1 ≤ x < 0 Ce−x x ≥ 0, が E(X) = −1,V (X) = 3 とするとき,A,B ,C を求めてください. 解. A = 23 , B = 0, C = 1 3 問題 43 密度関数 1 γ π (x − x0 )2 + γ 2 f (x) = をもつ確率分布をコーシー分布という.この分布が期待値をもたないことを 示してください. 解. まず,密度関数であることを示そう.(x − x0 )/γ = y とおく. ∫ ∞ ∫ ∞ 1 γ 1 1 dx = dx 2 2 πγ −∞ 1 + ((x − x0 )/γ)2 −∞ π (x − x0 ) + γ ∫ ∞ 1 1 = dy π −∞ 1 + y 2 π/2 = [arctan y]−π/2 = 1 一方,x ∈ [n − 1, n) では n−1 n−1 1 1 x ≥ 2 ≥ = −2 1 + x2 n +1 (n + 1)2 n+1 (n + 1)2 この和は発散することから ∫ ∞ 0 x dx 1 + x2 は発散する.したがって,期待値は存在しない. 離散型と同様に 期待値の性質 (1) E(X + Y ) = E(X) + E(Y ) (2) E(aX + b) = aE(X) + b (3) X と Y が独立ならば,E(XY ) = E(X) × E(Y ) 2.3. 期待値と分散 29 分散の性質 (1) V (aX + b) = a2 V (X) (2) V (X) = E(X 2 ) − (E(X))2 (3) X と Y が独立ならば,V (X + Y ) = V (X) + V (Y ) 問題 44 Y = ϕ(X) とするとき, ∫ E(Y ) = ϕ(x)fX (x) dx を ϕ(x) = ax + b,ϕ(x) = x2 ,ϕ(x) = etx のときにみたすことを示してくだ さい. 解. P (Y ≤ y) = P (ϕ(X) ≤ y) = P (X ∈ ϕ−1 (−∞, y)) ここで符号に注意すれば fY (y) = d P (Y ≤ y) = dt これより ∑ fX (x)|ϕ′ (x)|−1 x : ϕ(x)=y ∫ E(Y ) = y fY (y) dy ∫ = ∑ y x : ϕ(x)=y) ∫ = fX (x)|ϕ′ (x)|−1 dy ϕ(x)fX (x) dx とくに ϕ(x) = ax + b ならば P (X ≤ P (Y ≤ y) = P (aX + b ≤ y) = P (X ≥ y−b a ) y−b a ) a>0 a<0 符号に注意して f ( y−b ) 1 X a a fY (y) = −f ( y−b ) 1 X a a a>0 a<0 これより,a < 0 のときには,変数変換 x = になることに注意すれば = fX ( y−b a y − b 1 ) a a により,積分範囲が (+∞, −∞) ∫ E(Y ) = yfY (y) dy ∫ = ∫ = y − b 1 ) dy yfX ( a a (ax + b)fX (x) dx 第 2 章 連続型確率分布 30 同様に,ϕ(x) = x2 のときには P (−√x ≤ X ≤ √x) x ≥ 0 2 P (Y ≤ y) = P (X ≤ x) 0 x<0 により fY (y) = これより E(Y ) fX (√y) 1 √ 2 y √ 1 + fX (− y) 2√ y 0 y≥0 y<0 ∫ = yfY (y) dy ∫ ∞ 1 √ √ y(fX ( y) + fX (− y)) √ dy 2 y 0 ∫ ∞ ∫ ∞ 1 1 √ = yfX (sqrty) √ dy + yfX (− y) √ dy 2 y 2 y 0 0 ∫ ∞ ∫ −∞ = x2 fX (x) dx + x2 fX (x) (−dx) 0 ∫0 2 = x fX (x) dx = ϕ(x) = etX のときには,y ≥ 0 について P (X ≤ P (Y ≤ y) = P (X ≥ より 1 t log y) t>0 1 t log y) t<0 f ( 1 log y) 1 X t ty fY (y) = −f ( 1 log y) 1 X t これより,t > 0 ならば ty t>0 t<0 ∫ E(Y ) = yfY (y) dy ∫ ∞ = ∫0 = 1 1 yfX ( log y) dy t ty etx fX (x) dx t < 0 でも同様に計算できる. 一般に Y = ϕ(X) は ϕ が C 1 級ならば ∫ E(Y ) = が成立する. ϕ(x)fX (x) dx 2.3. 期待値と分散 31 問題 45 確率変数 X1 , . . . , Xn に対して V (X1 ) Cov(X1 , X2 ) Cov(X2 , X1 ) Σ= .. . ··· V (X2 ) ··· .. .. . . Cov(Xn , X2 ) · · · Cov(Xn , X1 ) Cov(X1 , Xn ) Cov(X2 , Xn ) .. . V (Xn ) を分散共分散行列という.この行列が対称行列であること,固有値がすべて 非負であることを示してください. 解. 対称行列であることは Cov(X, Y ) = Cov(Y, X) より明らか.2 次形式 a1 . . (a1 , . . . , an )Σ . an が,確率変数 a1 X1 + · · · + an Xn の分散 V( n ∑ ai Xi ) = i=1 n ∑ E[( ai (Xi − E(Xi ))2 ] i=1 = n ∑ n ∑ i=1 j=1 ai aj E[(Xi − E(Xi )(Xj − E(Xj )] a1 . . = (a1 , . . . , an )Σ . an になっていることから非負定値であることがでる. 問題 46 E[|X − a|] および E[(X − a)2 ] を最小にする a を求めてください. 解. メディアンと期待値である. ∫ d d E(|X − a|) = |X − a| dP da da (∫ ) ∫ d = (X − a) dP + + (a − X) dP da X>a X≤a ∫ ∫ = − dP + dP X>a X≤a = −P (X > a) + P (X ≤ a) = 2P (X ≤ a) − 1 したがって,最小になるのは P (X ≤ a) = 1 2 となる場合である. 第 2 章 連続型確率分布 32 ∫ E[(X − a)2 ] = ∫ = ∫ (X − a)2 dP [(X − E(X)) + (E(X) − a)]2 dP (X − E(X))2 dP + (E(X) − a)2 = より,a = E(X) のときである. 2.4 モーメント毋関数 ∫ tX M (t) = E[e ]= etx fX (x) dx をモーメント毋関数という.これは密度関数の Laplace 変換であり,特性関 数は密度関数の Fourier 変換であることがわかる.離散型と同様に M (0) = 1, M ′ (0) = E(X), M ′′ (0) = E(X 2 ) 定理 3 確率変数 X と Y が MX (t) = MY (t) をみたすならば,X と Y は同 分布である. 特性関数の一意性 (L´evy の反転公式) からこの証明ができる. 問題 47 正規分布 N(m, v),指数分布 Exp(λ) のモーメント毋関数を求めて, 期待値と分散を計算してください. 解. N(m, v) Exp(λ) M (t) 期待値 分散 mt+vt2 /2 m v λ λ−t 1 λ 1 λ2 e 離散型と同様に,X1 , . . . , Xn に対しては,t = (t1 , . . . , tn ) を用いて,X = (X1 , . . . , Xn ) MX (t) = E[etX ] により定義する.X1 , . . . , Xn が独立であることと MX (t) = n ∏ i=1 とは同値である. MXi (ti ) 2.4. モーメント毋関数 33 問題 48 X1 , X2 , . . . を値 ±1 を確率 12 ずつでとる独立な確率変数とする.こ ¯ = X1 + · · · + Xn について, √X¯ の特性関数を求めてください. のとき,X n 解. M1 (t) = E[etX1 ] = e−t + et 2 なので MX/ ¯ √n (t) ¯ = E[etX/n ] t = MX ( √ ) n n ∏ t = MXi ( √ ) n i=1 ( √ √ )n e−t/ n + et/ n = 2 この式をテイラー展開すると (1 + 2 t2 + · · · )n → et n を得る.右辺は N(0, 2) のモーメント毋関数である.これは中心極限定理に 対応している.ここで,E(Xi ) = 0 かつ V (Xi ) = 2 であることに注意する こと. 問題 49 2 項分布 B(n, p) にしたがう確率変数 X において, X n および のモーメント毋関数を求め,その n → ∞ の極限を求めてください. 解. MX (t) = (et p + q)n であるから MX/n (t) = E[etX/n ] = (ent/n p + q)n t = ((1 + + · · · )p + q)n n pt = (1 + + · · · )n → ept n X−np √ npq 第 2 章 連続型確率分布 34 すなわち,X → p を示している. M(X−np)/√npq (t) √ = E[et(X−np)/ npq ] √ t = MX ( √ )e−tnp/ npq npq √ √ p + q)n e−tnp/ npq t2 pt p2 t2 t + + · · · )p + q)(1 − √ + + · · · ))n = (((1 + √ npq 2npq npq 2npq = (et/ npq p2 t2 pt2 p2 + − + · · · )2 2npq npq npq 2 t2 n = (1 + ) → et /2 2n √ すなわち (X − np)/ npq → N (0, 1) を示している. = (1 + 問題 50 (正規分布の再生性) X と Y がそれぞれ正規分布 N (m, v) と N (m′ , v ′ ) にしたがい,独立なとき,X + Y は N (m + m′ , v + v ′ ) にしたがう. 解. = E[et(X+Y ) ] = E[etX ] × E[etY ] vt2 v′ t = exp[mt + | × exp[m′ t + ] 2 2 ′ 2 (v + v )t = exp[(m + m′ )t + ] 2 これは,畳み込みでも証明できる.(x − m) + (y − m′ ) = s,y − m′ = t と おくとヤコビアンが 1 に等しいことを用いる. ∫ ∞ ∫ z−x 2 ′ ′ 1 √ P (X + Y ≤ z) = dx dy e−(x−m) /2v × e−(y−m )/2v ′ 2π vv −∞ −∞ ∫ z−(m+m′ ) ∫ ∞ 2 2 ′ 1 √ = ds dt e−(s−t) /2v−t /2v ′ 2π vv −∞ −∞ ∫ z−(m+m′ ) ∫ ∞ v + v′ 1 v′ s 2 vv ′ s2 √ ds dt exp[− = (t − ) − ] 2vv ′ v + v′ (v + v ′ )2 2π vv ′ −∞ −∞ √ ∫ z−(m+m′ ) 1 s2 vv ′ √ ] × 2π ds = exp[− ′ 2(v + v ) v + v′ 2π vv ′ −∞ ∫ z−(m+m′ ) 1 s2 = √ exp[− ] ds 2(v + v ′ ) 2π(v + v ′ ) −∞ ∫ z 1 (s − (m + m′ ))2 = √ exp[− ] ds 2(v + v ′ ) 2π(v + v ′ ) −∞ MX+Y (t) 2.5. その他の連続型確率分布 2.5 35 その他の連続型確率分布 (1) X1 , . . . , Xn を独立で標準正規分布にしたがうとする.このとき X12 + · · · + Xn2 の確率分布を自由度 n − 1 の χ2 分布という. (2) X は標準正規分布にしたがい,Y が自由度 n の χ2 分布にしたがうと き, √X の確率分布を自由度 n の t 分布という. Y /n (3) X, Y をそれぞれ自由度 m, n の χ2 分布にしたがい,独立とする.この とき X/m Y /n の確率分布を自由度 (m, n) の F 分布という. それぞれの密度関数は 1 xn/2−1 e−x/2 (自由度 n の χ2 分布) 2n/2 Γ(n/2) ( )−(n+1)/2 x2 1 √ 1+ (自由度 n の t 分布) n nB(n/2, 1/2) ( m )m/2 ( 2 mx )−(m+n)/2 xm/n−1 1 + (自由度 (m, n) の F 分布) B(m/2, n/2) n n 問題 51 自由度 n の χ2 分布のモーメント毋関数は MX (t) = (1 − 2t)−n/2 に等しいことを示してください. 解. x(1/2 − t) = y とおくと MX (t) = = = = = E[etX ] = ∫ ∞ ∫ ∞ 0 etx 1 xn/2−1 e−x/2 dx 2n/2 Γ(n/2) 1 xn/2−1 e−x(1/2−t) dx n/2 Γ(n/2) 2 0 )n/2−1 ∫ ∞( y 1 dy e−y n/2 1/2 − t 1/2 − t 2 Γ(n/2) 0 ∫ ∞ 1 y n/2−1 e−y dy (1/2 − t)−n/2 2n/2 Γ(n/2) 0 (1 − 2t)−n/2 第 2 章 連続型確率分布 36 定理 4 (コクランの定理) X1 , . . . , Xn は標準正規分布 N (0, 1) にしたがい, 独立とする.Y1 , . . . , Yk はそれぞれランク n1 , . . . , nk の 2 次形式 X1 . . Yi = (X1 , . . . , Xn )Ai . Xk で表され, X12 + · · · + Xn2 = Y12 + · · · + Yk2 をみたすとする.このとき,Y1 , . . . , Yk が自由度 n1 , . . . , nk の独立な χ2 分布 にしたがう必要十分条件は n1 + · · · + nk = n である. 証明. 自由度 n の χ2 分布のモーメント毋関数は (1 − 2t)−n/2 であるの で,独立な自由度 n1 , . . . , nk な χ2 分布にしたがう Y1 , . . . , Yk に対して MY1 +···+Yk (t) = k ∏ (1 − 2t)−ni /2 = (1 − 2t)−(n1 +···+nk )/2 i=1 と自由度 n1 + · · · + nk の χ2 分布のモーメント毋関数に等しくなる.X12 + · · · + Xn2 = Y12 + · · · + Yk2 より, n = n1 + · · · + nk をみたす.逆に X1 . . X= . , Xn Y1 . . Y = . Yk と表すことにすると Yi = t XAi X とすると,n = n1 + · · · + nk より,ユニタリ行列 U1 0 · · · 0 0 0 U2 · · · U = . .. .. .. . .. . . 0 が存在して ··· ··· A1 0 U −1 .. . 0 A2 .. . ··· ··· .. . 0 0 .. . 0 ··· ··· Ak Uk U = B 2.5. その他の連続型確率分布 37 を対角行列 B にできる.一方 t YY A1 0 = tX .. . 0 = t 0 A2 .. . ··· ··· ··· .. . ··· 0 0 .. X . Ak XU BU −1 X また,仮定より t Y Y = t XX より,U BU −1 = E ,すなわち B = U −1 EU は単位行列 E でなくてはならない.そこで, U −1 X = Z とおくと t Y Y = t ZZ と表せる.Z1 , . . . , Zn の確率分布が標準正規分布にしたがい,独立であるこ とを示せば良い.t = t (t1 , . . . , tn ) と s = U t = t (s1 , . . . , sn ) とおくと M(Z1 ,...,Zn ) (t) = E[et1 Z1 ···+tn Zn ] = E[e(t,Z ) ] = E[e(U t,U Z ) ] = E[e(U t,X ) ] = = n ∏ i=1 n ∏ E[esi Xi ] exp[s2i /2] i=1 = exp[(s, s)/2] = exp[(U −1 s, U −1 s)/2] = exp[(t, t)/2] = et1 /2+···+tn /2 2 2 は n 個の独立な標準正規分布のモーメント毋関数である.これで,Z1 , . . . , Zn は独立で標準正規分布にしたがうことが示せた. X1 , . . . , Xn を独立で標準正規分布にしたがうとする.このとき ¯ X = 2 SX = 2 SˆX = X1 + · · · + Xn n n ∑ 1 ¯ 2 (Xi − X) n i=1 1 ∑ ¯ 2 (Xi − X) n − 1 i=1 n 第 2 章 連続型確率分布 38 と表す. ¯ 2, コクランの定理より n(X) ∑n i=1 (Xi ¯ 2 は独立でそれぞれ自由度 1 と − X) n − 1 の χ2 分布にしたがう. 1/n · · · . .. . A= . . 1/n · · · 1/n .. . , 1/n 1 − 1/n −1/n B= .. . −1/n −1/n ··· 1 − 1/n · · · .. .. . . −1/n · · · −1/n −1/n .. . 1 − 1/n これより √ ¯ ¯ ¯ nX X X √∑ =√ =√ 2 ¯ SX /(n − 1) 2 /n (Xi − X)/(n − 1) SˆX は自由度 n − 1 の t 分布にしたがう. • Γ 分布:Γ(p, a) ap p−1 −ax x e Γ(p) ( )p a 平均 ap ,分散 ap2 ,モーメント毋関数 a−t f (x) = 再生性 Γ(p, a) + Γ(q, a) = Γ(p + q, a) – 指数分布 Exp(λ) は Γ(1, λ) – 自由度 n の χ2 分布は γ( n2 , 12 ) • β 分布: β(a, b) f (x) = 平均 1 xp−1 (1 − x)b−1 , B(a, b) (0 < x < 1) a ab a+b ,分散 (a+b)2 (a+b+1) 問題 52 U1 , . . . , Un を独立で一様分布 U(0, 1) にしたがう確率変数とする.そ の順序統計量を U (1) ≤ U (2) ≤ · · · ≤ U (n) と並べ直すと U (k) の確率分布は β(k, n − k − 1) であることを示してください. 解. 帰納法で確かめる. P (U (n ≤ x) = P (U1 ≤ x, . . . , Un ≤ x) = xn したがって, B(n, 1) = 1 Γ(n)Γ(1) = Γ(n + 1) n に注意すると,密度関数は fU (n) (x) = nxn−1 = 1 × n−1 C1 xn−1 (1 − x)1−1 B(n, 1) 2.6. Γ 関数 39 また 1 Γ(n + 1) n! = = B(k, n − k + 1) Γ(k)Γ(n − k + 1) (k − 1)!(n − k)! に注意する.そこで k + 1 まで成立したとすると P (U (k) ≤ x) = = P (U (k+1) ≤ x) + n Ck P (U1 , . . . , Uk ≤ x, Uk+1 , . . . , Un > x) ∫ x n! n! tk (1 − t)n−k−1 dt + xk (1 − x)n−k k!(n − k)! 0 k!(n − k − 1)! これを x で微分すると,U (k) の密度関数は n! n! xk (1 − x)n−k−1 + kxk−1 (1 − x)n−k k!(n − k − 1)! k!(n − k)! n! − xk (n − k)(1 − x)n−k−1 k!(n − k)! n! = xk−1 (1 − x)n−k−1 ((n − k)x + k(1 − x) − (n − k)x) k!(n − k)! n! = xk−1 (1 − x)n−k−1 (k − 1)!(n − k)! 1 = xk−1 (1 − x)n−k−1 B(k, n − k + 1) 2.6 Γ 関数 ∫ ∞ Γ(x) = tx−1 e−t dt (x > 0) 0 広義積分 • t = ∞ のところ,tx−1 ≤ et/2 が十分大きな t で成り立つので tx−1 e−t ≤ e−t/2 for suffciently large t • 0 < x < 1 のときの t = 0 tx−1 e−t ≤ tx−1 これと ∫ [ 1 t 0 x−1 1 x dt = t x により,広義積分可能が出る. ]1 = 0 1 x 第 2 章 連続型確率分布 40 (1) Γ(1) = 1 (2) x > 1 について Γ(x) = (x − 1)Γ(x − 1) 後者は部分積分 ∫ Γ(x) ∞ tx−1 e−t dt = 0 [ ]∞ = tx−1 (−e−t ) 0 − ∫ ∞ (x − 1)tx−2 (−e−t ) dt 0 = (x − 1)Γ(x − 1) 例9 (1) 帰納法により Γ(n) = (n − 1)! (2) ( ) √ 1 = π Γ 2 なぜなら ( ) 1 Γ 2 ∫ ∞ = 0 ∫ = 2 ∫ = t−1/2 e−t dt ∞ 0 ∞ e−x dt 2 e−x dx = 2 (t = x2 , dt = 2xdx = 2t1/2 dx) √ π −∞ 2.7 B 関数 ∫ 1 xp−1 (1 − x)q−1 dx B(p, q) = (p, q > 0) 0 広義積分 • 0 < p < 1 で x = 0,0 < q < 1 のときは 0 < x < 12 とすると xp−1 q≥1 xp−1 (1 − x)q−1 ≤ xp−1 ( 1 )q−1 0 < q < 1 2 そこで ∫ 1 xp−1 dx = 0 で広義積分可能になる. • 0<q <1でx=1 1 p1 1 [x ]0 = p p 2.7. B 関数 2.7.1 41 e−x の積分 2 補題 1 ∫ ∞ e−x dx = 2 0 証明. √ π 2 この証明は,重積分の極座標変換によるもの,ベータ関数を使う ものがある.極座標変換によるもの,まず,e−(x 積分と累次積分が一致することから, (∫ ∫ √ −(x +y ) e 2 2 x2 +y 2 ≤N N )2 −x dxdy ≤ 2 e 2 dx 0 +y 2 ) は連続関数なので,重 ∫ ≤ √ √ x2 +y 2 ≤ 2N e−(x 2 +y 2 ) dxdy ここで,x = r cos θ, y = r sin θ とおく変数変換のヤコビ行列は ) ( ) ( ∂x ∂x cos θ −r sin θ ∂r ∂θ = ∂y ∂y sin θ r cos θ ∂r ∂θ なので,ヤコビアンはその行列式の r であることを用いると ∫ ∫ π/2 ∫ N 2 rdr −(x2 +y 2 ) e dxdy = dθ e−r √ 2 2 2 x +y ≤N 0 0 ∫ N2 π = e−t dt (t = r2 , dt = 2rdr) 2 0 2 π = (1 − e−N ) 4 ∫ 2 2 により e−(x +y ) dxdy は第一象限で広義積分可能で,その値は π4 である. これより,補題の証明が終わる. 定理 5 (微分と積分の交換) f が [a, b] × [c, d] で C 1 級とする.このとき, ∫ b ∫ b d ∂f f (x, y) dx = (x, y) dx dy a a ∂y 証明. ∫ G(y) f (x, y) dx ∫ g(y) b = a b = a とおく.Fubini の定理より ∫ d g(y) dy ∫ b ∂f f (x, y) dx ∂y ∫ d = c a ∫ c ∂f (x, y) dydx ∂y b (f (x, d) − f (x, c)) dx = a = G(d) − G(c) 第 2 章 連続型確率分布 42 d → c ととれば,微積分の基本定理より G′ (c) = g(c). この応用として 補題 2 ∫ ∞ √ π 2 e−x dx = 2 0 の別証明: 証明. (∫ t f (t) = ∫ e−x dx 2 0 1 e−(1+x g(t) = 2 )2 )t2 0 dx 1 + x2 とおくと,微分と積分の交換より ∫ t 2 2 f ′ (t) = 2 e−x dx × e−t 0 1 ∫ g ′ (t) (−2t(1 + x2 ))e−(1+x = 0 ∫ 1 = −2 te−(1+x 2 )t2 2 )t2 dx 1 + x2 dx 0 t ̸= 0 で,u = tx とおくと ∫ ′ t g (t) = −2 e−t 2 −u2 du = −f ′ (t) 0 したがって, f (t) + g(t) は定数である.一方, ∫ 1 f (0) + g(0) = 0 + 0 dx π = 2 1+x 4 ここで e−(1+x なので, ∫ g(t) ≤ 1 2 )t2 2 1 ≤ e−t 1 + x2 e−t dx = e−t → 0 (t → ∞) 2 2 0 これより, lim f (t) = t→∞ π 4 2.7. B 関数 43 補題 3 B(p, q) = Γ(p)Γ(q) Γ(p + q) 証明. 連続関数なので,累次積分を重積分に置き換えて ∫ N∫ N Γ(p)Γ(q) = lim e−x−y xp−1 y q−1 dxdy N →∞ c↓0 c ∫ = e−x−y xp−1 y q−1 dxdy lim D c D x (u = x + y, v = と変数変換して) x+y ) ∫ M( ∫ b −u p−1 q−1 = lim lim e (uv) (u − uv) u dv du M →∞ ∫ = = a↓0 b↑1 0 lim M →∞ M a e−u up+q−1 du lim a↓0 b↑1 0 ∫ b v p−1 (1 − v)q−1 dv a Γ(p + q) × B(p, q) ここで,x = uv ,y = u − uv に注意して,ヤコビ行列は ) ( ) ( ∂u ∂x v u ∂u ∂v = ∂y ∂v 1 − v −u ∂u ∂v なので,その行列式は −u,したがって,ヤコビアンは u であることを用いた. ( ) (1) B 12 , 12 = π ( ) √ (2) Γ 21 = π 補題 4 証明. 後者は, ( ( ))2 ( ( ))2 (1 1) Γ 12 1 π=B , = = Γ 2 2 Γ(1) 2 より出る.まず, B その 1. √ 1−x x B (1 1) ∫ 1 dx √ , = 2 2 x(1 − x) 0 −2t なので,dx = (1+t 2 )2 dt.したがって, √ ∫ 0√ 1 + t2 −2t dt 1 + t2 t (1 + t2 )2 ∞ ∫ ∞ dt 2 1 + t2 [0 ]∞ 2 arctan t =π = t とおくと,x = (1 1) , = 2 2 = = 1 1+t2 0 第 2 章 連続型確率分布 44 その 2. B ∫ 1 (1 1) dx √ , = 2 2 1/4 − (1/2 − x)2 0 ∫ 1 1 dt 1 √ = (t = − x) 2 2 1/4 − t /4 2 −1 ∫ 1 dt √ = 1 − t2 −1 [ ]1 π π = arcsin t = − (− ) = π 2 2 −1 最後の行は [ ]1 = − arccos t = −(0 − π) = π −1 としてもよい. 問題 53 ∫ π/2 sinm x cosn x dx = 0 1 (m + 1 n + 1) B , 2 2 2 を示してください. 証明. ∫ ∫ π/2 sinm x cosn x dx 1 = 0 0 dt tm/2 (1 − t)n/2 √ 2 t(1 − t) (sin2 x = t) ∫ 1 1 (m−1)/2 t (1 − t)(n−1)/2 dt 2 0 1 (m + 1 n + 1) B , 2 2 2 = = 問題 54 半径 1 の n 次元球の体積を求めてください. 証明. ∫ 2 In (x ) = ∫ √1−x2 −x21 √ 1−x2 √ − 1−x2 dx1 − √ 1−x2 −x21 ··· ∫ √1−x2 −···−x2n−1 − √ 1−x2 −···−x2n−1 とおくと,In (0) が n 次元球の体積になる.とくに ∫ 2 I1 (x ) = √ 1−x2 √ − 1−x2 √ dx1 = 2 1 − x2 dxn 2.8. 精密法 45 帰納法の仮定 In (x) = cn (1 − x2 )n/2 とおくと,上から c1 = 2.一方, ∫ √1−x2 2 In (x ) = In−1 (x2 + x21 ) dx1 √ − 1−x2 ∫ √ = cn−1 1−x2 (1 √ − 1−x2 ∫ π/2 = cn−1 −π/2 − x2 − x21 )(n−1)/2 dx1 (1 − x2 )(n−1)/2 (1 − sin2 θ)(n−1)/2 ∫ = cn−1 (1 − x2 )n/2 √ 1 − x2 cos θ dθ (x1 = π/2 cosn θ dθ −π/2 = cn−1 (1 − x2 )n/2 B (1 n + 1) , 2 2 これより cn (1 n + 1) , 2 2 (1 n) (1 n + 1) cn−2 B , B , 2 2 2 2 ··· (1 n + 1) (1 3) (1 4) B , ···B , c1 B , 2 2 2 2 2 2 Γ(1/2)Γ(3/2) Γ(1/2)Γ(4/2) Γ(1/2)Γ((n + 1)/2) 2 ··· Γ(4/2) Γ(5/2) Γ((n + 2)/2) Γ(3/2) 2π (n−1)/2 Γ((n + 2)/2) 1 π n/2 Γ((n + 2)/2) = cn−1 B = = = = = = 2.8 精密法 P (B(n, p) ≥ k) = P (B(n, p) ≥ k) = P (β(k, n − k + 1) ≤ p) k ≤ p) P( k + (n − k − 1)Fn−k+1,k 参考 Γ(m, a) = β(m, n) Γ(m + n, a) √ 1 − x2 sin θ) 第 2 章 連続型確率分布 46 と Γ 分布の再生性 Γ(m, a) + Γ(n, a) = Γ(m + n, a) を a = 1 2 で用いて,Γ 分 2 布と χ 分布の関係を用いると β(m, n) = 1 1 + (m/n)Fm,n を用いている. 2.8.1 ポアソン分布の精密法 まず,ポアソン過程 Nt を定義しよう. k (1) t > 0 について,P (Nt = k) = e−λt (λt) k! ,つまり,Nt は Po(λt) にした がう.つまり,平均 λt のポアソン分布にしたがう. (2) 0 < t1 < t2 < · · · のとき,Nt1 , Nt2 − Nt1 , Nt3 − Nt2 , . . . は独立 (3) t > s として,Nt − Ns は Nt−s と同分布,つまり Po(λ(t − s)) にした がう. Tk で t < Tk で Nt = k − 1,t > Tk で Nt = k となる時刻とする. P (T1 ≤ t) = P (Nt ≥ 1) = ∑ e−λt k=1 (λt)k k! −λt = 1−e より T1 は平均 1 λ の指数分布にしたがう.同様に ∫ ∞ P (T2 − T1 ≤ t) = P (Nt+s ≥ 2, T1 ∈ ds) 0 ∫ ∞ = P (Nt+s − Ns ≥ 1, Ns+ds ≥ 1, Ns = 0) ∫0 ∞ = P (Nt+s − Ns ≥ 1)P (Ns+ds ≥ 1, Ns = 0) ∫0 ∞ = P (Nt+s − Ns ≥ 1)e−λs ds 0 ∫ ∞ = P (Nt ≥ 1)e−λs ds = P (Nt ≥ 1) = 1 − e−λt 0 と T2 − T1 も平均 1 λ の指数分布にしたがう.独立性も同様にしたがう. これを用いるとポアソン分布の χ2 分布の関係がでてくる.指数分布 Exp(λt) は Γ(1, λt) であることを用いると Tk = T1 + k ∑ (Ti − Ti−1 ) i=1 は独立な指数分布の和であることと Γ 分布の再生性から Tk は Γ(k, λt) にし たがう. 2.8. 精密法 47 Γ 分布の再生性 Γ(p, a) + Γ(q, a) = Γ(p + q, a) それぞれに対応する確率変数を X, Y とし,独立とする.このとき, FX+Y (x) = P (X + Y ≤ x) (∫ x−y q ) ∫ x p a a = y p−1 e−ay z q−1 e−az dz dy Γ(q) 0 Γ(p) 0 (∫ s ) ∫ x p+q a = e−as tq−1 (s − t)p−1 dt ds (s = y + z, t = y) Γ(p)Γ(q) 0 0 (∫ 1 ) ∫ x ap+q −as p+q−1 q−1 p−1 = e s r (1 − r) dr ds (t = sr) Γ(p)Γ(q) 0 0 ∫ x ap+q = e−as sp+q−1 ds B(p, q) Γ(p)Γ(q) 0 ∫ x ap+q = e−as sp+q−1 ds Γ(p + q) 0 これより P (Nt ≤ k) = 1 − P (Nt > k) = 1 − P (Nt ≥ k + 1) = 1 − P (Tk+1 < t) ∫ t λk+1 xk e−λx dx = 1− 0 Γ(k + 1) である.ここで 2λx = y と変数変換すると ∫ 2λt (1/2)k+1 k −y/2 上の式 = 1 − y e dy Γ(k + 1) 0 ( ) 2(k+1) 1 がでる.右辺の被積分関数は Γ(k + 1, 1/2) = Γ , 2 2 = 自由度 2(k + 1) の χ2 分布の密度関数である.つまり平均 λt のポアソン分布が k より小さい 確率は自由度 2(k + 1) の χ2 分布が 2λt 以上である確率と等しいことが示せ た.つまり,平均 λ のポアソン分布の分布関数 Fλ は自由度 2(k + 1) の χ2 分 布の密度関数 f2(k+1) を用いると Fλ (k) = k ∑ i=0 −λ λ e ∫ i i! ∞ = f2(k+1) (x) dx = 1 − F2(k+1) (2λ) (2.1) 2λ とみなせる.ここで F2(k+1) は自由度 2(k + 1) の χ2 分布の分布関数である. 定理 6 (ポアソン分布の精密法) X をポアソン分布 Po(λ) にしたがうとす る.このとき,Y を自由度 2(k + 1) の χ2 分布にしたがう Y を用いると P (X ≤ k) = 1 − P (Y ≤ 2λ) と表される. 第 2 章 連続型確率分布 48 これを用いると λ の推定には,データに対応する確率変数を X1 , . . . , Xn と すると,これらは独立なのでポアソン分布の再生性より,X1 + · · · + Xn は 平均 nλ のポアソン分布にしたがう. Poisson 分布の再生性 X は Po(λ),Y は Po(µ) で独立とすると P (X + Y = k) = k ∑ P (X = l) × P (Y = k − l) l=0 = k ∑ e−λ l=0 λl −µ µk−l e l! (k − l)! 1 ∑ l k−l k+l Cl λ µ k! k = e−(λ+µ) l=0 (λ + µ)k = e−λ+µ k! より,X + Y は Po(λ + µ) にしたがう. そこで信頼係数を 5%とすると k = k−1 ∑ e−λ i=0 k ∑ e−λ i=0 ∫ λi i! = λi i! = ∞ ∑n i=0 xi とするとき, f2k (x) dx = 1 − F2k (2nλ) = 2.5% 2nλ ∫ ∞ f2(k+1) (x) dx = 1 − F2(k+1) (2nλ) = 97.5% 2nλ をみたす 2 つの λ の間が信頼区間とみなすことができる.すなわち自由度 2k の χ2 分布の 97.5%点を C1 ,自由度 2(k + 1) の χ2 分布の 2.5%点を C2 とす れば C1 ≤ 2nλ ≤ C2 が信頼区間になる. 2.8.2 2 項分布の精密法 k ∑ i=0 より, i n−i n Ci p q 1 = B(k + 1, n − k) ∫ 1−p tn−k−1 (1 − t)k dt 0 2.8. 精密法 49 定理 7 (2 項分布の精密法) 2 項分布 B(n, p) の分布関数 Fn,p は自由度 (2(k+ 1), 2(n − k)) の F 分布の密度関数 f2(k+1),2(n−k) を用いると Fn,p (k) = k ∑ ∫ i n−i = n Ci p q f(2(k+1),2(n−k) (x) dx (n−k)p/(k+1)q i=0 = 1 − F2(k+1),2(n−k) ( (n − k)p ) (k + 1)q (2.2) と表せる.ここで F2(k+1),2(n−k) は自由度 (2(k + 1), 2(n − k)) の F 分布の分 布関数である. したがって,信頼区間 95%の推定を行うならば,k = k−1 ∑ = 1 − F2k,2(n−k+1) ( i n−i n Ci p q = 1 − F2(k+1),2(n−k) ( i=0 i=1 xi とおいて (n − k + 1)p ) = 2.5% kq i n−i n Ci p q i=0 k ∑ ∑n (n − k)p ) = 97.5% (k + 1)q の間の p が信頼区間になる.ここで上の式の p と q の役割を入れ替えると n−k+1 ∑ n Ci p q = 1 − F2(n−k),2(k+1) ( n−i i i=0 kq ) = 97.5% (n − k + 1)p となる. 自由度 (2(n−k+1), 2k) の F 分布の 2.5%点を C1 ,自由度 (2(k+1), 2(n−k)) の F 分布の 2.5%点を C2 とすると kq (n − k + 1)p 2(n − k)p 2(k + 1)q ≤ C1 ≤ C2 を解いて k C2 (k + 1) ≤p≤ k + C1 (n − k + 1) n − k + C2 (k + 1) が信頼区間になる. 2 項分布の精密法の証明.部分積分により ∫ 1−p 1 tn−k−1 (1 − t)k dt B(k + 1, n − k) 0 ]1−p [ ∫ 1−p 1 1 1 n−k k n−k = − t (1 − t)k t (1 − t)k−1 dt B(k + 1, n − k) n − k B(k + 1, n − k) n − k 0 0 ∫ 1−p 1 k n−k = n Ck p q − tn−k (1 − t)k−1 dt B(k, n − k + 1) 0 第 2 章 連続型確率分布 50 を繰り返せば k ∑ i n−i n Ci p q = i=0 1 B(k + 1, n − k) ∫ 1−p tn−k−1 (1 − t)k dt 0 この右辺で ϕ1 = 2(k + 1),ϕ2 = 2(n − k) とおいて t= ϕ2 ϕ1 F + ϕ2 と変数変換すると, t = 0 ならば F = ∞, t = 1 − p ならば F = ϕ2 p ϕ1 q なので 1 B(k + 1, n − k) ∫ 1−p tn−k−1 (1 − t)k dt 0 1 = B(ϕ1 /2, ϕ2 /2) ( ∫ ϕ2 p/ϕ1 q ϕ1 ϕ2 )ϕ1 /2 F ϕ1 /2−1 ( )−(ϕ1 +ϕ2 )/2 ϕ1 1+ F dF ϕ2 これは自由度 (ϕ1 , ϕ2 ) の F 分布の密度関数である. 2.9 その他,統計に現れる確率分布 • χ2 分布 (自由度 n) f (x) = 1 xn/2 e−x/2 , Γ(n/2)2n/2 (x > 0) 標準正規分布にしたがう独立な n 個の確率変数の和のしたがう確率分 布,ガンマ分布 Γ( n2 , 12 ) である. 再生性: 自由度 n と自由度 m の独立な χ2 分布の和は自由度 n + m の χ2 分布にしたがう. • t 分布 (自由度 n) 1 f (x) = √ nB(1/2, n/2) ( x2 1+ n )−(n+1)/2 標準正規分布にしたがう確率変数 X とそれと独立な自由度 n の χ2 分 布にしたがう確率変数 Y とするとき, X √ Y /n のしたがう確率分布である. 2.9. その他,統計に現れる確率分布 51 • F 分布 (自由度 m, n) f (x) = (m/n)m/2 m/2−1 m x (1 + x)−(m+n)/2 , B(m/2, n/2) n (x > 0) 自由度 m の χ2 分布にしたがう確率変数 X と自由度 n の χ2 分布にし たがう確率変数 Y とするとき X/m Y /n のしたがう確率分布である. 2.9.1 ガンマ分布,ベータ分布と他の確率分布の間の関係 (1) 指数分布 Exp(λ) は Γ(1, λ) (2) 自由度 n の χ2 分布は Γ( n2 , 12 ) (3) P (Po(λ) ≤ k) = P (Γ(k + 1, 1) > λ) = P (χ22(k+1) > 2λ) (4) P (B (n, p) ≥ k) = P (β(k, n − k + 1) ≤ p) (5) Γ(p1 , a)/(Γ(p1 , a) + Γ(p2 , a)) = β(p1 , p2 ) (6) とくに a = 1 2 とおいて 1/(1 + (m/n)Fm,n ) = β(m, n) 上の4と 6 をあわせると ( P (B (n, p) ≥ k) = P ) k ≤p k + (n − k + 1)Fn−k+1,k これは 3 とともに精密法で用いられる. 52 第3章 条件付き確率,条件付き期 待値 条件付き確率 3.1 事象 A, B について P (A | B) = P (A ∩ B) P (B) を B によって条件づけられた A の条件付き確率という.事象 A, B が独立 P (A ∩ B) = P (A) × P (B) のときには P (A | B) = P (A) をみたす. 問題 55 (Polya の壷) 壷に赤玉 a 個と白玉 b 個入っている.赤玉を取り出 したときには c + 1 個の赤玉を壷に戻し,白玉を取り出したときには c + 1 個 の白玉を戻すとする.この操作を 3 回行った後で,赤玉を取り出す確率を求 めてください. 解. 1 回目を考えると赤玉を取り出す確率は a a+b である.2 回目を考え ると, (1) 赤玉を取り出して,その次にも赤玉を取り出す.赤玉を取り出す確率は a a+c a+b ,その条件の下でまた赤玉を取り出す条件付き確率は a+b+c .した がって,この確率は a(a + c) (a + b)(a + b + c) (2) 1 回目に白玉を取り出して,その次に赤玉を取り出す白玉を取り出す確 率は b a a+b ,その条件の下で赤玉を取り出す条件付き確率は a+b+c .した がって,この確率は ba (a + b)(a + b + c) 3.1. 条件付き確率 53 2 式を加えて a(a + c) ba a + = (a + b)(a + b + c) (a + b)(a + b + c) a+b と 1 回目と同じである.後は帰納法で確かめることができるが,何回目でも 赤玉を取り出す確率は a a+b である. 定理 8 (ベイズ) P (B | A) = P (A | B)P (B) P (A) 証明. P (A ∩ B) = P (A | B) × P (B) より P (B | A) = = P (A ∩ B) P (A) P (A | B)P (B) P (A) 一般には 系 1 (ベイズ) (1) P (A) > 0, P (Bi ) > 0 (2) B1 , . . . , Bn は互いに素 ∑n (3) i=1 P (Bi ) = 1 をみたすとき P (A | Bk )P (Bk ) P (Bk | A) = ∑n i=1 P (A | Bi )P (Bi ) 証明. ∪ ∪ ∪ P ( i Bi ∩ A) P (A) − P (( i Bi )c ∩ A) P (A) P ( Bi | A) = = = =1 P (A) P (A) P (A) i に注意すると,定理 8 から n n ∪ ∑ ∑ P (A | Bi )P (Bi ) 1 = P ( Bi | A) = P (Bi | A) = P (A) i i=1 i=1 により P (A) = n ∑ i=1 P (A | Bi )P (Bi ) 第3章 54 条件付き確率,条件付き期待値 をみたす.再び,定理 8 から P (Bk | A) = P (A | Bk )P (Bk ) P (A) の分母に代入すればよい. 問題 56 (1) 硬貨を 5 回投げたとき,3 回以上表が出たことがわかっている ときに 5 回全部が表である条件付き確率を求めてください. (2) X が幾何分布 Ge(p) にしたがうとき,m < n について P (X = m + n | X ≥ n) を求めてください. 解. (1) A =5 回全部表の事象,B =3 回以上表の事象とすると P (A) = 2−5 , P (B) = 5 ∑ − 5 Ci 2 5 i=3 また,P (A ∩ B) = P (B) であるので, P (A | B) = ∑5 2−5 −5 i=3 5 Ci 2 = 5 C3 1 1 = + 5 C4 + 5 C5 16 (2) P (X = n) = pq n より P (X ≥ n) = ∞ ∑ pq i = pq n i=n P (X = m + n | X ≥ m) = 1 = qn 1−q P (X = m + n) pq m+n = = pq m P (X ≥ m) qn 指数分布にしたがうときには過去に起きていないことは影響を与えない. 問題 57 X と Y がそれぞれ独立で (1) 2 項分布 B(N, p) と B(M, p) にしたがうとき (2) 幾何分布 Ge(p) と Ge(p) にしたがうとき (3) ポアソン分布 Po(λ) と Po(µ) にしたがうとき P (X = n | X + Y = n + m) を求めてください. 3.1. 条件付き確率 55 解. (1) 2 項分布の再生性より X + Y は 2 項分布 B(N + M, p) にしたがう.こ れより P (X = n | X + Y = n + m) = = = P (X = n, Y = m) P (X = n)P (Y = m) = P (X + Y = n + m) P (X + Y = n + m) n N −n m M −m N Cn p q M Cm p q n+m N +M −n−m q N +M Cp N CnM Cm N +M Cn+m (2) P (X + Y = n + m) = = = n+m ∑ k=0 n+m ∑ k=0 n+m ∑ P (X = k, Y = n + m − k) P (X = k)P (Y = n + m − k) pq k pq n+m−k k=0 = p2 q n+m (n + m + 1) これより P (X = n | X + Y = n + m) = = = P (X = n)P (Y = m) P (X + Y = n + m) pq n pq m p2 q n+m (n + m + 1) 1 n+m+1 (3) ポアソン分布の再生性より X + Y は Po(λ + µ) にしたがう.これより P (X = n | X + Y = n + m) = = P (X = n)P (Y = m) P (X + Y = n + m) e−λ λn /n! × e−µ µm /m! −(λ+µ) e (λ + µ)n+m /(n + m)! = (λ + µ)−(n+m) n+m Cn λn µm 問題 58 くじが 100 本あって,そのうち当たりくじは10本である.これを 2 つの箱に分け入れる.箱を等確率で引くとして,当たりくじを引く確率を 最小もしくは最大にするにはどのように分ければよいでしょうか. 第3章 56 条件付き確率,条件付き期待値 解. 箱を A,B とする箱 A に n 枚 (n ≤ 50),当たりくじを k 枚入れるとす る.箱 B には 100 − n 枚のうち 10 − k 枚が当たりくじであるので,A を選ん だときに当たる条件付き確率と B を選んだときに当たる条件付き確率は P (当たり | A の箱を選んだ) = P (当たり | B の箱を選んだ) = k n 10 − k 100 − n したがって,当たる確率は P (当たり) P (A の箱を選んで当たり) × P (A の箱を選んだ) P (A の箱を選んだ) P (B の箱を選んで当たり) × P (B の箱を選んだ) + P (B の箱を選んだ) = P (当たり | A の箱を選んだ) × P (A の箱を選んだ) = +P (当たり | B の箱を選んだ) × P (B の箱を選んだ) k 1 10 − k 1 × + × n 2 100 − n 2 100k + 10n − 2nk 10n + k(100 − 2n) = 2n(100 − n) 2n(100 − n) = = n ≤ 50 をとめて考えると,分子は k について単調増加なので,k = 0 のとき 最小,k = 10 のとき最大になり, 最小値 = 最小値は n = 0 のときに 5 , 100 − n 1 20 ,k 最大値 = 1000−10x = 10 のとき,n ≥ 10 であり, 2x(100−x) は単 調減少関数なので,最大値は n = 10 のときに 3.1.1 1000 − 10n 2n(100 − n) 1 2 離散型 P (X = x | Y = y) = P (X = x, Y = y) P (Y = y) Y = y という条件のもとでの X の期待値 (X の条件付き期待値) は E(X | Y = y) = ∑ i xi P (X = x | Y = y) = ∑ 1 xi P (X = xi , Y = y) P (Y = y) i 以下では,E(X | Y ) は y の関数で,y での値を E(X | Y = y) をとる関数と 考える. 定理 9 E[E(X | Y )] = E(X) 3.1. 条件付き確率 57 証明. E[E(X | Y )] = ∑ E(X | Y = yj ) × pYj j 1 ∑∑ = xi P (X = xi Y = yj ) × pYj pYj j i ∑∑ = xi P (X = xi Y = yj ) j = ∑ i xi P (X = xi ) = E(X) i 問題 59 (compound Poisson) X はポアソン分布 Exp(λ) にしたがい,Y1 , Y2 , . . . は独立なベルヌーイ分布 Be(p) にしたがう,すなわち P (Y1 = 0) = 1 − p P (Yi = 1) = p, とするとき,Y = Y1 + · · · + YX とおく.このとき,X, Y の同時確率分布と E(Y ) を求めてください. 解. λn n! P (Y = k | X = n) = n Ck pk q n−k P (X = n) = e−λ より,0 ≤ k ≤ n ならば P (Y = k, X = n) = = P (Y = k | X = n) × P (X = n) n k n−k −λ λ e n Ck p q n! 期待値は E(Y ) = E[E[Y | X]] = ∞ ∑ E[Y | X = n] × e−λ n=0 = ∞ ∑ n ∑ k n−k n Ck p q n=0 k=0 ∞ ∑ −λ = e = e−λ = e−λ k=0 ∞ ∑ k=0 ∞ ∑ e e λn n! ∞ 1 k −k ∑ (qλ)n p q k! (n − k)! n=k ∞ 1 k −k ∑ (qλ)m+k p q k! m! m=0 1 k k qλ p λ e k! k=0 −λ pλ qλ = e × e−λ =1 λn n! 第3章 58 条件付き確率,条件付き期待値 3.1.2 連続型 X, Y が連続型のとき fX|Y =y (x) = f(X,Y ) (x, y) fY (y) を条件 Y = y のときの X の密度関数とよぶ. 定理 10 (ベイズ) fY |X=x (y) = fX|Y =y (x)fY (y) fX (x) 証明. f(X,Y ) (x, y) = fX|Y =y (x) × fY (y) より fY |X=x (y) = = f(X,Y ) (x, y) fX (x) fX|Y =y (x) × fY (y) fX (x) ∫ E(X | Y = y) = xfX|Y =y (x) dx を条件付き平均値という. E(X | Y = y) = 1 fY (y) ∫ xf(X,Y ) (x, y) dx をみたす.E(X | Y ) は y を変数とする関数とみなす.これを用いると離散型 と同様に 定理 11 E[E(X | Y )] = E(X) 3.1. 条件付き確率 59 証明. ∫ E[E(X | Y )] = = = = E(X | Y = y)fY (y) dy ∫ 1 xf(X,Y ) (x, y) dxfY (y) dy fY (y) ) ∫ (∫ x f(X,Y ) (x, y) dy dx ∫ xfX (x) dx = E(X) ∫ 3.1.3 離散型と連続型の場合 一般論は,Y 可測な事象 C について ∫ ∫ E(X | Y ) dP = X dP C C をみたす,Y 可測な関数 E(X | Y ) が条件付き平均値の Lebesgue 積分におけ る定義になる.これを X の代わりに 1X −1 A ,C = Y −1 (B) とおくと ∫ ∫ E(1X −1 (A) | Y ) dP = 1X −1 (A) dP = P (X ∈ A, Y ∈ B) Y −1 (B) Y −1 (B) • ともに離散型のとき,A = {k},B = {l} とおくと P (X = k | Y = l) × P (Y = l) = P (X = k, Y = l) • ともに連続型のとき ) ∫ (∫ ∫ fX|Y =y (x) dx fY (y) dy = B A f(X,Y ) (x, y) dxdy A×B により fX|Y =y (x) × fY (y) = f(X,Y ) (x, y) • X が連続型,Y が離散型のとき ∫ fX|Y =y (x) dx × P (Y = l) = P (X ∈ A, Y = l) A より fX|Y =y (x) × P (Y = l) = fX (x, Y = l) • X が離散型,Y が連続型のとき ∫ P (X = k | Y = y)fY (y) dy = P (X = k, Y ∈ B) B より P (X = k | Y = y) × fY (y) = fY (X = k, y) 第3章 60 条件付き確率,条件付き期待値 条件付き確率の性質 3.1.4 (1) E(a1 X1 + a2 X2 + b | Y ) = a1 E(X1 | Y ) + a2 E(X2 | Y ) + b (2) E(h(Y )X | Y ) = h(y)E(X | Y ) (3) E[E(X | Y )g(Y )] = E(Xg(Y )) (4) E[E(Z | X, Y ) | Y ] = E(Z | X) (5) X と Y が独立ならば E(X | Y ) = E(X) 証明. 連続型の場合に行う. (1) これは明らか (2) ∫ E(h(Y )X | Y ) = h(y)xfX|Y =y (x) dx ∫ = h(y) xfX|Y =y (x) dx = h(y)E(X | Y = y) (3) ∫ E[E(X | Y )g(Y )] = E(X | Y = y)g(y)fY (y) dy ) ∫ (∫ = xfX|Y =y g(y)fX|Y =y (x) dx fY (y) dy ∫∫ = xf(X,Y ) (x, y)g(y) dxdy = E[Xg(y)] (4) ∫ E[E[Z | X = x, Y ) | Y ) E(Z | X = x, Y = y)fY |X=x (y) dy ) ∫ (∫ f(X,Y ) (x, y) = zfZ|X=x,Y =y dz dy fX (x) ∫∫ ∫ f(X,Y,Z) (x, y, z) = z dz dy = zfZ : X=x (z) dz fX (x) = E(Z | X = x) = (5) 独立ならば fX|Y =y (x) = f(X,Y ) (x, y) = fX (x) fY (y) ∫ ∫ なので, E(X | Y )(y) = xfX|Y =y (x) = xfX (x) dx = E(X) 3.1. 条件付き確率 61 問題 60 X と Y が独立で指数分布 Exp(λ) にしたがうとき X + Y ,X − Y , X Y の密度関数を求めてください.XY の密度関数は大変である. 解. (1) X + Y FX+Y (x) = P (X + Y ≤ x) = E[P (X + Y ≤ x) | Y ] ∫ = P (X ≤ x − y)fY (y) dy ∫ = FX (x − y)fY (y) dy 上の式を x で微分して ∫ fX (x − y)fY (y) dy fX+Y (x) = ∫ x = ∫ λe−λ(x−y) λe−λy dy 0 x = λ2 e−λx dy = λ2 xe−λx 0 これはガンマ分布 Γ(2, λ) である. (2) X − Y FX−Y (x) = E[P (X − Y ≤ x) | Y ] ∫ = FX (x + y)fY (y) dy これを x で微分して ∫ fX−Y (x) = fX (x + y)fY (y) dy ∫ λe−λ(x+y) λe−λy dy = −x∨0 λ2 e−λx ∫ e−2λy dy = λ2 e−λx ∫ e−2λy dy −x λ e−λx x ≥ 0 2 = λ eλx x<0 2 x≥0 x<0 第3章 62 (3) 条件付き確率,条件付き期待値 X Y = P (X/Y ≤ x) = E[P (X/Y ≤ x) | Y ] ∫ = FX (xy)fY (y) dy FX/Y (x) これを x で微分して ∫ fX/Y (x) = fX (xy)yfY (y) dy ∫ λ2 e−λxy ye−λy dy ∫ = λ2 ye−λ(x+1)y dy = = 1 (x + 1)2 XY の場合には P (XY ≤ x) = E[P (XY ≤ x) | Y ] ∫ = FX (x/y)fY (y) dy FXY (x) = これを x で微分して ∫ fXY (x) = = 1 fX (x/y) fY (y) dy y ∫ ∫ 1 −λ(x/y+y) λ2 e dy y となって,積分ができない.積や商の場合には負の値を取る場合にはより注 意が必要になる. 最良推定値 3.1.5 定理 12 E((Y − g(X))2 ) を最小にする g は g(X) = E(Y | X) である. 証明. E((Y − g(X))2 ) = E((Y − E(Y | X) + (E(Y | X) − g(X))2 ) = E((Y − E(Y | X))2 ) + 2E((Y − E(Y | X))(E(Y | X) − g(X)) +E((E(Y | X) − g(X))2 ) ここで,中項は E((Y − E(Y | X))(E(Y | X) − g(X)) = E(Y E(Y | X)) − E(E(Y | X)E(Y | X)) −E(Y g(X)) + E(E(Y | X)g(X)) 3.2. Bayes の話 63 ここで, E(E(Y | X)g(X)) = E(Y g(X)) また,E(Y | X) の 1 つを g と思えば E(E(Y | X)E(Y | X)) = E(Y E(Y | X)) であることから,中項は 0 であることがわかる.これより, E((Y − g(X))2 ) = E((Y − E(Y | X))2 ) + E((E(Y | X) − g(X))2 ) 前項は g によらないので,定理の証明終わり 3.2 Bayes の話 X と Y を考える.X の確率分布を事前確率分布といい,P (X | Y ) を事 後確率とよぶ.X の確率分布は情報なしで定まるので,主観的確率ともよば れる. 例 10 壷が 2 つある.どれかを選ぶのを確率変数 X とする.主観的 (事前) 確率は P (X = i) = 1 2 である.壷には赤玉と白玉が • 壷 1 には赤 5 個,白 1 個 • 壷 2 には赤 1 個,白 5 個 とする.今,片方の壷をランダムに選んで,さらに玉を取り出すと赤だった. この壷は 1 か 2 か考えてみよう.取り出す玉の色を表す確率変数を Y とし, 赤を 0,白を 1 としよう. P (Y = 0 | X = 1) = P (Y = 0 | X = 2) = 5 6 1 6 である.Bayes により P (X = 1 | Y = 0) = P (X = 1, Y = 0) P (Y = 0 | X = 1) × P (X = 1) = P (Y = 0) P (Y = 0 | X = 1)P (X = 1) + P (Y = 0 | X = 2)P (X = 2) なので,事後確率は P (X = 1 | Y = 0) = 5 5/6 × 1/2 = 5/6 × 1/2 + 1/6 × 1/2 6 と赤をひいたことで,その壷が 1 である確率がずっと高くなった. 第3章 64 条件付き確率,条件付き期待値 例 11 硬貨投げを考える.n 回投げたときの表の回数を Y とする.X は表の 出る確率としよう.主観的確率は α, β の β 分布とする. ∫ ∫ pk = P (Y = k) = f (Y = k, X = p) dp = P (Y = k | X = p)fX (p) dp ∫ 1 = n Ck pk q n−k pα−1 q β−1 dp B(α, β) ∫ 1 = n Ck pα+k−1 q β+n−k−1 dp B(α, β) B(α + k, β + n − k) = n Ck B(α, β) 一方, P (X = k | Y = p) = n Ck pk q n−k より,Bayes より,事後確率は fX|Y =k (p) 1 pk pα−1 q β−1 B(α, β) = n Ck pk q n−k B(α, β) n Ck B(α + k, β + n − k) 1 = pα+k−1 q β+n−k−1 B(α + k, β + n − k) = P (Y = k | X = p) × fX (p) × すなわち,β 分布は事前確率から事後確率への移行で保存される. このことを 2 項分布の共役事前分布は β 分布であるという. 問題 61 正規分布の共役事前分布は正規分布であることを確かめてください. 解. X の事前分布は N (m0 , v0 ) とする.また fY |X=m (y) = √ 1 e−(y−m)/2v 2πv にしたがうとする.このとき, ∫ fY (y) = fY |X=m (y)fX (m) dm ∫ 2 2 1 1 √ = e−(y−m) /2v √ e−(m−m0 ) /2v0 dm 2πv0 2πv 1 −(y−m0 )2 /2(v+v0 ) e = √ 2π(v + v0 ) これより事後確率は fX|Y =y (m) = = = fY |X=m (y)fX (m) fY (y) √ 2 2 2 1 1 √ e−(m−m0 ) /2v0 2π(v + v0 )e(y−m0 ) /2(v+v0 ) e−(y−m) /2v √ 2πv0 2πv 1 √ exp[−(v0 y − m(v + v0 ) + m0 v)/2vv0 (v + v0 )] 2πvv0 /(v + v0 ) 3.3. Markov 連鎖 65 と正規分布になっていることがわかる. Y1 , . . . , Yn が独立なときにも示せる. 問題 62 ポアソン分布の共役事前確率分布は Γ 分布であることを示してくだ さい. 解. X の事前確率分布は Γ(a, 1/θ) とする. fX (λ) = θa a−1 −λθ λ e Γ(a) また ∫ P (Y = k) = = = e−λ λk θa a−1 −λθ λ e dλ k! Γ(a) ∫ λa+k−1 e−λ(θ+1) dλ θa k!Γ(a) θa Γ(a + k) k!Γ(a) (θ + 1)a+k−1 これより,事後確率は fX|Y =k (λ) P (Y = k | X = λ)fX (λ) P (Y = k) k λ 1 a−1 −λθ k!Γ(a) (θ + 1)a+k−1 = e−λ λ e k! Γ(a) θa Γ(a + k) a+k−1 (θ + 1) = λa+k−1 e−λ(θ+1) θa Γ(a + k) = 3.3 Markov 連鎖 離散型の確率変数 X1 , X2 , . . . について P (Xn = xn |X1 = x1 , . . . , Xn−1 = xn−1 ) = P (Xn = xn |xn−1 = xn−1 ) をみたすときマルコフ連鎖という.条件付き確率を用いて表現するならば, Bn で Xn を可測にする最小の σ–algebra,B˜n で X1 , . . . , Xn を可測にする最 小の σ–algebra とすると,m > n ならば P {ω : Xm (ω) = xm | B˜n }(ω) = P {ω : Xm (ω) = xm | Bn }(ω) 第3章 66 条件付き確率,条件付き期待値 が成り立つことである.すなわち,時刻 n 以降の事象は n での値にのみより, それまでの履歴によらないと言うことである. X1 , X2 , . . . が独立ならば,ω ∈ {ω : X1 (ω) = x1 , . . . , Xn (ω) = xn } のとき P {ω : Xm (ω) = xm , X1 (ω) = x1 , . . . , Xn (ω) = xn } P {ω : X1 (ω) = x1 , . . . , Xn (ω) = xn } = P {ω : Xm (ω) = xm } P {ω : Xm (ω) = xm , Xn (ω) = xn } | Bn }(ω) = P {ω : Xn (ω) = xn } = P {ω : Xm (ω) = xm } P {ω : Xm (ω) = xm | B˜n }(ω) = P {ω : Xm (ω) = xm であるから,Markov である. 例 12 X1 , X2 , . . . を公平な硬貨投げで, +1 Xn = −1 表 裏 としよう.このとき, Sn = X 1 + · · · + X n はマルコフ連鎖になる.これを対称 random walk という. 確率変数 X1 , X2 , . . . が独立同分布なら,条件付き確率を行列で表すことがで きる.例えば,2 つの値 a, b しかとらないときには ( ) P (X2 = a|X1 = a) P (X2 = b|X1 = a) Π= P (X2 = b|X1 = a) P (X2 = b|X1 = b) になる.これを推移確率行列という. π = (P (X1 = a), P (X1 = b)) を初期確率という.また ( P (X3 = a|X1 = a) 2 Π = P (X3 = b|X1 = a) ) P (X3 = b|X1 = a) P (X3 = b|X1 = b) および πP = (P (X2 = a), P (X2 = b)) などをみたすことに注意しよう. 一般の推移確率行列 p11 p21 Π= .. . p12 p22 .. . ··· ··· .. . p1n p2n .. . pn1 pn2 ··· pnn 3.4. 極限定理 67 と初期確率 π = (π1 , . . . , πn ) は (1) pij ≥ 0 (2) ∑n j=1 pij = 1 (3) πi ≥ 0 (4) ∑n i=1 πi = 1 をみたす. ∑ πi pij = πj i をすべての j についてみたす,すなわち πΠ = π をみたすとき,定常である という. 問題 63 1 ≤ i, j ≤ n について,推移確率が pij = Ci ij で与えられるとき,Ci を求めてください. 解. n ∑ pij = ci i j=1 n(n + 1) 2 より Ci = 1 2 × i n(n + 1) 3.4 極限定理 (n) 推移確率行列 Π について,Πn の (i, j) 成分を pi,j で表すことにしよう.こ れは初めに i にいたときに時刻 n に j にいる確率であることは行列のかけ算 をしてみればわかるだろう.とくに n = 2 ならば (2) pi,j = k ∑ l=1 であることからわかる. pi,l pl,j 第3章 68 条件付き確率,条件付き期待値 推移確率行列 Π が非退化であるとは,任意の i, j について,ある n が存在 (n) して,pi,j > 0 をみたすこととする.非退化でない行列は非退化な行列に分 解できることは容易にわかる. 非退化な推移確率行列について,n → ∞ の場合を考えてみよう. 定理 13 (Perron–Frobenius) A を非退化かつ成分が非負な行列とすると き,その最大固有値は正かつ単純であり,対応する固有ベクトルとして成分 がすべて正なものを選ぶことができる. 1 . . を用いよう.1 が固有値であることは . が固有ベクトルであることからわ 1 かり,さらに,Πn が推移確率行列になっていることから,1 が最大固有値で 1 n .. あることがわかる.なぜなら,もし絶対値が 1 以上の固有値があれば Π . 1 は発散してしまう.さらに 1 が最大固有値であることから,定常確率が存在 することも示された. 1 以外の固有値がすべて絶対値で 1 より小さいときには,任意の初期状態 π について πΠn は定常確率に収束することがわかり,さらに n−1 1 ∑ ikθ e →0 n k=0 であることを用いると π n−1 1∑ k Π n k=0 も定常状態に収束することがわかる.これをエルゴード性という. 3.5 吸収壁ランダムウォーク 自分は 1 円,相手は N − 1 円の,2 人合わせて N 円所持しているとする. 1 回あたり 1 円を賭けてギャンブルをするとき,私が破産する確率を求めて みよう.負ける確率を p,勝つ確率を q とする. これを解くには pn で,初め n のところにいたときに破産する確率とする. 欲しいのは p1 だけだが,このように一般の場合を求めるとよい.1 回ギャン ブルをすると n − 1 か n + 1 に移動するから pn = p × pn−1 + q × pn+1 が成り立つ.さらに境界条件 p0 = 1,pN = 0 が成り立つ.式を書き換えると pn+1 = p 1 pn − pn−1 q q 3.5. 吸収壁ランダムウォーク 69 であるから ( ) ( )( ) pn+1 1/q −p/q pn = pn 1 0 pn−1 ( ) 1/q −p/q ここで P = の固有値は 1 と pq であるから,対角化する行列を 1 0 ( ) ( ) α −1 p1 とおくと, U とおいて, =U p0 β ( )n p pn = α + β q が成り立つ.境界条件より α + β = 1, ( )N p α+β =0 q であるので, pN , pN − q N α= β=− qN pN − q N より, pN qN pn = N − p − qN pN − q N を得る.この式は p = q = 1 2 のときには使えない.それには,上の式を整理 して pn = として,p, q → 1 2 ( )n p q pn (pN −n − q N −n ) pN − q N ととれば n pn = 1 − N ( ) 2 −1 が導ける.より,正確には P = が,固有値 1 の Jordan 標準形で 1 0 あることから pn = α + nβ になることに境界条件を用いればよい. 逆に,相手が破産する確率を qn とおくと,これは p と q を入れ替えて, N − n をみればよいので qn = q N −n (q n − pn ) q N − pN このことから, pn + qn = 1,つまり,そのうち,どちらかが破産する確率 が 1 であることがわかる. では,どのくらいの時間で破産するのだろうか,pn,k で最初 n にいて,k 時刻後に破産する確率とする.上と同様に, pn,k = p × pn−1,k−1 + q × pn+1,k−1 (k ≥ 1) 第3章 70 条件付き確率,条件付き期待値 が成り立つ.両辺に tk をかけて,k = 1, . . . について加えると ∞ ∑ k=1 pn (t) = ∑∞ k=0 pn,k tk = pt ∞ ∑ pn−1,k tk + qt k=0 ∞ ∑ pn+1,k tk k=0 pn,k tk とおくと,上の式は pn (t) − pn,0 = ptpn−1 (t) + qtpn+1 (t) ここで,n ̸= 0 ならば,pn,0 = 0,とくに p0 (t) ≡ 1 かつ pN (t) ≡ 0 である. 3.6 反射壁ランダムウォーク 両側の壁で反射して戻るランダムウォークを反射壁ランダムウォークと言 います.1 つの例をあげておきましょう. 3.6.1 エーレンフェストの壷 実際の物理現象ではさまざまな要因が絡み合い,複雑な様相を呈するため にメカニズムの原理が見つけにくい場合が少なくありません.そこで原理の 部分だけを取り出して自然の仕組みを解明してみようというわけです.エー レンフェストの壷は,多数の粒子の運動を記述する統計力学のモデルとして 提唱されたわかりやすいモデルです. 2 つの壷を用意します.それと玉が N 個あるとします.玉には番号がふっ てあります.これらの玉を 2 つの壷に分けていれ,1 時刻ごとに 1 から N ま での番号を 1 つ選んで,その番号の玉を入っている壷から取り出して,他の壷 へと移動します.これをひたすらに繰り返すというのがこのモデルです.物 理の対象としては,2 つの球を細い管でつないだものを用意します.この装 置の中に空気の粒子が多数入っていますが,その合計個数を N 個とします. 空気の粒子はでたらめに動きまわりますから,ときどき管を通って他の球へ と移動していきます.これを長い時間観察したらどんな風になるだろうかと いうわけです. たとえ,初めに片方の球が空っぽでも,時間がたてば多い方から少ない方 へと移動するチャンスが多いわけですから,長い時間には 2 つの球に入って いる粒子の数 (エーレンフェストの壷なら 2 つの壷に入っている玉の数) は等 しくなって来るだろうという予想がたちます.これを数学的にチェックした いというわけです.両方の球に半分ずつ粒子が入った状態は平衡状態とみな すことができます.このモデルは,同時に平衡状態とはなんだろうという問 題の解決にもなっているはずです. 3.6. 反射壁ランダムウォーク 71 簡単なモデル 多数の粒子のモデルを扱う前に,もっとシンプルなモデルで記号などを準 備しておきましょう.2 つの状態 A と B というのがあるとします.状態 A か らは 1 時刻たつと確率 p で状態 B に移動します.ということは確率 1 − p で 状態 A のままでいるわけです.状態 B にいると 1 時刻後には必ず状態 A に 移動するものとしましょう.これは工場の機械の状態をモデル化したもので す.状態 A は故障なく機械が働いている状態,状態 B は機械が壊れてしまっ た状態とすると,正常なときにはある確率 p で壊れて状態 B に移動しますが, 壊れたら必ず次の時刻では修理して正常な状態に戻すという風に考えてくだ さい.こうしたものは確率オートマトンなどといわれ,コンピュータサイエ ンスでも用いられる概念です. このメカニズムは行列 ( ) 1−p p P = 1 0 で表現できます.行列の (1, 1) 成分 P11 は状態 A にいるという条件のもとで 1 時刻後にも状態 A にいる確率,(1, 2) 成分 P12 は状態 A にいるという条件の もとで状態 B に 1 時刻後に移動する確率,(2, 1) 成分 P21 は状態 B にいると いう条件のもとで状態 A に 1 時刻後に移動する確率,最後に (2, 2) 成分 P22 は状態 B にいるという条件のもとで 1 時刻後にも状態 B にいる確率を与えて いますので,この行列を推移確率行列といいます. 2 は行列のかけ算から P11 P11 + P 2 を考えてみましょう.この (1, 1) 成分 P11 P12 P21 に等しいわけですが,この初めの項は初め状態 A にいるという条件 のもとで,次も A にいてさらにその次も A にいる確率を表しています.第 2 項は初め状態 A にいるという条件のもとで,次は状態 B にいって,またその 2 は初め A 次に状態 A に戻って来る確率を表しています.ということは,P11 にいるという条件のもとで 2 時刻後にも A にいる確率を表しています.一般 に Pijn についてもおわかりですね. それでは,今状態 A にいる確率を π1 ,状態 B にいる確率を π2 としましょ う.1 時刻後に状態 A にいる確率は今 A にいて,次も A にいる確率と今 B にいて次に A に移動する確率の和ですから π1 P11 + π2 P21 と表せます.こ れは行列を用いると (π1 , π2 )P の第 1 成分ですし,この横ベクトルの第 2 成 分は同様に 1 時刻後に状態 B にいる確率に等しくなっています.横ベクトル π = (π1 , π2 ) を初期確率といいます. 今,この機械を長い時間動かしていてランダムに機械の点検にいくことに しましょう.きっと,ある確率で正常であって,この確率は時間がたっても 変わらないものであるはずです.これを不変確率といいます.不変確率を求 めてみましょう.不変確率は 1 時刻たっても変わらないはずですから πP = π 第3章 72 条件付き確率,条件付き期待値 をみたしていなければなりません.いいかえると,π は行列 P の固有値 1 の 固有ベクトルであることとがわかります. 壷に戻って 1 つの壷に注目してその壷に入っているボールの個数を k としましょう.ラ ンダムに選ぶのですから,確率 k N でその壷に入っているボールを選んで他方 へ移します.このとき,この壷の中のボールは 1 つ減って k − 1 になります. = NN−k で他方の壷に入っているボールを選ぶので,この ときにはこの壷のボールは k + 1 個になります.推移確率行列を書けば また,確率 1 − k N 0 1 N 0 P = 0 0 1 0 0 ··· 0 0 0 N −1 N 0 N −2 N .. . ··· ··· .. . 0 0 .. . 0 0 .. . 0 0 ··· ··· N −1 N 2 N .. . 0 .. . 0 0 0 0 0 0 1 0 0 0 .. . 1 N 0 で与えられます.(π0 , . . . , πN )P = (π0 , . . . , πN ) をみたす横ベクトルは π0 = 1 π1 N 2 π2 N k−1 k+1 πk = (1 − )πk−1 + πk+1 N N 1 πN = πN −1 N π1 = π0 + をみたします.これより,πk = N Ck π0 (1 ≤ k ≤ N − 1) をみたすことが帰納的に確かめられ ます.実際,k = 0 のときは正しいのは明らかです.また,k まで正しいとす ると, k−1 k+1 )πk−1 + πk+1 , N N k−1 k+1 )N Ck−1 π0 + πk+1 N Ck π0 = (1 − N N πk = (1 − 3.6. 反射壁ランダムウォーク 73 ゆえに πk+1 = = = = = ) ( N k−1 )N Ck−1 π0 N Ck − (1 − k+1 N ( ) N! N N! N −k+1 − π0 k + 1 (N − k)!k! N (N − k + 1)!(k − 1)! ( ) N (N − 1)! N! − π0 k + 1 (N − k)!k! (N − k)!(k − 1)! N (N − 1)! (N − k)π0 k + 1 (N − k)!k! N! π0 = N Ck+1 π0 (N − k − 1)!k! により確かめられます.全体の確率が 1 であることから N ∑ πi = i=1 N ∑ N C k π0 =1 k=0 一方, N ∑ N Ck = (1 + 1)N = 2N k=0 より,π0 = 2−N がわかります.したがって,πk = −N N Ck 2 となりますか ら,これは N 個の硬貨を投げたときの表の回数を表す確率分布である 2 項分 布に等しいことになります.硬貨をいっぱい投げればその約半数は表になる はずです (これを大数の法則といいます) から,N が大きいときには,この壷 には全体のボールの約半数が入っていることが示せました.これが平衡状態 でしたね. まとめ 以上から平衡状態とは確率分布であることに納得がいってもらえたでしょ うか.半分ずつ壷に入っているのが平衡状態なのですが,確率分布ですから いつもぴったり半分ずつ入っているわけではありません.物理を勉強してい る人達は平衡状態が確率分布であることを正確に把握している人ばかりでは ないと思いますが,揺らぎという言葉でこのずれを理解をしているようです. 最後に述べておかなければいかないことがあります.ニュートンの立場に たった古典力学では実際の物理運動は初期値が定まればあとは決まった運動 をするわけで,なんらランダムな現象は存在しないはずです.それにもかか わらずランダム性を考慮した上の説明がうまくいっているのはなぜなのかを 考えてやる必要があります.もっと,身近な例では氷をお湯の中にいれれば 融けてぬるま湯という平衡状態に達するわけですが,これも分子レベルで考 えれば,氷を形成している分子は速度が遅く,お湯の分子は速度が速いとい 第3章 74 条件付き確率,条件付き期待値 う違いだけです.これらがランダムに動きまわるとよく混ざってしまい,速 度の差がなくなってぬるま湯になると考えるとわかりやすいですよね.これ は決まりきった運動をする場合にも平衡状態は確率分布であることから,ラ ンダムな現象ととらえられるということなのです.多数の粒子による複雑さ が導く秩序と考えたらいいのかもしれません. 3.7 ランダムウォーク Z 上を右へ確率 p,左へ確率 q (p, q > 0, p + q = 1) で移動するランダム ウォークを考えます.言い換えれば独立同分布の Xi の値 −1 +1 Xi の確率 q p の確率変数について Sn = X 1 + · · · + X n 1 2 がランダムウォークです.p = q = のとき,対称ランダムウォークといい ます. fn で時刻 n で初めて原点に戻る確率 ,pn で時刻 n で原点に戻る確率 と します.pn は簡単に求められます.n は偶数で,その半分が +1 残りの半分 が −1 にいけばよいのですから ( pn = n ) pn/2 q n/2 n/2 をみたします.一方, pn = q2 pn−2 + · · · + qn−2 p2 + qn をみたします.つまり,n 回目に原点に戻るのは k 回目に初めて原点に戻っ て,その後,n − k 回でまた原点に戻るというわけです.p0 = 1, f0 = 1 とお くと,上の式は n ̸= 0 のときは pn = n ∑ fk pn−k k=0 と書けます.k が奇数のところは 0 とします.p(z) = ∑∞ n n=0 z qn とおくと n = 0 のときに注意して p(z) = 1 + = 1+ = 1+ ∞ ∑ n=1 ∞ ∑ zn zn n ∑ k=0 n ∑ n=1 k=1 ∞ ∑ ∞ ∑ n fk pn−k fk pn−k z fk pn−k k=1 n=k ∑∞ n=0 z n pn ,q(z) = 3.7. ランダムウォーク 75 ここで,n − k を n とおくと p(z) = 1+ ∞ ∑ fk z k ∞ ∑ z n pn n=0 k=1 = 1 + f (z)p(z) つまり f (z) = 1 − 1 p(z) を得ます.一方, p(z) = = ∞ ∑ z n pn n=0 ∞ ∑ z 2m p2m m=0 = ∑ z 2m m=0 = ∑ m=0 = ∑ m=0 ∞ ∑ z 2m ( ) 2m m m p q m (2m(2m − 1) · · · 2 · 1 m m p q m!m! z 2m 2m (2m − 1)(2m − 3) · · · 1 m m p q m! (−1/2) · · · (−1/2 − (m − 1)) m m p q m! m=0 ( ) ∞ ∑ −1/2 = (−4pqz 2 )m m m=0 = z 2m 2m (−2)m = (1 − 4pqz 2 )−1/2 一般の 2 項展開を用いました.これで √ f (z) = 1 − 1 − 4pqz 2 ですから,この T = 2n の係数は ( ) 1/2 1/2(−1/2) · · · (1/2 − n + 1) − (−4pq)n = −(−4pq)n n! n (1(−1)(−3) · · · (3 − 2n) n! 1 · 3 · · · (2n − 3) = 2n (pq)n n! n (2n − 2)! = 2(pq) n!(n − 1)! ( ) 1 n 2n − 1 = 2(pq) 2n −1 n = (−2)n (pq)n 第3章 76 条件付き確率,条件付き期待値 ∑∞ となります.f (1) = n=1 fn はいずれ原点に復帰する確率ですが,f (1) = √ 1 − 1 − 4pq ですので,対称ランダムウォークのときだけ,f (1) = 1 になり, それ以外では f (1) < 1 になります.対称ランダムウォークのときには,必ず 原点に戻ってくるというわけです (再帰性とよばれます).では,原点に戻っ てくる平均時間はいくつでしょう. ∞ ∑ nfn = f ′ (1) n=0 に注意すると f ′ (1) = √ 4pq 1 − 4pq です.つまり,対称ランダムウォークでは戻ってくる平均時間は無限大なの です.もちろん,対称でないときにも,永遠に戻ってこない確率が正ですの で,戻ってくる平均時間は無限大です. 77 第 4 章 極限定理 4.1 大数の法則 定理 14 (チェビシェフ) P {ω ∈ Ω : |Y − E(Y )| > ε} ≤ 証明. V (Y ) ε2 ∫ V (Y ) = ≤ E((Y − E(Y ))2 ) = ∫ {ω∈Ω : |Y (ω)−E(Y )|>ε} (Y (ω) − E(Y ))2 dP (Y (ω) − E(Y ))2 dP ∫ ≤ = ε2 dP {ω∈Ω : |Y (ω)−E(Y )|>ε} 2 ε P {ω ∈ Ω : |Y (ω) − E(Y )| < ε} 同じことを 4 乗で行えば P {ω ∈ Ω : |Y − E(Y )| > ε} ≤ E[(Y − E(Y ))4 ] ε4 が出る. 定理 15 (大数の弱法則) X1 , X2 , . . . を独立かつ同分布とする.E(Xi ) = m, V (Xi ) = v とする.このとき,∀ε > 0 について P {ω ∈ Ω : | X1 (ω) + · · · + Xn (ω) − m| > ε} → 0 n 証明. P {ω ∈ Ω : | X1 (ω) + · · · + Xn (ω) − m| > ε} ≤ n 1 X1 (ω) + · · · + Xn (ω) v V( )= 2 ε2 n nε この収束を確率収束 (測度収束) という. 第4章 78 極限定理 定理 16 (Schwarz) X1 , X2 が E(X12 ), E(X22 ) < ∞ のとき √ |E[X1 X2 )| ≤ E(X12 )E(X22 ) 証明. まず (a + b)2 ≤ 2(a2 + b2 ) より E[(X1 + X2 )2 ] ≤ 2(E(X12 ) + E(X22 )) が成り立つ. E[(tX1 + X2 )2 ] = t2 E(X12 ) + 2tE(X1 X2 ) + E(X22 ) ≥ 0 判別式 D/4 = E(X1 X2 )2 − E(X12 )E(X22 ) ≤ 0 定理 17 (大数の強法則) X1 , X2 , . . . を独立かつ同分布とする.E(Xi ) = m, V (Xi ) = v とする. X1 (ω) + · · · + Xn (ω) → E(X) n a.e. 証明. E(|X|4 ) < ∞ を仮定した証明を述べよう.Schwarz より E(|X)) ≤ √ E(X 2 ) ≤ (E(X 4 ))1/4 .また, E[(X − m)2 ) ≤ 2(E(X 2 ) + m2 ) < ∞ E[(X − m)4 ] ≤ 8(E(X 4 ) + m4 ) < ∞ この式は 2(a2 + b2 ) ≥ (a + b)2 および 8(a4 + b4 ) − (a + b)4 = (a − b)4 + 6(a2 − b2 )2 ≥ 0 から導ける. チェビシェフを 4 乗で用いると X1 (ω) + · · · + Xn (ω) − m > ε} = P {ω ∈ Ω : |X1 (ω) + · · · + Xn (ω) − nm| > nε} P {ω ∈ Ω : n ∑ E[( (Xi − m))4 ] ≤ (nε)4 一方,独立性を使うと ∑ E[( (Xi − m))4 ] = nE[(Xi − m)4 ] + 4 C2 n(n − 1) (E[(X1 − m)2 ])2 ≤ ∃Cn2 2 4.2. Weierstrass の多項式近似定理 79 したがって ∞ X1 (ω) + · · · + Xn (ω) C ∑ 1 P {ω ∈ Ω : − m > ε} ≤ 4 <∞ n ε n=1 n2 n=1 ∞ ∑ Borel–Cantelli の定理より X1 (ω) + · · · + Xn (ω) lim sup{ω ∈ Ω : − m > ε} n n→∞ の確率は 0 に等しい.したがって,単調収束定理より X1 (ω) + · · · + Xn (ω) P {ω ∈ Ω : lim − m ̸= 0} n→∞ n ( ) X1 (ω) + · · · + Xn (ω) = P lim {ω ∈ Ω : lim sup − m > ε} ε→0 n n→∞ ( ) ∞ ∩ X1 (ω) + · · · + Xk (ω) = P lim {ω ∈ Ω : sup − m > ε} ε→0 k k≥n n=1 ∞ ∪ ∩ X1 (ω) + · · · + Xk (ω) {ω ∈ Ω : = P lim − m > ε} ε→0 k n=1 k≥n ( = lim P lim sup{ω ∈ Ω : ε→0 n→∞ ) X1 (ω) + · · · + Xn (ω) > ε} = 0 − m n 4.2 Weierstrass の多項式近似定理 定理 18 (Weierstrass) C[0, 1] の中で多項式全体 P [0, 1] は一様ノルムにつ いて稠密である. 証明. Xix の値 0 1 確率 1−x x というベルヌーイ型の確率変数をとる. Sn = n ∑ Xix i=1 とおく. 任意の連続関数 f に対して pn (x) = E[f (Sn /n)] = n ∑ k=0 n Ck x k k (1 − x)n−k f ( ) n (Bernstein) 第4章 80 極限定理 f は一様連続であるので,任意の ε > 0 について ∃δ > 0 s.t. |x − x′ | < δ ⇒ |f (x) − f (x′ )| < ε である. [ ] Sn |f (x) − pn (x)| = E f (x) − f ( ) n ] [ S n ≤ E f (x) − f ( ) n ∫ Sn |f (x) − f ( )| dP = n {ω : |Sn (ω)/n−x|≥δ ∫ Sn + |f (x) − f ( )| dP n {ω : |Sn (ω)/n−x|<δ Sn (ω) ≤ max 2|f | × P {ω ∈ Ω : − x ≥ δ} + ε n x(1 − x) ≤ max 2|f | × +ε nδ 2 max |f | +ε ≤ 2nδ 2 ここで,E(Xix ) = x, V (Xix ) = x(1 − x) に注意して,チェビシェフを用いた. したがって,sup norm ||f − pn || < max |f | +ε→ε 2nδ 2 により証明を終わる. 4.3 ポアソンの小数の法則 定理 19 Xn を 2 項分布 B(n, p/n) にしたがうとする.このとき,limn→∞ Xn はポアソン分布 Po(p) にしたがう. 証明. Xn のモーメント毋関数は ( p p )n MXn (t) = et + (1 − ) n n p t = (1 + (e − 1))n n → exp[et p − p] 4.4. L´evy の反転公式 81 L´ evy の反転公式 4.4 特性関数は確率分布を定めることを,次の定理は主張しています. 定理 20 (レビーの反転公式) X の特性関数を ϕX ,確率分布を µX とする とき,µX ([a, b]) = µX ((a, b)) をみたす任意の区間 (a, b) ⊂ R について 1 lim µX ((a, b)) = 2π N →∞ ∫ N −N e−ita − e−itb ϕX (t) dt it が成り立つ. 右辺の極限の取り方が微妙な表現ですが,この定理によって,特性関数が与 えられれば確率分布が求められる,すなわち,特性関数と確率分布は 1 対 1 に対応することがわかります. 証明. 第 1 段階 ∫∞ 0 sin t t dt = π 2 iz を示そう. ez を考えます.この関数は特異点を 0 に持つ.そこで,積分の道を r から R まで実数を動き,半径 R の円上を左 回りに 180◦ まわり,原点に向かって戻っていって,−r にぶつかったら,円 の上を右回りに r に戻る道 (図 ??) を考える.この道の中には特異点はない ので,積分は 0 に等しくなる.各パートに分けて積分をみよう. −R −r r R 図 4.1: 積分路 (1) r から R まで ∫ r R eiz dz = z ∫ R r cos x dx + i x ∫ r R sin x dx x (2) R から −R まで,z = Reiθ と変数変換して ∫ 0 π eiR(cos θ+i sin θ) iReiθ dθ = i Reiθ ∫ ∫ π π eiR(cos θ+i sin θ) dθ = i 0 e−R sin θ eiR cos θ dθ 0 被積分関数は R → ∞ で 0 に収束するので,積分も 0 に収束する. 第4章 82 極限定理 (3) −R から −r まで ∫ −r −R eiz dz = − z ∫ R r e−ix dx = − x ∫ r R cos x dx + i x ∫ R r sin x dx x (4) −r から r まで,z = reiθ と変数変換して ∫ 0 ir(cos θ+i sin θ) ∫ 0 e iθ ire dθ = i eir(cos θ+i sin θ) dθ reiθ π π 被積分関数は r → 0 で 1 に収束するので,積分は −πi に収束する. 以上をまとめれば ∫ ∞ 2i 0 sin x dx = πi x を得る.このことから ∫ ∞ 0 π 2 sin xt dt = 0 t − π 2 x>0 x=0 x<0 を得る. 中心極限定理 4.5 (1) 確率分布 µk → µ とは,任意の有界な台をもつ連続関数につ いて ∫ ∫ lim f dµk = f dµ 定義 1 n→∞ をみたすことである. (2) Xk が X に法則収束するとは,対応する確率分布が収束することである. 特性関数に関する定理を列挙しておこう. 定理 21 ϕk を確率分布 µk の特性関数とする.µk → µ∞ ならば,ϕk → ϕ∞ に広義一様収束する. 定理 22 ϕk を確率分布 µk の特性関数とする.ϕk が ϕ に各点収束し,ϕ が原 点で連続ならば,ある確率分布 µ が存在して µk → µ 定理 23 (Glivenko) ϕk が ϕ∞ に各点収束するなら,µk → µ∞ 4.5. 中心極限定理 83 定理 24 (L´ evy) ϕk が ϕ に各点収束し,原点の近傍で一様収束すればある 確率分布 µ が存在して µk → µ 定理 25 (Bochner) ϕ が (1) ϕ(0) = 0 (2) ϕ は原点で連続 (3) 非負定値,つまり,∀x1 , . . . , xn ∈ R と c1 , . . . , cn ∈ C について n ∑ ci c¯j ϕ(xi − xj ) ≥ 0 i,j=1 ならば,ϕ はある確率分布の特性関数である. 参考 定理 26 (Riesz’s representation theorem) H を Hilbert space,f ∈ H ∗ とするならば,ただ 1 つ x ∈ H が存在して f (u) = (u, x) 定理 27 (中心極限定理) X1 , X2 , . . . は独立同分布で,平均 m,分布 v が存 在するとき, 証明. Yn = Sn − nm √ → N (0, 1) nv Xn √−m v とおく. ϕ(Sn −nm)/√nv (t) = n ∏ √ E[exp(itYj / n)] j=1 √ = E(exp(itY / n))n 一方,テイラー展開をすると √ t2 Y 2 iθY /√n Y exp(itY / n) = 1 + it √ − e 2n n (0 < θ < t) この期待値をとると √ t2 E(Y 2 ) iθY /√n E(exp(itY / n)) = 1 − e 2n これより ϕ(Sn −nm)/√nv (t) = )n ( t2 iθY /√n 1− e 2n であるので,Lebesgue の収束定理よりこれは e−t 2 準正規分布の特性関数なので証明を終わる. /2 に収束する.これは標 84 第5章 5.1 推定,検定 導入 硬貨を n 回投げたとき,表の出る回数を求める.硬貨投げを表す確率変数 X1 , . . . , Xn の期待値は 12 であるから,n 回投げたときの平均は n2 である.し たがって,その頻度の平均は 12 である.大数の法則により,n が十分に大き ければ,頻度は 1 2 に近いと推定される. そこで中心極限定理を用いると P (−2 < X1 + · · · + Xn − n/2 √ < 2) n/4 は概ね 95%とみなせる (より正確には −1.96 から 1.96).これを用いて具体的 な表を作ると 投げた回数 100 10000 1000000 頻度の範囲 0.4 ∼ 0.6 0.49 ∼ 0.51 0.499 ∼ 0.501 表の回数の範囲 40∼60 4900 ∼ 5100 499000 ∼ 501000 頻度の誤差範囲 ±10% ±1% ±0.1% 回数の誤差範囲 ±10 回 ±100 回 ±1000 回 問題 64 サイコロの 1 の目は確率 1 6 で出るとする.95%の 1 の目の出る頻度 の誤差の範囲が ±5% 未満になるには何回以上サイコロを投げる必要がある だろうか. 解. サイコロの 1 の目に対応する確率変数を X1 , X2 , . . . とすると, E(Xi ) = 1 , 6 V (Xi ) = 5 36 中心極限定理より P (−2 < ¯= なので,X X1 +···+Xn n X1 + · · · + Xn − n/6 √ < 2) + 0.95 5n/36 とすると x ¯ − 1/6 P (−2 < √ < 2) + 0.95 5/36n 5.2. 用語 85 したがって √ 5 ¯− <X P (−2 36n √ 5 36 ) + 0.95 求めるものは √ 2 1 6 <2 5 < 0.05 36n である.解くと n ≥ 213 問題 65 値 −1 と 1 をとる確率がそれぞれ 1 2 の公平なギャンブルを考える. 所持金の誤差範囲が ±1000 を超えてしまうのは何回以上ギャンブルをしたと きだろうか. 解. 対応する確率変数を X1 , X2 , . . . とすると,E(Xi ) = 0,V (Xi ) = 1 で あるので,中心極限定理より P (−2 < したがって X1 + · · · + Xn √ < 2) + 0.95 n √ √ P (−2 n < X1 + · · · + Xn < 2 n) + 0.95 求めるものは √ 2 n > 1000 なので,解は n > 250000 5.2 用語 母集団からランダムかつ独立に値を得る確率変数を X1 , X2 , . . .,その結果と して得る標本を x1 , x2 , . . . のように対応する小文字で表すのが習慣である.標本 ¯ = X1 +···+Xn ,対応する標本平均を x ¯ = x1 +···+xn の平均を表す確率変数は X n n 第 5 章 推定,検定 86 で表す.以下も同様なので,標本に対応する値のみを記する. 1∑ (xi − x ¯) (標本分散) n i=1 √ s = s2 (標準偏差) n 1 ∑ sˆ2 = (xi − x ¯) (不偏分散) n − 1 i=1 n s2 = mν = 1∑ (xi − x ¯ )ν n i=1 m′ν = 1∑ ν x n i=1 i n (ν 次の平均のまわりの積率 (モーメント)) n (ν 次の原点のまわりの積率 (モーメント)) m2 = s2 である.とくに m3 /s3 を歪度,m4 /s4 − 3 を尖度という. 標本 x1 , . . . , xn の真ん中の値を中央値 (メディアン) という.ヒストグラム を描いたときもっとも頻度の多い値をモードという. 2 次元の標本,(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) について,x1 , . . . , xn と y1 , . . . , yn の標準偏差を sx ,sy と表すとき 1∑ (xi − x ¯)(yi − y¯) (共分散) n i=1 cov (相関係数) sx sy n cov = r 5.3 5.3.1 = 推定,検定 母集団 統計とは母集団とよばれる集合から得られるデータにより,母集団に固有 な値を推定,検定することである.母集団の平均を母平均,分散を母分散と よぶがこれらは母集団を M = {a1 , . . . , aN },母平均を m,母分散を v で表 すとき m= N 1 ∑ ai , N i=1 v= N 1 ∑ (ai − m)2 N i=1 で与えられる. データを x1 , . . . , xn とするとき,m の推定値として x ¯= 1 n ∑n i=1 xi を用い るのは自然だが,その根拠は何なのだろう. データを得る前に戻ると,1 回目のデータを得る確率変数を X1 などとす るとき,Xi は各 aj を確率 E(Xi ) = 1 N ∑ で取ることになる.すなわち, ji = 1N aj × n 1 1 ∑ = aj = m N N j=1 5.3. 推定,検定 87 ¯ = 1 ∑N Xi であるので,大数の法則 である.x ¯ に対応する確率変数は X i=1 N ¯ → m であるので,データ数が多ければ,X ¯ の実現値である x により,X ¯は m に近いと言えることになる. このことは,母集団というものがはっきりしない確率事象についても,例 えば,硬貨投げの表の出る確率というようなものでも,Xi を表が出れば 1, 裏が出れば 0 という確率変数とすれば E(Xi ) は表の出る確率であるので,母 集団がある場合の推定,検定の理論をこのような例の場合にも使えることに なる. 5.3.2 必要なこと 以下の確率変数は平均 m,分散 v とする.X1 , X2 , . . . について ¯ X = S2 = Sˆ2 = X1 + · · · + Xn n n 1∑ ¯ 2 (Xi − X) n i=1 1 ∑ ¯ 2 (Xi − X) n − 1 i=1 n ¯ は m の不偏推定量,Sˆ2 は v の不偏推定量になる. X ( ) ¯ X−m √ (1) 中心極限定理.X1 , X2 , . . . を独立,同分布とする.P a < <b v/n は標準正規分布が値 (a, b) をとる確率に近づく.例えば ( ) ¯ −m X P −1.96 < √ < 1.96 + 95% v/n (2) X1 , X2 , . . . が正規分布 N(m, v) にしたがうなら, 1∑ ¯ 2 = n S2 (Xi − X) v i=1 v n は自由度 n − 1 の χ2 分布にしたがう. (3) X1 , X2 , . . . が正規分布 N(m, v) にしたがうなら, ¯ −m ¯ −m X X √ =√ S 2 /(n − 1) Sˆ2 /n は自由度 n − 1 の t 分布にしたがう. 第 5 章 推定,検定 88 5.3.3 推定量 母集団からランダムかつ独立に値を取り出す確率変数を X1 , X2 , . . . とする. ˆ 1 , . . . , Xn ) を考える.真 母集団の真の値 θ(例えば母平均) を推定する θˆ = θ(X の値が θ のときの確率変数の密度関数 (または確率分布) を f (x, θ) で表す.こ のとき,θˆ が ˆ = θ をみたすことである. (1) 不偏推定量であるとは E(θ) (2) 有効推定量であるとはクラメル · ラオの不等式 ( ˆ ≥ V (θ) nE ([ ∂ log f (X, θ) ∂θ ]2 )}−1 において,不等号ではなく等号が成立すること. (3) 充足推定量であるとは,X1 , . . . , Xn の密度関数 n ∏ ∏n i=1 f (x, θ) が ˆ 1 , . . . , xn ), θ) × h(x1 , . . . , xn ) f (x, θ) = g(θ(x i=1 と表されることである.ここで,g は θˆ の密度関数であり,h が θ によ らない関数である. (4) 一致推定量であるとは ˆ 1 , . . . , Xn ) = θ lim θ(X n→∞ をみたすことである. 5.3.4 ¯ X f (x, θ) = 2 √1 e−(x−θ) /2 2π のときに有効推定量と充足推定量を考える. ∂ log f (x, θ) ∂ = ∂θ ∂θ より E([ ∂ log f 2 ] )= ∂θ したがって,右辺は ( ) 1 (x − θ)2 − log 2π − =x−θ 2 2 ∫ (x − θ)2 f (x, θ) dx = 1 = X の分散 1 n, ˆ = V ( X1 + · · · + Xn ) = 1 V (θ) n 5.3. 推定,検定 89 で一致する. ∏ f (xi , θ) = (2π)−n/2 exp(− ∑ (x − θ)2 2 ) ∑ 1 ∑ 2 (2π)−n/2 exp[− ( xi − 2θ xi + nθ2 ] 2 1∑ 2 = (2π)−n/2 exp[θθˆ − nθ2 ] × exp[− xi ] 2 = これで充足推定量であることがわかる. 5.3.5 1 n f (x, θ) = ∑ Xi2 2 √ 1 e−x /2θ 2πθ ∂ log f ∂θ ( ) ∂ 1 1 x2 = − log 2π − log θ − ∂θ 2 2 2θ 2 1 x = − + 2 2θ 2θ したがって 上の期待値 )2 ∫ ( 1 x2 − + 2 f (x, θ) dx 2θ 2θ 1 1 1 = − 3 θ + 2 正規分布の 4 次モーメント 2 4θ 2θ 4θ 1 1 1 = − 3θ + 23 2 4θ 2θ 4θ 2θ2 = n = 右辺は V (S 2 ) = = = ∑ 1 E[( Xi2 )2 ] n2 )2 ( 1 n(n − 1) 1 ∑ 2 4 2 2 nE(X ) + (E(X )) − E( Xi ) n2 n2 n 3θ2 n−1 2 2θ2 + θ − θ2 = n n n で一致するので,有効推定量である. ∏ f (xi , θ) = (2π)−n/2 θ−n/2 e− ∑ ˆ x2i /2θ = (2π)−n/2 θ−n/2 e−nθ/2θ なので h ≡ 1 で充足推定量である. 第 5 章 推定,検定 90 5.4 検定方程式 帰無仮説 H0 を θ = θ0 ,対立仮説が H1 を θ = θ1 と 2 つしか値をとらない 場合を考える. 大きさ n の標本 x1 , . . . , xn に対して,帰無仮説の採択域は第 1 種の誤りが 起きる確率が有意水準に等しくなるように選ぶが,その中で最良のものはネ イマン · ピアソンの定理によって与えられる. ∏n { } i=1 f (xi , θ1 ) ∏ Rc = (x1 , . . . , xn ) : n )≥c i=1 f (xi , θ0 ) とおいて,P ((X1 , . . . , Xn ) ∈ Rc |θ = θ0 ) が有意水準に等しくなるように c を 定める.このとき,領域 Rc は有意水準が一定のもとで第 2 種の誤りがもっ とも小さくなる. 検出力とは 1− 第 2 種の誤りが起きる確率である.対立仮説の値 θ1 を動か したときの検出力のグラフを検出力曲線という.θ1 が θ0 から遠ざかれば,通 常は検出力があがって 1 に近づいていく. f (x, θ0 ) = e−x かつ f (x, θ1 ) = 2e−2x のときのネイマン · ペアソンの適用. ∑ ∏ f (xi , θ1 ) 2n e−2 xi ∑ ∏ = f (xi , θ0 ) e− xi ∑ = exp[n log 2 − xi ] Rc = {(x1 , . . . , xn ) : n log 2 − ∑ xi ≥ log c} log c } n ∑ θ = θ0 のもとで指数分布 Exp(1) = Γ(1, 1) より, Xi の分布は Γ(n, 1) であ るので,c は Γ(n, 1) の分布関数が log c2n をとる範囲が有意水準に等しくな るように選べばよい. = {(x1 , . . . , xn ) : x ¯ ≤ log 2 + 5.4.1 最尤法 ∏n 密度関数の最大値によって推定値を定める方法である. i=1 f (xi , θ) を尤 ∑n 度関数,その対数をとった l(x, θ) = i=1 log f (xi , θ) を対数尤度関数という. ここで,x = (x1 , . . . , xn ) である. 最尤法では ∂ l(x, θ) = 0 ∂θ をみたす θˆ を θ の推定値とする. 1 問題 66 f (x, θ) = √2πv e−(x−θ) /2v とする.すなわち,母平均を推定すると ˆ 1 , . . . , xn ) = x き,θ(x ¯ であることを確かめなさい. 2 5.4. 検定方程式 91 解. x = (x1 , . . . , xn ) とする. l(x, θ) = = n ∑ log f (xi , θ) i=1 n ( ∑ 1 (xi − θ)2 − log 2πv − 2 v i=1 = − より ) n n 1 ∑ log 2πv − (xi − θ)2 2 2v i=1 1∑ ∂ l(x, θ) = (xi − θ) ∂θ v i=1 n ∂ ˆ より, ∂θ l(x, θ) = 0 の解は θ(x) =x ¯ である. 1 問題 67 f (x, θ) = √2πθ e−(x−m) /2θ とする.すなわち,母分散を推定すると ∑ ˆ 1 , . . . , xn ) = 1 n (xi − m)2 であることを確かめなさい. き,θ(x 2 n i=1 解. x = (x1 , . . . , xn ) とする. l(x, θ) = = n ∑ i=1 = より log f (xi , θ) i=1 n ( ∑ (xi − m)2 1 − log 2πθ − 2 θ n n n 1 ∑ − log 2π − log θ − (xi − m)2 2 2 2θ i=1 n ∂ n 1 ∑ (xi − m)2 l(x, θ) = − + 2 ∂θ 2θ 2θ i=1 ∂ ˆ より, ∂θ l(x, θ) = 0 の解は θ(x) = 5.4.2 ) 1 n ∑n i=1 (xi − m)2 である. 推定 ˆ 1 , . . . , Xn ) が確率 α でみたす範囲を信頼区間 信頼係数 α のときには,θ(X ˆ 1 , . . . , xn ) という.また,その端点を信頼限界という.標本の値を代入した θ(x が信頼区間に入るであろうと推定するわけである. 第 5 章 推定,検定 92 5.4.3 検定 推定が行えるようにたてる仮説を帰無仮説という.帰無仮説が成り立たな いとする仮説を対立仮説という. 有意水準 β のときには,信頼係数 1 − β の信頼区間に標本の値を代入した ˆ θ(x1 , . . . , xn ) が入っているときには帰無仮説を採択し,入っていないときに は棄却する.信頼区間の取り方によって,両側検定,片側検定がある. 帰無仮説が正しいときに棄却してしまう誤りを第 1 種の誤りという.この 誤りを犯す確率は有意水準になる.それに対して,帰無仮説が誤りなのにも 関わらず採択してしまう誤りを第 2 種の誤りという. 5.4.4 平均の推定,検定 ¯ を母平均 m の推定量とする.データ数が多ければ X ¯ −m X √ v/n を標準正規分布にしたがうとみなす.v が未知の場合には Sˆ2 または S 2 を代 わりに用いる.ベルヌーイ分布,すなわち X = 1 の確率 p,X = 0 の確率 1 − p のときには m = p,v = p(1 − p) であることを用いれば,v を m で表 すことができるので m の推定,検定に用いることができる. 母集団が正規分布にしたがうと仮定できるならば ¯ −m X √ Sˆ2 /n を自由度 n − 1 の t 分布にしたがうことを用いる. 5.4.5 平均値の差の推定,検定 X1 , . . . , Xn と Y1 , . . . , Ym と 2 種類の独立な確率変数があるとする.E(Xi ) = ¯ − Y¯ は平均 m1 − m2 , m1 , V (Xi ) = v1 ,E(Yi ) = m2 , V (Y2 ) = v2 とすると X + vm2 であることを用いる.分散 v1 , v2 が既知ならば,平均の推定,検 定と同様に考えることができる. 未知の場合に t 分布で推定,検定を行うならば,v = v1 = v2 を仮定する. 分散 v1 n このとき, 1∑ n 2 ¯ 2, Sx = (Xi − X) v v i=1 n 1∑ m 2 Sy = (Yi − Y¯ )2 v v i=1 m 5.4. 検定方程式 93 はそれぞれ自由度 n − 1,m − 1 の χ2 分布にしたがうので, nv Sx2 + m 2 v Sy は 自由度 n + m − 2 の χ 分布にしたがう.したがって, 2 nSx2 + mSy2 n+m−2 ¯ − Y¯ は平均 m1 − m2 ,分散 は v の推定量になることと,X v n + v m であるこ とを用いると √ ¯ − Y¯ ) − (m1 − m2 ) (X (1/n + 1/m)(nSx2 + mSy2 )/(n + m − 2) は自由度 n + m − 2 の t 分布にしたがう. これを用いれば平均の差の推定, 検定ができる. 5.4.6 分散の推定,検定 母集団は正規分布 N(m, v) にしたがうと仮定する. 1∑ ¯ 2 = n S2 (Xi − X) v i=1 v n が自由度 n − 1 の χ2 分布にしたがうことを用いる. 5.4.7 分散の比の検定 X1 , . . . , Xn と Y1 , . . . , Ym と 2 種類の独立な確率変数があるとして,それ ぞれ正規分布 N(m1 , v1 ) および N(m2 , v2 ) にしたがうとする. 帰無仮説 v = v1 = v2 とする.このとき 1∑ ¯ 2, (Xi − X) v i=1 n 1∑ (Yi − Y¯ )2 v i=1 m がそれぞれ自由度 n − 1 および m − 1 の χ2 分布にしたがうことから ∑n ¯ 2 /(n − 1) (Xi − X) ∑i=1 m ¯ 2 i=1 (Yi − Y ) /(m − 1) が自由度 (n − 1, m − 1) の F 分布にしたがうことを用いる. 5.4.8 精密法 ポアソン分布の精密法 まず,ポアソン過程 Nt を定義しよう. k (1) t > 0 について,P (Nt = k) = e−λt (λt) k! ,つまり,Nt は Po(λt) にした がう.つまり,平均 λt のポアソン分布にしたがう. 第 5 章 推定,検定 94 (2) 0 < t1 < t2 < · · · のとき,Nt1 , Nt2 − Nt1 , Nt3 − Nt2 , . . . は独立 (3) t > s として,Nt − Ns は Nt−s と同分布,つまり Po(λ(t − s)) にした がう. Tk で t < Tk で Nt = k − 1,t > Tk で Nt = k となる時刻とする. P (T1 ≤ t) = P (Nt ≥ 1) = ∑ e−λt k=1 (λt)k k! = 1 − e−λt より T1 は平均 1 λ の指数分布にしたがう.同様に ∫ P (T2 − T1 ≤ t) ∞ = ∫ 0 ∫ 0 ∞ = ∞ = ∫0 ∞ = ∫ 0 = ∞ P (Nt+s ≥ 2, T1 ∈ ds) P (Nt+s − Ns ≥ 1, Ns+ds ≥ 1, Ns = 0) P (Nt+s − Ns ≥ 1)P (Ns+ds ≥ 1, Ns = 0) P (Nt+s − Ns ≥ 1)e−λs ds P (Nt ≥ 1)e−λs ds = P (Nt ≥ 1) = 1 − e−λt 0 と T2 − T1 も平均 1 λ の指数分布にしたがう.独立性も同様にしたがう. これを用いるとポアソン分布の χ2 分布の関係がでてくる.指数分布 Exp(λt) は Γ(1, λt) であることを用いると Tk = T1 + k ∑ (Ti − Ti−1 ) i=1 は独立な指数分布の和であることと Γ 分布の再生性から Tk は Γ(k, λt) にし たがう. Γ 分布の再生性 Γ(p, a) + Γ(q, a) = Γ(p + q, a) 5.4. 検定方程式 95 それぞれに対応する確率変数を X, Y とし,独立とする.このとき, FX+y (x) = P (X + Y ≤ x) (∫ x−y q ) ∫ x p a a = y p−1 e−ay z q−1 e−az dz dy Γ(q) 0 0 Γ(p) (∫ s ) ∫ x p+q a e−as tq−1 (s − t)p−1 dt ds (s = y + z, t = y) = Γ(p)Γ(q) 0 0 (∫ 1 ) ∫ x p+q a = e−as sp+q−1 rq−1 (1 − r)p−1 dr ds (t = sr) Γ(p)Γ(q) 0 0 ∫ x ap+q −as p+q−1 = e s ds B(p, q) Γ(p)Γ(q) 0 ∫ x ap+q = e−as sp+q−1 ds Γ(p + q) 0 これより P (Nt ≤ k) = 1 − P (Nt > k) = 1 − P (Nt ≥ k + 1) = 1 − P (Tk+1 < t) ∫ t λk+1 xk e−λx dx = 1− Γ(k + 1) 0 である.ここで 2λx = y と変数変換すると ∫ 2λt (1/2)k+1 k −y/2 y e dy Γ(k + 1) 0 ( ) 2(k+1) 1 がでる.右辺の被積分関数は Γ(k + 1, 1/2) = Γ , 2 = 自由度 2(k + 1) 2 上の式 1− = の χ2 分布の密度関数である.つまり平均 λt のポアソン分布が k より小さい 確率は自由度 2(k + 1) の χ2 分布が 2λt 以上である確率と等しいことが示せ た.つまり,平均 λ のポアソン分布の分布関数 Fλ は自由度 2(k + 1) の χ2 分 布の密度関数 f2(k+1) を用いると Fλ (k) = k ∑ i=0 −λ λ e ∫ i i! ∞ = f2(k+1) (x) dx = 1 − F2(k+1) (2λ) (5.1) 2λ とみなせる.ここで F2(k+1) は自由度 2(k + 1) の χ2 分布の分布関数である. これを用いると λ の推定には,データに対応する確率変数を X1 , . . . , Xn と すると,これらは独立なのでポアソン分布の再生性より,X1 + · · · + Xn は 平均 nλ のポアソン分布にしたがう. 第 5 章 推定,検定 96 Poisson 分布の再生性 X は Po(λ),Y は Po(µ) で独立とすると P (X + Y = k) = k ∑ P (X = l) × P (Y = k − l) l=0 = k ∑ e−λ l=0 λl −µ µk−l e l! (k − l)! 1 ∑ l k−l k+l Cl λ µ k! k = e−(λ+µ) l=0 (λ + µ)k = e−λ+µ k! より,X + Y は Po(λ + µ) にしたがう. そこで信頼係数を 5%とすると k = k−1 ∑ −λ λ e i=0 k ∑ i=0 ∞ = i! −λ λ e ∫ i ∑n i=0 xi とするとき, f2k (x) dx = 1 − F2k (2nλ) = 2.5% 2nλ ∫ i ∞ = i! f2(k+1) (x) dx = 1 − F2(k+1) (2nλ) = 97.5% 2nλ をみたす 2 つの λ の間が信頼区間とみなすことができる.すなわち自由度 2k の χ2 分布の 97.5%点を C1 ,自由度 2(k + 1) の χ2 分布の 2.5%点を C2 とす れば C1 ≤ 2nλ ≤ C2 が信頼区間になる. 2 項分布の精密法 k ∑ i n−i n Ci p q i=0 1 = B(k + 1, n − k) ∫ 1−p tn−k−1 (1 − t)k dt 0 より,2 項分布 B(n, p) の分布関数 Fn,p は自由度 (2(k + 1), 2(n − k)) の F 分 布の密度関数 f2(k+1),2(n−k) を用いると Fn,p (k) = k ∑ ∫ i n−i n Ci p q = i=0 = 1 − F2(k+1),2(n−k) ( f(2(k+1),2(n−k) (x) dx (n−k)p/(k+1)q (n − k)p ) (k + 1)q (5.2) と表せる.ここで F2(k+1),2(n−k) は自由度 (2(k + 1), 2(n − k)) の F 分布の分 ∑n 布関数である.したがって,信頼区間 95%の推定を行うならば,k = i=1 xi 5.4. 検定方程式 97 とおいて k−1 ∑ = 1 − F2k,2(n−k+1) ( i n−i n Ci p q = 1 − F2(k+1),2(n−k) ( i=0 k ∑ (n − k + 1)p ) = 2.5% kq i n−i n Ci p q i=0 (n − k)p ) = 97.5% (k + 1)q の間の p が信頼区間になる.ここで上の式の p と q の役割を入れ替えると n−k+1 ∑ n Ci p q = 1 − F2(n−k),2(k+1) ( n−i i i=0 kq ) = 97.5% (n − k + 1)p となる. 自由度 (2(n−k+1), 2k) の F 分布の 2.5%点を C1 ,自由度 (2(k+1), 2(n−k)) の F 分布の 2.5%点を C2 とすると kq (n − k + 1)p 2(n − k)p 2(k + 1)q ≤ C1 ≤ C2 を解いて k C2 (k + 1) ≤p≤ k + C1 (n − k + 1) n − k + C2 (k + 1) が信頼区間になる. 2 項分布の精密法の証明.部分積分により ∫ 1−p 1 tn−k−1 (1 − t)k dt B(k + 1, n − k) 0 [ ]1−p ∫ 1−p 1 1 n−k 1 k n−k = t (1 − t)k − t (1 − t)k−1 dt B(k + 1, n − k) n − k B(k + 1, n − k) n − k 0 0 ∫ 1−p 1 = n Ck pk q n−k − tn−k (1 − t)k−1 dt B(k, n − k + 1) 0 を繰り返せば k ∑ i n−i = n Ci p q i=0 1 B(k + 1, n − k) ∫ 1−p tn−k−1 (1 − t)k dt 0 この右辺で ϕ1 = 2(k + 1),ϕ2 = 2(n − k) とおいて t= ϕ2 ϕ1 F + ϕ2 と変数変換すると, t = 0 ならば F = ∞, t = 1 − p ならば F = ϕ2 p ϕ1 q 第 5 章 推定,検定 98 なので 1 B(k + 1, n − k) ∫ 1 = B(ϕ1 /2, ϕ2 /2) 1−p tn−k−1 (1 − t)k dt 0 ( ∫ ϕ2 p/ϕ1 q ϕ1 ϕ2 )ϕ1 /2 F ϕ1 /2−1 ( )−(ϕ1 +ϕ2 )/2 ϕ1 1+ F dF ϕ2 これは自由度 (ϕ1 , ϕ2 ) の F 分布の密度関数である. 5.5 分散分析他 適合度検定 5.5.1 事象を k 個の互いに素な領域 E1 , . . . , Ek に分けて,標本を n 個選んで Ei ∑k に入る度数を fi とする ( i=1 fi = n). 帰無仮説: P (Ei ) = pi を検定する.まず,前提として npi ≥ 5 をみたすよ うにする.みたされていないときには,複数の Ei をまとめて条件をみたすよ うにする. このとき k ∑ (fi − npi )2 npi i=1 は自由度 k − 1 の χ2 分布にほぼしたがう. k = 2 のときは,f2 = n − f1 より (f1 − np)2 (f2 − nq)2 + np nq (f1 − np)2 (n − f1 − nq)2 + np nq { } 1 1 = (f1 − np)2 + np nq ( )2 f1 − np = √ npq = によって,n が大きくなれば自由度 1 の χ2 分布に近づくことがわかる. 5.5.2 一元配置法 因子が A1 , . . . , Ak があって,各因子から標本を選ぶ.分散 v とする.Ai か らの標本を xi,1 , xi,2 , . . . , xi,ni とする.全体の標本数を n = n1 + · · · + nk とおく. x ¯i = x ¯ = xi,1 + · · · + xi,ni (Ai の平均) ni k ni 1 ∑∑ xi,j (全体の平均) n i=1 j=1 5.6. 回帰分析 99 とおくと SA = k ∑ ni (¯ xi − x ¯)2 を v でわったものは自由度 k − 1 の χ2 分布にしたがう i=1 SE = ni k ∑ ∑ (xi,j − x ¯ i )2 を v でわったものは自由度 n − k の χ2 分布にしたがう i=1 j=1 より SA /(k − 1) SE /(n − k) は自由度 (k − 1, n − k) の F 分布にしたがう. 5.6 回帰分析 2 次元の標本 (x1 , y1 ), . . . , (xn , yn ) が,線形の関係 Y = α + βX + ε をみた しているという仮定の下で,α と β の推定値 a, b を求めるものである.ε は 独立同分布で平均 0 の確率変数である.このとき, n ∑ (yi − a − bxi )2 i=1 を最小にする a, b が推定値とすることから最小 2 乗法とよばれる.連立方程式 n ∑ yi = an + b i=1 n ∑ n ∑ xI i=1 xi y i = a i=1 n ∑ xi + b i=1 n ∑ x2i i=1 を解けばよい. y¯ = a + b¯ x ∑n (x − x ¯)(yi − y¯) i=1 ∑n i b = (x ¯ )2 i=1 i − x sxy sy sxy = = s2x sx sx sy sy = r sx とも表される. 1∑ (yi − (a + bxi ))2 n i=1 n σ ˆ2 = は回帰式により推定した y の値と実際の値との誤差の 2 乗和になる.これは yˆi = a + bxi とおくと n ∑ i=1 (yi − y¯)2 = n ∑ i=1 (ˆ yi − y¯)2 + n ∑ i=1 (yi − yˆi )2 第 5 章 推定,検定 100 をみたすことから σ ˆ 2 = s2y (1 − r2 ) が導ける.さらに,相関係数 ∑n (xi − x ¯)(yi − y¯) r = √∑n i=1 ∑n ¯)2 i=1 (yi − y¯)2 i=1 (xi − x は,相関係数が 0 であるという仮定のもとで, √ r (1 − r2 )/(n − 2) は自由度 n − 2 の t 分布にしたがう. ε が正規分布 N(0, v) にしたがっているとすると √ √ n(n − 2)s2x (n − 2)s2x (α − a) ∑n と (β − b) 2 2 σ ˆ2 ˆ i=1 xi σ は自由度 n − 2 の t 分布にしたがう.これを用いれば回帰係数の推定,検定 が行える. 5.6.1 重回帰分析 例えば,2 つの独立変数をもつときには Z = α + βX + γY + ε の係数を推定するもので, n ∑ (zi − a − bxi − cyi )2 i=1 を最小にする a, b, c が α, β, γ の推定値である.回帰分析と同様に ∑n (ˆ yi − y¯)2 r2 = ∑ni=1 ¯)2 i=1 (yi − y t = = t sxy Σ−1 sxy s2y rxy R−1 rxy の平方根を重相関係数という. 一般の場合,X1 , . . . , Xk で Y を推定する.最小 2 乗法から Σ を分散共分 散行列とすると y − y¯ = (x − x ¯)Σ−1 (sxy ) 5.6. 回帰分析 101 変形すれば,R = Σ/s2x を相関行列とすると x−x ¯ −1 y − y¯ =( )R (rxy ) sy sx ここで Σ= 1t XX n と表せる,ここで x11 − x ¯1 .. X= . ··· .. . x1n − x ¯1 ··· xk1 − x ¯k .. . xkn − x ¯k ⃗ を真の値とするとき 推定値は α, β ⃗ + Σ−1 1 t X⃗ε = β n 1 t ¯ −1 a = α + ε¯ − XΣ X⃗ε n ⃗b このことから,誤差の分散を σ 2 とするとき E(⃗b) = β⃗ 2 V (⃗b) = σn Σ−1 さらに Sˆe2 = E(a) = α 2 ¯ ¯ −1 X) V (a) = σn (1 + t XΣ ∑ 1 (yi − yˆi )2 n−k−1 が不偏分散であることから √ (bj − βj )/ σ 2 (Σ−1 )jj /n √ √ = Sˆe2 (Σ−1 )jj /n Sˆe2 /σ 2 √ ¯ −1 X)/n ¯ (a − α)/ σ 2 (1 + t XΣ a−α √ √ = ¯ −1 X)/n ¯ Sˆe2 (1 + t XΣ Sˆe2 /σ 2 b j − βj は自由度 n − k − 1 の t 分布にしたがうとみなしてよい. 5.6.2 時系列解析 時間 t に依存する確率変数 Yt を考える.Yt が定常であるとは E(Yt ) が定 数であるだけでなく,γt = Cov(Yt , Yt−h ) が h にのみより,t に依存しないこ とである. ρh = Cov(Yt , Yt−h ) V (Yt ) を自己相関という.これも Yt が定常なら t によらない. 第 5 章 推定,検定 102 AR(p) モデル, Auto–Regression Model Yt = ϕ0 + ϕ1 Yt−1 + · · · + ϕp Yt−p + εt をみたす.ここで εt は誤差,すなわち,独立同分布で平均 0 とする. E(Yt ) = µ とおいて整理すれば Yt − µ = ϕ0 + ϕ1 (Yt−1 − µ) + · · · + ϕp (Yt−p − µ) + εt なので,これの平均をとったり,Yt−k − µ をかけて平均をとったりすればユー ルウォーカー方程式 ϕ0 = (1 − (ϕ1 + · · · + ϕp ))µ ρ1 1 ρ1 · · · ρp−1 ϕ1 1 · · · ρp−2 ϕ2 ρ2 ρ1 . = . .. .. .. . . . . . . . . .. ρp ρp−1 ρp−2 · · · 1 ϕp が成り立つ. MA(q) モデル,Moving Average Model Yt = θ0 + εt − θ1 εt−1 − · · · − θq εt−q εt は Yt−1 , Yt−2 , . . . と独立で,εt−1 , εt−2 , . . . は独立同分布,平均 0 ARMA(p, q) モデル ARMA(1,1) モデルは Yt = ϕ1 Yt−1 + εt − θ1 εt−1 5.7 5.7.1 シミュレーション 逆関数法 一様分布 U (0, 1) から得られた乱数から分布関数 F をもつ確率変数のデー タを作る.F が狭義の単調増加とすれば y = F −1 (x) とおけばよい. x1 x2 · · · 値 確率 p1 p2 ··· ならば,[0, p1 ) ならば x1 ,[p1 , p2 ) ならば x2 などととる. 5.7. シミュレーション 103 連続型の場合,例えば指数分布 Exp(λ) ならば y = F (x) = 1 − e−λx なの で,λx = − log(1 − y) つまり,x = − log(1−y) λ ととれる.一様分布では y 以 上が出る確率は 1 − y ,また密度関数 f をもつ確率分布が F (x) 以上の値をと るのは 1 − F (x) なので,y = F (x) ととることで,対応する乱数が得られる. ところで,一様分布は 0 と 1 を入れ替えても同じなので,1 − y を y とし y てもよい.したがって,U (0, 1) のデータに対して, − log を選ぶと Exp(λ) λ を得る. 5.7.2 棄却法 X の密度関数を f ,Y の密度関数を g として,Y のデータが得られている とする.f (y) ≤ cg(y) が常に成り立つならば,X に対応するデータを次の方 法で得ることができる. (1) U (0, 1) に対応するデータを作る. (2) U ≤ f (y)/cg(y) ならば X として Y のデータを選ぶ.さもなければ次 の U (0, 1) のデータを選ぶ. この手順によって,f にしたがう確率変数のデータが得られることは f (Y ) P (Y ≤ x, U ≤ f (Y )/cg(Y )) P (Y ≤ x|U ≤ )= ) cg(Y ) P (U ≤ f (Y )/cg(Y )) ∫x ∫ x f (y)/cg(y) g(y) dy = ∫ = f (y) dy f (y)/cg(y) g(y) dy P (X ≤ x) = によりわかる. Γ(2, 2) を ExP(1) から作る.Γ(2, 2) の密度関数は f (x) = 22 2−1 −2x x e = 4xe−2x Γ(2) なので, f (x) 1 = 4xe−x cg(x) c また,xe−x ≤ 1,したがって,c = 4 e と選べばよい.そこで,まず Exp(1) か らのデータは一様分布 U1 (0, 1) から,Y = − log U1 により作る.もう一つの 独立な一様分布 U2 (0, 1) から, U2 ≤ 4Y e−2Y = −e log U1 elog U1 = −eU1 log U1 4/ee−Y ならば,Y = − log U1 を採用し,さもなければ次に移る. 第 5 章 推定,検定 104 5.7.3 合成法 f (x) = h1 g1 (x) + h2 g(x) (h1 , h2 ≥ 0) で h1 +h2 = 1,g1 , g2 は逆関数法から F1−1 (U1 ) と F2−1 (U1 ) で作る.0 ≤ U2 ≤ h1 ならば,Y = F1−1 (U1 ),h1 ≤ U2 ≤ 1 ならば,Y = F2−1 (U1 ) ととる. このとき P (Y ≤ x) = P (F1−1 (U1 ) ≤ x, 0 ≤ U2 ≤ h1 ) + P (F2−1 (U1 ) ≤ x, h1 ≤ U2 ≤ 1) = P (F1−1 (U1 ) ≤ x)P (U2 ≤ h1 ) + P (F2−1 (U1 ) ≤ x)P (h1 ≤ U2 ≤ 1) ∫ x ∫ x = h1 g1 (y) dy + (1 − h1 ) g2 (y) dy ∫ x = f (y) dy 105 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 .00 0.0000 0.0398 0.0793 0.1179 0.1554 0.1915 0.2257 0.2580 0.2881 0.3159 0.3413 0.3643 0.3849 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.4953 0.4965 0.4974 0.4981 .01 0.0040 0.0438 0.0832 0.1217 0.1591 0.1950 0.2291 0.2611 0.2910 0.3186 0.3438 0.3665 0.3869 0.4049 0.4207 0.4345 0.4463 0.4564 0.4649 0.4719 0.4778 0.4826 0.4864 0.4896 0.4920 0.4940 0.4955 0.4966 0.4975 0.4982 .02 0.0080 0.0478 0.0871 0.1255 0.1628 0.1985 0.2324 0.2642 0.2939 0.3212 0.3461 0.3686 0.3888 0.4066 0.4222 0.4357 0.4474 0.4573 0.4656 0.4726 0.4783 0.4830 0.4868 0.4898 0.4922 0.4941 0.4956 0.4967 0.4976 0.4982 .03 0.0120 0.0517 0.0910 0.1293 0.1664 0.2019 0.2357 0.2673 0.2967 0.3238 0.3485 0.3708 0.3907 0.4082 0.4236 0.4370 0.4484 0.4582 0.4664 0.4732 0.4788 0.4834 0.4871 0.4901 0.4925 0.4943 0.4957 0.4968 0.4977 0.4983 .04 0.0160 0.0557 0.0948 0.1331 0.1700 0.2054 0.2389 0.2704 0.2995 0.3264 0.3508 0.3729 0.3925 0.4099 0.4251 0.4382 0.4495 0.4591 0.4671 0.4738 0.4793 0.4838 0.4875 0.4904 0.4927 0.4945 0.4959 0.4969 0.4977 0.4984 .05 0.0199 0.0596 0.0987 0.1368 0.1736 0.2088 0.2422 0.2734 0.3023 0.3289 0.3531 0.3749 0.3944 0.4115 0.4265 0.4394 0.4505 0.4599 0.4678 0.4744 0.4798 0.4842 0.4878 0.4906 0.4929 0.4946 0.4960 0.4970 0.4978 0.4984 .06 0.0239 0.0636 0.1026 0.1406 0.1772 0.2123 0.2454 0.2764 0.3051 0.3315 0.3554 0.3770 0.3962 0.4131 0.4279 0.4406 0.4515 0.4608 0.4686 0.4750 0.4803 0.4846 0.4881 0.4909 0.4931 0.4948 0.4961 0.4971 0.4979 0.4985 .07 0.0279 0.0675 0.1064 0.1443 0.1808 0.2157 0.2486 0.2794 0.3078 0.3340 0.3577 0.3790 0.3980 0.4147 0.4292 0.4418 0.4525 0.4616 0.4693 0.4756 0.4808 0.4850 0.4884 0.4911 0.4932 0.4949 0.4962 0.4972 0.4979 0.4985 .08 0.0319 0.0714 0.1103 0.1480 0.1844 0.2190 0.2517 0.2823 0.3106 0.3365 0.3599 0.3810 0.3997 0.4162 0.4306 0.4429 0.4535 0.4625 0.4699 0.4761 0.4812 0.4854 0.4887 0.4913 0.4934 0.4951 0.4963 0.4973 0.4980 0.4986 .09 0.0359 0.0754 0.1141 0.1517 0.1879 0.2224 0.2549 0.2852 0.3133 0.3389 0.3621 0.3830 0.4015 0.4177 0.4319 0.4441 0.4545 0.4633 0.4706 0.4767 0.4817 0.4857 0.4890 0.4916 0.4936 0.4952 0.4964 0.4974 0.4981 0.4986 106 χ2 t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 16 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞ 0.05 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.671 1.658 1.645 0.025 12.71 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.000 1.980 1.960 0.01 31.82 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.390 2.358 2.326 0.005 63.66 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.660 2.617 2.576 0.995 0.975 0.05 0.025 0.01 0.005 1 0.00004 0.0010 3.841 5.024 6.635 7.879 2 0.01003 0.0506 5.991 7.378 9.210 10.60 3 0.072 0.216 7.815 9.348 11.34 12.84 4 0.207 0.484 9.488 11.14 13.28 14.86 5 0.412 0.831 11.07 12.83 15.09 16.75 6 0.676 1.237 12.59 14.45 16.81 18.55 7 0.989 1.690 14.07 16.01 18.48 20.28 8 1.344 2.180 15.51 17.53 20.09 21.95 9 1.735 2.700 16.92 19.02 21.67 23.59 10 2.156 3.247 18.31 20.48 23.21 25.19 11 2.603 3.816 19.68 21.92 24.72 26.76 12 3.074 4.404 21.03 23.34 26.22 28.30 13 3.565 5.009 22.36 24.74 27.69 29.82 14 4.075 5.629 23.68 26.12 29.14 31.32 15 4.601 6.262 25.00 27.49 30.58 32.80 16 5.142 6.908 26.30 28.85 32.00 34.27 5.697 7.564 27.59 30.19 33.41 35.72 17 18 6.265 8.231 28.87 31.53 34.81 37.16 19 6.844 8.907 30.14 32.85 36.19 38.58 20 7.434 9.591 31.41 34.17 37.57 40.00 8.034 10.28 32.67 35.48 38.93 41.40 21 22 8.643 10.98 33.92 36.78 40.29 42.80 23 9.260 11.69 35.17 38.08 41.64 44.18 24 9.886 12.40 36.42 39.36 42.98 45.56 25 10.52 13.12 37.65 40.65 44.31 46.93 26 11.16 13.84 38.89 41.92 45.64 48.29 27 11.81 14.57 40.11 43.19 46.96 49.64 12.46 15.31 41.34 44.46 48.28 50.99 28 29 13.12 16.05 42.56 45.72 49.59 52.34 30 13.79 16.79 43.77 46.98 50.89 53.67 40 20.71 24.43 55.76 59.34 63.69 66.77 60 35.53 40.48 79.08 83.30 88.38 91.95 80 51.17 57.15 101.9 106.6 112.3 116.3 100 67.33 74.22 124.3 129.6 135.8 140.2 107 F5% 1 2 3 m 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 161.4 18.51 10.13 7.709 6.608 5.987 5.591 5.318 5.117 4.965 4.844 4.747 4.667 4.600 4.543 4.494 4.451 4.414 4.381 4.351 4.325 4.301 4.279 4.260 4.242 4.225 4.210 4.196 4.183 4.171 2 199.5 19.00 9.552 6.944 5.786 5.143 4.737 4.459 4.256 4.103 3.982 3.885 3.806 3.739 3.682 3.634 3.592 3.555 3.522 3.493 3.467 3.443 3.422 3.403 3.385 3.369 3.354 3.340 3.328 3.316 3 215.7 19.16 9.277 6.591 5.409 4.757 4.347 4.066 3.863 3.708 3.587 3.490 3.411 3.344 3.287 3.239 3.197 3.160 3.127 3.098 3.072 3.049 3.028 3.009 2.991 2.975 2.960 2.947 2.934 2.922 n 4 5 224.6 230.2 19.25 19.30 9.117 9.013 6.388 6.256 5.192 5.050 4.534 4.387 4.120 3.972 3.838 3.687 3.633 3.482 3.478 3.326 3.357 3.204 3.259 3.106 3.179 3.025 3.112 2.958 3.056 2.901 3.007 2.852 2.965 2.810 2.928 2.773 2.895 2.740 2.866 2.711 2.840 2.685 2.817 2.661 2.796 2.640 2.776 2.621 2.759 2.603 2.743 2.587 2.728 2.572 2.714 2.558 2.701 2.545 2.690 2.534 6 234.0 19.33 8.941 6.163 4.950 4.284 3.866 3.581 3.374 3.217 3.095 2.996 2.915 2.848 2.790 2.741 2.699 2.661 2.628 2.599 2.573 2.549 2.528 2.508 2.490 2.474 2.459 2.445 2.432 2.421 7 236.8 19.35 8.887 6.094 4.876 4.207 3.787 3.500 3.293 3.135 3.012 2.913 2.832 2.764 2.707 2.657 2.614 2.577 2.544 2.514 2.488 2.464 2.442 2.423 2.405 2.388 2.373 2.359 2.346 2.334 8 238.9 19.37 8.845 6.041 4.818 4.147 3.726 3.438 3.230 3.072 2.948 2.849 2.767 2.699 2.641 2.591 2.548 2.510 2.477 2.447 2.420 2.397 2.375 2.355 2.337 2.321 2.305 2.291 2.278 2.266 9 240.5 19.38 8.812 5.999 4.772 4.099 3.677 3.388 3.179 3.020 2.896 2.796 2.714 2.646 2.588 2.538 2.494 2.456 2.423 2.393 2.366 2.342 2.320 2.300 2.282 2.265 2.250 2.236 2.223 2.211 10 241.9 19.40 8.786 5.964 4.735 4.060 3.637 3.347 3.137 2.978 2.854 2.753 2.671 2.602 2.544 2.494 2.450 2.412 2.378 2.348 2.321 2.297 2.275 2.255 2.236 2.220 2.204 2.190 2.177 2.165 108 第6章 その他 ジニ係数 6.1 ジニ係数は、イタリアの数理統計学者のコッラド・ジニ(Corrado Gini)が 1936 年に考案した統計学の概念です。 ジニ係数は、統計データさえあれば簡単に計算できるために、所得格差 などを分析するさいにはよく使われる指標です。 ジニ係数は0と1の間の数値となりますが、数値が大きければ大きいほ ど(1にちかいほど)格差が大きく、数値が小さいほど(0に近いほど)、格 差が小さいことを表しています。たとえば、ジニ係数が0・2 63 から0・5 74に上昇したら、格差が拡大したことを意味します。 ジニ係数の便利な点は、所得の分配や格差の実態を一個の数値に凝縮し て示せること、したがって、ジニ係数を比較して、格差の程度を比較するこ とができることです。 しかし、ジニ係数の計算は、二重、三重に量的な平均化を積み重ねて一 個の数値を算出しますから、その格差がどのような質的意味をもっているの か、その格差の原因については、なにも語らないという限界をもっています。 また、ジニ係数を算出するもとになる統計(「家計調査」など)の標本 (データ)それ自体が、今日の所得格差の実態を正確に表しているかどうか、 という問題もあります。 ジニ係数の算出方法は、次の手順をふんで計算すれば、それほど複雑で はありません。 (1) 対象となる集団に含まれるすべての数値間の差の絶対値を合計して、 平均する(これを「平均差」という)。 (2) 全体の平均値を計算する。 (3) 平均差を全体の平均値の2倍で割る(2倍で割るのは、ジニ係数を0と 1の間に収めるため)。この結果がジニ係数です。 たとえば(245 万円、362 万円、826 万円)のジニ係数は次のようになり ます。 6.1. ジニ係数 109 (1) 差の絶対値の平均差 |245 − 362| + |245 − 826| + |362 − 245| + |362 − 826| + |826 − 245| + |826 − 362| 6 2324 = = 387.3 6 (2) 平均差 245 + 362 + 826 1433 = = 477.7 3 3 (3) ジニ係数 387.3 = 0.4054 477.7 × 2 (akahata/aik4/2006-12-28/20061228faq12 01 0.html から引用)
© Copyright 2025