プリント - blade

応用統計学
原 信一郎
http://blade.nagaokaut.ac.jp/~hara/class/applied-statistics/
平成 26 年 7 月 31 日
3
第 1 章 序章
テーマ
現象の起こる確率について
高度な「計量」をすること。
[問題](1) と (2) にはどのぐらい「差」があるか?
(1) サイコロを 10 回振って 1 回しか 1 が出なかった。
(2) サイコロを 100 回振って 10 回しか 1 が出なかった。
(memo)
例1
(1) n = 10, p = 16 , q = 56 , x = 1 で、( 56 )10 + 10 C1 ( 56 )9 ·
1
6
= 0.4845.
(2) n = 100, p = 16 , q = 56 , x = 10 で、
( 56 )100 + 100 C1 · ( 65 )99 ·
1
6
+ · · · + 100 C10 · ( 56 )90 · ( 16 )10 = 0.0427
この計算を正規分布で近似する方法で計算すると、 √
10−100×1/6
一般にサイズが k 倍になれば、対応点は
√
k 倍になる。
k倍
−−→
100×1/6×5/6
表
0.5−x
= −1.7889 −→ 0.4633 −−−−→ 0.0367
5
第 2 章 順列と組み合わせ
§1
順列
定義 1
n Pr
· · · 異なる n 個の中から r 個を取って並べた順列の総数。
n Pr
例題 1
= n · (n − 1) · · · (n − r + 1) =
n!
.
(n − r)!
(1) アルファベット a, b, c, d, e, f, g から 1 文字ずつ 5 文字並べる通り数は幾つか。
(2) 上で 7 文字全て取り、abc と並ぶ通り数は幾つか。
§2
組合せ
例題 2 1,2,3,4,5 から 3 個取りだした組合せの数は?
定義 2
· · · 異なる n 個の中から r 個を取った組合せの総数。
n Cr
n Cr
n Cr
を
(n)
r
=
n · (n − 1) · · · (n − r + 1)
n!
=
.
r(r − 1) · · · 2 · 1
r!(n − r)!
とも書き 2 項係数と呼ぶ。
練習問題 1 10 個の点から作られる三角形の (最大) 個数は?
定理 2.1
(1)
n Cr
=
n Pr
r!
.
(2)
n Cr
= n Cn−r .
(3)
n Cr
= n−1 Cr + n−1 Cr−1 .
(4) r · n Cr = n · n−1 Cr−1
§3
2 項定理
定理 3.1 (2 項定理)
(a + b)n = n C0 an + n C1 an−1 b + · · · + n Cn−1 abn−1 + n Cn bn .
系 3.2 (1 + x)n = n C0 + n C1 x + · · · + n Cn−1 xn−1 + n Cn xn .
系 3.3
(2)
(1)
n C0
n C0
+ n C1 + · · · + n Cn−1 + n Cn = 2n .
− n C1 + · · · + (−1)n−1 n Cn−1 + (−1)n n Cn = 0.
(3) n が奇数のとき、n C0 + n C2 + · · · + n Cn−1 = n C1 + n C3 + · · · + n Cn = 2n−1 .
トピック…パスカルの三角形、パチンコ
第2章
6
§4
順列と組み合わせ
多項定理
例題 3 a,a,a,b,b,c,c の並べ方は何通りあるか?
定義 3 n 個のもののうち a が p 個、b が q 個、c が r 個、d が s 個…あり、これらの並べ方の通り数を (p, q, r, s, · · · )
と書き、多項係数と言う。
定理 4.1 (p, q, r, s, · · · ) =
(p + q + r + s + · · · )!
p! q! r! s! · · ·
例題 4 tomorrow の並べ替え方は何通り?
定理 4.2 (多項定理)
(a + b + c + d + · · · )n の ap bq cr ds · · · の係数は (p, q, r, s, · · · ) である。
この定理から、(p, q, r, s, · · · ) を多項係数と呼ぶことがある。とがある。2 項係数は、多項係数の一種であり、n Cr
は (r, n − r) と書くことができる。
例題 5 (x + y + z)6 の x3 y 2 z の係数は何か?
7
第 3 章 確率
§1
確率
1.1
試行と事象
試行
···
同じ条件の下で繰り返し実験や観察を行うこと
事象
···
観察で得られた結果
Ω={
例2
,
,
,
,
{ 偶数の目 } = {
,
{
}, {
}, {
{
,
}, {
}, {
,
,
,
}
,
「あり得る全て」という事象 = 標本空間
}
}, {
事象 (の例)
}, {
}
}, · · ·
これ以上分割できない事象 = 根源事象
根源事象の幾つかの合併 = 複合事象
例 3 2 枚の硬貨を同時に投げるという試行の例、
(表, 裏), (表, 表), (裏, 裏), (裏, 裏), (表, 裏), · · ·
定義 4 (身も蓋もない抽象的な定義)
(1) 標本空間 Ω とは集合のことである。
(2) 事象 A とは Ω の部分集合のことである。
Ω
A
(注) つまり、A が事象であることは、Ω の要素であること「A ∈ Ω」ではなくて、部分集合であること「A ⊂ Ω」である。
記法 1
(1) x が X の要素であることを x ∈ X と書く。
(2) x が X の要素でないことを x ̸∈ X と書く。
(3) Y が X の部分集合であることを Y ⊂ X と書く (Y = X は許される)。
(4) 集合 X の部分集合全体を P(X) あるいは 2X と書き、X のべき集合という。
(注)A ⊂ X ⇐⇒ A ∈ 2X .
例 4 2{1,2,3} = {ϕ, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}
全事象 · · · Ω そのもののこと
空事象 · · · ϕ のこと
次の例は極めて重要である。今後この例を元に様々な確率論的考え方を発展させていく。
例 5 A 君が 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。この時、
(1) 標本空間は、Ω = { 表, 裏 } である。
第3章
8
確率
(2) 事象は、{}, { 表 }, { 裏 }, { 表, 裏 } の 4 つある。
例 6 サイコロを 1 回だけ投げ、上になった面を読み取る。この時、
(1) 標本空間は、Ω = {
(2) 事象は、{}, {
,
,
}, {
,
,
}, · · · , {
,
} である。
}, · · · , {
,
,
,
}, · · · の 26 個ある。
例 7 白黒 2 つのサイコロを 1 回だけ投げ、上になった面をそれぞれ読み取る。この時、
(1) 標本空間は、Ω = {
(2) 事象は、{}, {
と、236 個ある。
§2
,
, ··· ,
,
}, {
}, {
} である。要素の数は 36。
}, · · · , {
}, {
,
}, · · · , {
,
,
}, · · ·
確率の考え方
記法 2 |A| で集合 A の要素の数を表す。
|A|
. (各根源事象が等確率である場合)
|Ω|
A が起こった回数
P(A) = limn→∞
.
n
定義 5 数学的確率
統計的確率
P(A) =
「確率論」は数学的確率のみを扱う。数学的確率は、まず最初に確率の仮定があって、それを元に別の確率を求める。
1
例えば、
「コインの表が出る確率を とする。2枚のコインが両方共表である確率はいくらか?」という具合である。こ
2
1
のとき、「コインの表が出る確率は本当に か?」とは問わない。
2
すなわち、数学的確率の問題とは、ある確率から別の確率を求める、という問題である。
樹形図
2.1
(授業では省略)
多くの場合、事象に含まれる要素の個数を数えることが確率を求めることに繋がるが、他の代表的な確率の計算のテ
クニックとして
(1) 入れ子式分割表、樹形図
(2) がある。
(問) コインを 4 回投げ、2 回表が出れば勝ちとする。勝つ確率を求めよ。
(解) 樹形図で考える:
1/2 × 1/2
1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2 × 1/2
1
2
×
1
2
+
(1
2
×
1
2
×
1
2
)
×2+
(1
2
×
1
2
×
1
2
×
1
2
)
×3=
13
16 .
3. 確率とは
§3
9
確率とは
結局、各根源事象が等確率であるという仮定のもとで、
P(A) =
|A|
.
|Ω|
これだけ。
次の例は極めて重要である。
例 8 A 君が 1 枚の硬貨を 1 回だけ投げる上になった面を読み取る。この時、
(1) 標本空間は、Ω = { 表, 裏 } である。
(2) 事象は、{}, { 表 }, { 裏 }, { 表, 裏 } の 4 つある。
(3) P(ϕ) = 0
(4) P({ 表 }) = P({ 裏 }) =
1
2
(5) P({ 表, 裏 }) = 1
例 9 サイコロを 1 回だけ投げ、上になった面を読み取る。この時、
(1) 標本空間は、Ω = {
,
,
(2) 事象 A について、P(A) =
,
,
,
} である。
|A|
である。
6
例 10 白黒 2 つのサイコロを 1 回だけ投げ、上になった面をそれぞれ読み取る。この時、
(1) 標本空間は、Ω = {
,
(2) 事象 A について、P(A) =
§4
,
, ··· ,
} である。要素の数は 36。
|A|
である。
36
基礎問題
【問題 A】サイコロを振る。出る目が偶数である確率はいくつか?
3
【解答 A】 .
6
【問題 B】財布からコインを 2 枚を取り出し机においた。表裏それぞれ 1 枚ずつ出る確率はいくつか。
2
【解答 B】あり得る場合は、表表、裏裏、表裏、裏表の 4 通りなので、 。
4
1
【解答 B’】あり得る場合は、表表、裏裏、表裏の 3 通りなので、 。
3
【問題 C】袋の中に、白い球が 3 個、黒い球が 2 個合計 5 個ある。ここから 3 つ取り出した時、その中に白い玉が 3
つとも入っている確率は?
【解答 C】5 つの球から 3 つ取る組合せは 5 C3 通り。これは全て等確率で起こる。また、白い球を 3 つ取る組合せは
3 C3
。
3 C3 通り。よって、求める確率は、
5 C3
【解答 C’】5 つの球から 3 つ取って一列に並べる順列の数は 5 P3 通り。これは全て等確率で起こる。また、白い球を
3 P3
。
3 つ取る順列は 3 P3 通り。よって、求める確率は、
5 P3
【解答 C”】5 つの球全てを取り出し一列に並べる方法が 5! 通り。これは全て等確率で起こる。このうち左から 3 つを
袋から取り出したと考え、残りの 2 つは実はまだ袋に入ったままだと「思う」。左に 3 つ白い球を置く方法は 3 C3 通り
3! × 2!
で、その後に黒い玉を置く方法は 2! 通り。よって、求める確率は、
。
5!
第3章
10
§5
確率
丁と半
サイコロを2つ投げる丁 (出た目の和が偶数) である確率と半 (出た目の和が奇数) である確率は等しい。その理由は、
【問題 D】出ための和が 3 で割り切れる確率は?
§6
集合の演算
確率の話を進める前に、集合に関する言葉をまとめておく。
Ω
• 積事象 · · · A ∩ B
B
A
B
Ω
• 和事象 · · · A ∪ B
• 余事象 · · · A
A
Ω
A
B
• 差事象 · · · A − B = A ∩ B
定義 6 A と B が背反 ⇐⇒ A ∩ B = ϕ.
命題 6.1
(1) A ∪ ϕ = A, A ∩ ϕ = ϕ.
(2) A ∪ Ω = Ω, A ∩ Ω = A.
(3) A ∪ A = Ω, A ∩ A = ϕ.
Ω
A
B
7. 確率の基本的性質
11
(4) 分配法則.
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
(5) ド・モルガンの法則.
A ∩ B = A ∪ B,
A ∪ B = A ∩ B.
(1) |A ∪ B| = |A| + |B| − |A ∩ B|
例 11
(包除原理).
Ω
A
B
(2) |2X | = 2|X| .
(例)
|2{1,2,3} | = |{ϕ, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}| = 8,
2|{1,2,3}| = 23 .
§7
確率の基本的性質
定義 7 写像 P : { 事象 } → { 実数 } は、以下の性質を満たすとき Ω 上の確率であるという。
(1) P(A) = 0.
(2) P(Ω) = 1.
(3) A1 , A2 , · · · が互いに排反事象 =⇒ P(A1 ∪ A2 ∪ · · · ) = P(A1 ) + P(A2 ) + · · · .
定理 7.1
(1) P(ϕ) = 0.
(2) P(A) = 1 − P(A).
(3) 0 5 P(A) 5 1.
(4) A ⊂ B =⇒ P(A) 5 P(B).
(5) P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
(確率の加法定理).
[証明] (5) だけ。
P(A ∪ B) + P(A ∩ B) = P(A ∪ (B − A ∩ B)) + P(A ∩ B)
= P(A) + P(B − A ∩ B) + P(A ∩ B)
= P(A) + P((B − A ∩ B) ∪ (A ∩ B))
= P(A) + P(B).
例題 6 52 枚からなるトランプから 1 枚引いたとき、それが、スペードあるいは絵札である確率を求めなさい。
注 1 ここで教科書 p.25 例 2.3 を見る。これはこれまでの「数学的確率」のフォーマットに乗っかっていないようにみえ
るが…
第3章
12
§8
条件付き確率と事象の独立
定義 8 A, B ⊂ Ω を事象とするとき、
P(B|A) =「A を全事象としたとき、B に属する確率」
と定義する。すなわち、
P(B|A) =「A が起こったとして B が起こる確率」
である。
注 2 P(B|A) を PA (B) とも書く。
特に、根源事象が等確率ならば、
P(B|A) =
|B ∩ A|
|A|
である。
定理 8.1 (確率の乗法定理)
P(B ∩ A) = P(A) · P(B|A).
[証明] 意味を考えれば当たり前だが、根源事象が等確率の場合は、
P(B ∩ A) =
|A ∩ B|
,
|Ω|
P(A) =
|A|
,
|Ω|
P(B|A) =
|B ∩ A|
|A|
より分かる。
系 8.2 条件付き確率の公式
P(B|A) =
P(B ∩ A)
P(A)
例題 7 サイコロを振って、出た目が黒 (1 以外) であった。出た目が奇数である確率は幾つか?
定理 8.3 P(B) は 0 でも 1 でもないとするとき、以下は同値。
(1) P(A ∩ B) = P(A)P(B)
(2) P(A|B) = P(A)
(3) P(A|B) = P(A)
(4) P(A|B) = P(A|B)
[証明]
P(A ∩ B) − P(A)P(B) = P(A|B)P(B) − P(A)P(B)
= (P(A|B) − P(A))P(B).
よって、(1) ⇐⇒ (2)。
P(A|B) − P(A) = P(A|B) − (P(A ∩ B) + P(A ∩ B))
= P(A|B) − (P(A|B)P(B) + P(A|B)P(B))
= P(A|B)(1 − P(B)) − P(A|B)P(B)
= P(A|B)P(B) − P(A|B)P(B)
= (P(A|B) − P(A|B))P(B).
確率
9. ベイズの定理
13
よって、(2) ⇐⇒ (4)。
この等式の B と B を入れ替えて、P(A|B) − P(A) = (P(A|B) − P(A|B))P(B)。よって、(3) ⇐⇒ (4)。
定義 9 (事象の独立性) 上の定理の (1) が成り立つ時、事象 A と B は (P に関して) 独立であるという。
例 12 一つのサイコロを一回投げるとき
Ω={
A={
,
,
,
,
,
}
,
,
}で
B
P(A)
P(B)
P(A ∩ B)
P(B|A)
独立性
目は偶数
目は 2
目は 5 以下
目は偶数
目は 4 以下
1
6
5
6
4
6
1
6
2
6
2
6
1
3
2
3
2
3
×
目は偶数
1
2
1
2
1
2
A
×
○
例題 8 2つの事象 A と B が背反であるとき、ほとんどの場合独立でない。何故か?
例題 9 (白白、白黒、黒黒のカードの問題) 表裏が、白白、白黒、黒黒である 3 枚のカードから、1 枚取って、机の上に
置いた。このとき表が白であったとする。裏も白である確率を求めなさい。
例 13 (モンティー・ホール問題) あるテレビ番組の話。ゲストは、3 つのドアを見せられる。ドアの 1 つの後ろにはゲ
ストが獲得できる車があり、一方、他の 2 つのドアにはヤギがいる(ハズレ)。ゲストは、それぞれのドアの後ろに何が
あるか知らないが、モンティ(司会) は知っている。
ゲストが 1 回目のドアの選択をした後、モンティは他の 2 つのドアのうちヤギが居る方を開けて見せる。更にゲスト
に、初めの選択のままでよいか、もう一方の閉じているドアに変更するか 2 回目の選択をさせる。ゲストは、ドアを変
更すべきだろうか?
§9
ベイズの定理
(参考)
定理 9.1 (ベイズの定理)
P(B|A) =
(P(A), P(B), P(A|B), P(A|B) から P(B|A) を求める定理)
P(B)P(A|B)
P(B)P(A|B) + P(B)P(A|B)
[証明] 分子 = P(B ∩ A), 分母 = P(B ∩ A) + P(B ∩ A) = P((B ∩ A) ∪ (B ∩ A)) = P((B ∪ B) ∩ A) = P(A) なので。
第3章
14
確率
1
例 14 ある人の受け取るすべてのメールのうち は広告メールである。メール本文に money という単語が入る確率は,
3
1
1
広告メールでは
,広告でないメールでは
である。あるメールに money という単語が入っていたとするとき、こ
10
100
のメールが広告メールである確率を求めよ。
(解)A =「money が含まれている」, B =「広告メールである」とすると求める確率は、
1
· 1
P(B)P(A|B)
5
P(B|A) =
= 1 1 3 10
2
1 = 6。
·
+
·
P(B)P(A|B) + P(B)P(A|B)
3 10
3 100
この文脈で P(A) を事後確率、P(B) を事前確率と呼ぶ。
15
第 4 章 確率変数
§1
確率変数と確率分布
定義 10 標本空間から R(実数) への関数
X:Ω→R
を確率変数という。(うるさく言えば X −1 ([a, b]) が必ず可測であること。)
注 3 つまり確率変数は関数である。
注 4 確率 P : 2Ω → R と対比せよ。
確率と確率変数の違いを表す図式
サイコロを 1 回投げ、確率変数 X = (目の数)2 − 3(目の数) を計算する:
標本空間Ω
= {1, 2, 3, 4, 5, 6}
事象 A
= {2, 4}
事象 B
= {1, 2, 3}
事象 C
= {6}
Ω
X
C
P
A
6
18
5
10
4
4
3
B 1
0 1/6 1/3 1/2
定義 11
R
0
2
-2
1
(1) P(X = x) = P(X = x となる事象) と定義する。すなわち、
P(X = x) = P(X −1 (x))
これを「X = x となる確率」という。
(2) 一般に P(X に関する条件) = P(X がその条件を満たす x 全体) と定義し、これを、「X がその条件を満たす確率」
という。(例) P(a 5 X 5 b)。
第 4 章 確率変数
16
注 5 X −1 (x) = {ω ∈ Ω | X(ω) = x}.
注 6 PX (B) = P(X −1 (B)), B ⊂ R とおくと、これは、R 上の確率を与える。これを確率変数 X の「確率法則」と呼ぶ。
定義 12
(1) x の関数 P(X = x) を確率変数 X の確率分布という。
(2) F(x) = P(X 5 x) を X の分布関数という。
注 7 つまり、分布関数 F(x) とは、確率変数が x 以下である確率。
例 15 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
この時 A 君の払う金額 X 万円を確率変数として捉えるとき、X の確率分布の表を作れ。
[解] 標本空間は、Ω = { 表, 裏 } であり、確率は P({ 表 }) = P({ 裏 }) = 21 で決定される。
また、X は、次で与えられる。
ω
表
裏
X(ω)
1
0
従って、X の確率分布と分布関数は次のようになる。
x
0
1
x
0
1
P(X = x)
1
2
1
2
F(x)
1
2
2
2
例 16 1 つのサイコロを振って出た目を a としたとき、X = a、とする。このとき、
標本空間: Ω = {
確率: P({
,
}) = P({
,
,
}) = P({
,
}
,
}) = P({
}) = P({
}) = P({
}) =
であり、確率変数 X の定義は以下の通り:
ω
X(ω)
1
2
3
4
5
6
表 4.1: X の定義
X の確率分布は以下の通り:
x
1
2
3
4
5
6
P(X = x)
1
6
1
6
1
6
1
6
1
6
1
6
表 4.2: X の確率分布
X の分布関数は以下の通り:
x
F(x)
···
1
2
3
4
5
6
···
0
1
6
2
6
3
6
4
6
5
6
6
6
6
6
表 4.3: X の確率分布関数
1
6
1. 確率変数と確率分布
17
次の例は重要で、今後何度も引用する。
例 17 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
B 君は、裏が出れば 1 万円払い、表が出れば払わない。
この時 A 君の払う金額を X 万円、B 君の払う金額を Y 万円として、確率変数として捉えるとき、X, Y の確率分布の
表を作れ。
[解] 標本空間は、Ω = { 表, 裏 } であり、確率は P({ 表 }) = P({ 裏 }) =
1
2
で決定される。
また、X, Y は、次で与えられる。
ω
表
裏
ω
表
裏
X(ω)
1
0
Y (ω)
0
1
従って、X, Y の確率分布は次のようになる。
x
0
1
x
0
1
P(X = x)
1
2
1
2
P(Y = x)
1
2
1
2
注 8 上の例に見るように、X, Y の確率分布は同等である。一般に確率分布や分布関数だけからもとの確率変数を復元
できない。
例 18 白黒 2 つのサイコロを振って出た目を a, b としたとき、X = a + b とする。このとき · · ·
たとえば、
を (3, 2) などと書くことにする。標本空間は次のように整理して書ける。
a\b
1
2
3
4
5
6
1
(1, 1)
(1, 2)
(1, 3)
(1, 4)
(1, 5)
(1, 6)
2
3
4
(2, 1)
(3, 1)
(4, 1)
(2, 2)
(3, 2)
(4, 2)
(2, 3)
(3, 3)
(4, 3)
(2, 4)
(3, 4)
(4, 4)
(2, 5)
(3, 5)
(4, 5)
(2, 6)
(3, 6)
(4, 6)
5
6
(5, 1)
(6, 1)
(5, 2)
(6, 2)
(5, 3)
(6, 3)
(5, 4)
(6, 4)
(5, 5)
(6, 5)
(5, 6)
(6, 6)
表 4.4: 標本空間 Ω
それぞれの ω = (i, j) に対して X(ω) = i + j を与える対応が次の確率変数 X である。
a\b
1
2
3
4
5
6
1
2
2
3
3
4
4
5
5
6
6
7
7
8
3
4
5
4
5
6
5
6
7
6
7
8
7
8
9
8
9
10
9
10
11
6
7
8
9
10
11
12
表 4.5: 確率変数 X の表
X の確率分布と分布関数は次のように与えられる。
x
2
3
4
5
6
7
8
9
10
11
12
P(X = x)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
表 4.6: X の確率分布
例題 10 例 18 で、P(4 < X 5 8) は?
第 4 章 確率変数
18
x
···
2
3
4
5
6
7
8
9
10
11
12
···
0
1
36
3
36
6
36
10
36
15
36
21
36
26
36
30
36
33
36
35
36
36
36
36
36
F(x)
表 4.7: X の確率分布関数
例 19 定数関数 X = c の確率分布は、確率がどのように与えられたとしても、

1 x = c
P(X = x) =
0 x ̸= c
= δkc (クロネッカーのデルタ).
命題 1.1 分布関数の性質
(1) F( − ∞) = 0, F(∞) = 1.
(2) x 5 x′ =⇒ F(x) 5 F(x′ ).
(3) 右連続.
(4) P(x < X 5 x′ ) = F(x′ ) − F(x).
確率変数にはその値域によって離散的なものと連続的なものがある。連続的なものでは、しばしば確率分布 P(X = x)
は 0 である。(分布関数は 0 でない)。
従って連続的確率変数では、確率分布ではなく、分布関数 F(x) が基本になる。また、確率分布の代わりに次の様な
f (x) を考える。
∫
定理 1.2 (確率密度)
X にそれなりの条件があれば、任意の a, b に対して P(a 5 X 5 b) =
f (x)dx となる関数 f (x)
a
がある。f (x) を X の確率密度という。
[証明] f (x) = F′ (x) とせよ。
このとき、
∫ ∞
命題 1.3 (1)
f (x)dx = 1.
−∞
(2) f (x) = 0.
∫ x
(3) F(x) =
f (x)dx.
−∞
′
(4) F (x) = f (x).
となる。
b
2. 確率変数の基本性質
19
言
ムニ
0
X
伊 (メ
ご 丈
)
鮮
/
対み
敏
す
コ
ャ
や
ヽ
玄 す
荘
メ
4ニ
代
めr
例 20 f (x) = 2x
とこ
帆
写 t賀
密 導 )
レー
路チ7(X=A)
寺一
と輸
撫線6う
ら叱帯「
締
(0 < x < 1).
例 21 確率密度関数が存在しない例
列車の到着時刻を X とし、必ず定刻 X = 0 に列車は到着するとする。分布関数は、

0 x < 0
F(x) =
1 x = 0
であるが、通常の意味では確率密度 f (x) は存在しない。(例 19 参照)
§2
確率変数の基本性質
定理 2.1
(1) X を確率変数、y = g(x) を関数とするとき、合成関数 Y = g ◦ X も確率変数である。Y を g(X) と書く。
(2) X, Y を確率変数、z = g(x, y) を関数とするとき、Z = g(X, Y ) も確率変数である。ただし Z(ω) = g(X(ω), Y (ω))
と定義する。
注 9 g(X) の確率分布は X の確率分布から g を用いて計算できる。
また一般に、g(X, Y ) の確率分布も確定していて、同時確率分布 (後述) で決定できるが、必ずしも X, Y それぞれの
確率分布からだけから決定されない。
例 22
(1) X を確率変数とするとき、X 2 も確率変数。
(2) X, Y を確率変数とするとき、cX(c は定数), X + Y, XY も確率変数。
例題 11 サイコロを振る。出た目を X とするとき、Y = X 2 − 3X の確率分布を求めなさい。
注 10 次の例題に見るように、X + Y の確率分布でさえ、X, Y の確率分布だけからは決定されない。もちろん、決定
されないが定義はされている。
例 23 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
B 君は、裏が出れば 1 万円払い、表が出れば払わない。
C 君は、表が出れば 1 万円払い、裏が出れば払わない。
この時 A、B、C 君の払う金額を X, Y, Z 万円とする。このとき、X, Y, Z, X + Y, X + Z の確率分布を作れ。
第 4 章 確率変数
20
[解]Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
1
2
ω
表
裏
ω
表
裏
ω
表
裏
X(ω)
1
0
Y (ω)
0
1
Z(ω)
1
0
で、確率変数が定義されている。よって、それぞれの確率分布は、
x
0
1
P(X = x)
1
2
1
2
x
0
P(X + Y = x)
0
x
0
1
P(Y = x)
1
2
1
2
1
1
2
0
x
0
1
P(Z = x)
1
2
1
2
x
0
1
2
P(X + Z = x)
1
2
0
1
2
この件については、例 24、28、33、次章「複数の確率変数」の例 41 で再び議論する。
§3
確率変数の平均値
確率変数 X 平均値 E(X) とは、X のおよその値の表現のひとつである。
定義 13 (離散的なケースの平均値) Ω が、事象 A1 , A2 , · · · に分割されているとする。確率変数 X が A1 , A2 , · · · で、
x1 , x2 , · · · という定値を取るとき、X の平均値あるいは期待値とは、
∑
x1 P(A1 ) + x2 P(A2 ) + · · · =
xi P(Ai ).
i
のことであり、これを E(X) と書く。
注 11 定義において、xi に重複があってもよい。Ai には重なりはない。
例 24 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
B 君は、裏が出れば 1 万円払い、表が出れば払わない。
この時 A 君の払う金額を X 万円、B 君の払う金額を Y 万円とする。X, Y の平均 E(X), E(Y ) を求めよ。
(解)
E(X) = 1 · P({ 表 }) + 0 · P({ 裏 }) = 1 ·
E(Y ) = 0 · P({ 表 }) + 1 · P({ 裏 }) = 0 ·
1
2
1
2
+0·
+1·
1
2
1
2
= 12 。
= 12 。
例 25 例 16 では、
E(X) = 1 · P({ }) + 2 · P({ }) + 3 · P({ }) + 4 · P({
1
1
1
1
1
1
7
=1· +2· +3· +4· +5· +6· = 。
6
6
6
6
6
6
2
}) + 5 · P({
}) + 6 · P({
})
例 26 例 18 では、
E(X) = 2 · P({(1, 1)}) + 3 · P({(1, 2)}) + 3 · P({(2, 1)}) + · · · + 12 · P({(6, 6)})
1
1
1
1
+3·
+3·
+ · · · + 12 ·
= 7。
=2·
36
36
36
36
例 27 X = コインを何回か投げて初めて表が出るまでの回数 では、E(X) =
定理 3.1
(1) 確率変数 X が x1 , x2 , · · · という互いに異なる値を取るとき、
∑
E(X) =
xi P(X = xi ).
i
(2) E(X) は定義における事象の分割に依存しない。すなわち、E(X) は、X(と P) にのみ依存する。
[証明] (1)Ai = {ω ∈ Ω|X(ω) = xi } とおく。(2) 定義に用いられる標本空間を分割する事象は (1) の Ai の細分だから。
3. 確率変数の平均値
21
例題 12 サイコロを振る。出た目をそれぞれ X とするとき、Y = X 2 − 3X の平均値を求めなさい。
例 28 例 24 において、このこの計算方法で、E(X), E(Y ) を求めると、
E(X) = 0 · P(X = 0) + 1 · P(X = 1) = 0 · 12 + 1 · 12 = 12 。
E(Y ) = 0 · P(Y = 0) + 1 · P(Y = 1) = 0 · 12 + 1 · 12 = 12 。
例 29 例 16 では、
E(X) = 1 · P(X = 1) + 2 · P(X = 2) + 3 · P(X = 3) + 4 · P(X = 4) + 5 · P(X = 5) + 6 · P(X = 6)
1
1
1
1
1
7
1
=1· +2· +3· +4· +5· +6· = 。
6
6
6
6
6
6
2
例 30 2 つのサイコロの例 18 で、この定理を使うと、
x
2
3
4
5
6
7
8
9
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
10
11
3
36
2
36
12
1
P(X = x)
36
より、
E(X) = 2 · P(X = 2) + 3 · P(X = 3) + 4 · P(X = 4) + 5 · P(X = 5) + 6 · P(X = 6) + 7 · P(X = 7) + 8 · P(X =
8) + 9 · P(X = 9) + 10 · P(X = 10) + 11 · P(X = 11) + 12 · P(X = 12)
2
3
4
5
6
5
4
3
2
1
1
+3·
+4·
+5·
+6·
+7·
+8·
+9·
+ 10 ·
+ 11 ·
+ 12 ·
=7
=2·
36
36
36
36
36
36
36
36
36
36
36
である。これを定義による方法 (例 26) と比較せよ。
注 12 確率変数が分からなくても、確率分布 (密度) すなわち確率法則が分かれば、その平均は決まる! 別の言葉でいえ
ば、確率と確率変数は事象でパラメトライズされているが、そのパラメータは平均から消去される。
定義 14 (連続的なケースの平均値) 確率変数 X を離散的な確率変数の極限で表現し、離散的な平均値の極限で E(X) を
定義する。
定理 3.2 確率変数 X が (−∞, ∞) に値を持っているとする。f (x) を X の確率密度とするとき、
∫ ∞
E(X) =
xf (x)dx.
−∞
[証明] 略。ちょっと難しい。条件を制限すればリーマン積分の範囲で可能かも。
C二 :翌
tr CMコ
う手ギキ掌ユ苫1上
角
乱歌的平↓
主
文
云
ボ
L(X)=ネ
‖
)
CX‐
え
幾幾的平拘
丈吉〔
京
にはうとi津弓
)拭北
例 31 例 20 の f (x) = 2x
(0 < x < 1) では、E(X) =
∫1
0
x · f (x) dx =
∫1
0
x · 2x dx = [ 23 x3 ]10 = 23 。
第 4 章 確率変数
22
コラム 1 JR 福知山線脱線事故 (2005 年)。平均と重心。電車の重心。重力質量と慣性質量。
コラム 2 宝くじの期待値は
143
。
300
コラム 3 倍倍ゲームとねずみ講
X = 2コインを何回か投げて初めて表が出るまでの回数+1 では、E(X) = 2 ·
§4
1
1
1
+ 4 · + 8 · + ··· = ∞
2
4
8
平均の基本性質
定理 4.1 X を確率変数、g(x) を x の関数とするとき、
(1) X が離散的である場合、{xi } を X の互いに異なる値域、pi = P(X = xi ) を X の確率分布とすれば、
E(g(X)) =
∑
g(xi )pi .
i
(2) X が連続的である場合、f (x) は X の確率密度とすれば、
∫ ∞
E(g(X)) =
g(x)f (x)dx.
−∞
注 13 この定理をもって、E(g(X)) の定義とする教科書があり、例 32 に見るように計算が楽だが、g(X) が確率変数な
ので、2 重定義になってしまう。また、E(g, X) と g を陽に書く必要もある。
[証明] (1) 定義から明らかであるが詳しく書くと、Ai = {ω ∈ Ω|X(ω) = xi } は Ω の分割で、この上で g(X(ω)) = g(xi )
∑
∑
の値は一定である。よって定義 13 の条件を満たすので、E(g(X)) =
g(xi )P(Ai ) =
g(xi )pi .
i
(2) も平均値の定義から。ただし例によって極限の問題はある。
例 32 X が
1
3
i
の確率で −1, 0, 1 の値を取るとする。この定理によれば、E(X 2 ) = (−1)2 31 + 02 31 + 12 31 =
る。もし、定理 3.1 を使ってしまうと、X 2 の確率分布が、
X
2
確率
0
1
1
3
2
3
2
3
と計算でき
なので、E(X 2 ) = 02 31 + 12 32 =
ややこしい。
定理 4.2 (E(X) の性質)
(1) k を定数の確率変数とするとき、
E(k) = k
(2) X, Y を確率変数とするとき、
E(X + Y ) = E(X) + E(Y )
特に、E(X + Y ) は、X, Y の確率分布 (密度) で決定できる。
(3) X を確率変数、k を定数とするとき、kX も確率変数であり、
E(kX) = kE(X)
[証明] (1) 明らか。
(2) 明らか。明らかなのに、定理 3.1 を使った次のような証明が時々見られる。
2
3
となり、
4. 平均の基本性質
23
∑
∑
Z = X +Y と置くと Z の確率分布は、P(Z = zk ) = xi +yj =zk pij である。ここに pij = xi +yj =zk P(X = xi かつ Y =
yj ) と置いた。
∑
∑
∑
zk P (Z = zk ) =
zk
E(X + Y ) =
pij
k
∑
=
∑
xi
∑
i
∑
=
∑
zk pij =
k xi +yj =zk
=
pij +
∑
j
(xi + yj )pij
i,j
∑
yj
j
xi P(X = xi ) +
∑
i
=
xi +yj =zk
k
∑
pij
i
yj P(Y = yj )
j
E(X) + E(Y )
だが、これは、自明なことを複雑に証明しているように見える。
また、別の良くやる証明は、X が f (X)、Y が g(X) という形をしているケースについて、定理 4.1 より、
∑
E(f (X) + g(X)) =
(f (xi ) + g(xi ))P (X = xi )
i
=
∑
f (xi )P (X = xi ) +
i
∑
g(xi )P (X = xi )
i
= E(f (X)) + E(g(X))
こちらの方がまし(?)
(3) 同様。
例 33 再び 23、24、28 の例を考える。E(X) = E(Y ) = E(Z) =
1
2
1
2
がわかっているので X + Y の確率分布がわからなく
1
2
+ = 1 と確定する。
一方、E(XY ) は、E(X), E(Y ) だけからは決まらないし、X, Y の確率分布からも決定できない。
実際、XY は定値関数 0 であり、Z は X に等しくこれは 0, 1 という値しかとならいので、XZ = X 2 = X 。
とも、E(X + Y ) は、E(X) + E(Y ) =
よって、X, Y, Z の確率分布は全て等しい一方、E(XY ) = E(0) = 0, E(XZ) =
1
2
である。
これについては、次章「複数の確率変数」の例 41 で再び議論する。
(例 23 の再掲)
1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば A 君に 1 万円払い、裏が出れば払わない。
B 君は、裏が出れば A 君に 1 万円払い、表が出れば払わない。
C 君は、表が出れば A 君に 1 万円払い、裏が出れば払わない。
この時 A、B、C 君の払う金額を X, Y, Z 万円とする。
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
X(表) = 1, X(裏) = 0
1
2
Y (表) = 0, Y (裏) = 1
Z(表) = 1, Z(裏) = 0
x
0
1
1
2
1
2
P(X = x)
E(X) = 0 · 12 + 1 ·
1
2
x
=
0
1
1
2
1
2
0
P(XY = x) 1
E(XY ) = 0 · 1 = 0
=
x
1
2
x
0
1
2
x
0
1
1
2
1
2
P(Z = x)
E(Z) = 0 · 12 + 1 ·
P(X + Z = x)
E(X + Z) = 0 ·
2
P(X + Y = x) 0 1 0
E(X + Y ) = 0 · 0 + 1 · 1 + 2 · 0 = 1
x
1
1
2
P(Y = x)
E(Y ) = 0 · 12 + 1 ·
1
2
x
0
0
1
2
P(XZ = x)
E(XZ) = 0 · 12 + 1 ·
1
2
1
1
2
1
1
2 = 2
=
1
2
1
2
=1
2
0 12
+1·0+2·
1
1
2
第 4 章 確率変数
24
§5
確率変数の分散
定義 15 (分散)X を確率変数とし、µ = E(X) とするとき、
V(X) = E((X − µ)2 )
を X の分散という。σ(X) =
√
V(X) を標準偏差という。
注 14 分散とは、その確率変数がどのぐらい多様な値を取るかを表したものである。特に、「V(X) = 0 =⇒ X = 定値
」が言える。
定理 5.1 (V(X) の性質)
(1) k を定数の確率変数とするとき、V(k) = 0。
(2) X を確率変数、k を定数とするとき、V(kX) = k 2 V(X)。
2
定理 5.2 V(X) = E(X 2 ) − E(X) .
[証明] ストレートな計算による。
注 15 (別証) 任意の m について、E((X − m)2 ) = E(m2 − 2mX + X 2 ) = m2 − 2E(X)m + E(X 2 ) = (m − E(X))2 +
2
E(X 2 )−E(X) がいえる。ここで、m = µ と置けばよい。結局、任意の m について、E((X −m)2 ) = (m−E(X))2 +V(X)
がいえるので、
E((X − m)2 ) は、m = E(X) の時、最小値 V(X) を取る。
例 34 コインを投げて表で 1 点、裏で 0 点 (例 24):
x
0
1
P(X = x)
1
2
1
2
では、
• (定義による計算) E(X) = 12 ,
V(X)
1
E((X − )2 )
2
1
1
1
1
= (0 − )2 · + (1 − )2 ·
2
2
2
2
1
=
.
4
=
• (定理 5.2 による計算) E(X) = 12 ,
E(X 2 )
=
02 ·
=
1
2
1
1
+ 12 ·
2
2
2
よって、V(X) = E(X 2 ) − E(X) =
例 35 サイコロの例 16:
1
2
− ( 12 )2 = 14 .
x
1
2
3
4
5
6
P(X = x)
1
6
1
6
1
6
1
6
1
6
1
6
では、
• (定義による計算) E(X) = 72 ,
V(X)
7
E((X − )2 )
2
7
1
7
1
7
1
7
1
7
1
7
1
= (1 − )2 · + (2 − )2 · + (3 − )2 · + (4 − )2 · + (5 − )2 · + (6 − )2 ·
2
6
2
6
2
6
2
6
2
6
2
6
35
.
=
12
=
5. 確率変数の分散
25
• (定理 5.2 による計算) E(X) = 72 ,
E(X 2 ) =
=
1
1
1
1
1
1
+ 22 · + 32 · + 42 · + 52 · + 62 ·
6
6
6
6
6
6
12 ·
91
6
2
よって、V(X) = E(X 2 ) − E(X) =
例 36 2 つのサイコロの例 18:
91
6
− ( 72 )2 =
35
12 .
x
2
3
4
5
6
7
8
9
10
11
12
P(X = x)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
では、
• (定義による計算) E(X) = 7,
E((X − 7)2 )
1
2
3
4
5
6
= (2 − 7)2 ·
+ (3 − 7)2 ·
+ (4 − 7)2 ·
+ (5 − 7)2 ·
+ (6 − 7)2 ·
+ (7 − 7)2 ·
36
36
36
36
36
36
5
4
3
2
1
+(8 − 7)2 ·
+ (9 − 7)2 ·
+ (10 − 7)2 ·
+ (11 − 7)2 ·
+ (12 − 7)2 ·
36
36
36
36
36
35
.
=
6
V(X) =
• (定理 5.2 による計算) E(X) = 7,
1
2
3
4
5
6
+ 32 ·
+ 42 ·
+ 52 ·
+ 62 ·
+ 72 ·
36
36
36
36
36
36
5
4
3
2
1
+82 ·
+ 92 ·
+ 102 ·
+ 112 ·
+ 122 ·
36
36
36
36
36
329
=
6
E(X 2 ) =
22 ·
2
よって、V(X) = E(X 2 ) − E(X) = 329/6 − 72 =
35
6 .
例 37 例 20: f (x) = 2x (0 5 x 5 1) では、
• (定義による計算) E(X) = 23 ,
2
E((X − )2 )
3
∫ 1
2
=
(x − )2 · 2xdx
3
0
∫ 1
8
8
=
(2x3 − x2 + x)dx
3
9
0
1
=
.
18
V(X) =
• (定理 5.2 による計算) E(X) = 23 ,
∫
1
x2 · 2xdx
E(X 2 ) =
∫
0
1
2x3 dx
=
0
=
1
.
2
2
よって、V(X) = E(X 2 ) − E(X) =
1
2
− ( 23 )2 =
1
18 。
定義 16 X, Y を確率変数とし、µX = E(X), µY = E(Y ) とおくとき、
Cov(X, Y ) = E((X − µX )(Y − µY ))
を X と Y の共分散という。
第 4 章 確率変数
26
注 16 V (X) = Cov(X, X) である。
練習問題 2 A、B 二つの硬貨を投げ、「A が表なら X = 1、裏なら X = 0」、「B が表なら Y = 0、裏なら Y = 1」と確
率変数 X, Y を定義する。Cov(X, Y ) を求めよ。
練習問題 3 A、B 二つの硬貨を投げ、「A が表なら X = 1、裏なら X = 0」、「A(B じゃなくて) が表なら Y = 0、裏な
ら Y = 1」と確率変数 X, Y を定義する。Cov(X, Y ) を求めよ。
定理 5.3 (Cov(X, Y ) の性質)
(1) k を定数の確率変数、Y を確率変数とするとき、Cov(k, Y ) = 0。
(2) X, Y を確率変数とするとき、Cov(X, Y ) = Cov(Y, X)。
(3) X, Y を確率変数、k を定数とするとき、Cov(kX, Y ) = kCov(X, Y )。
(4) X, X ′ , Y を確率変数、k を定数とするとき、Cov(X + X ′ , Y ) = Cov(X, Y ) + Cov(X ′ , Y )。
定義 17 Cov(X, Y ) = 0 であるとき、確率変数 X, Y は、無相関であると言う。
定理 5.4 Cov(X, Y ) = E(XY ) − E(X)E(Y )
[証明] ストレートな計算による。
注 17 任意の m, n について、E((X − m)(Y − n)) = (m − E(X))(n − E(Y )) + E(XY ) − E(X)E(Y ) = (m − E(X))(n −
E(Y )) + Cov(X, Y ) 。
§6
共分散行列 (試験範囲外)
共分散行列という概念を用いると、分散と共分散は統一的に扱うとことができる。
( )
(
) ( )
X
E(X)
µX
⃗
⃗
今、X, Y を同一の確率 (標本) 空間上の確率変数として、X =
と置く。µ
⃗ = E(X) =
=
とお
Y
E(Y )
µY
(
)
t
(X − µX )2
(X − µX )(Y − µY )
⃗ −µ
⃗ −µ
となる。
くとき、(X
⃗ ) (X
⃗) =
(X − µX )(Y − µY )
(Y − µY )2
(
)
( )
t
V(X)
Cov(X, Y )
X
⃗
⃗
⃗
⃗
定義 18 V(X) = E((X − µ
⃗ ) (X − µ
⃗ )) =
と書き、これを X =
の共分散行列と言う。
Cov(X, Y )
V(Y )
Y
次の定理と系は、定理 5.2、5.4 の拡張である。
定理 6.1 任意のベクトル m
⃗ に対し、
t
t
t
t
⃗ − m)
⃗ − m))
⃗ −µ
⃗ −µ
⃗ + E((m
E((X
⃗ (X
⃗ = E((X
⃗ ) (X
⃗ )) + E((m
⃗ −µ
⃗ ) (m
⃗ −µ
⃗ )) = V(X)
⃗ −µ
⃗ ) (m
⃗ −µ
⃗ )).
[証明]
t
⃗ − m)
⃗ − m)
(X
⃗ (X
⃗
=
=
t
⃗ −µ
⃗ −µ
(X
⃗ − (m
⃗ −µ
⃗ )) (X
⃗ − (m
⃗ −µ
⃗ ))
t
t
t
t
⃗ −µ
⃗ −µ
⃗ −µ
⃗ −µ
⃗ −µ
(X
⃗ ) (X
⃗ ) − (X
⃗ ) (m
⃗ −µ
⃗ ) − (m
⃗ −µ
⃗ ) (X
⃗ ) + (X
⃗ ) (m
⃗ −µ
⃗ ).
t
⃗ −µ
⃗ −µ
ここで、両辺 E( ) をすると、E(X
⃗ ) = E( (X
⃗ )) = 0 より、目的の式が得られる。
系 6.2
⃗ = E(X
⃗ tX)
⃗ − E(X)
⃗ tE(X).
⃗
V(X)
[証明] 上の定理で m
⃗ = 0 と置け。
( )
( )
X
X′
⃗
=A
注 18 V(X) を用いると、次のようなことはすぐわかる。
「X, Y が無相関、A が直交行列であるとき、
′
Y
Y
で定義される X ′ , Y ′ は、無相関である。」
27
第 5 章 様々な確率変数
ここでは、幾つかの良く現れる確率変数を紹介する。
§1
離散的な確率分布
確率変数の情報がなくても、その確率分布が分かれば、平均、分散などは分かる。しばらく、確率分布を問題にする。
当たるか外れるか
1.1
(ベルヌーイ分布)
確率変数 X の取り得る値が {0, 1} で、確率分布が
P(X = 1) = p, P(X = 0) = 1 − p
であるとき、E(X) と V(X) を求めよ。
2 項分布 B(n, p)
1.2
確率分布
P(X = x) = n Cx px (1 − p)n−x ,
x = 0, · · · , n
を 2 項分布と呼び B(n, p) と書く。
(意味) 事象 A の起こる確率を p とするとき、それを n 回繰り返し、A が x 回起こる確率。
定理 1.1
(1) E(X) = np.
(2) V(X) = np(1 − p).
[証明]
(1)
n
∑
x · n Cx px (1 − p)n−x = np
x=0
(2) E(X 2 ) =
n
∑
n−1 Cx−1 p
x−1
(1 − p)n−1−(x−1) = np.
x=1
n
∑
x2 · n Cx px (1 − p)n−x = np
x=0
n
∑
= np(1 +
n
∑
x · n−1 Cx−1 px−1 (1 − p)n−1−(x−1)
x=1
(x − 1) · n−1 Cx−1 p
x−1
(1 − p)n−1−(x−1) ) = np(1 + (n − 1)p)n−1 .
x=1
よって、V(X) = np(1 + (n − 1)p) − (np)2 = np(1 − p).
注 19 実はこの計算は、確率変数の独立性を用いて、第 6 章定理 2.3 を用いると簡単になる。
第 5 章 様々な確率変数
28
§2
多項分布
まず、ベルヌーイ分布の「多項版」を考える。
事象、A, B, C が起こる確率が、pA , pB , pC
(pA + pB + pC = 1) であるとする。このとき、A の上でのみ 1 という
値を取る確率変数を XA 、B の上でのみ 1 という値を取る確率変数を XB 、C の上でのみ 1 という値を取る確率変数を
XC とするとき、
定理 2.1
(1) E(XA ) = pA .
(2) V(XA ) = pA (1 − pA ).
(3) Cov(XA , XB ) = −pA pB .
である。なぜなら、(3) のみ証明すると、XA XB = 0 なので、Cov(XA , XB ) = E(XA XB ) − E(XA )E(XB ) = −pA pB
である。
xA + xB + xC = n であるとき、(xA , xB , xC ) を多項係数として、
P(XA = xA , XB = xB , XC = xC ) = (xA , xB , xC )pA xA pB xB pC xc
を多項分布と呼ぶ。(この場合 3 項)
(意味) 事象 A, B, C の起こる確率を pA , pB , pC とするとき、xA + xB + xC 回の試行で、A, B, C がそれぞれ
xA , xB , xC 回起こる確率。
定理 2.2
(1) E(XA ) = npA .
(2) V(XA ) = npA (1 − pA ).
(3) Cov(XA , XB ) = −npA pB .
[証明] これも確率変数の独立性を用いて、多項版ベルヌーイ分布の定理の n 倍とすればよい。
ポアソン (Simeon Poisson) 分布
2.1
λx −λ
e
(x = 0, 1, 2, · · · ).
x!
(意味)2 項分布で、λ = np を固定し、p → 0, n → ∞ とした近似。
P (X = x) =
注 20
(1) λ = np とすると、 lim P(2 項分布 = k) = P(ポアソン分布 = k)。
n→∞
(2) この分布は x + λ の時最大値を取る。
(3)
∞
∑
λx
x=0
x!
e−λ = 1 はマクローリン展開で証明できる。
定理 2.3 ポアソン分布 X について、
(1) E(X) = λ.
(2) V(X) = λ.
[証明]
∞
∞
∑
∑
λx
λy+1
(1) E(X) =
x
=
= λ.
x!
y!
x=0
y=0
(2) E(X 2 ) =
∞
∑
x=0
x2
∞
∞
∞
∑
∑
λx
λy+1
λy+1 ∑ λy+1
2
=
(y + 1)
=
y
+
= λ · λ + λ よって、V(X) = E(X 2 ) − E(X) =
x!
y!
y!
y!
y=0
y=0
y=0
λ2 + λ − λ2 = λ.
3. 連続的な確率分布
29
例 38 ある工場で作る液晶ディスプレイは 1 日平均 2 個不良品が出る。ある日に 2 個出る確率は幾つか?
22
(答) e−2 = 0.2706.
2
§3
連続的な確率分布
3.1
一様分布
 1

(a 5 x 5 b)
f (x) = b − a

0 (他)
(意味) ある期間でランダムに起こる。起こるのは確実。
定理 3.1 一様分布 X について、
(1) E(X) =
a+b
.
2
(2) V(X) =
(b − a)2
.
12
3.2
指数分布

λe−λx (x > 0)
f (x) =
0 (他)
(意味) 単位あたりの発生回数がポワソン分布の時の、発生間隔の分布。
(λt)x −λt
【証明】t 時間で現象が X 回起こるとすると、P(X = x) =
e . よって、Y = 現象が初めて出現する時間 とす
x!
d
ると、P(Y = t) = 1 − P(Y < t) = 1 − P(X = 0) = 1 − e−λt 。よって、f (t) = P(Y = t) = λe−λt 。
dt
定理 3.2 指数分布 X について、
(1) E(X) =
1
.
λ
1
.
λ2
∫ x
(3) F (x) =
f (x)dx = 1 − e−λx .
(2) V(X) =
0
3.3
正規分布
次の確率密度関数で表される分布を正規分布と言い、N (µ, σ 2 ) と書く。
f (x) = √
1 x−µ 2
1
e− 2 ( σ ) .
2πσ
N (0, 1) を標準正規分布と言う。
∫ ∞
√
x2
e− 2 dx = 2π.
注 21
−∞
第 5 章 様々な確率変数
30
X が N (µ, σ 2 ) に従うなら、Z =
P (a 5 X 5 b) = P (
X −µ
は、N (0, 1) に従い、
σ
a−µ
b−µ
5Z5
).
σ
σ
である。X から Z を作ることを「標準化」と言う。
問題 1 (教科書 p.43 例 2.19) 確率変数 X が N (50, 102 ) に従うとき、P(35 5 X 5 75) を求めよ。
問題 2 (教科書 p.43 例 2.20) ある学校で新入生の身長が平均値 166cm、標準偏差 7cm だった。身長が正規分布に従う
とすると、身長が 173cm 以上の学生は全体の何%いるか
3.4
変数の変換
この項は授業範囲外である。
一般に確率変数の X の確率密度関数を fX , 確率分布関数を FX と書くことにする。
定理 3.3 確率変数 X, Y に対し、微分可能な単調増加関数 ϕ で Y = ϕ(X) の関係があるとき、y = ϕ(x) なら、
fY (y) =
1
fX (x)
ϕ′ (x)
が成り立つ。
[証明] FY (y) = FX (x) に注意すると,fY (y) =
d
d
FY (y) =
FX (x) =
dy
dy
定理 3.4 X が N (0, 1) に従うなら,X 2 の確率密度関数は
√
1
1
e− 2 x
2πx
である。
[証明] 上の定理を使う。
d
dx F (x)
dy
dx
=
fX (x)
。
ϕ′ (x)
31
第 6 章 複数の確率変数
この章では複数の確率変数を同時に考える。
§1
同時確率分布、同時確率密度関数
今標本空間 Ω 上の確率 P( ) を一つ固定して考え、Ω 上の 2 つの確率変数 X, Y を考える。
この節のテーマを扱う幾つかの場合、Ω は、Ω1 × Ω2 = {(ω1 , ω2 )|ω1 ∈ Ω1 , ω2 ∈ Ω2 } の様に直積の形をしている。
例 39 「2 枚のコインを投げる」と言ったとき、標本空間は、Ω = {(表, 表), (表, 裏), (裏, 表), (裏, 裏)} であるが、実
はこれは、Ω1 = { 表, 裏 }, Ω2 = { 表, 裏 } としたとき、
Ω = Ω1 × Ω2
と書ける。しばしばこれを
ω2 \ ω1
表
裏
表
(表, 表)
(表, 裏)
裏
(裏, 表)
(裏, 裏)
Ω:
と書いたりする。
また、P({(ω1 , ω2 )}) = P({ω1 })P({ω2 }) で「定義」する。すなわち、P({(表, 表)}) = P({(表, 裏)}) = P({(裏, 表)}) =
P({(裏, 裏)}) =
1
4
とする。ごれが、「2 枚のコインを投げる」ということの本質である。
定義 19 (当たり前みたいだけど) X, Y を確率変数とするとき、
P(X に関する条件, Y に関する条件) = P(X に関する条件と Y に関する条件が同時に成り立つという事象)
と定義する。
定義 20 (同時確率分布)(X, Y ) を離散的な確率変数とするとき、x, y の関数 P(X = x, Y = y) を (2 次元) 同時確率分
布という。P((X, Y ) = (x, y)) とも書く。
次の定理は、わざわざ定理とする必要はないが、後に述べる連続ケースとの対比のため述べる。
定理 1.1 確率変数 X, Y の値域が離散な値 {xi }i , {yj }j であるとき、pij = P (X = xi , Y = yj ) とおくと
P((X, Y ) ∈ D) =
∑
pij
(xi , yj )∈D
が全ての R2 の部分集合 D について成り立つ。
注 22
(1) 2 つの確率変数 X と Y が与えられただけで、同時確率分布は得られる。このことは、しばしば誤解されて
いる。
(2) 標本空間が Ω = Ω1 × Ω2 と直積の形をしていても、確率が P({(ω1 , ω2 )}) = P({ω1 })P({ω2 }) と積で与えられてい
るとは限らない。これもよく誤解されている。
(3) Ω 上に2つの確率変数 X, Y が定義されているからといって、P(X = x, Y = y) = P(X = x)P(Y = y) が成り立
つとは限らない。
第 6 章 複数の確率変数
32
定義 21 確率変数 X の確率分布を同時確率変数 (X, Y ) における X の周辺確率分布という。
また、確率変数 Y の確率分布を同時確率変数 (X, Y ) における Y の周辺確率分布という。
定理 1.2 確率変数 X, Y の値域が離散な値 {(xi , yi )}i であるとき、pij = P (X = xi , Y = yj ) とおくと、周辺確率分
布は次で与えられる。
P(X = xi )
=
∑
pij .
j
P(Y = yi ) =
∑
pij .
i
例 40 「2 枚のコインを投げる。X =1 枚目が表なら 1 裏なら 0、Y =2 枚目が表なら 1 裏なら 0。」と言ったときの同時
確率分布表を書く。
y\x
0
1
0
1
1
4
1
4
1
4
1
4
X と Y の同時確率分布表 P(X = x, Y = y):
周辺確率分布は次のようになる。
x
0
1
P(X = x)
1
2
1
2
y
0
1
P(Y = y)
1
2
1
2
1
, X(表) = 1, X(裏) = 0, Y (表) =
2
0, Y (裏) = 1, Z(表) = 1, Z(裏) = 0 について、X, Y の同時確率分布表と、X, Z の同時確率分布表と、X, Y, Z の
周辺確率分布を書いてみよう。
例 41 前章例 23 の X, Y, Z すなわち、Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
X と Y の同時確率分布表:
y\x
0
1
0
1
0
1/2
1/2
0
z\x
0
1
0
1
1/2
0
0
1/2
X と Z の同時確率分布表:
以下の様に、周辺確率分布は、単に X, Y, Z の確率分布である。
x
0
1
y
0
1
z
0
1
P(X = x)
1
2
1
2
P(Y = y)
1
2
1
2
P(Z = z)
1
2
1
2
例 42 サイコロを 2 つ振ったときの 1 つめの目 X と 2 つめの目 Y 。Ω = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6}.
X と Y の同時分布表 P(X = x, Y = y)
y\x
1
2
3
4
5
6
1
2
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
3
4
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
1/36
5
6
1/36
1/36
1/36 1/36 1/36
1/36 1/36 1/36
X の周辺確率分布
1
2
3
4
1/36
1/36
1/36
1/36
5
6
1/6 1/6 1/6 1/6
Y の周辺確率分布
1
2
3
4
1/6
1/6
5
6
1/6
1/6
1/6
x
P(X = x)
y
P(Y = y)
1/6
1/6
1/6
例 43 サイコロを 1 つ振ったときの上側の目 X と手前側の目 Y 。Ω = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6}.
1. 同時確率分布、同時確率密度関数
33
X と Y の同時確率分布表 P(X = x, Y = y)
y\x
1
2
3
4
5
6
1
2
0
1/24
1/24
0
1/24
1/24
1/24
1/24
1/24
0
0
1/24
3
4
1/24
1/24
1/24
1/24
0
0
0
0
1/24
1/24
1/24
1/24
5
6
1/24
0
0
1/24 1/24
1/24 1/24 1/24
X の周辺確率分布
1
2
3
4
0
1/24
1/24
0
5
6
1/6 1/6 1/6 1/6
Y の周辺確率分布
1
2
3
4
1/6
1/6
5
6
1/6
1/6
1/6
x
P(X = x)
y
P(Y = y)
例 44
1/6
1/6
1/6
(1) 例 42 で、P(3 5 X 5 4, 3 5 Y 5 4) を求める。D = {(3, 3), (3, 4), (4, 3), (4, 4)} であり、
P((X, Y ) ∈ D)
=
∑
P(X = x, Y = y)
(x, y)∈D
= P(X = 3, Y = 3) + P(X = 3, Y = 4) + P(X = 4, Y = 3) + P(X = 4, Y = 4)
1
1
1
1
1
=
+
+
+
= .
36 36 36 36
9
(2) 例 43 で、P(3 5 X 5 4, 3 5 Y 5 4) を求める。D = {(3, 3), (3, 4), (4, 3), (4, 4)} であり、
P((X, Y ) ∈ D)
=
∑
P(X = x, Y = y)
(x, y)∈D
= P(X = 3, Y = 3) + P(X = 3, Y = 4) + P(X = 4, Y = 3) + P(X = 4, Y = 4)
= 0 + 0 + 0 + 0 = 0.
定理 1.3 (同時確率密度)X, Y を連続的な確率変数とするとき、
∫
P ((X, Y ) ∈ D) =
f (x, y)dxdy
D
が全ての R2 の部分集合 D について成り立つような、関数 f (x, y) が存在する。
[証明] f (x, y) =
∂2
P(X 5 x, Y 5 y) と置け。
∂x∂y
注 23 実は X = Y のような単純なケースでもこの定理は成り立たず、なかなか一筋縄ではいかない。
上の f (x, y) を X と Y の同時確率密度関数という。
定理 1.4 同時確率変数 (X, Y ) によって誘導された確率変数 X, Y の密度関数は以下で与えられる。
∫ ∞
f1 (x) =
f (x, y)dy.
∫
f2 (y)
−∞
∞
=
f (x, y)dx.
−∞
これらを (f による)X, Y の周辺確率密度関数いう。
[証明] 略。
第 6 章 複数の確率変数
34

4xy
例 45 確率密度関数が f (x, y) =
(0 5 x 5 1, 0 5 y 5 1)
0
(その他)
1
Y 5 2 ) 及び、周辺確率密度を求める。
∫ 21 ∫ 12
1
1
1
P(0 5 X 5 , 0 5 Y 5 ) =
4xydxdy =
,
2
2
16
0
0
∫ 1
f1 (x) =
4xydy = 2x,
で与えられる確率分布に対し、P(0 5 X 5 21 , 0 5
0
∫
f2 (y) =
例 46 確率密度関数が f (x, y) =

x + y
1
4xydx = 2y.
0
(0 5 x 5 1, 0 5 y 5 1)
0
(その他)
Y 5 21 ) 及び、周辺確率密度を求める。
∫ 21 ∫ 12
1
1
1
(x + y)dxdy = ,
P(0 5 X 5 , 0 5 Y 5 ) =
2
2
8
0
0
∫ 1
1
f1 (x) =
(x + y)dy = x + ,
2
0
∫ 1
1
f2 (y) =
(x + y)dx = y + .
2
0
例 47
で与えられる確率分布に対し、P(0 5 X 5 21 , 0 5
(1) X = 気温、Y = 湿度。
(2) X と定数値 k の同時確率密度関数は f (x)δ(y − k) である。ここで、f (x) は X の確率密度関数。
(3) X と X の同時確率密度関数は f (x)δ(y − x) である。ここで、f (x) は X の確率密度関数。
定理 1.5 確率変数 X, Y の値域が離散な値 {xi }i , {yj }j であるとき、pij = P (X = xi , Y = yj ) とおくと、2 変数関数
g(x, y) に対して
∑
E(g(X, Y )) =
g(xi , yj )pij
i, j
が成り立つ。
[証明] 事象 Aij = {ω ∈ Ω|X(ω) = xi かつ Y (ω) = yj } 上での g の値は g(xi , yj ) で一定であり、Aij は Ω の分割である。
よって、P(Aij ) = pij と定義 13 より。
定理 1.6 確率変数 X, Y の値域が連続で f (x, y) を同時確率密度関数とするとき、2 変数関数 g(x, y) に対して
∫ ∞∫ ∞
g(x, y)f (x, y)dxdy
E(g(X, Y )) =
−∞
−∞
が成り立つ。
[証明] 略。
練習問題 4 次の例について、E(XY ) を求めよ。
(1) 2 枚のコインの例 40。
(2) 1 枚のコインの例 41。
(3) 2 個のさいころの例 42。
(4) 1 個のさいころの例 43。
(5) 確率密度が 4xy の例 45。
(6) 確率密度が x + y の例 46。
2. 確率変数の独立
§2
35
確率変数の独立
定義 22 (確率変数の独立) 確率変数 X, Y が (P に関して) 独立であるとは、「X に関する条件を満たす事象」と「Y に
関する条件を満たす事象」とが常に (P に関して) 独立であるときに言う。すなわち、P(X に関する条件, Y に関する条
件) = P(X に関する条件) · P( Y に関する条件) であるときに言う。
定理 2.1 Ω が離散の時には、確率変数 X, Y が独立であることは、任意の a, b ∈ R に対して
P(X = a, Y = b) = P(X = a) · P(Y = b)
と同値。
[証明] 明らか。
定理 2.2 Ω が連続の時には、確率変数 X, Y が独立であることは、f を、X, Y の同時確率確率密度 f1 , f2 を X, Y の
周辺確率密度として、
f (x, y) = f1 (x) · f2 (y)
が成り立つことと同値。
[証明] 略。
例 48
(1) 定数値と任意の確率変数は独立である。
(2) 2 枚のコインの例 40 の X, Y は独立である。
(3) 1 枚のコインの例 41 の X, Y, Z は独立でない。
(4) 2 個のさいころの例 42 の X, Y は独立である。
(5) 1 個のさいころの例 43 の X, Y は独立でない。
(6) 確率密度が 4xy の例 45 の X, Y は独立である。
(7) 確率密度が x + y の例 46 の X, Y は独立でない。
例題 13 2 枚のコイン A, B を投げ、W = 「A が表なら 0 裏なら 1」, X = 「B が表なら 0 裏なら 1」とし、さらに
Y = W + X, Z = W − X とする。次の問いに答えなさい。
(1) Y と Z の同時確率分布表を書きなさい。
(2) Y と Z の周辺確率分布を書きなさい。
(3) Y と Z は独立か?
定理 2.3 X と Y が独立な確率変数であるとき、
(1) f (X) と g(Y ) も独立。
(2) E(XY ) = E(X)E(Y ).
(3) Cov(X, Y ) = 0.
(4) V(X + Y ) = V(X) + V(Y ).
2
2
(5) V(XY ) = V(X)V(Y ) + E(X) V(Y ) + V(X)E(Y ) .
[証明]
第 6 章 複数の確率変数
36
(1) 明らか。
(2) 確率変数 X, Y の値域が離散な値 {xi }i , {yj }j であるとき、pij = P (X = xi , Y = yj ) とおくと、pi , pj を X, Y
∑
∑
の周辺確率だとすれば、独立性より pij = pi pj 。よって定理 1.5 より、E(XY ) = i, j xi yj pij = i, j xi yj pi pj =
∑
∑
( i xi pi )( j yj pj ) = E(X)E(Y ) が成り立つ。
連続ケースは略。
(3) そもそも V(X + Y ) = V(X) + 2Cov(X, Y ) + V(Y ) である。
2
2
2
2
2
(4) V(XY ) = E((XY )2 )−E(XY ) = E(X 2 )E(Y 2 )−E(X) E(Y ) = (V (X)+E(X)2 )(V (Y )+E(Y )2 )−E(X) E(Y ) =
右辺。
注 24 X と Y が独立であっても X と X + Y とか X と X/Y が独立であるとは限らない。
§3
確率変数の直積 (試験範囲外)
【クイズ】任意の確率変数に対しその平均値は確定する。任意の確率変数 X, Y に対し XY も確率変数である。では、
X, Y が独立でなく一般の場合、XY の平均値が確定しないのはなぜか?
(答) これは誤解である。XY の確率分布は確定し、XY の平均値も確定している。ただ、XY の確率分布が X, Y そ
れぞれの確率分布からは確定 (表現) できないので、当然 XY の平均値は X, Y それぞれの平均値等で表現できないだけ
である。
これは、平均値が確率変数 (によるパラメトライズ) によらず確率分布だけで決まることから、X, Y の確率分布で XY
の確率分布が表現できるように思ってしまった、という誤解かもしれない。
確率空間 (Ω1 , P1 ), (Ω2 , P2 ) があったときその積の確率空間 (Ω1 × Ω2 , P1 · P2 ) が定義できる。ただし、P1 · P2 は、
(P1 · P2 )(A1 × A2 ) = P1 (A1 )P2 (A2 ) で「生成された」Ω1 × Ω2 上の確率。
確率空間の同型を定義すれば、「積空間に同型」で独立性を定義できる。
また、確率空間 (Ω, P ) からそのべき (Ωn , P n ) が定義できる。
また、Ω1 , Ω2 それぞれに確率変数 X, Y があれば、Ω1 × Ω2 上の確率変数 X ′ = X ◦ pr1 , Y ′ = Y ◦ pr2 (X × Y と誤
解しないように。pr1 , pr2 は Ω1 , Ω2 への射影。つまり、X ′ (ω1 , ω2 ) = X(ω1 ), Y ′ (ω1 , ω2 ) = Y (ω2 ) ) が定義できる。こ
の 2 つの確率変数 X ′ , Y ′ は独立である。
標本 (確率変数)X の n 回の非復元抽出 (ω1 , ω2 , · · · , ωn ) の数学的表現は、第 8 章の注 30 で述べる。
37
第 7 章 データの整理
§1
度数分布
(1) 変量
(i) 離散変量
(ii) 連続変量
(2) 度数分布表 · · · 階級 (級) → 度数
級間隔 =⇒ スタージェスの公式 k = 1 + log2 N
(3) 階級値 = 階級の中央値
(4) ヒストグラム
(5) 相対度数分布、累積度数分布、累積相対度数分布
§2
代表値と散布度
(1) 代表値
(i) 平均 (mean)
x =
1∑
xi
n i=1
x =
n
1 ∑
xi fi
N i=1
n
(n = 総数)
(n = 階級数, N =
n
∑
fi = 総数)
i
(ii) 中央値 (median) M e · · · n の偶奇に注意
(iii) 最頻値 (mode) M o · · · これは階級に分けないと余り意味が無い。
(2) 散布度
(i) 範囲 R = xL − xS
(ii) 平方和
S
=
n
∑
(xi − x)2
i=1
S
=
n
∑
(xi − x)2 fi
i=1
(iii)
1. 分散 (variance)
s2
=
S
1∑
=
(xi − x)2
n
n i=1
s2
=
n
S
1 ∑
=
(xi − x)2 fi
N
N i=1
n
第 7 章 データの整理
38
2. 標準偏差 (standard deviation) s =
√
s2
3. 不偏分散 (unbiased estimate of variance)
n
S
1 ∑
2
u =
=
(xi − x)2
n−1
n − 1 i=1
S
1 ∑
=
(xi − x)2 fi
N −1
N − 1 i=1
n
u2
=
(3) 計算
S
=
n
∑
1
x2i −
n
i=1
s
=
S
=
s2
=
(
)2
xi
i=1
)2
n
1∑
xi
n i=1
( n
)2
n
∑
1 ∑
2
xi fi
xi fi −
N i=1
i=1
(
)2
n
n
1 ∑ 2
1 ∑
x fi −
xi fi
N i=1 i
N i=1
1∑ 2
x −
n i=1 i
n
2
( n
∑
(4) 簡易計算 (p.10) · · · 全ての値を x0 ずらすと、平均は x0 ずれ、分散は変わらない。全ての値を c 倍すると、平均
は c 倍、分散は c2 倍になる。
練習問題 5
17 27 -13 -3 7
の平均値と分散を求めなさい。
2.1
標準化
x が、x1 , x2 , · · · xn という値を取るとき z =
(1) z の平均は 0 で、分散は 1 である。
(2) z の標準化は z そのものである。
§3
相関と回帰
3.1
散布図
(1) 散布図 (相関図)
(2) 正の相関、負の相関、無相関
3.2
x
相関係数
x1
···
x2
xn
y y1 y2 · · · yn
に対する相関係数を求める。
1∑
(xi − x)(yi − y)
n i=1
n
cxy =
を x と y の共分散 (covariance) という。
x−x
を計算したもの、z1 , z2 , · · · zn を x の標準化と言う。
sx
3. 相関と回帰
39
因みに「sx 2 = x の分散 = cxx 」 である。
このとき
rxy = r =
cxy
sx · sy
を x と y の相関係数 (correlation) という。
注 25
(1) 共分散を標準化したものが相関係数である、と言える。
(2) cxy = cyx , rxy = ryx である。
【相関係数 r の性質】
(1) −1 5 r 5 1
(2)
r + 1 ···
xi − xと yi − y は比例している
r + −1 · · ·
xi − xと yi − y は比例している (ただし比例係数は負)
r + 0 ···
xi − xと yi − y は比例関係にない
(3) x と y を 1 次変換しても r は不変。(例 F = 1.8 × C + 32)
注 26 r2 を決定係数と言う。R2 と書いたり R2 と書いたりする。「あーるじじょうち」と読んだりする。
x
x1
x2
···
y
y1
y2
∑
···
xn
に対する r の計算法
yn
∑
(1) Sx = i x2i − n1 ( i xi )2
∑
∑
(2) Sy = i yi2 − n1 ( i yi )2
∑
∑
∑
(3) Sxy = i xi yi − n1 ( i xi )( i yi )
Sxy
(4) r = √
Sx · Sy
例題 14
(
[解] r
x
10.5
20.5
15.5
y
110
90
120
)
15.5
x
10.5
20.5
y
110
90
120
yi
x2i
yi2
xi yi
−1 0
1 −2
1
1
0
4
0
−2
xi
0
1
0
1
0
0
−1
2
5
−2
Sx
Sy
Sxy
r
の相関係数を求めよ。
(
=r
1 2
·0 =2
3
1
14
= 5 − · (−1)2 =
3
3
1
= −2 − · 0 · (−1) = −2
3
√
−2
3
= √
=−
.
7
14
2·
= 2−
3
x
10
20
15
y
10
-10
20
)
(
=r
x
2
4
3
y
1
-1
2
)
(
=r
x
-1
1
0
y
0
-2
1
)
第 7 章 データの整理
40
§4
回帰直線
定義 23 図の l12 + l22 + · · · + ln2 を最小にするような直線 y = a + bx を (y の x への) 回帰直線という。
注 27 回帰は英語で regression で、F.Galton が定義した。
定理 4.1 回帰直線は
y−y
x−x
= rxy
.
sy
sx
である。ここで、rxy は x と y の相関係数、x, y は、x, y の平均、sx , sy は x, y の標準偏差である。
x·1
˜
˜
[証明] x = (xi ), y = (yi ) とし、1 = (1 · · · 1) とおく。y = y·1
n , x = n , y = y − y1, x = x − x1 とおく。
˜ + (y − bx − a)1 であり、y,
˜ x
˜ ⊥ 1 より、|y − (bx + a1)|2 = |y˜ − bx|
˜ 2 + |(y − bx − a)1|2
y − (bx + a1) = y˜ − bx
2
˜ · y˜ 2
x
(x · y)
˜ 2 = |x|
˜ 2 b2 − 2x
˜ · yb
˜ + |y|
˜ 2 = |x|
˜ 2 (b −
˜2−
ここで、|y˜ − bx|
) + |y|
.
2
˜
|x|
|x|2
˜ · y˜
x
cxy
これは、b =
= 2 のとき最小になり、また、|(y − bx − a)1|2 = (y − bx − a)2 n は、a = y − bx のとき最小にな
2
˜
|x|
sx
る。
注 28
(1) これを y = a + bx と書いたとき、b = r
sy
cxy
= 2 を回帰係数と言う。
sx
sx
(2) r + 0 の時、y の x への と、x の y への の回帰係数は 0 に近く、回帰直線は大きく異なる。これは回帰直線の不安
定さを示している。
(3) yˆ =
y−y
x−x
, x
ˆ=
は、それぞれ x, y の標準化みたいなものであり、回帰直線は、yˆ = rxy x
ˆ と書ける。
sy
sx
4. 回帰直線
41
例題 15 次はある地域の5日間の天気予報の降水確率 x(%) と実際の降水量 y(mm) である。
x
80
20
40
60
50
y
40
0
20
50
40
(1) x と y の平均 x、y を求めよ。
(2) x と y の分散 sx 2 ,sy 2 を求めよ。
(3) x と y の共分散 cxy を求めよ。
(4) x と y の相関係数 r を求めよ。
(5) y の x への回帰直線を求めよ。
注 29
(1) 相関係数等計算機 (WEB 版)
http://blade.nagaokaut.ac.jp/~hara/class/applied-statistics/covar/
(2) 確率分布 (WEB 版)
http://blade.nagaokaut.ac.jp/~hara/class/applied-statistics/dist/
(3) カシオの計算サイト http://keisan.casio.jp/
http://blade.nagaokaut.ac.jp/~hara/class/applied-statistics/covar/
43
第 8 章 標本分布
§1
母集団と標本
(1) 全数調査
(2) 標本調査
(3) 母集団
(4) 無作為抽出
(5) 標本、標本の大きさ
(6) 有限母集団:無限母集団
(7) 復元抽出法:非復元抽出法
母集団
標本
§2
統計学と数学
ここでは、現実の統計と理論的な確率 (論) を結びつける。
例とする母集団として、新潟県の中学生全体を取ろう。中学生のどんな部分集団 (例えば西中学校の中学生) に対して
もその全体からみたパーセンテージがえられる。
よって、次のような「なぞらえ」を行うと、「現実」を数学の枠組みで捉えられるだろう。
母集団 (新潟県の全中学生)
=⇒
Ω
(標本空間)
部分集団 (西中学)
=⇒
A
(事象)
部分集団の割合
=⇒
P(A)
(確率)
これはすなわち、個々のメンバーに注目することを根源事象とし、根元事象が等確率で起こるとして、P を定義したこ
とに相当する。
ところで、個々のメンバー (中学生) に対しては、様々な特性 (例えば身長とか体重とか) がある。その特性の標本を 1
つ取り出すこと、つまり「1 つの標本を取る」あるいは、「1 つの標本 X を取る」あるいは、「1 つの標本 X がその実現
値 x を取る」に相当する数学的表現は何だろうか?1 つの考え方を以下に述べる。
1 つ Ω の要素 ω に対して身長などの特性を表す実数 x がある。従って、標本 X は、確率変数 X であるとみなすこと
ができる。つまり、X は ω に x = X(ω) を対応付けている。x を標本 X の実現値と呼ぶ。
第 8 章 標本分布
44
更に、例えば「身長が xcm 以下の中学生」のパーセンテージを考えることができる。すなわち、実数 x に対しては、
確率 P(X = x) や P(X 5 x) を考えることができる。これが、標本分布あるいは標本の分布関数である。
メンバーω と特性 x の対応
=⇒
x = X(ω)
(X : 確率変数)
特性に条件をつけた集団の割合
=⇒
P(X 5 x)
(分布関数)
実際には、ω, X, X(ω) のどれもが標本と呼ばれることがあるので注意する必要がある。(また、次に述べる複数個の
確率変数 X1 , X2 , · · · を標本と呼ぶこともある。)
「ある特性について、大きさ n の標本 X1 , X2 , · · · , Xn を取る」と言ったときは、
「各確率変数 Xi は、ある確率変数
X と同じ確率分布を持ち、互いに独立である」ということを仮定する。
注 30 この X の n 回の標本の抽出を数学的に表現してみる。(参考:第 6 章第 3 節)
Ω 上の確率変数 X が与えられたとする。
Ωn = {(ω1 , ω2 , · · · , ωn ) | ω1 , ω2 , · · · , ωn ∈ Ω} に直積として確率定義する。この時、Ωn 上の確率変数の集まり
X1 , X2 , · · · , Xn を次のように定義する。
Xi
:
Ωn → R
(ω1 , ω2 , · · · , ωi , · · · , ωn ) 7→ X(ωi ).
X の大きさ n の標本とは、この X1 , X2 , · · · , Xn のことである。これらの確率変数は互いに独立である。
また、X1 , X2 , · · · , Xn の実現値 x1 , x2 , · · · , xn とは、その値の集まり X(ω1 ), X(ω2 ), · · · , X(ωn ) である。
さて、ここからが面白い (?) ところだが、一般に確率変数の集まり X1 , X2 , · · · , Xn を一つの集合だと思って、
「デー
X1 + X2 + · · · + Xn
タ整理」のところで述べた各種の量を計算することができる。例えば X =
のような標本平均や標
n
本分散などである。このような量を統計量という。統計量の実現値の計算こそが「データ整理」である。
統計量も Ωn 上の確率変数であり、分布を持つ。この分布を標本分布と呼ぶ。
これに対して元の X に対する平均 E(X) や分散 V (X) は、母平均、母分散と言い、総称して母数という。X がある
特性を表す確率変数なら、E(X), V (X) は、その母集団の特性の値のデータ平均や分散と一致する。(この後の定理 3.2)
統計学の目的の一つは、統計量 (の実現値) から母数を推し量ることである。
3. 標本平均 X の分布
45
§3
標本平均 X の分布
3.1
一般的な話
定理 3.1 データの平均が µ、データの分散が σ 2 である母集団から取った 1 つの標本を確率変数 X で表せば、E(X) =
µ, V(X) = σ 2 である。
[証明] 各メンバーを ωi 、メンバーの総数を n とする。E(X) =
V(X) = E((X − E(X)) ) =
2
∑
i (X(ωi )−µ)
n
2
∑
i X(ωi )P ({ωi }) =
∑
1
i X(ωi ) n =
∑
i
X(ωi )
n
= µ. また、
=σ . 2
定義 24 大きさ n の標本 X1 , X2 , · · · , Xn を考える。
(1) 標本平均 X とは、 n 個の確率変数 Xi の平均である。すなわち
X=
X1 + · · · + Xn
.
n
(2) 標本分散 S 2 (X) とは、 n 個の確率変数 Xi の分散である。すなわち
S 2 (X) =
(X1 − X)2 + · · · + (Xn − X)2
.
n
これについては後で考察する。
定理 3.2 確率変数 X1 , · · · , Xn が独立で、平均値 µ、分散 σ 2 の分布に従うとき、その標本平均 X =
の分布の平均、分散は、E(X) = µ, V(X) =
∑
σ2
である。
n
X1 + · · · + Xn
n
∑
∑
Xi
E(Xi )
µ
)= i
= i = µ.
n
n
n
∑
∑
∑ 2
Xi
σ2
i V(Xi )
iσ
また、V(X) = V( i
) =
=
=
. 2
2
n
n
n
n
定理 2.3
[証明] E(X) = E(
3.2
i
正規分布に関わること
一般には次のような「大定理」がある。
定理 3.3 (中心極限定理) 確率変数 X1 , · · · , Xn が独立で、平均 µ、分散 σ 2 の同一の分布に従うとき、その標本平均
X1 + · · · + Xn
σ2
X=
の分布は、n が大きいとき、N (µ,
) に近づく。
n
n
この定理は多くのデータが正規分布に従っていると仮定する根拠となっている。
定理 3.4 (正規分布の再現性)
(1) X, Y が独立で正規分布 N (µx , σx 2 ), N (µy , σy 2 ) に従うなら、X + Y は、正規分布 N (µx + µy , σx 2 + σy 2 ) に
従う。
(2) X が正規分布 N (µ, σ 2 ) に従うなら、kX は正規分布 N (kµ, k 2 σ 2 ) に従う。
注 31
(1) X + Y が 2 山にならない。
(2) 因みに 2 つの集団があってそれぞれ大きさが n1 , n2 、平均が µ1 , µ2 、分散が s1 2 , s2 2 であるとき、それを合わせ
た集団の平均と分散を µ, s2 とすると、
µ =
s2
=
n1 µ1 + n2 µ2
,
n1 + n2
n1 n2
n1 s1 2 + n2 s2 2
(µ1 − µ2 )2 .
+
n1 + n2
(n1 + n2 )2
第 8 章 標本分布
46
(3) X1 , X2 が同一で、独立な確率変数なら、V(X1 + X2 ) = 2V(X1 ). 一方、V(X1 + X1 ) = 4V(X1 ).
系 3.5 N (µ, σ 2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本平均を X とすると、X は、N (µ,
に従う。
σ2
)
n
系 3.6 N (µ, σ 2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本平均を X とすると、X の標準化
X −µ
√ は、標準正規分布 N (0, 1) に従う。
σ/ n
3.3
標本比率の分布
母集団が A と A に分けられるとき、A 上で 1、A 上で 0 となる確率変数を考える。
これは、ベルヌーイ分布と呼ぶのだった。(第 5 章第 1.1 節)
P(A) = p を母集団比率と言う。
さて、n 回の復元抽出をした時の標本平均を標本比率と言う。
すなわち、各 Xi を i 回目に A に入るとき 1、A に入るとき 0 である独立な確率変数とし、X = X1 + · · · Xn として、
X
を標本比率と言う。
n
以下のことが言える。
(1) E(Xi ) = p, V(Xi ) = p(1 − p).
(2) X は、2 項分布 B(n, p) に従い、E(X) = np, V(X) = np(1 − p).
(3) E(
X
X
p(1 − p)
) = p, V( ) =
.
n
n
n
(4) n が大きいとき、中心極限定理より、
X
p(1 − p)
は N (p,
) に近い。
n
n
次の定理は、中心極限定理を用いずとも素朴に証明できる。
定理 3.7 (ラプラスの定理)
(1)
X を 2 項分布 B(n, p) に従う確率変数とすると、n が大きいとき、
X
p(1 − p)
は、N (p,
) に近い。
n
n
(2) X は、N (np, np(1 − p)) に近い。
X − np
(3) √
は、N (0, 1) に近い。
np(1 − p)
例題 16 次の (1) と (2) にはどのぐらい「差」があるか?
(1) サイコロを 5 回振って 1 回以上 1 が出る確率
(2) サイコロを 500 回振って 100 回以上 1 が出る確率
§4
χ2 分布
定義 25 N (0, 1) に従う独立な確率変数 X1 , X2 , · · · , Xn に対し、χ2 =
n
∑
i=1
う。χ2 (n) と書くことがある。
Xi 2 の従う分布を自由度 n の χ2 分布とい
5. t 分布
注 32
(2008/06/09 - 16:25:28): ページ 4 (2008年6月9日 16:25)
47
(1) X が標準正規分布に従うなら、X 2 は χ2 (1) に従う。
(2) n = 1 のときの確率密度関数は f1 (x) = √
(3) n = 2 のときの確率密度関数は f2 (x) =
(4) 漸化式: fn+2 (x) =
1
1
e− 2 x 。 (第 4 章定理 3.4)
2πx
1 −1x
e 2 。
2
x
fn (x)。
n
定理 4.1 X, Y が独立で、自由度 m, n の χ2 分布に従うとき,X + Y は自由度 m + n の χ2 分布に従う。
[証明] 定義より明らか。
定理 4.2 N (µ, σ 2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本平均を X とすると、χ2 =
n
∑
Xi − µ 2
(
)
σ
i=1
は自由度 n の χ2 分布に従う。
[証明] 定義より明らか。
定理 4.3 N (µ, σ 2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本平均を X とすると、χ2 = (
X −µ 2
√ )
σ/ n
は自由度 1 の χ2 分布に従う。
[証明] 系 3.6 より、
X −µ
√ が N (0, 1) に従うから。
σ/ n
定理 4.4 N (µ, σ 2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本平均を X とすると、χ2 =
は自由度 n − 1 の χ2 分布に従う。
n
∑
Xi − X 2
(
)
σ
i=1
[証明] 難しいので略。(n = 2 の時は明らかだが。) 注 33 定理 4.2 と比較せよ。
教科書 p.51 例 3.2 をやろう。
§5
t 分布
スチューデントの t 分布と言われるが、「スチューデント」はギネスビールの技術者コゼットのペンネームであった。
定義 26 X が N (0, 1)、Y が χ2 (n) に従い、X と Y が独立であるとき、
X
T =√
Y /n
の従う分布を自由度 n の t 分布という。t(n) と書くことがある。
第 8 章 標本分布
48
注 34
(1) E(T ) = 0, V (T ) =
n
, (n > 2) である。
n−2
(2) n → ∞ あるいは n > 30 ぐらいで、T + N (0, 1) である。
(2008/06/09
- 16:25:28):
ページ 4 (2008年6月9日 16:25) n の標本 X1 , X2 , · · · , Xn の標本平均を X 、標本分散を S 2 =
定理 5.1
N (µ, σ 2 ) に従う母集団から取った大きさ
1∑
(Xi − X)2 とするとき、
n
X −µ
√
T =
S/ n − 1
は自由度 n − 1 の t 分布に従う。
注 35 系 3.6 と比較せよ。
X −µ
n
√ は N (0, 1) に従い、定理 4.4 より、 2 S 2 は χ2 (n − 1) に従う。これらは独立でもある (証明
σ
σ/ n
略)。よって定義より、
[証明] 系 3.6 より、
√
X −µ
√
σ/ n
n 2
S /(n − 1)
σ2
=
X −µ
√
=T
S/ n − 1
は、自由度 n − 1 の t 分布 t(n − 1) に従う。
教科書 p.52 例 3.3 をやる。例 3.4 はいい。
注 36 この T =
§6
X−µ
√
S/ n−1
を X のスチューデント化と言う。因みに Z =
X−µ
√
σ/ n
は標準化。
F 分布
定義 27 X, Y が独立で χ2 (n1 ), χ2 (n2 ) に従うとき、
F =
X/n1
Y /n2
の従う分布を自由度 (n1 , n2 ) の F 分布という。F (n1 , n2 ) と書くことがある。
6. F 分布
注 37 E(F ) =
49
n2
n2 −2
(n2 > 2), V (F ) =
2n22 (n1 +n2 −2)
n1 (n2 −2)2 (n2 −4)
(n2 > 4).
定理 6.1 X1 , X2 , · · · , Xn を N (µ, σ 2 ) に従う標本で、X =
とするとき、
F =
1
n
∑
Xi · · · 標本平均、S 2 =
1
n
∑
(Xi − X)2 · · · 標本分散
(X − µ)2
S 2 /(n − 1)
は自由度 (1, n − 1) の F 分布に従う。
n
X −µ
√ は N (0, 1) に従い、定理 4.4 より、 2 S は χ2 (n − 1) に従う。これらは独立でもある (証明
σ
σ/ n
略)。よって定義より、
[証明] 系 3.6 より、
X −µ 2
√ ) /1
(X − µ)2
σ/ n
=
=F
n 2
S 2 /(n − 1)
S
/(n
−
1)
σ2
(
は、χ2 (n − 1) に従う。
第 8 章 標本分布
50
§7
まとめ
X1 , X2 , · · · , Xn が N (0, 1) に従い独立であるとき、
(1) X =
√
X1 + X2 + · · · + Xn
は N (0, 1/n) に従う。 n · X は N (0, 1) に従う。
n
(2) X1 2 + X2 2 + · · · + Xn 2 は χ2 (n) に従う。
2
2
2
(3) (X1 − X) + (X2 − X) + · · · + (Xn − X) は χ2 (n − 1) に従う。
√
n−1
X
√
(4)
は t(n − 1) に従う。
2
2
2
n
(X1 − X) + (X2 − X) + · · · + (Xn − X)
(5) 【早見表】
χ2 分布
正2 + 正2 + · · · + 正2
t 分布
√
正
正2 + 正2 + · · · + 正2
自由度
F 分布
)
正 + 正2 + · · · + 正2
自由度1
( 2
)
正 + 正2 + · · · + 正2
自由度2
(
2
51
第 9 章 推定
§1
点推定
T (x1 , x2 , · · · , xn ) を n 変数の関数とする。母数 θ を持つ母集団から取った標本 X1 , X2 , · · · , Xn について、確率変
数 T (X1 , X2 , · · · , Xn ) を計算して θ を推定する。これを点推定と言う。
定義 28 E(T ) = θ となるとき T = T (X1 , X2 , · · · , Xn ) を θ の不偏推定量と言う。
∑n
定理 1.1 母平均 µ を持つ母集団から取った標本 X1 , X2 , · · · , Xn について、標本平均 X =
定量である。
i=1
n
Xi
は、µ の不偏推
[証明] (易) ∑n
定理 1.2 不偏分散 U 2 =
− X)2
は母分散 σ 2 の不偏推定量である。(標本分散 S 2 =
n−1
i=1 (Xi
散 σ 2 の不偏推定量でない。)
∑n
i=1 (Xi
− X)2
n
は母分
[証明] Xi − µ = Xi − X + X − µ の両辺を 2 乗して
(Xi − µ)2 = (Xi − X)2 + 2(Xi − X)(X − µ) + (X − µ)2
∑n
i=1
すると
n
∑
(Xi − µ)2 =
i=1
ここで、
(Xi − X)2 + 2
i=1
∑n
n
∑
n
∑
i=1 (Xi
(Xi − µ) =
i=1
であり、E(
n
∑
i=1 (Xi
nσ 2 = E(
n
∑
(X − µ)2
i=1
)
i=1 (Xi − X) (X − µ) = 0 であるから、
(Xi − X) +
− µ)2 ) =
n
∑
(∑n
2
i=1
∑n
(Xi − X)(X − µ) +
i=1
− X)(X − µ) =
2
n
∑
n
∑
(X − µ) =
2
i=1
∑n
i=1
n
∑
(Xi − X)2 + n(X − µ)2
i=1
V(Xi ) = nσ 2 、E((X − µ)2 ) = V(X) =
1 2
σ なので、
n
(Xi − X)2 ) + σ 2
i=1
よって、証明された。
注 38 【数学的メモ (E に関するピタゴラスの定理)】確率変数 X, Y に対して、X ⊥ Y (X と Y は直交する) というこ
とを E(XY ) = 0 と定義すると次の定理が成り立つ。
X ⊥ Y =⇒ E((X + Y )2 ) = E(X 2 ) + E(Y 2 )
2
例として、µ = E(X) のとき、(X − µ) ⊥ µ よって、E(X 2 ) = E((X − µ)2 ) + E(µ) = E((X − µ)2 ) + E(X) 。
第9章
52
§2
推定
区間推定
母数 θ と、ある統計量 (確率変数) T1 , T2 について、P(T1 < θ < T2 ) = 1 − α であり、T1 , T2 の実現値として、t1 , t2
が得られたとき、「1 − α を信頼係数 (信頼度) として t1 < θ < t2 である」という言い方をする。
これを母数 θ の区間推定という。t1 , t2 を信頼限界、[t1 , t2 ] を信頼区間、という。
母数 θ について「t1 < θ < t2 となる確率が 1 − α である。」という言い方は、必ずしも間違いではないが、あまりし
ない。
注 39 【区間推定の基本的なトリック】
|X − θ| < k
すなわち、
θ−k <X <θ+k
を
X −k <θ <X +k
と逆転して考えると、X の実現値 x から、θ の区間推定、
x−k <θ <x+k
が得られる。
例題 17 正規分布 N (µ, 225) をなす母集団から、1 つサンプルを取ると値が 60 だった。µ を信頼係数 95% で推定せよ。
X −µ
【解】N (µ, 225) から取った標本を X とすると、
は、標準正規分布 N (0, 1) に従い、従って、数表より、確率
15
が 0.95 で
|X − µ|
< 1.96
15
である。X の実現値が 60 なので、
60 − µ 15 < 1.96
である。これを µ についての条件に直せば、次のように言える。
32.6 < µ < 89.4
であれば、X = 60 は、確率 0.95 以内で起こる出来事である。
【今後の話の早見表】
母平均 µ
母分散 σ 2
標本平均 X
標本分散
使う分布
タイプ 1
推定量
要
要
不要
正規分布
タイプ 2
推定量
不要
要
要
t(n − 1) 分布
タイプ 3
要
推定量
不要
母平均を利用した分散
χ2 (n) 分布
タイプ 4
不要
推定量
要
要
χ2 (n − 1) 分布
§3
母平均の推定
3.1
σ 2 と X から µ を推定
定理 3.1 母集団 N (µ, σ 2 ) の σ 2 が分かっている時の n 個の標本の平均 X から推定する µ の信頼係数 1 − α の信頼区間は
σ
|olX − µ| < λ √
n
σ
σ
すなわち、 X − λ √ < µ < X + λ √
n
n
3. 母平均の推定
である。ここに、λ は標準正規分布 N (0, 1)
[証明] Z =
53
で与えられる。
X −µ
X −µ
√ は、N (0, 1) に従うので、P(| √ | < λ) = 1 − α から。
σ/ n
σ/ n
例題 18 ある県では毎年 1 年入学時に数学の基礎学力テストを実施している。今年入学した全員に同一のテストを行っ
2
たところ、ある高校の 450 人の平均点は 62.0 である。全県の分散は 15.02 点 であった。テストの成績が正規分布に従う
ものとして信頼係数 95% で全県平均 µ を推定せよ。
15.0
15.0
(答)62.0 − 1.96 √
< µ < 62.0 + 1.96 √
で、60.61 < µ < 63.39。
450
450
第9章
54
3.2
推定
U 2 と X から µ を推定
定理 3.2 母集団 N (µ, σ 2 ) から取った n 個の標本の平均 X と不偏分散 U 2 =
信頼係数 1 − α の信頼区間は
U
|X − µ| < t √
n
1 ∑n
(Xi − X)2 から推定する µ の
n − 1 i=1
U
U
すなわち、 X − t √ < µ < X + t √
n
n
である。ここに、t は自由度 n − 1 の t 分布 t(n − 1)
[証明] 標本分散を S 2 =
で与えられる。
1 ∑n
X −µ
X −µ
2
√
√ は、t(n − 1) に従うので。
=
i=1 (Xi − X) とする。定理 5.1 より T =
n
U/ n
S/ n − 1
注 40 結論の
U
U
X − t√ < µ < X + t√
n
n
は、
X − t√
S
S
< µ < X + t√
n−1
n−1
と同じである。
例題 19 ある県では毎年 1 年入学時に数学の基礎学力テストを実施している。今年入学した全員に同一のテストを行っ
2
たところ、ある高校の 450 人の平均点は 62.0、分散は 15.02 点 であった。テストの成績が正規分布に従うものとして信
頼係数 95% で全県平均 µ を推定せよ。
15.0
15.0
(答)62.0 − 1.96 √
< µ < 62.0 + 1.96 √
で、60.61 < µ < 63.39。
449
449
(参考: 例題 18。実は値がほとんど変わらない。)
例題 20 ある工場で作るねじを 5 個抜き取り調査するとその直径は
99.8
99.9
100.0
100.1
100.2
(mm)
であった。以下の問に答えよ。
(1) このデータの平均 x と不偏分散 u2 を求めよ。
√
(2) この工場で作るねじの大きさ µ を信頼度 α = 99% で推定せよ。( 5 = 2.23)
【解】
(1) x = 100.0.
u2 = (0.22 + 0.12 + 0 + 0.12 + 0.22 )/4 = 0.025.
X −µ
√ は自由度 4 の t 分布に従う。P (|T | > t) = 0.01 となる t は t = 4.604. よって
U/ 5
√
0.025
= 0.33.
求める信頼区間は |100.0 − µ| < 4.604 · √
5
(2) X を標本平均とすると、T =
練習問題 6 次は、電車のある運転手が、8 回電車を停車させた時の停車位置の基準線からのずれを表している。
90
60
− 20
− 10
50
20
− 30
80
(単位 cm)
この運転手の停車位置のずれの平均の信頼区間を求めよ。ただし、信頼係数は 90%とする。
他の問題:教科書例 4.4
1∑ 2
2
S2 =
Xi − X の方が計算しやすいかも。
n
4. 母分散の推定
55
§4
母分散の推定
4.1
µ と S0 2 から σ 2 を推定
平均が分かっているのに分散が分からないという不自然なケース (?)
定理 4.1 母集団 N (µ, σ 2 ) の µ が分かっているとき、n 個の標本から作った量 S0 2 =
σ 2 の信頼係数 1 − α の信頼区間は
k1 <
nS0 2
< k2
σ2
すなわち、
1 ∑n
(Xi − µ)2 から推定する
n i=1
nS0 2
nS0 2
< σ2 <
k2
k1
2
仏一
である。ここに、k1 , k2 は自由度 n の χ2 分布 χ2 (n)
[証明] 定理 4.2 より χ0 2 =
n
∑
i=1
(
で与えられる。
Xi − µ 2
nS0 2
) =
は、χ2 (n) に従うので。
σ
σ2
問題:教科書例 4.5。
1∑ 2
2
S0 2 =
Xi − X + (X − µ)2 で計算すると良いかも。
n
4.2
X と S 2 から σ 2 を推定
定理 4.2 母集団 N (µ, σ 2 ) から取った n 個の標本から作った量 X =
る σ 2 の信頼係数 1 − α の信頼区間は
k1 <
nS 2
< k2
σ2
すなわち、
1 ∑n
1 ∑n
Xi と S 2 =
(Xi − X)2 から推定す
n i=1
n i=1
nS 2
nS 2
< σ2 <
k2
k1
である。ここに、k1 , k2 は自由度 n − 1 の χ2 分布 χ2 (n − 1)
[証明] 定理 4.4 より χ2 =
で与えられる。
n
∑
nS 2
Xi − X 2
) = 2 は、χ2 (n − 1) に従うので。
(
σ
σ
i=1
例題 21 次は、電車のある運転手が、8 回電車を停車させた時の停車位置の基準線からのずれを表している。
90
60
− 20
− 10
50
20
− 30
80
(単位 cm)
この運転手の停車位置のずれの分散の信頼区間を求めよ。ただし、信頼係数は 90%とする。
【解】8 つの標本のずれの平均は x = 30、分散 s2 = 1900 である。
8S 2
この運転手のずれの分散を σ 2 とすれば、χ2 = 2 は自由度 7 の χ2 分布に従う。
σ
信頼区間外を 10%すなわち左右に 5%ずつ取るので、P (χ2 > k1 ) = 0.95 となる k1 を求めて k1 = 2.167。また、
P (χ2 > k2 ) = 0.05 となる k2 を求めて k1 = 14.07。
8s2
8s2
求める信頼区間は
< σ2 <
すなわち、 1080 < σ 2 < 7014 。
k2
k1
練習問題 7 ある工場で作るねじを 5 個抜き取り調査するとその直径は
99.8
99.9
100.0
100.1
100.2
(mm)
であった。この工場で作るねじの大きさの分散 σ 2 を信頼度 α = 99% で推定せよ。
他の問題:教科書例 4.6。
1∑ 2
2
S2 =
Xi − X で計算すると良いかも。
n
第9章
56
§5
母比率の推定
5.1
大標本の場合
推定
例題 22 ある選挙において、有効得票 N = 200000 の内 n = 100 票を調べると k = 50 票が T 氏の得票であった。T 氏
の得票率 p を信頼度 a = 0.95 で推定せよ。
以下が考え方である。
(1) T 氏の得票数 X = X1 + X2 + · · · + Xn は B(n, p) に従う。
(2) B(n, p) は n が大きいので、N (np, np(1 − p)) で近似できる。
(3) 標本平均 pˆ =
X
は n が大きいので、N (p, p(1 − p)/n) で近似できる。
n
pˆ − p
(4) 標準化して Z = √
は、N (0, 1) に従う。
p(1 − p)/n
(5) P(|Z| 5 z) = 0.95 となる z を求めると z = 1.96。
|ˆ
p − p|
5 z となる確率が 95%。
(6) つまり √
p(1 − p)/n
√
√
(7) つまり pˆ − z p(1 − p)/n 5 p 5 pˆ + z p(1 − p)/n となる確率が 95%。
√
√
(8)
p(1 − p)/n を pˆ(1 − pˆ)/n で近似して、
√
√
pˆ − z pˆ(1 − pˆ)/n 5 p 5 pˆ + z pˆ(1 − pˆ)/n となる確率が 95%。
√
√
(9) pˆの実現値 = k/n = 50/100 = 0.5、 pˆ(1 − pˆ)/n = 0.5 · 0.5/100 = 0.05 より、0.402 5 p 5 0.598 で、8.04 万 5
N p 5 11.96 万。
定理 5.1 (母比率の推定) サイズ n の標本のうち性質 A を持つものが k 個あったすると、A の母比率 p の信頼度 a の信
頼区間は
√
pˆ − z
で与えられる。ここに pˆ =
pˆ(1 − pˆ)
5 p 5 pˆ + z
n
√
pˆ(1 − pˆ)
n
k
、z は N (0, 1) で P( − z 5 X 5 z) = a となるもの。
n
注 41 この近似が良いものであるためには、nˆ
p も n(1 − pˆ) も 5 より大きいことが望ましい。
練習問題 8 H 氏は標本数 n = 100 で得票数 30 だった。信頼度 95%で得票率を推定せよ。
定理 5.2 (母比率の差の推定) 性質 A と性質 B は独立とする。サイズ nA の標本のうち性質 A を持つものが kA 個あっ
たとし、サイズ nB の標本のうち性質 B を持つものが kB 個あったとする。A, B の母比率 pA , pB の差 pA − pB の信頼
度 a の信頼区間は
√
pˆA − pˆB − z
pˆA (1 − pˆA ) pˆB (1 − pˆB )
+
5 pA − pB 5 pˆA − pˆB + z
nA
nB
で与えられる。ここに pˆA =
√
pˆA (1 − pˆA ) pˆB (1 − pˆB )
+
nA
nB
kA
kB
, pˆB =
、z は N (0, 1) で P( − z 5 X 5 z) = a となるもの。
n
n
練習問題 9 T 氏は標本数 nA = 100 で得票数 kA = 50 だった。また別の選挙区で H 氏は標本数 nB = 100 で得票数
kB = 30 だった。信頼度 95%で得票率の差を推定せよ。
定理 5.3 (母比率の差の推定) 標本数 n のうち、性質 A を持つものが kA 個、性質 B を持つものが kB 個あったとする。
A, B の母比率 pA , pB の差 pA − pB の信頼度 a の信頼区間は
√
√
pˆA (1 − pˆA ) + pˆB (1 − pˆB ) + 2ˆ
pA pˆB
pˆA (1 − pˆA ) + pˆB (1 − pˆB ) + 2ˆ
pA pˆB
pˆA − pˆB − z
5 pA − pB 5 pˆA − pˆB + z
n
n
で与えられる。ここに pˆA =
kA
kB
, pˆB =
、z は N (0, 1) で P( − z 5 X 5 z) = a となるもの。
nA
nB
6. 母相関係数の推定
57
pˆA pˆB
(証明のヒント) 「様々な確率変数」での定理 2.2 より、Cov(ˆ
pA , pˆB ) = −
であることから、V(ˆ
pA − pˆB ) が計算で
n
きる。
練習問題 10 標本数 n = 100 のうち、T 氏は得票数 kA = 50、H 氏は得票数 kB = 30 だった。信頼度 95%で得票率の差
を推定せよ。
注 42 pA − pB の下限が 0.067 から 0.029 に下がったように見えるが、向こうの標本数は nA + nB = 200、こっちは
n = 100 である。向こうを nA = nB = 50 とすれば、0.012 5 pA − pB 5 0.387 となる。
練習問題 11 前問において、信頼度 99%で得票率の差を推定せよ。
5.2
小標本の場合
標本数が少ない場合の母比率の推定には、F 分布を用いる、という例が、教科書 P.68 に載っているが、本講義では省
略する。
§6
母相関係数の推定
母相関係数の推定には、Fisher の z 変換によって正規分布に持ち込む、という例が、教科書 P.69 に載っているが、本
講義では省略する。
59
第 10 章
§1
検定
最も単純な例
例題 23 飲むと太るという粉ミルクを飲んで育った生後 2ヶ月の赤ちゃん一人の体重を測ると 6.8Kg グラムであった。一
方、一般的には生後 2ヶ月の赤ちゃんの平均体重は 6Kg で、標準偏差は 0.5Kg である。
やはりこの粉ミルクは太らせるのか、有意水準 5%で検定せよ。
【解】
この粉ミルクを飲んだ赤ちゃんの体重は正規分布 N (µ, σ 2 ) (σ = 0.5) に従うとする。µ0 = 6.0 を一般的な赤ちゃんの
平均体重とするとき、
H0 (帰無仮説) :
µ = µ0 すなわち「別に太らない」
H1 (対立仮説) :
µ > µ0 すなわち「太る」
として、検定をする。
X を粉ミルクを飲んだ赤ちゃんの体重を表す確率変数とする。H0 の下、特に太らず、X が N (µ0 , σ 2 ) に従うとするな
X − µ0
x − µ0
6.8 − 6.0
ら、Z =
は N (0, 1) に従う。Z の実現値 z を X の実現値 x = 6.8 から求めると、z =
=
= 1.6。
σ
σ
0.5
一方、P (Z > λ) = 0.05 となる λ は数表より λ = 1.645。
1.6 < 1.645 より、H0 は棄却できない。
結論:
「太るとは言えない」
0.09
0.0
.0000
.0040
.0080
.0120
.0160
,o199
.0239
.0279
.0319
.0359
0.1
,0398
.0438
.0478
.0517
.0557
.0596
.0636
.0675
.0714
.0753
0.2
.0793
.0832
.0871
.0910
.0948
.0987
.llj26
0.3
,1179
.1217
.1255
.1293
.1331
.1368
,1406
.1443
.1480
.1517
0.4
.1554
.1591
.1628
.1664
1700
.1736
1772
.1808
.1844
.1879
0.5
.1915
.1950
.1985
.2019
.2054
.2088
.2123
.2157
.2190
.2224
06
.2257
.2291
.2324
.2357
.2389
.2422
.2454
.2486
.2517
.2549
0.7
.2580
.2611
.2642
.2673
.2704
.2734
.2764
.2794
.2823
.2852
0.8
.2881
.2910
,2939
.2967
.2995
.3023
.3051
.3078
.3106
.3133
09
.3159
.3186
.3212
.3238
.3264
.3289
.3315
.3340
.3865
.3389
1,0
.3438
.3461
,3485
,3508
.3531
.3554
.3577
.3599
1 , 1
.3413
・
3643
,3665
,3686
.3708
。3729
1.2
。
3849
.3869
.3888
.3907
.3925
.3944
.3962
.3980
.3997
ユ, 3
,4032
.4049
.4066
.4082
.4099
.4115
,4131
.4147
.4162
1.4
.4192
.4207
.4222
.4236
.4251
.4265
.4279
.4292
4306
1.5
,4332
.4345
,4357
.4370
.4382
.4394
.4406
.4418
.4429
9
.4452 .狙 63 .4474.4484臣
.3749
。3770
.1064
。3790
.1103
.3810
.1141
3621
.3830
.4015
,4177
.4319
.4441
.4515 .4525 .4535 .4545
.4554
.4564
.4573
.4582
憂 王 亜 轟
.4591 .4599
.4608
.4616
.4625
。 4633
1.8
.4641
.4649
,4656
.4664
.4671
.4678
.4686
.4693
.4699
,4706
1.9
.4713
.4719
,4726
.4732
.4738
.4744
.4750
.4756
.4761
2.0
.4772
.4778
.4783
.4788
.4793
.4798
.4803
.4808
.4812
.4817
2.1
4821
。
.4826
.4830
.4834
.4838
.4842
.4846
.4850
.4854
.4857
2.2
.4861
.4864
.4868
.4871
.4875
,4878
.4881
.4884
.4887
.4890
2.3
.4893
.4896
.4898
.4901
2.4
.4918
.4920
.4922
4925
.4904
。4927
.4906
.4929
.4909
.4931
.4911
.4932
.4913
.4934
,4916
.4936
2.5
.4938
.4940
.4941
,4943
.4945
.4946
.4948
.4949
.4951
.4952
2.6
.4953
.4955
,4956
,4957
.4959
.496o
,4961
.4962
.4963
.4964
2.7
.4965
.4966
.4967
.4968
.4969
.4970
.4971
.4972
.4973
2.8
.4974
.4975
。4976
。4977
.4977
.4978
.4979
.4979
.4980
4981
2.9
.4981
,4982
.4982
.4983
.4984
.4984
.4985
.4985
.4986
.4986
3.0
.4987
.4987
.4987
.4988
.4988
.4989
.4989
.4989
,4990
.4990
3.1
4990
。
.4991
.4991
.4991
.4992
.4992
.4992
.4992
.4993
.4993
,4767
θ、
θS
4974
汁い18θ土=│.8
例題 24 例題 23 と同じ設定で、赤ちゃん一人ではなく二人の体重の平均が 6.8Kg グラムであったとしたらどうか。
【解】粉ミルクを飲んだ赤ちゃんの体重を表す確率変数 X が特に太らず、N (µ0 , σ 2 ) に従うとするなら、二人体重の平
X − µ0
6.8 − 6.0
x − µ0
√ は、N (0, 1) に従う。z =
√ =
= 2.26。
均 X は (正規分布の再現性より)、N (µ0 , σ 2 /2)、Z =
0.5/1.41
σ/ 2
σ/ 2
これは 1.645 より大きいので、H0 は棄却される。
結論:
「太ると言える」
注 43
(1) 例題の前者で P(Z > 1.6) = 0.0548 をこの標本に基づく p 値と言う。従ってこの様にも言う。「この標本に
基づく p 値が 0.0548 であり、有意水準 0.05 より大きいので、帰無仮説 µ = µ0 は棄却されない。」
第 10 章
60
検定
(2) 例題の後者では P(Z > 2.26) = 0.012 をこの標本に基づく p 値と言う。従ってこの様にも言う。「この標本に基づ
く p 値が 0.012 であり、有意水準 0.05 より小さいので、帰無仮説 µ = µ0 は棄却される。」
§2
検定の考え方
[検定の考え方]
(1) データを得る。
(2) 仮説立て、それを元にモデル (確率分布) を決める。
(3) そのデータの結果が実現される確率が小さいとき、仮説は棄却される。
[検定の実際]
(1) パラメータに関する否定したい仮説 (帰無仮説)H0 と肯定したい仮説 (対立仮説) H1 を設定する。
(2) 適当な統計量 T を選び仮説 H0 の下で T の分布を決定する。
(3) 小さい実数 α(有意水準, 危険率) に対して P(T ∈ W ) = α となる範囲 W (棄却域=めったに起こらないはずの領域)
を仮説 H1 を考慮して決める。
W の決め方 (正規分布の例、一般には…)
言い回し
H0
H1
W
名称
· · · は、異なるといえるか
T =c
T ̸= c
(−∞, λ1 ) ∪ (λ2 , ∞)
両側検定
· · · は、大きいといえるか
T =c
T >c
(λ, ∞)
右側検定
· · · は、小さいといえるか
T =c
T <c
(−∞, λ)
左側検定
(4) データに対する T の実現値 t に対して
(i) t ∈ W =⇒ 有意水準 α で H0 を棄却する。(H1 の肯定)
(ii) t ̸∈ W =⇒ 有意水準 α で H0 を採択 (受容) する。(何もいえない)
すなわち、
(i) モデルに沿って考えるとめったにないことが起こった。
(ii) モデルに沿って考えるとめったにないことが起こったわけではない。
(5) 対立仮説は肯定されるか断言不能になるかどちらかである。
§3
母平均の検定
3.1
母分散 σ 2 が既知である場合の母平均 µ の検定
例題 25 (教科書 p.75 例 5.1) ある集団 A の中から、量 X のサイズ n = 108 のサンプルを取ると、標本平均 X は
x = 164.1(教科書では 164.2) だった。一方、一般に X は N (µ0 , σ 2 ) (µ0 = 163.1, σ = 6.99) に従っているとする。
次のケースで有意水準 α = 0.05 で検定せよ。
(1) A の平均 µ は µ0 と (ありえないほど) 異なる言えるか?(一致すると言えるか?とするとまずい。)
(2) A の平均 µ は µ0 より (ありえないほど) 大きいといえるか。(小さくないことは大前提。)
【解】
3. 母平均の検定
61
(1) 帰無仮説 H0 と対立仮説 H1 を次のように設定する。
H0
: µ = µ0
H1
: µ ̸= µ0
とする。これを有意水準 α = 0.05 で検定する。H0 を仮定すると、Z =
X − µ0
√ は N (0, 1) に従う。その実現値は
σ/ n
164.6 − 163.4
x − µ0
√ =
√
= 1.78。一方、 P(|Z| > λ) = α = 0.05 となる λ を求めると、λ = 1.96 (両側検定)。
σ/ n
6.99/ 108
−λ < z < λ より、H0 は棄却されない。
z=
つまり、A について µ = µ0 は棄却できない。(採択される。H1 については何とも言えない。)
(2) 帰無仮説 H0 と対立仮説 H1 を次のように設定する。
H0
: µ = µ0
H1
: µ > µ0
とする。これを有意水準 α = 0.05 で検定する。H0 を仮定すると、Z =
X − µ0
√ は N (0, 1) に従う。その実現値は
σ/ n
x − µ0
√ = 1.78。一方、 P(Z > λ) = α = 0.05 となる λ を求めると、λ = 1.645 (右側検定)。
σ/ n
z > λ より、H0 は棄却される。
z=
つまり、A について µ > µ0 といえる。(H1 であると言える。)
注 44
(1) 「母分散 σ 2 が既知である場合の母平均 µ の検定」の「母分散」、「母平均」とは、検定の対象となる集団 A
の分散と平均であって、
「一般」のそれではない。しかし、母分散については、
「一般」の分散をもって、A の母分
散として代用する。
(2) 「母分散が既知とする」という言い方をよくするが、「A の分散が一般の場合と等しいと仮定する」と言った方が
いいだろう。
(3) 原理的には、A の平均 µ と「一般」の µ0 との比較でなく、A の平均 µ と任意の値との比較で検定ができる。ただ、
しばしば「一般」の値との違いに興味持つ事が多いということである。
注 45
(1) 両側検定で棄却できないが、右側では棄却できる。右側検定の方がゆるいのだろうか?そうではない。片側
では、µ < µ0 のとき棄却できない。それを考えれば「イーヴン」である。
(2) 右側が「ゆるい」のはベースとなる知識によって第 2 種の誤りが大きくならないことが分かっているので、安心し
ているから。
(3) 「大きい =⇒ 異なる」は真であるのに、両側で H0 が棄却できないのに、右側で H0 が棄却できるのはなぜか?· · ·
ベースとなる知識があるから。
練習問題 12 世界の映画の上演時間の平均は 120.0 分、標準偏差は 10.0 分である。「インド映画は長い」と言われてい
るが、私の見たインド映画 5 本の上演時間は (平均)127 分であった。インド映画の上演時間は世界の平均より長いと言
えるか有意水準 5%で検定せよ。ただし、上演時間は正規分布に従うとする。
3.2
母分散 σ 2 が未知である場合の母平均 µ の検定
例題 26 (教科書 p.76 例 5.2) ある集団 A の中から、量 X のサイズ n = 30 のサンプルをとると、標本平均は x = 0.1032、
標本分散は s2 = 0.00242 だった。一方、一般に X は N (µ0 , σ 2 ) (µ0 = 0.1, σ 2 = 未知) に従っているとする。A の平均
は µ0 と異なる言えるか?有意水準 α = 0.05 で検定せよ。
【解】A の平均を µ とするとき
H0
: µ = µ0
H1
: µ ̸= µ0
第 10 章
62
検定
∑
とする。これを有意水準 α = 0.05 で検定する。X を標本平均、S 2 = n1 (Xi − X)2 を標本分散をあらわす確率変数
X − µ0
√
とする。H0 を仮定すると、T =
は自由度 n − 1 の t 分布 t(n − 1) に従う (第 8 章定理 5.1)。その実現値は
S/ n − 1
x − µ0
0.1032 − 0.1
√ = 7.18。一方、 P(|T | > λ) = α = 0.05 となる λ を求めると、λ = 2.045(両側検定)。
t= √
=
s/ n − 1
0.0024/ 29
t > λ より、H0 は棄却される。
つまり、A について µ = µ0 は棄却される。
(1) α = 0.05 で余裕なので α = 0.04 にして、
「強い主張」に切り替えていいか?· · · そうすると第 2 種の誤り (後
注 46
述) をする確率が大きくなる。
(2) つまり t の値を見てから有意水準を決めてよいか? · · · もちろんよい。(だめと書いてある教科書もある)
(3) なぜ「ぎりぎり検定」がないのか?· · · わかりません。
練習問題 13 世界の映画の上演時間の平均は 120.0 分である。
「インド映画は長い」と言われているが、私の見たインド
映画 5 本の上演時間は
130.0
150.0
130.0
125.0
140.0
(分)
であった。インド映画の上演時間は世界の平均より長いと言えるか有意水準 1%で検定せよ。ただし、上演時間は正規分
布に従うとする。
§4
検定のポリシー
定義 29
第 1 種の誤り
···
H0 が正しいのに H0 を棄却すること
· · · 下図のα
第 2 種の誤り
···
H1 が正しいのに H0 を採択すること
· · · 下図のβ
第 1 種と第 2 種の誤りの説明図:
的 物
イ
ジ
ン
う
負の
チ
【棄却域設定のポリシー】
第 1 種の誤りを一定 (=小さい) に定め、その上で第 2 種の誤り (=母集団の本当の確率分布が H1 を満たすとして、H0 を
採択すること) の確率を最小にするように棄却域を定める。
注 47 有意水準とは第 1 種の誤りを犯す確率である。
注 48 (正規分布等に関する) 対立仮説に応じた棄却域の取り方の根拠は「ネイマン・ピアソンの補題」で証明される。
§5
2 つの母集団の分散が未知であるときの母平均の差の検定
∑
1
定理 5.1 X1 , X2 , · · · , Xm を N (µ1 , σ 2 ) に従う標本で、X = m
Xi 、S1 2 =
∑
∑
Yi 、S2 2 = n1 (Yi − Y )2 とするとき、
を N (µ2 , σ 2 ) に従う標本で、Y = n1
T =√
は自由度 m + n − 2 の t 分布に従う。
X − Y − (µ1 − µ2 )
(
)
1
mS1 2 + nS2 2 1
+
m+n−2
m n
1
m
∑
(Xi − X)2 。また、Y1 , Y2 , · · · , Yn
6. 母分散の検定
63
σ2 σ2
[証明] 第 8 章定理 5.1 と同様にして示せる。正規分布の再現性より、X − Y は N (µ1 − µ2 ,
+ ) に従い、χ2 分布の
m
n
m
n
定義より、 2 S1 2 + 2 S2 2 は χ2 (m + n − 2) に従う。これらは独立でもある (証明略)。よって t 分布の定義より、
σ
σ
X − Y − (µ1 − µ2 )
√
σ 2 /m + σ 2 /n
X − Y − (µ1 − µ2 )
v
=√
(
) =T
um 2
mS1 2 + nS2 2 1
1
u S1 + n S2 2
t σ2
+
σ2
m+n−2
m n
m+n−2
は自由度 m + n − 2 の t 分布に従う。
例題 27 (教科書 p.79 例 5.4) ある市の住民検診で任意に選んだ男性、女性の最低血圧の測定値は以下の通りであった。
男女間に差はあるといえるか、男女間で分散に差はないとし、有意水準 α = 5% で検定せよ。
平均
男性
x = 82.91
女性
y = 81.04
分散
標本数
2
m = 11
2
n = 10
s1 = 82.9
s2 = 101.77
【解】帰無仮説 H0 と対立仮説 H1 を
H0
: µ1 = µ2
H1
: µ1 ̸= µ2
と設定する。これを有意水準 α = 0.05 で両側検定する。
t0 = √
x−y
(1
m·s1 2 +n·s2 2
m+n−2
m
+
82.91 − 81.04
=√
(1
)
11×82.91+10×101.77
1
11+10−2
n
11
+
1
10
) = 0.420.
t(19) 分布で、両袖の合計が 0.05 になる x 軸の値は、2.093 なので、t0 は棄却域に入らない。すなわち、H0 は採択される。
練習問題 14 ある植物を A と B のグループに分け、栽培を行う。グループ A には成長促進の薬を与え、グループ B に
は何の薬も与えなかった。結果、グループ A と B の植物の大きさに関して、以下のような表が得られた。
平均
分散
標本数
2
A
x = 168.1
s1 = 8.8
m = 10
B
y = 164.3
s2 2 = 10.1
n=8
グループ A と B の植物の大きさに関する分散は等しいと見なしてよいとする。グループ A に与えた成長促進の薬は効果
を与えるかどうか、検定せよ。
注 49 2 つのグループの分散が等しいとはかぎらないとする検定方法として、ウェルチ (Welch) 検定がある。
§6
母分散の検定
6.1
µ が未知であるときの σ の検定
例題 28 (教科書 p.84 例 5.7) ある集団 A の中から、量 X のサイズ n = 10 のサンプルをとると、標準偏差が s = 0.268
だった。一方、一般に X は N (µ, σ02 ) (µ = 未知, σ0 = 0.245) に従っているとする。A の標準偏差は σ0 と異なる言える
か?有意水準 α = 0.05 で検定せよ。
【解】A の標準偏差を σ とするとき
H0
: σ = σ0
H1
: σ ̸= σ0
第 10 章
64
検定
とする。これを有意水準 α = 0.05 で検定する。
1 ∑n
nS 2
2
2
は χ2 (n − 1) に従う (第 8 章定理 4.4)。
S 2 を標本分散、S 2 =
i=1 (Xi − X) とする。H0 を仮定すると、χ =
n
σ02
α
10 × 0.2682
= 12.0。一方、 P(χ2 < k1 ) = P(χ2 > k2 ) =
その実現値は k =
= 0.025 となる k1 , k2 を求めると、
2
0.245
2
k1 = 2.700, k2 = 19.02。よって、k1 < k < k2 。
すなわち、H0 は採択。
練習問題 15 次は、ある電車の運転手が、8 回電車を停車させた時の停車位置の基準線からのずれを表している。
90
60
− 20
− 10
50
− 30
20
80
(単位 cm)
一般の運転手のずれの分散は σ0 2 = 8000 cm2 であるとして、この運転手の停車位置のずれのばらつきは少ないといえ
るか、有意水準 5% で検定せよ。
§7
適合度の検定
定理 7.1 一般に検定したいモデルにおいて、事象 i が起こる確率を pi 、標本における i の出現確率 (相対度数) を gi と
するとき、
K=n
k
∑
(gi − pi )2
pi
i=1
は、標本数 n が大きいとき、自由度 k − 1 の χ2 分布に従う。
注 50 モデルに従った事象 i が起こる頻度を qi 、標本における i の出現度数を fi とすると、K は次のようにも書ける。
K=
k
∑
(fi − qi )2
qi
i=1
例題 29 サイコロを n=100 回振ったら出た目 i, (1 5 i 5 k, k = 6) の相対度数は以下の様だった。
目 (i)
1
2
3
4
5
6
相対度数 (gi )
0.11
0.24
0.13
0.18
0.12
0.22
このサイコロは正常か?有意水準 α = 5% で検定しなさい。
【解】
今の場合、pi = 1/6 なので、K の実現値は
(
K
=
=
(0.24 − 0.1667)2
(0.13 − 0.1667)2
(0.18 − 0.1667)2
(0.11 − 0.1667)2
+
+
+
0.1667
0.1667
0.1667
0.1667
)
2
2
(0.22 − 0.1667)
(0.12 − 0.1667)
+
+
0.1667
0.1667
9.08
100
また、自由度 k − 1 = 5 の χ2 分布の 5% 点は、11.07 なので、対立仮説「確率 1/6 からずれている」は結論できず、帰
無仮説「すべての確率は 1/6」は棄却できない。
練習問題 16 (教科書 p.90 例 5.12 参照) 植物の交配によって A, B 2 つの遺伝子が現われる割合は非 A、非 B を A、B
と表せば、AB : AB : AB : AB = 9 : 3 : 3 : 1 となることが期待されていたが、75 サンプルでの実験の結果は以下の通
りであった。
8. 独立性の検定
65
表れ方
AB
AB
AB
AB
相対度数
0.504
0.250
0.244
0.002
この理論は当てはまるといえるか、有意水準 5%で検定せよ。
§8
独立性の検定
定理 8.1 事象 (i, j) の出現確率 (相対度数) を gij とし、gi• =
K=n
∑J
j=1 gij ,
g•j =
∑I
i=1 gij
とおくと、
I ∑
J
∑
(gij − gi• g•j )2
gi• g•j
i=1 j=1
は、標本数 n が大きいとき、自由度 (I − 1)(J − 1) の χ2 分布に従う。
∑J
∑I
注 51 事象 (i, j) の出現度数を fij とし、fi• = j=1 fij , f•j = i=1 fij とおくと、K は次のようにも書ける。
K=
I ∑
J
∑
(nfij − fi• f•j )2
nfi• f•j
i=1 j=1
例題 30 血液型が I = 4 種あり、性格を J = 4 種に分けて、n = 100 人のクラスで、どれに当てはまるかアンケートを
取った。
性格 (i) \血液型 (j)
O
A
B
AB
大らか
0.07
0.04
0.05
0.06
几帳面
0.04
0.03
0.05
0.09
0.05
0.07
0.03
0.11
0.08
0.04
0.10
0.09
気まぐれ
二重人格
血液型と性格は関連があるか?有意水準 α = 5% で検定しなさい。
【解】
性格 (i) \血液型 (j)
O
A
B
AB
gi•
大らか
0.07
0.04
0.04
0.09
0.05
0.03
0.06
0.04
0.22
0.20
二重人格
0.03
0.05
0.05
0.07
0.11
0.08
0.10
0.09
0.29
0.29
g•j
0.19
0.23
0.27
0.29
1.00
几帳面
気まぐれ
(
)
(0.07 − 0.22 · 0.19)
+ · · · = 10.85。また、自由度 (I − 1)(J − 1) = 9 の χ2 分布の 5% 点は、16.92 なので、
0.22 · 0.19
帰無仮説「血液型と性格は独立である」は棄却できず、対立仮説「血液型と性格は関係がある」が結論できない。
2
K = 100
練習問題 17 【練習問題】
ある工場で生産するシリコン基板の欠陥のパターンを A, B, C, D に分類した。次の表は各時間帯での各欠陥パター
ンの出現頻度である。
欠陥と生産時間帯に関係があるか?
A
B
C
D
9:00–11:00
11:00-14:00
15
26
21
31
45
34
13
5
14:00-17:00
33
17
49
20
第 10 章
66
注 52
(1) 相関係数等計算機 (WEB 版)
http://blade.nagaokaut.ac.jp/~hara/class/applied-statistics/covar/
(2) 確率分布 (WEB 版)
http://blade.nagaokaut.ac.jp/~hara/class/applied-statistics/dist/
(3) カシオの計算サイト http://keisan.casio.jp/
検定