確率分布2

データ解析
第5回
確率分布2 - 連続確率分布
H26年11月6日
全 眞嬉
1
連続確率変数

連続型確率変数(continuous probability variable )
◦ 実現値が連続した値(任意の実数値) をとる確率変数。連続
型確率変数の分布を連続型確率分布という。

確率密度関数(probability density function)
◦ 確率を分配する規則を表す連続曲線。単に密度関数とも呼
ばれる。
f ( x)
X
2
確率密度関数
(probability density function)
累積分布関数が連続で微分可能なとき, その
導関数を確率密度関数と言う
 連続型確率変数Xが開空間(a,b)に入る確率は、
この区間での確率密度関数とX軸との間の
面積で表される
b
P(a < X < b) = ∫ f ( x)dx

a
f ( x)
a b
X
3
確率密度関数の性質
b
f ( x) ≥ 0, ∫ f ( x)dx = 1
a
Xが期待値aをとる確率はX = aという線分の面積
a
P( x = a) = P(a ≤ X ≤ a) = ∫ f ( x)dx = 0
a
となる。このことから
P ( a ≤ X ≤ b) = P ( a < X ≤ b)
= P ( a ≤ X < b)
= P ( a < X < b)
が成立する。
4
正規分布(Normal Distribution)
平均値の付近に集積するようなデータの
分布を表した連続的な変数に関する確率
分布
 統計学で最も多用される分布
 自然現象や社会現象の多くの確率現象を
説明するために利用される

5
正規分布(Normal Distribution)

次の確率密度関数に従う確率分布を正規分
布と言う
( x− µ ) 2
−
2σ 2
1
f ( x) =
e
µ − σ µ µ + σ
2π σ
この分布に従う確率変数Xの平均値はµ ,
分散はσ 2となる

2
µ
σ
正規分布は平均値 と分散
によって決
2
(
,
) と表記する
N
µ
σ
まり、
6
正規分布の確率密度関数
確率密度関数f(x)のグラフの形は分散
σ 2 の値だけで決まる
 平均値 µ は頂点の横軸を決める

N (0,0.52 )
N (0,12 )
N (0,2 2 )
7
正規分布

正規分布とは
N (0,0.52 )
◦ ある標本集団のばらつきが、その平均値を
境として前後同じ程度にばらついている状
態を示す
◦ 表した分布図で見ると、平均値を線対称軸
とした左右対称の釣鐘型でなだらかな曲線
を描く
◦ つまり、平均値の周辺にサンプルが多く集
まり、値が大小の左右の裾野に向かうとサ
ンプル数が急激に減る
8
正規分布関数

正規分布の分布関数は次のようになる
F ( x) = P( X ≤ x)
∞
∞
−∞
−∞
= ∫ f (t )dt = ∫

1 e
2π σ
−
(t − µ )2
2σ 2
dt
積分値を解析的に求めることはできないの
で,正規分布表を用いて確率を求める
平均値はµ , 分散はσ 2の正規分布をN ( µ , σ 2 )と表す
確率変数Xが正規分布N ( µ , σ 2 )に従うことを
X ~ N ( µ , σ 2 )と書く
9
正規曲線

正規分布の確率密度関
数をグラフで表すと次
の様になる。これを正
規曲線と呼ぶ。
,σ 2 )
N ( µ 
正規曲線の特徴
正規曲線は正の値をと
り、正規曲線の下側の
面積は1
 正規曲線は平均 x = µ に関して左右対称


正規曲線の平均、メ
ディアン、モードはす
べて等しくµ となる
µ − 2σ µ − σ µ µ + σ µ + 2σ
10
パーセント点

上側100p%点と両側100p%点
◦ 確率密度関数の上側又は両側の確率がpに
なる時の確率変数Xの値xのこと
◦ パーセント点と呼ばれる

数式
上側100 p%点:P ( X ≥ x) = p
p
両側100 p %点:P ( X ≥ x) =
2
11
パーセント点
確率密度関数のグラフ
確率p
上側100 p %点のx
確率
p
2
確率
p
2
両側100 p %点のx
12
正規分布の両側5%点、両側1%点

,σ 2 )
推定や検定で利用される正規分布 N ( µ のパーセント点
N ( µ ,σ 2 )
合計確率
0.05
µ − 1.96σ µ − σ µ µ + σ µ + 1.96σ
N ( µ ,σ 2 )
合計確率
0.01
µ − 2σ µ − σ µ µ + σ µ + 2σ µ − 2.58σ µ + 2.58σ
P ( µ − 1.96σ ≤ X ≤ µ + 1.96σ ) = 0.95 P( µ − 2.58σ ≤ X ≤ µ + 2.58σ ) = 0.99
13
正規分布の上側5%点、上側1%点

,σ 2 )
推定や検定で利用される正規分布 N ( µ のパーセント点
N ( µ ,σ 2 )
確率
0.05
µ − σ µ µ + σ µ + 1.64σ
P( X ≤ µ + 1.64σ ) = 0.95
N ( µ ,σ 2 )
確率
0.01
µ − 2σ µ − σ µ µ + σ µ + 2σ µ + 2.33σ
P( X ≤ µ + 2.33σ ) = 0.99
14
標準正規分布
(Standard Normal Distribution)
2
平均値が0、分散が1の正規分布 N (0,1 )
 次の確率密度関数に従う確率分布を標準正
規分布と言う

x2
−
2
1
f ( x) =
e
2π
この分布に従う確率変数Xの平均値は0,
分散は12となる
15
正規分布における標準化
= E[ X ] を引き、標準偏差
確率変数Xから期待値 µ σ = σ ( X ) で割った変数zを確率変数Xの標準化された
変数と言う
X −µ

Z=

σ
標準化を行うことによって、任意の正規分布
を標準正規分布に変換できる。
N ( µ , σ 2 ) とすると X ~ N ( µ , σ 2 )
Z=
X −µ
σ
とおけば、確率変数Zは E[ Z ] = 0,V [ Z ] = 1
16
正規分布における標準化
確率変数うXが正規分布N ( µ , σ 2 )に従う時
X −µ
これを標準化を行う Z =
σ
この標準化された分布は標準分布N(0,12 )になる
N (0,12 )
N (µ ,σ 2 )
標準
17
正規分布表
N (0,12 )
N (0,12 )
P ( Z > zα ) = α
0 zα
18
標準正規分布表
N (0,12 )
P( Z > 1.96) = 0.025
0.025
0 1.96
19
標準正規分布の両側5%点、両側1%点
N (0 ,1 )
,12 )
N (0 2
合計確率
0.05
− 1.96 0 1.96
合計確率
0.01
− 2.58 0 2.58
20
標準正規分布の上側5%点、上側1%点
,12 )
N (0 ,12 )
N (0 確率
0.05
1.65
確率
0.01
2.33
21
t分布(t Distribution)

小さな標本を使っての母平均の推定に使う
分布
◦ 母平均を推定した時には、母集団の分散が分
かっていない

次の確率密度関数に従う確率分布を自由度
nのt分布という
2 − n+1
x 2
f ( x) = k (1 + ) (kは定数)
n
この分布に従う確率変数Xの平均値µ , 分散σ 2
n
2
µ = 0, σ =
n−2
22
t分布
t分布は自由度nの値だけで決まる
 グラフは正規分布に似た釣鐘型
 自由度nを大きくするとt分布は標準正
規分布に近づく

自由度=5
,1 )
N (0 2
t分布
自由度=10
,12 )
N (0 t分布
23
t分布表
自由度nが10のとき
両側5%点は2.229
24
t分布の確率密度関数
自由度1
自由度2
自由度3
自由度∞
25
χ 分布
2
母集団から標本を抽出しそれから不偏分散
を求める
 この不偏分散に関する分布
 母集団の分散を探る重要な役割
 次の確率密度関数に従う確率分布を自由度
2
χ
nの
分布と言う

f ( x) = kx
n
x
−1 −
2
2
e
この分布に従う確率変数Xの平均値µ , 分散σ 2
µ = n, σ 2 = 2 n
26
χ 分布の確率密度関数
2
自由度1
自由度2
自由度3
自由度4
自由度5
27
χ 分布表
2
28
エクセルの関数
分布名
Excel 関数名
説明
正規分布
NORMDIST
正規分布の累積分布関数
正規分布の%点逆引
NORMINV
標準正規分布
NORMDIST の「逆関数」
NORMSDIST 標準正規分布の累積分布関数
NORMSDIST の「逆関数」
標準正規分布の%点逆引
NORMSINV
カイ2乗分布
CHIDIST
カイ2乗分布の上側確率
カイ2乗分布の%点逆引
CHIINV
CHIDIST の「逆関数」
F分布
FDIST
F分布の上側確率
F分布の%点逆引
FINV
FDISTの「逆関数」
t 分布
TDIST
t 分布の片側・両側尾部確率(x 以上・± x
以遠)
t 分布の%点逆引
TINV
TDIST の「逆関数」
29