加重平均 - Romeo

加重平均
経営統計の補足資料
2014年6月16日
金沢学院大学経営情報学部
藤本祥二
加重合計
例) {3, 3, 4, 4, 4, 5, 5, 5, 5, 6}の10個のデータ
合計= 3 + 3 + 4 + 4 + 4 + 5 + 5 + 5 + 5 + 6 = 44, 平均= 44/10 = 4.4
度数で纏めてから合計や平均を計算する. ↓度数の重みを掛ける ↓相対度数の重みを掛ける
データ
番号
𝒊
1
2
3
4
合計
データ
(の値)
𝒙𝒊
𝑥1 = 3
度数
相対度数
𝒇𝒊
𝑓1 = 2
𝒓𝒊
𝑟1 = 0.2
度数×
データ
𝒇𝒊 𝒙𝒊
𝑓1 𝑥1 = 6
𝑥2 = 4 𝑓2 = 3
𝑥3 = 5 𝑓3 = 4
↑最頻値
𝑥4 = 6 𝑓4 = 1
10
-
𝑟2 = 0.3
𝑟3 = 0.4
𝑟4 = 0.1
1.0
𝑓2 𝑥2 = 12 𝑟2 𝑥2 = 1.2
𝑓3 𝑥3 = 20 𝑟3 𝑥3 = 2.0
𝑓4 𝑥4 = 6 𝑟4 𝑥4 = 0.6
44
4.4
4
4
𝑓𝑖
𝑖=1
度数の和は
全データ数
4
𝑟𝑖
𝑖=1
相対度数の
和は1
相対度数
×データ
𝒓𝒊 𝒙𝒊
𝑟1 𝑥1 = 0.6
4
𝑓𝑖 𝑥𝑖
𝑖=1
度数×データ
の和はデータの合計
𝑟𝑖 𝑥𝑖
𝑖=1
相対度数×データ
の和はデータの平均
加重平均その1
例) {3, 3, 4, 4, 4, 5, 5, 5, 5, 6}の10個のデータ
𝑓1 𝑥1
𝑓2 𝑥2
𝑓3 𝑥3
𝑓4 𝑥4
4というデータ
が3個ある
5というデータ
が4個ある
4
合計 = 2 × 3 + 3 × 4 + 4 × 5 + 1 × 6 =
3というデータ
が2個ある
𝑓1
𝑓2
𝑓3
𝑓4
6というデータ
が1個ある
𝑓𝑖 𝑥𝑖
度数という重みを掛けた
データの合計
𝑖=1
4
データ数 = 2 + 3 + 4 + 1 =
𝑓𝑖
重みの合計
𝑖=1
4
重みを掛けた合計
平均 

重みの合計
fx
i 1
4
i i
f
i 1
i
44

 4 .4
10
このような
平均の計算方法を
加重平均という
加重平均その2
例) {3, 3, 4, 4, 4, 5, 5, 5, 5, 6}の10個のデータ
𝑟1
𝑥1
𝑟2
𝑥2
𝑟3
𝑥3
𝑟4
𝑥4
4
0.2 × 3 + 0.3 × 4 + 0.4 × 5 + 0.1 × 6 =
3というデータ
が2割ある
5というデータ
が4割ある
4というデータ
が3割ある
𝑟1
𝑟2
𝑟3
6というデータ
が1割ある
𝑟𝑖 𝑥𝑖
𝑖=1
相対度数という
重みを掛けた
データの合計
4
𝑟4
1.0 = 0.2 + 0.3 + 0.4 + 0.1 =
𝑟𝑖
重みの合計
𝑖=1
4
重みを掛けた合計
平均 

重みの合計
r x
i 1
4
i i
r
i 1
4 .4

 4 .4
1 .0
このような
平均の計算方法を
加重平均という
i
相対度数の場合は重みの合計が必ず1になるので
加重合計がそのまま加重平均になる
異なる重さの重りの釣り合い
重さ(weight)
の違う重りの
釣り合う位置
(重心)を計算
するのに加重
平均の公式が
使える
𝑑1 = 𝑥1 − 𝑥
−1.4
𝑑2
−0.4
重さ
𝑤2
𝑤1
3
2
𝑥1
3
4
x
w x
i 1
4
i i
w
i 1
i
44

 4 .4
10
𝑥2
4
𝑥
4.4
𝑑4
1.6
𝑑3
0.6
𝑤3
4
𝑤4
1
𝑥3
5
𝑥4
6
左側(反時計回り)のトルク
−𝑤1 𝑑1 − 𝑤2 𝑑2 = 2.8 +1.2=3.0
右側(時計回り)のトルク
𝑤3 𝑑3 + 𝑤4 𝑑4 = 2.4 + 1.6 = 3.0
加重平均の公式で求めた位置が
ちゃんと釣り合いの位置になってる
左右のトルクは釣り合ってる
釣り合いの条件
• 前ページの例で,4個の重さが異なる重りでは
−𝑤1 𝑑1 − 𝑤2 𝑑2 = 𝑤3 𝑑3 + 𝑤4 𝑑4
が釣り合うための条件であることが分かった
移項すると
𝑤1 𝑑1 + 𝑤2 𝑑2 + 𝑤3 𝑑3 + 𝑤4 𝑑4 = 0
が釣り合うための条件であることが分かる.
• 一般に𝑛個の重さが異なる重りでは
𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑥=
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
が平均の位置になり,偏差 𝑑𝑖 = 𝑥𝑖 − 𝑥 を使った
𝑤1 𝑑1 + 𝑤2 𝑑2 + ⋯ + 𝑤𝑛 𝑑𝑛 = 0
の条件が必ず成り立つことが証明できる.
「加重平均は釣り合いの位置」の証明
𝑑𝑖 = 𝑥𝑖 − 𝑥
を使う
𝑤1 𝑑1 + 𝑤2 𝑑2 + ⋯ + 𝑤𝑛 𝑑𝑛
= 𝑤1 𝑥1 − 𝑥 + 𝑤2 𝑥2 − 𝑥 + ⋯ + 𝑤2 𝑥𝑛 − 𝑥
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
−𝑤1 𝑥 − 𝑤2 𝑥 − ⋯ − 𝑤𝑛 𝑥
括弧を外し
計算の順番を変える
後半部分を −𝑥 で括る
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
− 𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛 𝑥
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
− 𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
𝑥 の定義を使う
𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
= 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛 − 𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
=0
平均の左右のトルクが釣り合って0になる事が示せた
約分
これまでの平均との関係
• 加重平均の公式
𝑤1 𝑥1 + 𝑤2 𝑥2 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑥=
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛
で全ての重さが等しい 𝑐 だとする
• 𝑤1 = 𝑤2 = ⋯ = 𝑤𝑛 = 𝑐 とすると上の式は
𝑐𝑥1 + 𝑐𝑥2 + ⋯ + 𝑐𝑥𝑛
𝑥=
𝑐 + 𝑐 + ⋯+ 𝑐
𝑐 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
=
𝑐𝑛
これまでの平均の式は
全ての重さが等しい場合の
加重平均
1
= 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑛
共通因子 𝑐 で括る
𝑐 を 𝑛 個足すので 𝑐𝑛
約分
連続データの分析
階級と階級値
連続データの分析
• 量的データは2種類ある
• 離散データ(discret data,整数データ)
• 連続データ(continuous data,実数データ)
– 小数点以下いくらでも小さく半端な値を持つ
例)身長データ、体重データ
– ○○以上○○未満などの階級に分けないと度数
の集計ができない
– 度数分布のグラフでは柱と柱の間をひっつける
このグラフのことを「ヒストグラム」という
階級値
• 階級値
– 階級を代表する値
– (階級の間の値なら何でも良いが)普通は階級の真ん中
の値を階級値にする
階級の下限 + 階級の上限
階級値 =
2
– 階級内のデータは全て階級値の値だと近似することで
データ全体の合計や平均の概算ができる
(階級値に度数や相対度数の重みを掛けた加重平均で計算)
– 階級に要約する前のデータ(生データ)はデータ量が多い
等の理由で手に入らないことがあるので階級値を使った
概算は重要
表2.3.9の女性の体重の度数分布
階級にまとめる前のデータが以下のものだったとする.
{18.1, 20.2, 22.5, 25.3, 27.4, 28.0, 30.2, 31.2, 34.9, 36.4,
37.1, 37.9, 38.4, 39.1, 41.4, 41.8, 43.2, 46.2, 48.6, 55.7} 単位[kg]
合計703.6, 平均: 35.18
階級
階級
階級値 度数 相対
番号
度数
𝒊
𝒙𝒊
𝒇𝒊
𝒓𝒊
1
15
1
0.05
10 ≤ 𝑥 < 20
2
25
5
0.25
20 ≤ 𝑥 < 30
3
35
8
0.40
30 ≤ 𝑥 < 40
↑最頻値の概算
4
45
5
0.25
40 ≤ 𝑥 < 50
5
50 ≤ 𝑥 < 60
55
合計
-
-
1
20
0.05
1.00
𝒇𝒊 𝒙𝒊
15
𝒓𝒊 𝒙𝒊
0.75
125
280
225
55
700
6.25
14.00
11.25
2.75
35.00
↑合計の概算
↑平均の概算
女性の体重の度数分布
度数の目盛
10
相対度数の目盛
0.5
8
0.4
6
0.3
4
0.2
2
0.1
0
0
0
10
20
30
𝑥
35
40
50
60
70
[kg]
表2.3.10の男性の体重の度数分布
階級にまとめる前のデータが以下のものだったとする.
{29.8, 34.2, 38.8, 41.6, 43.3, 47.0, 48.2, 50.8, 52.5, 54.8,
55.2, 57.6, 59.3, 60.5, 61.2, 64.6, 66.2, 66.6, 67.4, 69.2} 単位[kg]
合計1068.8, 平均: 53.44
階級
階級
階級値 度数 相対
番号
度数
𝒊
𝒙𝒊
𝒇𝒊
𝒓𝒊
1
25
1
0.05
20 ≤ 𝑥 < 30
2
35
2
0.10
30 ≤ 𝑥 < 40
3
45
4
0.20
40 ≤ 𝑥 < 50
4
55
6
0.30
50 ≤ 𝑥 < 60
↓最頻値の概算
5
60 ≤ 𝑥 < 70
65
合計
-
-
7
20
0.35
1.00
𝒇𝒊 𝒙𝒊
25
𝒓𝒊 𝒙𝒊
1.25
70
180
330
455
1060
3.50
9.00
16.50
22.75
53.00
↑合計の概算
↑平均の概算
男性の体重の度数分布
度数の目盛
10
相対度数の目盛
0.5
8
0.4
6
0.3
4
0.2
2
0.1
0
0
10
20
30
40
50
𝑥
53
60
70
80
[kg]
P.128問11
番号
階級
階級値 度数
𝒊
𝒙𝒊
𝒇𝒊
1 0.0 < 𝑥 ≤ 0.5 0.25
8
2 0.5 < 𝑥 ≤ 1.0 0.75
27
3 1.0 < 𝑥 ≤ 1.5 1.25
45
4 1.5 < 𝑥 ≤ 2.0 1.75
50
↑最頻値の概算
5 2.0 < 𝑥 ≤ 2.5 2.25
39
6
7
8
2.5 < 𝑥 ≤ 3.0
3.0 < 𝑥 ≤ 3.5
3.5 < 𝑥 ≤ 4.0
2.75
3.25
3.75
合計
-
-
21
7
3
200
相度
𝒓𝒊
0.040
0.135
0.225
0.250
0.195
0.105
0.035
0.015
1.00
𝒇𝒊 𝒙𝒊
2.00
20.25
56.25
87.50
87.75
57.75
22.75
11.25
345.5
↑合計の概算
𝒓𝒊 𝒙𝒊
0.01000
0.10125
0.28125
0.43750
0.43875
0.28875
0.11375
0.05625
1.7275
↑平均の概算
1日に飲む水の量の度数分布
度数の目盛
60
相対度数の目盛
0.3
50
0.25
40
0.2
30
0.15
20
0.1
10
0.05
0
0
-0.5
0
0.5
1
1.5
2
𝑥
0.17275
2.5
3
3.5
4
4.5
[l]