相対度数分布グラフ、平均

基礎統計
4月 19日 00:19am.改訂
http://mcobaya.web.fc2.com/kisotokei/index_ut.htm
N を資料の個数(サンプルサイズ)、n を階級の数とすると
2014 年 4 月 18 日開講(金曜日)第 5 時限
1) 原データから平均を計算する方法
教科書
ベレ出版
第一章
石井俊全『まずはこの一冊から
2000 円+税
1323 教室
意味がわかる統計学』
x
(私の発注ミスで入荷遅れます。)
相対度数分布グラフ
x1    x N
N
2)度数分布表から平均を計算する方法:
変量(調査、計測した資料の値)この講義では、サンプルサイ
n を階級の数、i 番目の階級の度数 fi、階級の代表値を xi とし、
ズを N とし、 x1 ,, xN
相対度数 g1 
階級:データ分類する区間「0点以上10点未満」等
サイズ:資料に含まれるデータの個数(資料の個数)
x
f
f1
, , g n  n と定義すると
N
N
f1 x1    f n xn
f
f
は x  x1 1    xn n
N
N
N
階級値:階級の範囲の中央(平均, 代表)値。これで階級内の
値を代表させる。この講義では、階級の数を n とし、 x1, , xn
とも書ける。よく見ると g1 
f
f1
, , g n  n は相対度数なので、
N
N
注意事項:サイズ:生徒数 20 人の学級のデータから学力がに
x  x1g n    xn gn
たいして、サンプル(資料)が 20 とはいわず、サイズが 20 で
と平均が相対度数と階級値で表現できた。
あるという。たとえば 20 人学級を二つ選んで、違う方法で教
同様にして、分散=偏差の二乗の平均
育したとき「サイズ 20 の2つのサンプルで。。。」という。
ヒストグラム(縦軸に度数、横軸に階級をとったグラフ)
s2 
( x1  x ) 2    ( xN  x ) 2
f
f
は相対度数 g1  1 , , g n  n
N
N
N
相対度数分布グラフの書き方
と階級の代表値 x1, , xn を使い
(縦軸が相対度数であるかのような記述をしていましたが、削
s 2  ( x1  x ) 2
f
f1
   ( xn  x ) 2 n  ( x1  x ) 2 g1    ( xn  x ) 2 g n
N
N
除し、訂正いたします。)
標準偏差は分散の平方根。注:直感的には、分散は「中心から
の距離の二乗」の概数なので、その分散である標準偏差は「中
ルール 1:各階級の柱の底辺の長さは階級幅に比例させる。
(一
心からの距離」のだいたいの値
つのグラフに異なる階級幅が混在するときに重要)
絶対値の平均でないのは、絶対値は数学的に扱いにくいこと
ルール 2:相対度数分布グラフの柱(長方形)面積は相対度数
(全体の度数に対する比率)に比例させる。(最重要)したが
って、相対度数が同じで、階級幅が c(2)倍なら高さを 1/c(半分)
と、偏差の自乗の平均で定義したほうが、性質がよいため(詳
細は省略)ので、この定義のほうが普及した。
分散も標準偏差もバラツキの尺度。 x1 , , xn が N 回の計測
とする。(方眼紙の1マスあたりの相対度数を決め、共通にし
値なら計測の精度を表し、投資の収益率ならば投資のリスク
ておくとよい。)
(不確実性)を示す。ハイリスク・ハイリターンというときの
ルール3:相対度数分布グラフを複数描くとき、どのグラフも
リスクです。(日常用語のリスクは下がるときだけだが、金融
全面積を揃えて等しくする。
でのリスクはバラツキの大きさを指す)
階級の幅を c, 相対度数=fi/N のとき、高さ=fi/(cN)とする。
第 2 節(p.26) 平均、分散・標準偏差
平均=変量の総和÷資料の個数
偏差=変量の平均からの差
分散=偏差の二乗の総和÷資料の個数
数値例 1:3 人の得点が2,5,8 点のとき、
全員に 4 点を加えると平均は 4 点上昇。分散は不変
全員の得点を 2 倍すると、平均は 2 倍、分散は 4 倍、標準偏差
は2倍
数値例 2:3 人の得点が 20,50,80 点のとき、この分布のバ
標準偏差=√分散。したがって、標準偏差は見当がつきやすい
ラつきは数値例の何倍か
が、分散の計算はより面倒。」
」
練習問題:
某大学の期末試験において 3 つのクラスで次のような点数分布
を得た。相互に比較しやすいように相対度数分布グラフを描け。
小さな正方形の面積を 0.05 とせよ。(ルール1-3の練習)
A 組(点数)
度数
相対度数
0 以上 20 未満
5
0.1
20 以上 40 未満
10
0.2
40 以上 60 未満
20
0.4
60 以上 80 未満
10
0.2
80 以上 100 以下
5
0.1
合計
50
1
B 組(点数)
度数
相対度数
0 以上 10 未満
5
0.05
10 以上 20 未満
5
0.05
20 以上 30 未満
10
0.1
30 以上 40 未満
10
0.1
40 以上 50 未満
20
0.2
50 以上 60 未満
20
0.2
60 以上 70 未満
10
0.1
70 以上 80 未満
10
0.1
80 以上 90 未満
5
0.05
90 以上 100 以下
5
0.05
合計
100
A組
B組
C組
C 組(点数)
度数
相対度数
0 以上 40 未満
10
0.2
40 以上 50 未満
10
0.2
50 以上 60 未満
10
0.2
60 以上 100 以下
20
0.4
合計
50
1