1 http://mcobaya.web.fc2.com/karato.htm 2014 年 10 月 22 日 p.104

http://mcobaya.web.fc2.com/karato.htm
2014 年 10 月 22 日
を引く。)p.106 の自由度の説明はうまい(厳密ではないが)
練習:
クラスサイズと成績
econ/TIMSS_xls/japan0.xlsx
1.「分析ツールによる回帰分析」
Excel2013 での分析ツールのインストール
2.散布図(直線近似)
ファイル=>Excel の option=>設定=>アドイン=>分析ツー
ルに印=>OK
□直線
1.
の隅に黒い■。
リボン「データ」の下に「データ分析」が出現
Y t



Xt のあてはめに
表のグラフをクリックし、アクティヴにする。グラフ
2.
「グラフツール」「レイアウト」「近似曲線」「その他
表 3-1 (p.95)をやってみましょう(第 3 章)
の近似オプション」
「線形近似」、グラフに数式表示」、
http://www3.u-toyama.ac.jp/kkarato/2014/econometrics/data/chap2-econometrics.xlsx
「グラフに R2 表示」を印づけ、「OK」
のデータを入手し、を開く。今度はラベルと残差にチェックを
いれて、レベルも範囲に含める。下の入力範囲参照。残差にチ
ェックをいれると予測値と残差が出力される。
下の分析ツールでの推定式に一致することを確認
決定係数はあてはまりの良さを測る尺度です。R2 ともよばれ
ます。多くの時系列データ(time series data)(複数時点
の単一調査対象)は集計データがおおいので雑音が相殺され、
あ て は ま り が よ い も の が お お く , 横 断 面 デ ー タ (cross
section data)(同一時点、複数調査対象)のうち個票デー
タ(集計前データ)はがノイズが大きく。あてはまりが悪いか
ら悪いモデルというわけではない。
p.104
証明: a,b を係数の最小自乗推定量, ut を残差とすると
それぞれの係数の意味を述べ、直感的に説明できるようにしよ
Σ(Yt-my)2=Σ(Yt-my)2=Σ(a+bXt +ut -my)
う。
=Σ(a+bXt -my)2 +Σut2+2Σut(a+bXt -my)
Y は被説明変数、X は説明変数
ここで Σut=0, ΣutXt =0 を使うと、
教科書 96 の公式の理解の仕方
Σut(a+bXt -my)=aΣut+bΣutXt -Σutmy=0なので
傾きは
共分散÷X(説明変数)の分散
第三項は0になる。したがって、
切片は
直線が X の平均と Y の平均を通る
ように決定
実績値の変動=予測値(理論値)の変動+残差の変動
理論値の合計と実績値の合計は一致する。(p.98)
が導かれる。教科書 p.105 (3.15)の公式
残差の合計は 0(p.99)
R2=Σ(a+bXt -my)2/Σ(Yt-my)2 より
残差と説明変数の積和は 0 (p.100)
ここからもう一つの R2 の定義
R2=1-Σut2/Σ(Yt-my)2
残差平方和
も容易に導出できる。
p.102
理論値の分散(変動)÷実績値の分散(変動)
自由度はサンプルサイズー未知の回帰係数の数(単回帰では2)
実は相関係数の自乗が R2 になっている。
残差分散=残差平方和÷自由度で定義される。
□Yt



Xt のあてはめにおいて
-
(R2=1
残差平方和/∑t=1n ( YtY )2
なぜ N でわらないのか。N で割ると小さくなりすぎる。N-2 で
割ると分散が平均的に正しく推定できる。
…あてはまりの
悪さの尺度
非線型式の回帰分析
残差分散は p.106 で示す。残差の平均=0に注意。分母は
線形でない関係式も変換により線形になる
自由度 (単回帰において残差の自由度はサンプルサイズから 2
1)ベキ関数(生産関数に用いられる)両対数モデルとも呼ぶ
1
ln(y)=-0.388+1.088×ln(x)
1) ln(x)が 0.01増加すると、ln(y)が 0.01088%増
加する
2) ln(x)の増分は x の増加率
3) xが 1%増加すると、y が 0.01088%
4) 比例関係より y が速く増加する。
(比例は x が 1%増
えると y も 1%増える)
5) これは経済学では弾力性(男性値)という。
半対数モデル
ln(y)=-0.388+0.021×x
xが1増えると ln(y)が
0.021 増加。y は 0.021(2.1%)増加する。X が年なら
ば年率 2.1%
2
2014 年 10 月 29 日(水曜日)あす 30 日(木曜日)は
=Mina,b,cΣ(Yt-a-bXt-cZt-dWt)2
金曜日の講義の日なので開講します。10 月 31 日は休講
<= Mina,b,c,d=0Σ(Yt-a-bXt-cZt-dWt)2
=Mina,bΣ(Yt-a-bXt-cZt-)2
多重回帰分析
3.3
=重回帰(k=2)回帰の残差平方和
となり、残差平方和は説明変数を追加するとかなら
多重回帰分析
ず小さくなる。
表 3.11
取引価格=57.13+0.35×駅までの時間-3.82×面積
決定係数のもう一つの定義:
同じ面積ならば
R2=1-残差平方和/yの変動
面積が一定のとき、面積が一分ふえると価格が 0.35 増
yの変動=Σ(Yt-my)2
加する。
最小二乗推定量 a,b に対し、この関係式は
面積が一定のとき、徒歩時間が一分ふえると価格が
Σ(Yt-my)2=Σ(Yt-a-bxt+ a+bxt-my)2
3.82 下落する。
=Σ(Yt-a-bxt)2
+2Σ(Yt-a-bxt) ( a+bxt-my)
最小自乗推定量の導出は偏微分で行う。
+Σ( a+bxt-my)2
V=Σ(Yt-a-bXt-cZt)2 を a で偏微分して0とおく
第一項は残差平方和
と
第二項は残差の性質から 0 なので
0=2Σ(-1)(Yt-a-bXt-cZt)
最初の決定係数の定義
V=Σ(Yt-a-bXt-cZt)2 を b で偏微分して0とおく
R2=Σ( a+bxt-my)2 /Σ(Yt-my)2
と
は
0=2Σ(-Xt)(Yt-a-bXt-cZt)
R2=[Σ(Yt-my)2-残差平方和]/Σ(Yt-my)2
V=Σ(Yt-a-bXt-cZt)2 を b で偏微分して0とおく
=1-残差平方和/Σ(Yt-my)2
と
と変形できる。これは二番目の定義
0=2Σ(-Zt)(Yt-a-bXt-cZt)
未知係数は a,b,c、方程式は3つ。未知係数一つに
したがって、決定係数は説明変数を追加すると、
ついて1つあるので、この連立方程式は未知係数に
かならず大きくなる。だから、単純回帰と重回帰
ついて原則解ける。明示的な公式を一般的に導くに
の比較、変数の追加前と追加後の重回帰モデルの
は線形代数の知識が必要。
比較には決定係数は使えない。
p.132 残差のルール 1)残差ベクトルは説明変
数ベクトルと直交する(1,…,1)
アイデア:決定係数を修正し、残差平方和が大き
2)残差の総和は 0
く減少したときは、大きくなり、残差平方和の減
少が小さいときはは小さくなるようにしよう。
重回帰と単回帰の関係
K を定数項(切片 a のこと)を含む説明変数の数と
どちらを選ぶべきか。
すると、
自由度修正済み決定係数
重回帰の残差平方和=Mina,b,cΣ(Yt-a-bXt-cZt
<= Mina,b,c=0Σ(Yt-a-bXt-cZt)2
=Mina,bΣ(Yt-a-bXt
)2=単純回帰の残差平方和
)2
自由度修正済み決定係数
= 1-
[残差平方和÷(m-K)]÷[変動÷(n-1)]
K が増加すると、残差平方和は減少するが、m-K、
も小さくなり、残差平方和÷(m-K)の増減は不定。
説明変数の数 k(説明変数 Wt)を増やすと
あてはまりを大幅に改善するような説明変数の追
重回帰(k=3)の残差平方和
加は自由度修正済み決定係数を大きくする。
3
P.135 定数項のない回帰式(かならず原点を通る)
例:差分をとった式(あまり意味はない)
多重共
4
5