http://mcobaya.web.fc2.com/karato.htm 2014 年 10 月 22 日 を引く。)p.106 の自由度の説明はうまい(厳密ではないが) 練習: クラスサイズと成績 econ/TIMSS_xls/japan0.xlsx 1.「分析ツールによる回帰分析」 Excel2013 での分析ツールのインストール 2.散布図(直線近似) ファイル=>Excel の option=>設定=>アドイン=>分析ツー ルに印=>OK □直線 1. の隅に黒い■。 リボン「データ」の下に「データ分析」が出現 Y t Xt のあてはめに 表のグラフをクリックし、アクティヴにする。グラフ 2. 「グラフツール」「レイアウト」「近似曲線」「その他 表 3-1 (p.95)をやってみましょう(第 3 章) の近似オプション」 「線形近似」、グラフに数式表示」、 http://www3.u-toyama.ac.jp/kkarato/2014/econometrics/data/chap2-econometrics.xlsx 「グラフに R2 表示」を印づけ、「OK」 のデータを入手し、を開く。今度はラベルと残差にチェックを いれて、レベルも範囲に含める。下の入力範囲参照。残差にチ ェックをいれると予測値と残差が出力される。 下の分析ツールでの推定式に一致することを確認 決定係数はあてはまりの良さを測る尺度です。R2 ともよばれ ます。多くの時系列データ(time series data)(複数時点 の単一調査対象)は集計データがおおいので雑音が相殺され、 あ て は ま り が よ い も の が お お く , 横 断 面 デ ー タ (cross section data)(同一時点、複数調査対象)のうち個票デー タ(集計前データ)はがノイズが大きく。あてはまりが悪いか ら悪いモデルというわけではない。 p.104 証明: a,b を係数の最小自乗推定量, ut を残差とすると それぞれの係数の意味を述べ、直感的に説明できるようにしよ Σ(Yt-my)2=Σ(Yt-my)2=Σ(a+bXt +ut -my) う。 =Σ(a+bXt -my)2 +Σut2+2Σut(a+bXt -my) Y は被説明変数、X は説明変数 ここで Σut=0, ΣutXt =0 を使うと、 教科書 96 の公式の理解の仕方 Σut(a+bXt -my)=aΣut+bΣutXt -Σutmy=0なので 傾きは 共分散÷X(説明変数)の分散 第三項は0になる。したがって、 切片は 直線が X の平均と Y の平均を通る ように決定 実績値の変動=予測値(理論値)の変動+残差の変動 理論値の合計と実績値の合計は一致する。(p.98) が導かれる。教科書 p.105 (3.15)の公式 残差の合計は 0(p.99) R2=Σ(a+bXt -my)2/Σ(Yt-my)2 より 残差と説明変数の積和は 0 (p.100) ここからもう一つの R2 の定義 R2=1-Σut2/Σ(Yt-my)2 残差平方和 も容易に導出できる。 p.102 理論値の分散(変動)÷実績値の分散(変動) 自由度はサンプルサイズー未知の回帰係数の数(単回帰では2) 実は相関係数の自乗が R2 になっている。 残差分散=残差平方和÷自由度で定義される。 □Yt Xt のあてはめにおいて - (R2=1 残差平方和/∑t=1n ( YtY )2 なぜ N でわらないのか。N で割ると小さくなりすぎる。N-2 で 割ると分散が平均的に正しく推定できる。 …あてはまりの 悪さの尺度 非線型式の回帰分析 残差分散は p.106 で示す。残差の平均=0に注意。分母は 線形でない関係式も変換により線形になる 自由度 (単回帰において残差の自由度はサンプルサイズから 2 1)ベキ関数(生産関数に用いられる)両対数モデルとも呼ぶ 1 ln(y)=-0.388+1.088×ln(x) 1) ln(x)が 0.01増加すると、ln(y)が 0.01088%増 加する 2) ln(x)の増分は x の増加率 3) xが 1%増加すると、y が 0.01088% 4) 比例関係より y が速く増加する。 (比例は x が 1%増 えると y も 1%増える) 5) これは経済学では弾力性(男性値)という。 半対数モデル ln(y)=-0.388+0.021×x xが1増えると ln(y)が 0.021 増加。y は 0.021(2.1%)増加する。X が年なら ば年率 2.1% 2 2014 年 10 月 29 日(水曜日)あす 30 日(木曜日)は =Mina,b,cΣ(Yt-a-bXt-cZt-dWt)2 金曜日の講義の日なので開講します。10 月 31 日は休講 <= Mina,b,c,d=0Σ(Yt-a-bXt-cZt-dWt)2 =Mina,bΣ(Yt-a-bXt-cZt-)2 多重回帰分析 3.3 =重回帰(k=2)回帰の残差平方和 となり、残差平方和は説明変数を追加するとかなら 多重回帰分析 ず小さくなる。 表 3.11 取引価格=57.13+0.35×駅までの時間-3.82×面積 決定係数のもう一つの定義: 同じ面積ならば R2=1-残差平方和/yの変動 面積が一定のとき、面積が一分ふえると価格が 0.35 増 yの変動=Σ(Yt-my)2 加する。 最小二乗推定量 a,b に対し、この関係式は 面積が一定のとき、徒歩時間が一分ふえると価格が Σ(Yt-my)2=Σ(Yt-a-bxt+ a+bxt-my)2 3.82 下落する。 =Σ(Yt-a-bxt)2 +2Σ(Yt-a-bxt) ( a+bxt-my) 最小自乗推定量の導出は偏微分で行う。 +Σ( a+bxt-my)2 V=Σ(Yt-a-bXt-cZt)2 を a で偏微分して0とおく 第一項は残差平方和 と 第二項は残差の性質から 0 なので 0=2Σ(-1)(Yt-a-bXt-cZt) 最初の決定係数の定義 V=Σ(Yt-a-bXt-cZt)2 を b で偏微分して0とおく R2=Σ( a+bxt-my)2 /Σ(Yt-my)2 と は 0=2Σ(-Xt)(Yt-a-bXt-cZt) R2=[Σ(Yt-my)2-残差平方和]/Σ(Yt-my)2 V=Σ(Yt-a-bXt-cZt)2 を b で偏微分して0とおく =1-残差平方和/Σ(Yt-my)2 と と変形できる。これは二番目の定義 0=2Σ(-Zt)(Yt-a-bXt-cZt) 未知係数は a,b,c、方程式は3つ。未知係数一つに したがって、決定係数は説明変数を追加すると、 ついて1つあるので、この連立方程式は未知係数に かならず大きくなる。だから、単純回帰と重回帰 ついて原則解ける。明示的な公式を一般的に導くに の比較、変数の追加前と追加後の重回帰モデルの は線形代数の知識が必要。 比較には決定係数は使えない。 p.132 残差のルール 1)残差ベクトルは説明変 数ベクトルと直交する(1,…,1) アイデア:決定係数を修正し、残差平方和が大き 2)残差の総和は 0 く減少したときは、大きくなり、残差平方和の減 少が小さいときはは小さくなるようにしよう。 重回帰と単回帰の関係 K を定数項(切片 a のこと)を含む説明変数の数と どちらを選ぶべきか。 すると、 自由度修正済み決定係数 重回帰の残差平方和=Mina,b,cΣ(Yt-a-bXt-cZt <= Mina,b,c=0Σ(Yt-a-bXt-cZt)2 =Mina,bΣ(Yt-a-bXt )2=単純回帰の残差平方和 )2 自由度修正済み決定係数 = 1- [残差平方和÷(m-K)]÷[変動÷(n-1)] K が増加すると、残差平方和は減少するが、m-K、 も小さくなり、残差平方和÷(m-K)の増減は不定。 説明変数の数 k(説明変数 Wt)を増やすと あてはまりを大幅に改善するような説明変数の追 重回帰(k=3)の残差平方和 加は自由度修正済み決定係数を大きくする。 3 P.135 定数項のない回帰式(かならず原点を通る) 例:差分をとった式(あまり意味はない) 多重共 4 5
© Copyright 2024