多因子分析による探索的多変量データ分析 [ 977.49KB ]

March
― 53 ―
2014
〈研究ノート〉
多因子分析による探索的多変量データ分析
中
*
山
慶 一 郎**
1.はじめに
多因子分析(Multiple Factor Analysis)、MFA とは、主成分分析 PCA Principal Component Analysis にお
ける変数を幾つかのグループに分け、グループ間の関係を分析する手法であり、PCA をさらに一般化し
た分析である。MFA は、Escofier and Pages(1988)にその考えが見られるが、その解説は文献[1]に詳
しい説明が見られる。また、最近、R の Package である FactoMineR では、比較的簡単に計算ができる。
MFA は幾つかの変数のグループから構成されるデータの分析に利用される幅広い適用性を有する分析
手法であり、本稿では、その理論と計算方法を概観し基本的な応用例として、主成分分析への適用と、複
数の分割表の結合について、幾つかの応用部門に適用した利用例を示すことにする。
MFA はグループに分割したデータ表を併置した複数の表をまとめて処理するもので、個別の表が全体
の表に対する影響の大きさのバランスをとるために、個別の表に weight を掛けて調整し、global table を
作成して分析を実施する。また、MFA では、変数が量的 quantitative であるか、質的 categorical であるか
によって、PCA Principal Component Analysis, CA Correspondence Analysis, MFA Multiple Factor Analysis が
適用され、分析が行われる。本稿では、これらの分析の考えかたを説明し、分析のやり方と FactoMineR
の package の適用について解説し、その分析例の一例を示すことにする。2 では、MFA のデータ構造を
説明し、3 では、解析の手順を R を用いて、4 で FactoMineR を用いた分析を展開する。5 で分析モデル
に従った計算例を呈示する。
2.データ構造について
今まで取り上げてきた多変量データ解析では、n×p のデータ構造において、変数 p は numerical variables か、categorical variables に分けられる。分析においても、主成分分析 PCA は前者になるし、対応分
析 MCA は後者になる。ここで取り上げる MFA においても、同様にそれらに対応して、2 種類のモデル
がある。まず、数値変数の場合を取り扱う。
a.MFA は PCA における変数が幾つかのグループから構成されるデータを問題にする。
図に表せば、通常のデータは 1 つの枠でデータが表示されるが MFA では複数の枠で表され処理され
る。この図は、J 個のデータセットからできている。
─────────────────────────────────────────────────────
*
キーワード:Multiple factor analysis, R, FactoMineR
**
関西学院大学名誉教授
― 54 ―
社 会 学 部 紀 要 第118号
set
1
variables
1
individuals
i
K
1
j
J
Kj
Xij
I
J 個のデータが連結されて 1 つのデータを構成し、1 つの枠は 1 つのグループからの変数を表す。MFA
の分析目的はすべてのグループ間の変数の特徴を見出すことである。分析の設計にさいしては、各グルー
プ毎の影響のバランスをとり全体のデータ構造を作る点に、その分析の特質が示されているように思う。
そのために、MFA では、各グループのデータに、その各グループ毎のデータの特異値分解 Singular value
decomposition の第 1 特異値 α 1 をウエート1)にして、データを再構成している。ウエート付けしたデータ
は、次のようになる。
!
│ X1
│ λ 11 ;
!Xλ
2
2
1
; ・・・ ;
!Xλ ││=[Z , Z , ・・・, Z ]
J
J
1
1
2
J
このように MFA はウエート付けした PCA(weighted PCA)であり、主成分の再スケーリングと見な
される。変数は一般には標準化されたデータで、個体間の距離を計算するようにウエート付けされてい
る。このウエートは 1 つのグループの変数には、同じウエート付けされているので、グループの構造は保
持されている。各グループの第 1 固有値は 1(svd(Zj)=1)である。
次に、この MFA 分析の理論的根拠として、一般化特異値分解 Generalized singular value decomposition
2)について簡単に触れておく。
(GSVD)
GSVD について
b.特異値分解 Singular value decomposition(SVD)では、データ行列は、
X=UΛVT
UTU=VTV=I と分解する。
−1/2
ここで、P=M U
X=PΔQT
∼
1/2
Q=W−1/2V と変換すると、
PTMP=QTWQ=I に分解される。
1/2
X=M XW
∼ ∼
X=M−1/2XW1/2 の関係がある。M と W は、行と列に対する制約を示している
ので、GSVD は SVD の一般化したものと考えられる。
GSVD では、
P=M−1/2U および Q=W−1/2V の変換を行う。
ここで、M はデータ行列 X の row に関する制約で、row(行数)を m とすると、
M=diag(1/m,・・・,1/m)であり、W は列、変数に対する制約で、
W=diag( α )=diag( α 1、 α 2、・・・、 α J)
この変換が GSVD であることは、
PT=UTM−1/2 かつ、QT=VTW−1/2 であるから、PTMP=UTM−1/2MM−1/2U=UTU=I
QTWQ=VTW−1/2WW−1/2V=VTV=I となることから、分かる。
さらに、SVD では、X=PΔQT において、F=PΔ とすると、X=FQT である。P=M−1/2U であるので、F
=M−1/2UΔ である。F は主成分得点 Score という。又、Q=W−1/2V であるから、G=W−1/2VΔ とすると、G
は主成分負荷量 loadings と言われている。F と G をグラフ表示 Biplot して、分析結果が解釈されること
が多い。
─────────────────────────────────────────────────────
1)このウエートは、一般にはデータ X の第 1 固有値 λ 1 を用いる。 λ 1= α 12 という関係がある。
2)SVD と GSVD については、文献[5]が詳しい。
March
― 55 ―
2014
c.次に、categorical data につてのモデルをのべる。この場合はデータは比率で表されるので、グループ
化されたデータは、全体として次の形で示される。
1
!
J
!
i
pijt
pi.
p.jt
1
j
row weight を pi. . と し 、 col weight を p.jt と す る と 、 対 応 分 析 correspondence analysis で は 、 φ =
pijt−pi..p.jt
を用いて、各点 n 座標の距離をもとめるが、
pi..p.jt
!
グループ化されたモデルの場合では、
!
i
j
pijt
pi.t
row weight=
p.jt
pi..
col weight=
pi.t
p.t
p.jt
p..t
Internal correspondence analysis3)では、次のように定義された距離を用いる。
pi.t
pijt
p.jt
1 ┌ pijt pi.t ┐
p..t
ICA= │ − │=
pi.. p.it
pi.. └ p.jt p..t ┘
( )
この ICA は分割表 contingency table を結合したデータの分析に用いられる MFA の適用の一つのモデ
ルを提供する。
3.簡単な例による MFA の R によるプログラム
a.ここで、以下の例について MFA の programming を試みることにする。この例は wine の taste を 3 人
の専門家による評価のデータ4)である。
wines
wine1
wine2
wine3
wine4
wine5
wine6
Expert1
Expert2
Expert3
fruity
woody
coffe
redfruit
roasted
vanillin
woody
fruity
buttery
woody
1
5
6
7
2
3
6
3
1
1
5
4
7
2
1
2
4
4
2
4
5
7
3
3
5
4
2
2
5
5
7
4
1
1
6
4
6
2
1
2
5
5
3
4
7
2
2
1
6
4
1
2
6
7
7
3
1
2
6
5
─────────────────────────────────────────────────────
3)文献[1]
、[3]
4)この例のデータは、資料 1 参照。また、以下の program は文献[1]のアルゴリズムにしたがって programing し
た。
― 56 ―
社 会 学 部 紀 要 第118号
まず Excel のシート上のデータを読み込む。
>Y1<−read.table
(”clipboard”,header=TRUE,row.names=1) #Excel から Expert1 をコピーする。
>Y2<−read.table
(”clipboard”,header=TRUE,row.names=1) #Expert2 をコピーする。
>Y3<−read.table
(”clipboard”,header=TRUE,row.names=1) #Expert3 をコピーする。
>n<−nrow
(Y1)
#n はデータの列の数
>sd<−apply
(Y1,2,sd)
>sdp<−sqrt
((n−1)/n)*sd
#sdp は母標準偏差
>XX1<−scale
(Y1,apply
(Y1,2,mean),sdp)
>X1<−(1/sqrt(n))*XX1
#Y1 のデータを標準化する。
>n<−nrow
(Y2)
>sd<−apply
(Y2,2,sd)
/n)*sd
>sdp<−sqrt
((n−1)
>XX2<−scale
(Y2,apply
(Y2,2,mean),sdp)
>X2<−(1/sqrt(n))*XX2
#Y2 のデータを標準化する。
>n<−nrow
(Y3)
>sd<−apply
(Y3,2,sd)
/n)*sd
>sdp<−sqrt
((n−1)
>XX3<−scale
(Y3,apply
(Y3,2,mean),sdp)
>X3<−(1/sqrt(n))*XX3
#Y3 のデータを標準化する。
>Z1<−X1/svd
(X1)$d[1]
#X1 のデータのウエイトを付ける。
>Z2<−X2/svd
(X2)
$d[1]
#X2 のデータにウエイトを付ける。
>Z3<−X3/svd
(X3)$d[1]
#X3 のデータにウエイトを付ける。
>Z<−cbind
(Z1,Z2,Z3)
#ウエイト付けしたデータを作る。
>Z
#グループの変動を調整したデータである。標準化したデータに、各デ
!
ータ X に α =1/ λ のウエイトを付けたもの。
fruity
woody
coffe
redfruit
roasted
vanillin
wine1
wine2
wine3
wine4
wine5
wine6
−0.3350906
0.1116969
0.2233938
0.3350906
−0.2233938
−0.1116969
0.34123959
−0.04265495
−0.29858464
−0.29858464
0.21327474
0.08530990
0.44864525
−0.16314373
−0.28550153
−0.16314373
0.08157186
0.08157186
−0.2616731
0.0000000
0.1308366
0.3925097
−0.1308366
−0.1308366
0.18550466
0.02650067
−0.29150733
−0.29150733
0.18550466
0.18550466
0.29845661
0.01570824
−0.26704013
−0.26704013
0.20420715
0.01570824
woody
fruity
buttery
woody
wine1
wine2
wine3
wine4
wine5
wine6
0.2821694
−0.1693016
−0.2821694
−0.1693016
0.1693016
0.1693016
−0.02214601
0.11073004
0.50935818
−0.15502206
−0.15502206
−0.28789810
0.19538868
−0.03907774
−0.39077736
−0.27354415
0.19538868
0.31262189
0.359976
−0.119992
−0.359976
−0.239984
0.239984
0.119992
いま、Z=[Z1, Z2, Z3]=UΔVT なる Singular Value Decomposition を行うと、UTU=VTV=I となり、更
に、GSVD を、同じ Z に用いると、Z=PΔQT と分解する。ここで、P=M−1/2U と、Q=W−1/2V なる変換を
行う。PTMP=QTWQ=I なる関係がある。
ここで、問題となるのが、M と W の設定である。M と W は row と column の制約を示している。列
March
― 57 ―
2014
の制約として、一様な周辺分布 1/n を想定する。
>n<−nrow
(Z)
#列の数(n=6)
>M<−c
(rep
(1/n,n))
>M
[1]0.1666667
0.1666667
0.1666667
0.1666667
0.1666667
0.1666667
Z=PΔQT において、F=PΔ とすると、Z=FQT で、P=M−1/2U であるので、F=M−1/2UΔ である。したが
って、
>P<−diag(1/sqrt(M))%*% svd
(Z)$u
>F<−diag(1/sqrt(M))%*% svd
(Z)$u %*% diag
(svd(Z)$d)
>F
#主成分得点 score
wine1
wine2
wine3
wine4
wine5
wine6
[,1]
dim.1
[,2]
dim.2
[,3]
dim.3
2.1721551
−0.5570173
−2.3176633
−1.8325573
1.4037873
1.1312955
−0.50859564
−0.19740840
−0.83025948
0.90504558
0.05497671
0.57624123
−0.484354015
0.410158063
0.006244002
−0.398982615
0.130753278
0.336181286
次に、individual の位置を表す。loadings を求める。これは、データの対称性を利用して、W を以下の
ように定義する。これは、個々のデータの分散 inertia を情報として、利用することにしよう。
col.w<−apply(Zˆ2,2,sum)
W<−col.w
>W
fruity
woody
coffe
redfruit
0.3493334 0.3493334 0.3493334 0.2738913
roasted
vanillin
woody
0.273891
0.2738913
0.273891
いま、ZT=QΔPT として、G=QΔ である。
Q<−diag(1/sqrt(W))%*% svd
(Z)$v
Q
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[7,]
[8,]
[9,]
[10,]
Dim.1
Dim.2
Dim.3
−0.57549
0.5848
0.544055
−0.52906
0.569142
0.564734
0.578049
−0.35146
0.562751
0.588693
0.366843
−0.245
−0.10664
0.649466
−0.00937
−0.33792
0.170123
−1.34811
0.317298
0.008324
0.05422
−0.05355
−1.09463
−0.60951
0.825803
−0.0085
−0.41431
0.022959
0.706054
−0.32523
fruity
buttery
woody
0.4031463 0.4031463 0.4031463
― 58 ―
社 会 学 部 紀 要 第118号
G<−diag(1/sqrt
(W))%*%svd
(Z)$v%*%diag(svd(Z)$d)
G #individuals の loading
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[7,]
[8,]
[9,]
[10,]
Dim.1
Dim.2
Dim.3
−0.96894
0.98462
0.916019
−0.89077
0.958257
0.950835
0.973254
−0.59174
0.947497
0.991174
0.219143
−0.14636
−0.0637
0.387976
−0.0056
−0.20186
0.101627
−0.80533
0.189546
0.004973
0.018416
−0.01819
−0.37179
−0.20702
0.280483
−0.00289
−0.14072
0.007798
0.239811
−0.11046
ここで、Z=[Z1, Z2, Z3]=PΔQT、Q=[Q1, Q2, Q3]とすると、Z=[PΔQ1T, PΔQ2T, PΔQ3T]となる。
Z=PΔQT であるので、Z=WQ=PΔQWQ=PΔ=F
従って、F=ZWQ=[Z1, Z2, Z3]WQ
QT=[Q1, Q2, Q3]T とすると、
Fk=ΣZkWkQk=Σ α kZkQk
これらから、G(k=1、・・・、10)
、F(k=1,・・・、6)が得られる。
K
k
b.次に contingency tables の場合は、
ここでは、具体的な計算例として、文献[1]p.337 のデータを利用した計算例を示す。
データには、以下のような 2 つの data table A, B を用いる。
table A
A1
A2
A3
計
table B
B1
B2
B3
計
R1
R2
R3
10
0
0
0
42
3
0
3
42
10
45
45
R1
R2
R3
58
6
6
6
7
2
6
2
7
70
15
15
計
10
45
45
100
計
70
15
15
100
Table A, B を比率に変換して、合併した table C を作成する。
table C
A1
A2
A3
小計
B1
B2
B3
小計
計
R1
R2
R3
0.05
0
0
0
0.21
0.015
0
0.015
0.21
0.05
0.225
0.225
0.29
0.03
0.03
0.03
0.035
0.01
0.03
0.01
0.035
0.35
0.075
0.075
0.4
0.3
0.3
計
0.05
0.225
0.225
0.5
0.35
0.075
0.075
0.5
1
(2)を用いて、ICA を計算すると、
C
A1
A2
A3
B1
B2
B3
R1
R2
R3
2.25
−1.50
−1.50
−0.25
1.61
−1.28
−0.25
−1.28
1.61
0.32
−0.21
−0.21
−0.75
1.06
−0.06
−0.75
−0.06
1.06
この結果を利用して、MFA の計算を行う。
Table C の周辺度数を、row.m<−apply
(C,1,sum)=
(0.4,0.3,0.3)とし、col.m<−apply
(C,2,sum)=
(0.05,0.225,0.225,0.35,0.075,0.075)とする。ここで、ICA の周辺度数を定義して、
March
― 59 ―
2014
row.w<−0.4,0.3,0.3(=row.m)とし、
col.w<−col.m*rep
(svd(A)$d[1]
(1/2)
ˆ
,3),svd(B)$d[1]
(1/2)
ˆ
,3)とすれば、
row.w,col.w を用いて、
>svd.triplet 5)(C,row.w,col.w)
から分析結果が得られる。
4.R の Package について
実際のデータ解析は、R の Package を用いるが、ここで、利用するのは、FactoMineR の MFA 関数で、
前節の例を、FactoMineR を用いて計算する。
MFA の使用方法の詳細は package の manual を参照されたい。ここでは、3 で利用した、wine のデー
タから、MFA の解説を試みる。wine のデータでは、
>res.mfa<−MFA
(wine,group=c
(3,4,3),type=c
(rep(“s”,3)),
6)
name.group=c
(“Exp1”,”Exp2”,”Exp3”),graph=FALSE)
>res.mfa この program を実行すれば、結果が表示される
wine データでは、グループは、Exp1, Exp2, Exp3 の名前をもち、3, 4, 3 個の変数からなる。変数の型 type
は“s”で指定する。変数の指定により、計算手順が決まる。MFA の計算手順は、変数の type 指定によ
り、グループ変数毎に実行される。これを separate analysis という。“c”は平均からの偏差に変換し、“s”
では、標準化したデータを、PCA を行う、separate analysis では、“n”の時は、MCA を、“f”では、CA
を選択する。次に、グループを結合したデータには、PCA を、global analysis として実施する。global.pca
で分解するデータは、すべての group を含む結合したデータで、その形は global.pca$call$X である。この
データは、データ全体としてバランスのとれた値に調整されたもので、このデータを GSVD で分解して、
解が得られ、適切な次元に還元されてグラフ化される。
FacoMineR では、関数 svd.triplet(data,row.w,col.w)によって、GSVD が実行される。wine のデータで
は、変数の値が、分散が 1 になるように調整された表 Z から計算できる。
>col.w<−apply
(Zˆ2,2,sum)=res.mfa$global.pca$call$col.w
col.w
fruity
woody
coffe
redfruit
roasted
vanillin
woody
fruity
buttery
woody
0.349
0.3493
0.349
0.2739
0.2739
0.2739
0.274
0.4031
0.403
0.4031
>row.w=rep(1/6,10)であるので、
$call$row.w
[1]0.1666667
0.1666667
0.1666667
0.1666667
0.1666667
0.1666667
>svd.triplet(X,row.w,col.w)
$vs
[1]0.40119363
0.14987622
0.08042432
0.04115212
0.02665631
─────────────────────────────────────────────────────
5)svd.trplet( )は FactoMineR の関数である。
6)MFA の関数を利用する際に、graph=FALSE を挿入しなければ、自動的に例示したグラフが出力される。
― 60 ―
社 会 学 部 紀 要 第118号
$U
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[,1]
[,2]
[,3]
[,4]
[,5]
1.2711212
−0.3474389
−1.4140072
−1.0405481
0.8346984
0.6961746
0.92660892
0.27016560
1.35740149
−1.51086811
−0.07505598
−0.96825192
1.39800724
−1.16988274
−0.08173772
1.23474813
−0.38081000
−1.00032490
−0.1796929
1.1939568
−0.8336602
0.3231376
1.0927284
−1.5964696
0.73412066
1.41849863
−0.67555479
0.07427285
−1.72005048
0.16871312
$V
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[7,]
[8,]
[9,]
[10,]
[,1]
[,2]
−0.5789116
0.5894411
0.5505659
−0.4679126
0.5093536
0.5029860
0.5200434
−0.3968883
0.6147770
0.6405205
−0.39860258
0.28010393
0.16178546
−0.57981005
0.03363665
0.32386906
−0.09801115
1.36269052
−0.29360121
0.04547837
[,3]
−0.014164039
0.033428395
1.092748677
0.598571670
−0.754298673
−0.005201197
0.357952471
−0.096411175
−0.775211483
0.342579147
[,4]
[,5]
0.2018224
0.5550319
−0.5313725
0.5292962
0.2174109
1.2130589
−0.6382870
−0.1956772
−0.5263743
0.3453576
0.94925706
0.10684259
0.95130635
−0.30238278
0.38309721
0.33359998
−0.73531895
0.02046325
0.30228485
−0.45720154
以下、このモデルで MFA を実行して、group の比較がグラフ化される
>res.mfa<−MFA
(wine.data,group=c
(3,4,3),type=rep(“s”,3),
+name.group=c
(”Exp1”,”Exp2”,”Exp3”))
>res.mfa.group
,L(ν
)を持つ。νi は次元 i dimension を表し、その大
この結果では、Group j は座標(L(ν
g
1 , Kj )
g
2 , Kj )
きさを K で示している7)。
=
0<=L(ν
g
1, Kj)
1
λ 1j
!
k∈Kj
2
cov(x.
≦1
k, ν1)
ここで、2 つの group の類似性を説明する幾つかの測度が考えられている。
Group Kk と KJ 間の類似性の測度は、
!(λ )
Kj
i 2
k
!(λ )
Kj
j 2
k
L(K
= k=1 j 2 =1+ k=2 j 2
g
k, KJ)
(λ i )
( λ 1)
>res.mfa$group$Lg
EXp1
EXp1
Exp2
Exp3
MFA
1.0017902
0.9517525
0.7822593
0.9650774
Exp2
0.9517525
1.0037355
0.8359190
0.9846926
Exp3
0.7822593
0.8359190
1.0326333
0.9350963
MFA
0.9650774
0.9846926
0.9350963
1.017661
─────────────────────────────────────────────────────
7)文献[3]を参照。
・Lg 係数 s:グループ間の関係性の Lg 係数は、2 個ずつの表がどの程度関係しているのかを測定できる。1 番
目の表の変数がより多く 2 番目の表の変数に関係するほど、Lg 係数が高くなる。
・RV 係数:グループ間の関係性の RV 係数は、Lg 係数から派生するもう 1 つの測度である。RV 係数の値は、
0 から 1 の間の値をとる。
March
― 61 ―
2014
第 1 図 グループの表示
>plot
(res.mfa,choix=”
group”
)
>res.mfa$group$coord[,1 : 2]
EXp1
Exp2
Exp3
Dim.1
Dim.2
0.9597660
0.9758837
0.8991509
0.02567692
0.05522578
0.27595635
グループ間の関連はグラフで直観的に理解できる。グループ間にはほぼ差のないことが知られる。
グループ間の相関関係は RV で示される。また、MFA の主成分に対する貢献度 contribution によって与
えられている。
res.mfa$group$RV, res.mfa$group$contrib
第 2 図 部分次元の表示
>plot
(res.mfa,choix=”
var”
,
hab=”
group”
)
各グループの次元への射影の様子が作図されている。次元 1 は各グループを十分に説明している。Exp
3 は dim2 の説明力があることが分かる。
― 62 ―
社 会 学 部 紀 要 第118号
第 3 図 個体の配置図
>plot
(res.mfa,choix=”
ind”
,
habillage=”
group)
>plot
(res.mfa,choix=”
ind”
)
MFA の計算による wine の配置を示す。
>res.mfa$ind$coord[,1 : 2]
wine1
wine2
wine3
wine4
wine5
wine6
Dim.1
Dim.2
2.1721551
−0.5570173
−2.3176633
−1.8325573
1.4037873
1.1312955
0.50859564
0.19740840
0.83025948
−0.90504558
−0.05497671
−0.57624123
第 4 図 Group 別変数の次元に対する相関
>plot
(res.mfa,choix=”
var”
,
hab=”
group”
)
March
― 63 ―
2014
>res.mfa$global.pca$var$cor[,1 : 2]
fruity
woody
coffe
red.fruit
roasted
vanillin
woody.1
fruity.1
butter
woody.2
Dim.1
Dim.2
−0.9689447
0.9846203
0.9160188
−0.8907682
0.9582567
0.9508348
0.9732536
−0.5917422
0.9474965
0.9911738
−0.219143241
0.146357563
0.063704928
−0.387975758
0.005595672
0.201864717
−0.101627307
0.805328580
−0.189546290
−0.004972744
第 5 図 グループ毎の個体の配置図
>plot
(res.mfa,choix=”
ind”
,
partial=”
all”
,
habillage=”
group”
)
>res.mfa$ind$coord.partiel[,1 : 2]
wine1.EXp1
wine1.Exp2
wine1.Exp3
wine2.EXp1
wine2.Exp2
wine2.Exp3
wine3.EXp1
wine3.Exp2
wine3.Exp3
Dim.1
Dim.2
2.7644318
2.2139276
1.5381060
−0.7730339
−0.2842466
−0.6137713
−1.9913978
−2.1115082
−2.8500839
1.1048125
0.8635191
−0.4425446
−0.2989190
0.1321352
0.7590090
−0.8058935
−0.4997180
3.7963899
wine4.EXp1
wine4.Exp2
wine4.Exp3
wine5.EXp1
wine5.Exp2
wine5.Exp3
wine6.EXp1
wine6.Exp2
wine6.Exp3
Dim.1
Dim.2
−1.9814561
−2.3930095
−1.1232063
1.2928336
1.4921140
1.4264142
0.6886225
1.0827227
1.6225413
−0.9271871
−1.2271463
−0.5608033
0.6206606
0.4880883
−1.2736790
0.3065265
0.2431217
−2.2783719
5.統計分析
a.まず、主成分分析による MFA の分析例を示す。取り上げたデータは、平成 24 年、25 年に公表され
た都道府県の学力調査の結果である。出題に対する平均正答率を分析データとした。MFA 分析では、平
成 24 年度と 25 年度との間に学力差が見られるかどうか、又、小学 6 年生と中学 3 年生との間に成績の差
があるかないかが分析の目的となる。又、県別順位がどのように、固定化の傾向にあるか、などが関心が
ある。
― 64 ―
社 会 学 部 紀 要 第118号
今、データをファイル名 seiseki とし、group 名を“24”、”25”とすると
>res.mfa<−MFA
(seiseki,group−c
(8,8),type=c
(“s”,
”s”),
name.group=c
(“24”,”25”))
データは以下の構造を持っている。
24 年
小学 6 年生
北海道
青 森
国語 B
算数 A
算数 B
国語 A.1
国語 B.1
算数 A.1
算数 B.1
79.0
84.7
53.5
58.7
69.6
77.4
55.8
61.4
74.2
76.0
63.1
65.5
60.8
62.4
48.1
48.9
……
……
……
……
……
……
……
縄
国語 A
……
……
沖
77.0
51.7
66.5
52.9
67.6
56.9
50.8
38.4
25 年
小学 6 年生
北海道
青 森
国語 A.2
国語 B.2
算数 A.2
算数 B.2
国語 A.3
国語 B.3
算数 A.3
算数 B.3
60.4
68.7
46.4
52.9
74.9
80.7
54.0
60.5
76.0
78.8
66.2
67.7
62.3
65.0
39.1
42.4
……
……
……
……
……
……
……
縄
中学 3 年生
……
……
沖
中学 3 年生
58.3
45.5
73.3
54.4
69.2
62.4
53.2
29.8
図から、24 年度と 25 年度の成績は殆ど差がない。
>plot
(res.mfa,choix=”group”)
>res.mfa$group
#グループの差の計算
$coord
$Lg
24
25
MFA
24
25
MFA
1.0424332
0.9635577
1.0227615
0.9635577
1.0592228
1.0313217
1.022761
1.031322
1.047281
Dim.2
0.9808249
0.9805229
0.1747955
0.2108039
$contrib
$RV
24
25
MFA
24
25
Dim.1
24
25
MFA
1.0000000
0.9169802
0.9788554
0.9169802
1.0000000
0.9791941
0.9788554
0.9791941
1.0000000
24
25
Dim.1
Dim.2
50.0077
49.9923
45.33086
54.66914
March
― 65 ―
2014
次元 1、2 で、ほゞ説明可能である。1 次元は成績を表すが、2 次元は説明が必要であろう。
ここで、データを 4 つのグループに分割して計算した。ただし、a=24、b=25 である。
>res.mfa<−MFA
(SEISEKI,group=c
(4,4,4,4),type=rep(”s”,4),
+
name.group=c
(”小 6 a”、”中 3 a”、”小 6 b”、”中 3 b”))
分析結果は、前と同じである。
― 66 ―
社 会 学 部 紀 要 第118号
参考のために、階層モデルを用いて計算を行った。結果は同じである。
March
2014
― 67 ―
>res.hmfa<−HMFA8)
(seiseki,H=hierar,type=rep(”s”,4),graph=FALSE)
>plot
(res.hmfa,choix=”group”)
更に、成績の府県別の差の要因を調べるためにクラス定員を説明変数として導入して計算したが、特に明
白な要因とは考えられない。
>res.pca<−PCA
(seiseki 29),quali.sup=6)
>plot.PCA
(res.pca,choix=”ind”,habillage=6)
>plot.PCA
(res.pca,choix=”ind”,habillage=6,label=”
none”)
b.次に質的データの分析例として、分割表に対する MFA の分析を呈示する。データは従来から分析し
てきた社会調査を利用し今回は「生活信条について、日本とドイツの調査の比較を行う。Q 5 a∼j(日本)
と、Q 4 A∼J(ドイツ)を用い、その回答の反応を MFA による分析で行った。
─────────────────────────────────────────────────────
8)HMFA は階層モデルの関数である。これについては、FactoMineR の manual を参照された。
9)seiseki 2 このファイルは、24 年小学 6 年データにクラス学生数を加えたものである。
― 68 ―
社 会 学 部 紀 要 第118号
>data<−cbind
(JD,DD)
#JD,DD は資料参照。
>res.mfa<−MFA
(data,group=c
(50,48),type=c
(”f”
,”f”),
+
name.group=c
(”日本”
、”ドイツ”))
>
Q 5(日本)と Q 4(ドイツ)の回答には殆ど差がない。ここでは、結果を呈示するのにとどめる。
March
― 69 ―
2014
又、変数 variables と個体 individuals についても、あまり差がない。
>res.mfa$group
$Lg
日本
ドイツ
MFA
日本
ドイツ
MFA
1.204412
0.568264
1.073208
0.5682640
1.0322875
0.9690011
1.0732082
0.9690011
1.2363882
日本
ドイツ
MFA
1.0000000
0.5096386
0.8794659
0.5096386
1.0000000
0.8577219
0.8794659
0.8577219
1.0000000
Dim.1
Dim.2
Dim.3
Dim.4
Dim.5
0.8255228
0.8262313
0.3145915
0.2669454
0.2742699
0.0978557
0.24337270
0.07749977
0.15181191
0.05595547
$RV
日本
ドイツ
MFA
$coord
日本
ドイツ
$contrib
日本
ドイツ
Dim.1
Dim.2
Dim.3
Dim.4
Dim.5
49.97855
50.02145
54.09657
45.90343
73.70358
26.29642
75.84717
24.15283
73.06821
26.93179
階層 MFA を利用すると、
>data<−cbind
(JD,DD)
>hierar<−list
(c
(15,25,5,5,14,25,4,5),
(
c 4,4))
>res.hmfa<−HMFA
(data,H=hierar,type=c
(rep(”s”,8)))
― 70 ―
社 会 学 部 紀 要 第118号
HMFA を用いても、大体同じである。L1G5(成功ドイツ)が、Dim 1,2 やや離れているのが観察され
る。
最後に全ての変数を 1 グループにして MFA を適用してみた。
>res.mfa<−MFA
(data,group=c
(15,25,5,5,14,25,4,5),
+
+
type=c
(rep(”f”,8)),name.group=c
(”成功 J”、”自己 J”、”家族 J”、”競争 J”、
”成功 G”、”自己 G”、”家族 G”、”競争 G”))
March
2014
― 71 ―
面白い結果が示される。
6.まとめ
本稿で取り上げた主因子分析(Multiple Factor Analysis)は、2 のデータ構造 a.で説明した主成分分析
(Principal Component Analysis)を複数の変数をもつ場合に拡張したものと、b.で解説したクロスデータ
(Contingency Table Analysis)にも、同様の手法を適用したものである。
本稿では、これらの分析手法の考え方と計算方法について、説明し、更に、R の package、FactoMineR
の関数 MFA を適用して、簡単な分析方法とデータ解析を示したものである。この分析手法は拡張され
て、対応分析(Correspondence Anaysis)、多重対応分析(Multiple Correspondence Analysis)にも応用さ
れ、MFA として、簡単にデータ解析が可能であり、R の FactoMineR, package で容易に利用可能となって
いる。
MFA は複数の表を処理するが、それらは、quantitative か categorical な変数の組から構成されており、
その解析手法は同じではないが、package では、parameter を指定することによって、計算することができ
る。
MFA は変数群の分析であるので。分析対象の変数間の構造の有無、時間的変化の差異など興味ある結
果を表示する。データ解析の一手法としては、分析対象の概観をえるのに優れた手法である。
本稿ではデータ構造 a で取り上げた PCA を一般化した分析手法と、その解析例と、b での、contingency
table を結合した分析例を呈示した。これ以外にも、MCA を一般化したものが考えられるし、更に、contingency table を用いるものでは、別のアルゴリズムが考えられている。
データ解析で MFA を利用することは、分析対象の構造を把握する上で、簡便であり、探索的分析手法
として、更に多くの分析を導入するのに役立つものであるう。
文献
[ 1 ]Pages and Becue-Bertaut, Multiple Factor Analysis for Contingency Tables, from, Multiple Correspondence Analysis and
Related Methods(2006)
, Chapman & Hall/CRC pp 199−326.
[ 2 ]Abdi & Williams & Valentin, Multiple Factor Analysis : Principal Component Analysis for Multi-Table and Multi-Block
Data Sets Computational Statistics vol 5/2(20133/4)Wiely Interdisciplinary Reviews
[ 3 ]J. Pages, Multiple Factor Analysis : Main Features and Application to Sensory Data, Revista Colombiana de Estadistica,
― 72 ―
社 会 学 部 紀 要 第118号
vol 27/1 2004/6
[ 4 ]Abdi & Valentin. Multiple Factor Analysis, in Encyclopedia of Measurement Statistcs. Thousand Oaks(CA):Sage
(2007)
[ 5 ]H. Abdi, Singular Value Deconposition(SVD)and Generalized Singular Value Dcomposition(GSVD)
(2007)
, Encyclopedia of Mesurement and Statistics, Thousand Oarks(CA)
;Sage
[ 6 ]H. Abdi, L. I. Williams and D. Valentin, Multiple factor analysis : principal component analysis for multitable and multiblock data sets, Wiley Periodicals, inc(2013)
[ 7 ]A. Zarraga and B. Goitisolo, Simultaneous Analysis : A Joint Study of Several Contingency Tables with Different Margins. from Multiple Correspondence Analysis and Related Methods(2006)
, Chapman & Hall/CRC pp 327−350.
[ 8 ]E. Abascal, I. G. Lautre, and M. I. Landaluce, Multiple Factor Analysis of Mixed Tables of Metric and Categorical Data.
From Multiple Correspondence Analysis and elated Methods(2006)
, Chapman & Hall/CRC pp 351−367.
[ 9 ]H. Abdi, RV Coefficient and Congruence Coefficient(2007 Encyclopedia of Mesurement and Statistics, Thousand Oarks
(CA)
;Sage
[10]B. Kostov, M. Bercue-Bertaut and F. Husson, Multiple Factor Analytsis for Contingency Tables in the FactoMineR Package, The R Journal vol 5/1(2013)
[11]C. E. Pardo, M Becue-Bertaut, J. E. Ortiz. Correspondence Analysis of Contingency Tables with Subpartitions on Rows
and Columns. Revista Colombiaana de Estadistica(2013. vol 36/1)
[12]A. Zarrage B. Goitisolo, Simultaneous Analysis in S-PLUS : The SimultAn Package. Journal of Statistical Software.
(2011/4)vol 40, Issue 11.
[13]B. Everitt, T. Hthorn, An Introduction to Applied Multivariate Analysis with R, Springer,(2011)
資料 1.
wines
wine1
wine2
wine3
wine4
wine5
wine6
Expert1
Expert2
Expert3
fruity
woody
coffe
redfruit
roasted
vanillin
woody
fruity
buttery
woody
1
5
6
7
2
3
6
3
1
1
5
4
7
2
1
2
4
4
2
4
5
7
3
3
5
4
2
2
5
5
7
4
1
1
6
4
6
2
1
2
5
5
3
4
7
2
2
1
6
4
1
2
6
7
7
3
1
2
6
5
March
― 73 ―
2014
資料 2.全国学力調査データ
都道府県の公立校の平均正答率(%)
(平成 24 年 8 月 9 日,平成 25 年 8 月 28 日
24 年
北海道
青森
岩手
宮城
秋田
山形
福島
茨城
栃木
群馬
埼玉
千葉
東京
神奈川
新潟
富山
石川
福井
山梨
長野
岐阜
静岡
愛知
三重
滋賀
京都
大阪
兵庫
奈良
和歌山
鳥取
島根
岡山
広島
山口
徳島
香川
愛媛
高知
福岡
佐賀
長崎
熊本
大分
宮崎
鹿児島
沖縄
朝日新聞による10))
小学 6 年生
国語 A
国語 B
算数 A
算数 B
理科
クラス学生数
分類
79
84.7
82.7
81.7
86.9
82.4
81.7
82.5
80.4
80.6
81.3
81.6
83.4
81.1
81.9
83.5
84.8
85.7
80.8
82.4
80.5
80.4
80.6
79.6
80.3
83.3
80.5
82.4
82.6
79.9
83.2
81.4
80.3
83.6
82.3
82.7
83.8
80.7
82.1
81.6
81.6
80.9
81.5
80.7
82.1
81.2
77
53.5
58.7
56.3
55.9
63
55
55.1
57.1
54.2
53.5
55.4
57.5
57.8
55.8
55.7
60.4
60.3
60.2
54.8
55.8
54.8
54.1
55
52.7
53.7
58.2
53.5
55.5
56.9
51.9
56.2
56.3
53.4
58.1
56.3
55.7
59.8
55.4
53.4
54.4
53.9
54.7
55
53.9
54.5
54.8
51.7
69.6
77.4
74.2
72.7
79.5
73.5
72.9
74.7
72.6
73.3
72.1
73.6
74.8
72.4
74.2
76.5
78.3
78.3
71.6
73.2
72
72.1
72
72.2
71.2
76.5
74.2
73.9
75.5
72.9
72.8
70.9
70.1
75.4
73.5
73.5
74.8
73.3
74.7
72.9
73.3
71.8
73.9
74.9
74.3
74
66.5
55.8
61.4
57.7
58.1
64
56
56.3
60.2
56.6
56.8
58.7
60.3
62.6
60.2
58.8
61.3
63.6
62.8
57.3
58.6
57.5
57.6
59.3
56.8
56.3
61.8
58.4
59.4
60
56.7
57.3
56.3
55.6
60.5
58
57.5
61.4
59.5
58.1
57.9
57.7
57.1
59.2
57.3
56.6
58.3
52.9
58.8
65.9
63.1
62.1
68.4
63.2
61.7
63.1
59.5
61.2
60.4
62.6
62.9
60.8
61.7
65.6
66.6
67.1
61.3
61.1
61.7
58.1
60.1
58
58.5
62.4
57.8
59.7
61.7
58
59.6
61.1
59.8
62.9
61.2
59.4
64.3
60.2
59.6
59.9
60.8
60.6
63.5
59.7
60.4
63.4
55.5
21.7
21.7
21.3
23.3
21.2
20.8
21.6
23.9
24.8
24.4
29.0
26.3
30.0
28.0
22.1
24.3
23.4
23.0
22.5
23.1
25.1
27.6
27.2
22.7
24.4
24.2
26.5
25.7
22.5
21.7
20.0
18.5
23.2
23.8
21.6
19.8
23.6
20.9
17.8
26.3
24.7
22.2
22.2
21.7
23.0
20.2
26.2
a
a
a
b
a
a
a
b
b
b
c
c
c
c
b
b
b
b
b
b
b
c
c
b
b
b
c
b
b
a
a
a
b
b
a
a
b
a
a
c
b
b
b
a
b
a
c
─────────────────────────────────────────────────────
10)但し、クラス学生数のデータは別のソースである。
― 74 ―
社 会 学 部 紀 要 第118号
中学 3 年生
北海道
青森
岩手
宮城
秋田
山形
福島
茨城
栃木
群馬
埼玉
千葉
東京
神奈川
新潟
富山
石川
福井
山梨
長野
岐阜
静岡
愛知
三重
滋賀
京都
大阪
兵庫
奈良
和歌山
鳥取
島根
岡山
広島
山口
徳島
香川
愛媛
高知
福岡
佐賀
長崎
熊本
大分
宮崎
鹿児島
沖縄
国語 A
国語 B
算数 A
算数 B
理科
クラス学生数
分類
74.2
76
75.9
76.2
79.7
77.4
76.6
74.8
75.4
77.3
74.7
74.9
76.1
75
75
78.1
77
78.9
76.2
76.3
75.6
76.1
75.3
74
74.7
74.8
73.1
76
76.7
74.6
76
74.6
74.1
75.3
75.2
74.6
75.3
76.5
72.5
74.1
73.7
75.2
75
74.2
74.8
74
67.6
63.1
65.5
64.2
65.5
70.3
66.9
64.4
65.3
63.7
65.5
63.1
63.5
64
63.6
62.7
67
66.4
67.5
64.8
63.8
65.9
64
63.6
61.1
62
62.2
59.1
62.2
62.9
61.7
65.2
65.6
61.6
63.6
64.1
61.4
62.3
63.4
61.6
62.4
63
63.8
64.4
63.6
65
62.3
56.9
60.8
62.4
59.1
60.8
67.4
62.3
60.9
61.9
61.6
63.7
60.2
61.4
63.8
61.2
61.1
66.5
66.3
68.1
60.6
62.3
65.1
65.3
65
61.6
63
62.5
60.2
63.8
63.5
62.9
64
61
61.4
62.4
63.6
63.1
63.2
64.1
58.3
59.4
61.2
62.5
61.9
61.5
64.5
60.4
50.8
48.1
48.9
47.4
50.5
56.7
50.1
49.1
50.7
49.6
53
48.1
48.8
51.3
49.8
47.4
54.6
54.7
56.2
51.4
48.8
53
52.7
50.9
48
48.4
48.4
45.9
49.7
50.4
48.5
49.5
47.8
47.5
49.8
50.9
47.1
49.4
51.1
45.4
47.1
47.4
51.3
50.1
47.9
50
46.6
38.4
50.5
52.1
51.1
52.7
56.1
54.9
52.2
52.4
51.5
55.2
48.8
50.1
50.1
49.6
50.4
56.8
56.3
57.8
52.1
51
54.5
53.2
53.7
50.6
51.1
49.5
47.8
51.9
51.1
49.8
52.4
50.7
51.2
50.2
52.6
51
51.5
52
47.3
49.7
49.2
50.7
52.7
51.5
52.7
49.6
41.4
25.0
26.3
26.0
27.1
26.3
25.2
25.5
28.9
27.0
29.4
32.4
30.5
33.0
31.6
28.2
29.6
29.4
25.4
27.9
27.8
28.7
29.2
31.3
27.6
29.1
28.7
31.0
31.3
27.7
25.5
24.8
24.0
28.0
29.1
24.7
24.8
28.7
27.8
22.7
30.7
28.8
27.3
27.9
26.8
27.0
27.0
30.6
a
b
b
b
b
a
a
b
b
b
c
c
c
c
b
b
b
a
b
b
b
b
c
b
b
b
c
c
b
a
a
a
b
b
a
a
b
b
a
c
b
b
b
b
b
b
c
March
― 75 ―
2014
25 年
北海道
青森
岩手
宮城
秋田
山形
福島
茨城
栃木
群馬
埼玉
千葉
東京
神奈川
新潟
富山
石川
福井
山梨
長野
岐阜
静岡
愛知
三重
滋賀
京都
大阪
兵庫
奈良
和歌山
鳥取
島根
岡山
広島
山口
徳島
香川
愛媛
高知
福岡
佐賀
長崎
熊本
大分
宮崎
鹿児島
沖縄
小学 6 年生
中学 3 年生
国語 A.2
国語 B.2
算数 A.2
算数 B.2
国語 A.3
国語 B.3
算数 A.3
算数 B.3
60.4
68.7
65.5
60.8
71.7
63.9
63.9
63.7
61.1
61.3
62.6
61.9
64.8
61.5
66.3
63.8
67.6
68.6
60.1
63.7
61.3
57.7
61.2
60.3
58.8
65.8
61.2
63.3
62.6
62.4
63.9
59.2
61.4
65.8
64.3
63.3
66.8
63.1
65.3
63.2
63.3
60.3
64
62.3
64.5
64.7
58.3
46.4
52.9
50.8
47.6
59.1
48.5
48.5
49.7
47.9
47.5
49.7
50.1
52.1
49.7
50.4
50.7
54.3
54.3
47.5
50.3
49.1
47.3
48.6
46.7
46.4
52.1
47.9
49.9
50.1
47.5
50.4
46.8
47.7
52.7
50.2
49
52.9
50.7
49.8
49.1
46.8
46.9
48.1
48.7
48.1
47.9
45.5
74.9
80.7
78.3
76.3
82.8
77.3
76.4
77.2
76.8
76.4
76.2
77.1
78.4
76.5
79.5
79.7
80.2
81.6
75.6
77.8
76.2
76.2
76.2
75.8
74.7
79.2
77.1
77.4
78.6
76.4
78.1
74.3
74.6
79.2
77.9
75.8
78.1
77.6
78.8
77.2
77.1
76.4
78.5
78.7
77
78.8
73.3
54
60.5
57.9
56.5
67.1
57.1
55.3
58.9
56.3
55
57.7
59.4
60.8
58.7
59.3
60.4
64.3
65.1
55.8
59.5
56
56.6
59.5
55.3
55.1
61.1
57.3
59.2
58.5
56.9
60.2
55.8
57.2
61.3
59.9
58.4
62.3
61
57.9
58.7
57.4
57.1
58.6
57.8
56.8
56.7
54.4
76
78.8
78.2
77.6
81.9
78.9
77.3
77.2
77.2
78.1
76.5
76.2
77.3
76.3
76.5
78.9
78.3
80
76.9
76.8
77.1
77.1
76.5
75
75.5
76.3
73.3
76.8
77.1
74.4
77.6
77.2
76.4
76.7
77.3
76.5
76.6
76.5
74.3
75.4
75.3
76.1
76.6
76
76.1
75.4
69.2
66.2
67.7
68.1
68.6
74.6
69.1
66.4
69.5
68
68.8
68.8
68.1
69.3
68.9
68.6
70.4
70.7
71.7
67.4
65.9
70.2
68.7
67.1
65.8
65.6
68.2
63
67
67.5
64.3
68.6
69.1
66.4
69.2
68.3
64.9
67
67.2
64.8
66.5
65.8
66.6
67.1
66.7
66.4
64.8
62.4
62.3
65
59.9
62.2
68.9
63.1
61
62.9
63.8
64.9
62.8
63.2
65.2
63.8
62.7
65.8
66.6
69.9
62.1
61.9
66.6
65
66.3
63.2
64.4
64.2
61.7
65.9
65.5
63.4
64.8
62.9
62.8
64.8
65.5
65.4
66.3
64.5
59.3
62
61.7
63.2
63.4
62
64
61.5
53.2
39.1
42.4
37.4
39.7
47.5
40.7
38.1
42.1
41.1
42.8
40.6
41.5
43.2
41.9
39.2
43.9
45
49.2
40
40.2
45.7
44.6
44.5
39.3
40.4
42.9
38.8
43.8
42.9
40.3
43
40.8
40.3
43.5
44.2
42.6
44.6
44
35.4
39.8
39.5
41.3
43
39.2
41.4
39.2
29.8
― 76 ―
社 会 学 部 紀 要 第118号
資料 3.生活の信条について
日本
ドイツ
記号(日)
記号(独)
Q5a
Q5b
Q5c
Q5d
Q5e
Q5f
Q5g
Q5h
Q5i
Q5j
Q4A
Q4B
Q4C
Q4D
Q4E
Q4F
Q4G
Q4H
Q4I
Q4J
a
b
c
d
e
f
g
h
i
j
A
B
C
D
E
F
G
H
I
J
内容
学歴
収入
地位
社会活動
ライフワーク、趣味
人間関係
友人、知人との交流
仕事
家族
競争
世俗的成功
世俗的成功
世俗的成功
自己充実感
自己充実感
自己充実感
自己充実感
自己充実感
家庭
競争
Demographic Variables
日本
ドイツ
記号(日)
記号(独)
性別
年齢
性別
年齢
Q1
Q2
D1
q1, D2
生活の信条について、年齢階級に対する日本とドイツの質問(Q5a∼Q5j, Q4A∼Q4J)の回答のクロス分布データ
>JD
∼20
30
40
50
60
70
80∼
∼20
30
40
50
60
70
80∼
Q3a1
Q3a2
Q3a3
34
42
59
86
109
80
23
40
57
43
55
51
29
8
15
23
25
35
21
4
2
Q3c5
Q5d1
Q5d2
Q5d3
Q5d4
11
7
13
22
30
35
8
36
55
59
72
83
44
12
36
46
41
72
56
28
11
12
11
14
14
10
9
1
Q5f5
Q5g1
Q5g2
Q5g3
48
58
60
64
59
43
12
36
50
43
84
84
50
9
9
12
23
31
32
18
9
3
0
3
3
1
3
1
Q5f4
∼20
30
40
50
60
70
80∼
3
6
5
11
7
5
2
1
0
4
0
0
1
0
Q3a4
5
2
7
8
2
4
1
Q3a5
3
1
0
2
0
2
0
Q3b1
Q3b2
Q3b3
20
35
53
85
94
79
20
49
55
53
71
66
34
12
20
29
23
24
18
5
2
Q5d5
Q5e1
Q5e2
Q5e3
47
67
59
80
75
44
11
37
47
56
74
78
49
13
12
6
10
26
23
16
6
Q5g5
Q5h1
Q5h2
Q5h3
39
41
49
71
77
49
13
38
52
58
78
77
44
7
16
25
21
29
19
18
10
2
5
7
2
1
1
0
Q5g4
3
2
3
6
6
5
1
1
1
4
0
1
1
0
Q3b4
5
4
5
4
4
2
0
Q3b5
3
2
0
2
1
0
0
Q5e4
0
4
5
3
5
6
2
Q3c1
Q3c2
Q3c3
Q3c4
16
14
23
32
42
36
11
31
53
43
58
62
37
10
36
50
52
70
66
36
9
11
8
11
21
12
7
3
Q5e5
Q5f1
Q5f2
Q5f3
39
39
52
59
73
47
11
38
56
52
80
74
48
11
16
23
20
33
28
15
7
Q5h5
Q5i1
Q5i2
59
87
86
116
113
71
20
19
22
39
59
57
39
7
1
0
4
1
1
2
0
Q5h4
2
6
2
5
5
5
1
2
0
3
2
1
0
0
March
― 77 ―
2014
Q5i3
∼20
30
40
50
60
70
80∼
14
14
7
8
12
4
3
Q5i4
3
1
0
1
0
1
1
Q5i5
2
0
1
0
0
1
0
Q5j1
8
5
4
4
5
7
1
Q5j2
Q5j3
Q5j4
Q5j5
20
22
30
24
28
14
5
37
47
41
70
89
44
13
17
33
34
59
45
34
10
15
17
25
27
15
18
2
>DD
Q2A1 Q2A2 Q2A3 Q2A4 Q2B1 Q2B2 Q2B3 Q2B4 Q2B5 Q2C1 Q2C2 Q2C3 Q2C4 Q2C5
∼20
30
40
50
60
70
80∼
6
25
41
57
45
54
49
2
24
20
42
45
31
27
0
3
2
3
5
3
2
0
1
2
2
0
2
0
3
12
23
35
36
43
39
4
32
36
48
44
38
30
1
7
5
16
10
9
7
0
1
1
4
4
0
1
0
1
0
1
1
0
0
2
8
20
22
19
20
16
4
31
19
51
52
43
28
Q4D1 Q4D2 Q4D3 Q4D4 Q4D5 Q4E1 Q4E2 Q4E3 Q4E4 Q4E5 Q4F1
∼20
30
40
50
60
70
80∼
10
10
18
8
12
14
2
19
22
34
37
32
34
4
18
13
28
18
27
16
7
13
13
20
26
18
11
4
1
7
4
6
1
3
3
16
25
27
17
17
16
1
37
29
52
55
51
46
7
3
8
19
13
12
10
3
5
3
5
8
8
3
8
0
0
1
2
2
3
1
22
20
19
18
20
19
7
Q4F5 Q4G1 Q4G2 Q4G3 Q4G4 Q4G5 Q4H1 Q4H2 Q4H3 Q4H4 Q4H5
∼20
30
40
50
60
70
80∼
0
1
1
3
0
1
2
Q4I4
∼20
30
40
50
60
70
80∼
>
1
1
0
2
1
0
0
36
40
50
47
43
43
12
20
23
47
42
43
32
5
Q4J1
Q4J2
Q4J3
Q4J4
Q4J5
5
8
10
9
8
5
0
28
22
31
29
26
13
1
14
16
32
24
25
20
4
11
14
22
26
20
28
8
3
5
9
7
11
12
6
3
1
4
4
2
2
3
2
1
3
2
2
0
0
0
0
0
0
0
1
0
25
33
37
39
32
25
5
29
29
60
44
47
42
11
7
3
3
8
7
5
4
0
0
4
3
3
5
0
0
0
0
1
1
1
0
2
10
16
19
17
19
23
0
4
8
10
6
8
8
0
0
1
2
1
0
2
Q4F2
Q4F3
Q4F4
26
32
54
45
34
37
2
7
4
18
17
27
18
6
6
8
12
12
9
3
3
Q4I1
Q4I2
Q4I3
40
49
68
65
64
56
15
19
14
31
22
23
20
4
1
1
5
6
2
2
1
― 78 ―
社 会 学 部 紀 要 第118号
Exploratory Multivariate Statistical Data Analysis
──Multiple Factor Analysis──
ABSTRACT
Multiple factor analysis deals with a multiple table, composed of quantitative or
categorical variables balancing the influence of the different sets on the first principal
axes. Recently MFA function has been extended to the contingency tables.
I explain this analysis using R and package FactoMineR, and demonstrate some
Japanese applications.
Key Words: Multiple factor analysis, R, FactoMineR