【７】数量化Ⅲ類

１１．　数量化Ⅲ類

　数量化Ⅰ類およびⅡ類では求めるべき外的基準があったが、数量化Ⅲ類では求めるべき外的基準がなく、与えられた質的データについて、そのデータの類似性について調べる方法である。項目（カテゴリ）と被験者（サンプル）について、両方同時に数量化を行い、項目と被験者の相互の関連をより明らかにする方法である。パターン類似法とも呼ばれている。量的データの分析である主成分分析に似た質的データの分析方法である。

項目（カテゴリ）と被験者（サンプル）について、質的データが与えられているとき、同一の項目に反応した被験者は類似性が高く、また同一の被験者に反応した項目は類似性が高いと仮定する。お互いに類似性の高い項目・被験者が近くにくるように並べかえると反応したものが対角線の周辺に集まってくる。このようにして、その類似性を調べようとするのであるが、項目と被験者を並べかえる代わりに、項目と被験者の相関係数を最大にすることにより実施する。

いま、４人の被験者について、野球とすもうのどのスポーツが好きかを調べたところ、下のような表な結果を得た。この結果から被験者の類似性や項目間の類似性を調べる。

好きなスポーツ項目に「ﾚ」をつける。

カテゴリ（項目）

被

験

者

サ

ン

プ

ル

Ｎｏ

野球

すもう

１

２

３

４

ﾚ

上の表について、「該当有り」には「１」を、「該当無し」には「０」の数量を与えると

１１．１　サンプルスコア・カテゴリスコアを求める。

サンプルデータの分散をＶaa、カテゴリデータの分散をＶbb、サンプルデータとカテゴリデータの共分散をＶabとすると

この式をａ₁・ａ₂・ａ₃・ａ₄ とｂ₁・ｂ₂ で偏微分し０とおくことにより、相関係数Ｒを最大にするａi・ｂjを求める。

　①×ａ₁＋②×ａ₂＋③×ａ₃＋④×ａ₄を求めると

ａ₁ｂ₁＋ａ₂ｂ₁＋ａ₂ｂ₂＋ａ₃ｂ₁＋ａ₄ｂ₂－λ（ａ₁²＋２ａ₂²＋ａ₃²＋ａ₄²）

＝ａ₁ｂ₁＋ａ₂ｂ₁＋ａ₂ｂ₂＋ａ₃ｂ₁＋ａ₄ｂ₂－λ

⑤×ｂ₁＋⑥×ｂ₂を求めると

ａ₁ｂ₁＋ａ₂ｂ₁＋ａ₂ｂ₂＋ａ₃ｂ₁＋ａ₄ｂ₂－μ（３ｂ₁²＋２ｂ₂²）

＝ａ₁ｂ₁＋ａ₂ｂ₁＋ａ₂ｂ₂＋ａ₃ｂ₁＋ａ₄ｂ₂－μ

これから　λ＝μ

①②③④から

これを⑤⑥に代入して

よって５ｂ₁＋ｂ₂－６λ²ｂ₁＝０ … ⑦

ｂ₁＋３ｂ₂－４λ²ｂ₂＝０ …　⑧

⑦⑧を変形して

この式から λ²＝１，０．５８３

数量化Ⅲ類では、得られた固有方程式を解くと、固有値の１つとして必ず１が得られるが、この解の１は採用しないで（全部同じ値となり意味がない）、２番目以降の固有値から採用する　ようにする。λ²＝０．５８３を採用し、固有ベクトルｂ₁・ｂ₂ を求める。

以上をまとめると

［カテゴリスコア］

カテゴリ

カテゴリスコア

野球(b₁)

すもう(b₂)

0.365

－0.548

［サンプルスコア］

サンプル

サンプルスコア

１(a1)

２(a2)

３(a3)

４(a4)

0.478

－0.120

0.478

－0.718

カテゴリ数・サンプル数が少ないためにそれぞれの類似性がはっきりしないが、サンプルス　　コアを見ると、①と③の被験者の嗜好が同じであり、②と④の被験者の嗜好が近いといえる。　　一般にカテゴリ数がｎ個あると、固有値もｎ個求められるが、数量化Ⅲ類では、固有値の中で最大の固有値は、常に１となるのでこれを除いたｎ－１個の固有値を採用する。

１１．２　行列を使用して、サンプルスコア・カテゴリスコアを求める。

カテゴリ数やサンプル数が増えてくると計算が非常に大変になる。そこで、同様の計算を行　　列を用いて実施する。各行列を下のようにする。

これを変形すると

Ｂ^-1/2･Ｄ’･Ａ^-1･Ｄ･Ｂ^-1/2^･ｘ－λ²･ｘ＝０

ただし　Ｂ^1/2･ｂ＝ｘとする

（Ｂ^-1/2･Ｄ’･Ａ^-1･Ｄ･Ｂ^-1/2－λ²）ｘ＝０

｜Ｂ^-1/2･ Ｄ’･Ａ^-1･Ｄ･Ｂ^-1/2 －λ²Ｅ｜＝０　よりλ²を得る。

実際に行列を使用して、カテゴリスコア・サンプルスコアを求める。

λ²＝１，０．５８３

固有値λ²＝１を除いて、λ²＝０．５８３を採用する。

λ²＝０．５８３に属する固有ベクトルｂを求める。

これより、ｂ₁＝０．３６５　ｂ₂＝－０．５４８

１１．３　アイテム・カテゴリ方式

　いままで行ってきた数量化Ⅲ類の方法は、１つの項目について「好き」「嫌い」のように２者択一的に選択するという方法をとったが、１つの項目について「好き」「普通」「嫌い」のように選択支が２つ以上ある時には、このような方法は使用できない。選択支がつ以上ある時には、アイテム・カテゴリ方式で求める必要がある。

　前の表をアイテム・カテゴリ方式で新しく表を作成すると、下のようになる。

Ｎ０

野球

すもう

好き(b1)

嫌い(b2)

好き(b3)

嫌い(b4)

１

２

３

４

○

該当するカテゴリは１、該当しないときは０の数量を与える。

該当するカテゴリは１、該当しない時には０の数量を与える。

Ｎ０	野球		すもう		計
Ｎ０	好き(b₁)	嫌い(b₂)	好き(b₃)	嫌い(b₄)	計
１(a₁) ２(a₂) ３(a₃) ４(a₄)	１１１０	０００１	０１０１	１０１０	２２２２
計	３	１	２	２	８

①サンプルスコア・カテゴリスコアを求める。

前回の方法と同様にして計算し、それぞれの得点を求める。

サンプルデ－タの分散Ｖaa、カテゴリデータの分散Ｖbb、共分散Ｖabを求めると

前回と同様にλ＝μとなるので

①②③④から

ａ₁＝　　ａ₂＝　ａ₃＝　　　ａ₄＝

これを、それぞれ⑤⑥⑦⑧に代入すると

この式から固有値を求めると、λ²＝1 , 0 , 0.789 , 0.211

λ²＝1 , 0 は無意味なので　λ²＝0.789 , 0.211 を採用する。

λ²＝ 0.789 , 0.211　を採用し、それぞれに属する固有ベクトルを求める。

①λ²＝0.789 の時

３ｂ₁＋ｂ₃＋２ｂ₄－６×0.789･ｂ₁＝０

ｂ₂＋ｂ₃－２×0.789･ｂ₂＝０

ｂ₁＋ｂ₂＋２ｂ₃－４×0.789･ｂ₃＝０

２ｂ₁＋２ｂ₄－４×0.789･ｂ₄＝０

以上から、ｂ₁＝－0.57･ｂ3　　ｂ₂＝1.73･ｂ3 ｂ₄＝－ｂ₃

　ｂ₃＝1　とすると、ｂ₁＝－0.57　　ｂ₂＝1.73 ｂ₄＝－1

　　　また標準化すると

　ｂ₁＝－0.188　　ｂ₂＝0.577 ｂ₃＝0.33　　ｂ₄＝－0.33

サンプルスコアを求めると

　ａ₁＝－0.88　　ａ₂＝0.24 ａ₃＝－0.88　ａ₄＝1.53

②同様にして、λ² ＝0.211　の時のカテゴリスコア・サンプルスコアを求めると

　ｂ₁＝0.577 　　ｂ₂＝－1.73 ｂ₃＝1 　　ｂ₄＝－1

　ａ₁＝－0.46 　ａ₂＝1.72 ａ₃＝－0.46 　ａ₄＝－0.79

　［カテゴリスコア］

λ²

野　球

すもう

好(b₁)

嫌(b₂)

好(b₃)

嫌(b₄)

0.789

0.211

－0.57

0.57

1.73

－1.73

－1

λ₁²＝ 0.789 を横軸に,λ₂²= 0.211 を縦軸にとりカテゴリスコアをグラフに描くと

グラフを見ると横軸の＋方向は、個人戦のスポーツが好き、－方向は団体戦のスポーツが好きな傾向と考えられる。また縦軸の＋方向は全般的にスポーツが好きな傾向、－方向は全般的にスポーツが嫌いな傾向を示すと考えられる。

［サンプルスコア］

被験者

固有値

λ₁²：0.211

λ₂²：0.789

ａ₁

ａ₂

ａ₃

ａ₄

－0.88

0.24

－0.88

1.53

－0.46

1.72

－0.46

－0.79

サンプルスコアをみると、被験者の嗜好の類似性を見ることができる。

　λ₁²＝ 0.789 を横軸に,λ₂²= 0.211 を縦軸にとりサンプルスコアをグラフに描くと

数量化3類例題

　主成分分析の例題を使用し、数量化3類の分析を実施する。ビジネスのカテゴリを削除し、それぞれのカテゴリで、該当あり：１　該当なし：０　の数量を与える。またカテゴリ反応数、アイテム反応数を求めておく。

	ニュース		スポーツ
	充実	不充実	充実	不充実	カテゴリ
NO	X11	X12	X31	X32	反応数
1	1	0	0	1	2
2	0	1	1	0	2
3	1	0	1	0	2
4	0	1	0	1	2
5	1	0	1	0	2
6	0	1	0	1	2
7	0	1	1	0	2
8	1	0	0	1	2
9	0	1	0	1	2
10	1	0	1	0	2
ｻﾝﾌﾟﾙ反応数	5	5	5	5

１．　カテゴリスコア・サンプルスコアを求める。

とする。

また

とする。aはサンプルスコア、bはカテゴリスコア、Xは固有ベクトルを求めるため行列である。

以上から　　　B^-1/2･D'･A^-1･D･B^-1/2を求める。

1.1.1　カテゴリスコアを求める。

b = B^-1/2･Xより

求められたカテゴリスコアを更にその標準偏差で割って基準化すると

1.1.2　サンプルスコアを求める。

　　a = A^-1･D･bより

1.2　　λ²＝0.4　の時

X₁＝0.5　　X₂＝－0.5　　X₃＝－0.5　　X₄＝0.5

1.2.1　カテゴリスコアを求める。

b = B^-1/2･Xより

求められたカテゴリスコアを更にその標準偏差で割って基準化すると

1.2.2　サンプルスコアを求める。

　　a = A^-1･D･bより

以上をまとめると

カテゴリスコア

λ²	ニュース		スポーツ
	充実	不充実	充実	不充実
	b₁₁	b₁₂	b₃₁	b₃₂
0.6	0.5	－0.5	0.5	－0.5
0.4	0.5	－0.5	－0.5	0.5

カテゴリスコアをグラフ化する

λ²＝0.6を横軸に、λ²＝0.4を縦軸にとりカテゴリスコアをグラフ化する。

これを見ると、横軸の＋方向に紙面の充実度の程度、縦軸＋方向に専門紙指向、－方向に大衆紙指向の度合いと考えられる。

次にサンプルスコアを同様にグラフ化する。

λ²＝0.6を横軸に、λ²＝0.4を縦軸にとりサンプルをグラフ化する。

横軸の＋方向に紙面の充実度の程度、縦軸＋方向に専門紙指向、－方向に大衆紙指向の度合いと考えられるので、紙面の充実度の高いのは、3,5,10の3紙であり、不充実の紙は4,6,9の3紙である。専門紙志向が強いのは、1,8の2紙であり、大衆紙志向の強いのは、2,7の2紙である。

EXCEL多変量分析ホームページへ戻る