EXCEL多変量分析ホームページへ戻る

11. 数量化V類

 数量化T類およびU類では求めるべき外的基準があったが、数量化V類では求めるべき外的基準がなく、与えられた質的データについて、そのデータの類似性について調べる方法である。項目(カテゴリ)と被験者(サンプル)について、両方同時に数量化を行い、項目と被験者の相互の関連をより明らかにする方法である。パターン類似法とも呼ばれている。量的データの分析である主成分分析に似た質的データの分析方法である。

 項目(カテゴリ)と被験者(サンプル)について、質的データが与えられているとき、同一の項目に反応した被験者は類似性が高く、また同一の被験者に反応した項目は類似性が高いと仮定する。お互いに類似性の高い項目・被験者が近くにくるように並べかえると反応したものが対角線の周辺に集まってくる。このようにして、その類似性を調べようとするのであるが、項目と被験者を並べかえる代わりに、項目と被験者の相関係数を最大にすることにより実施する。

 いま、4人の被験者について、野球とすもうのどのスポーツが好きかを調べたところ、下のような表な結果を得た。この結果から被験者の類似性や項目間の類似性を調べる。

 

 好きなスポーツ項目に「レ」をつける。

 

 

カテゴリ(項目)

No

野球

すもう

 

 

 

上の表について、「該当有り」には「1」を、「該当無し」には「0」の数量を与えると

11.1 サンプルスコア・カテゴリスコアを求める。

  サンプルデータの分散をVaa、カテゴリデータの分散をVbb、サンプルデータとカテゴリデータの共分散をVabとすると

 

 

 

 

この式をa1・a2・a3・a4 とb1・b2 で偏微分し0とおくことにより、相関係数Rを最大にするai・bjを求める。

 

 @×a1+A×a2+B×a3+C×a4を求めると

  11+a21+a22+a31+a42−λ(a12+2a22+a32+a42

  11+a21+a22+a31+a42−λ

 D×b1+E×b2を求めると

  11+a21+a22+a31+a42−μ(3b12+2b22

  11+a21+a22+a31+a42−μ

    これから λ=μ

 @ABCから

      

 

 

  これをDEに代入して

    

 

 よって      5b1+b2−6λ21=0      F

             1+3b2−4λ22=0    … G

 FGを変形して

 

 

  

    

 

    この式から  λ2 =1 ,0.583

  数量化V類では、得られた固有方程式を解くと、固有値の1つとして必ず1が得られるが、この解の1は採用しないで(全部同じ値となり意味がない)、2番目以降の固有値から採用する ようにする。λ2=0.583を採用し、固有ベクトルb1・b2 を求める。

 


 

 

以上をまとめると

 

[カテゴリスコア]

カテゴリ

カテゴリスコア

野球(b1)

すもう(b2)

0.365

0.548

 

[サンプルスコア]

サンプル

サンプルスコア

(a1)

(a2)

(a3)

(a4)

0.478

0.120

0.478

0.718

 

  

 

 

 

 カテゴリ数・サンプル数が少ないためにそれぞれの類似性がはっきりしないが、サンプルス  コアを見ると、@とBの被験者の嗜好が同じであり、AとCの被験者の嗜好が近いといえる。  一般にカテゴリ数がn個あると、固有値もn個求められるが、数量化V類では、固有値の中で最大の固有値は、常に1となるのでこれを除いたn−1個の固有値を採用する。

 

11.2 行列を使用して、サンプルスコア・カテゴリスコアを求める。

 カテゴリ数やサンプル数が増えてくると計算が非常に大変になる。そこで、同様の計算を行  列を用いて実施する。各行列を下のようにする。

    

 

これを変形すると

          -1/2D’・A-1D・B-1/2−λ2=0

              ただし 1/2とする

    -1/2D’・A-1D・B-1/2−λ2=0

    -1/2 D’・A-1D・B-1/2 −λ2|=0 よりλ2を得る。

実際に行列を使用して、カテゴリスコア・サンプルスコアを求める。

      

                                               

   

        λ2 =1 ,0.583

  固有値λ2=1を除いて、λ2=0.583を採用する。

 

λ2=0.583に属する固有ベクトルを求める。

 

これより、b1=0.365 b2=−0.548

 

 

11.3 アイテム・カテゴリ方式

 いままで行ってきた数量化V類の方法は、1つの項目について「好き」「嫌い」のように2者択一的に選択するという方法をとったが、1つの項目について「好き」「普通」「嫌い」のように選択支が2つ以上ある時には、このような方法は使用できない。選択支がつ以上ある時には、アイテム・カテゴリ方式で求める必要がある。

  前の表をアイテム・カテゴリ方式で新しく表を作成すると、下のようになる。

 

N0

すもう

好き(b1)

嫌い(b2)

好き(b3)

嫌い(b4)

×

×

×

×

×

×

×

×

    

     該当するカテゴリは1、該当しないときは0の数量を与える。

 

 該当するカテゴリは1、該当しない時には0の数量を与える。

 

N0

すもう

好き(b1)

嫌い(b2)

好き(b3)

嫌い(b4)

(a1)

(a2)

(a3)

(a4)

 

 @サンプルスコア・カテゴリスコアを求める。

     前回の方法と同様にして計算し、それぞれの得点を求める。

     サンプルデ−タの分散Vaa、カテゴリデータの分散Vbb、共分散Vabを求めると

 

 

 

 

 

 

 

 

 

 

  前回と同様にλ=μとなるので

  @ABCから

  1=  a2=  3=   a4

    これを、それぞれDEFGに代入すると

 

   この式から固有値を求めると、λ21 , 0 , 0.789 , 0.211

   λ21 , 0  は無意味なので λ20.789 , 0.211 を採用する。

 

   λ2 0.789 , 0.211 を採用し、それぞれに属する固有ベクトルを求める。

  20.789 の時

        3b1+b3+2b4−6×0.789・b1=0

        2+b3−2×0.789・b2=0

        1+b2+2b3−4×0.789・b3=0

        2b1+2b4−4×0.789・b4=0

      以上から、b1=−0.57・b3  b21.73・b3     4=−b3

       31 とすると、b1=−0.57  b21.73     4=−1

   また標準化すると

       b1=−0.188  b20.577     30.33  b4=−0.33

 サンプルスコアを求めると

   

     a1=−0.88  a20.24    3=−0.88 a41.53

 A同様にして、λ2 0.211 の時のカテゴリスコア・サンプルスコアを求めると

       b10.577   b2=−1.73     31       4=−1

       a1=−0.46   21.72       3=−0.46   4=−0.79

 

 [カテゴリスコア]

 

λ2

野 球

すもう

(b1)

(b2)

(b3)

(b4)

0.789

0.211

0.57

0.57

1.73

1.73

1

1

1

1

 

 

 

 

   λ12 0.789 を横軸に,λ22= 0.211 を縦軸にとりカテゴリスコアをグラフに描くと

 

       

 

グラフを見ると横軸の+方向は、個人戦のスポーツが好き、−方向は団体戦のスポーツが好きな傾向と考えられる。また縦軸の+方向は全般的にスポーツが好きな傾向、−方向は全般的にスポーツが嫌いな傾向を示すと考えられる。

 

 

 

 

[サンプルスコア]

被験者

固有値

λ120.211

λ220.789

1

2

3

4

0.88

0.24

0.88

1.53

0.46

1.72

0.46

0.79

 

  サンプルスコアをみると、被験者の嗜好の類似性を見ることができる。

 λ12 0.789 を横軸に,λ22= 0.211 を縦軸にとりサンプルスコアをグラフに描くと

数量化3類例題

 主成分分析の例題を使用し、数量化3類の分析を実施する。ビジネスのカテゴリを削除し、それぞれのカテゴリで、該当あり:1 該当なし:0 の数量を与える。またカテゴリ反応数、アイテム反応数を求めておく。

 

 

ニュース

スポーツ

 

 

充実

不充実

充実

不充実

カテゴリ

NO

X11

X12

X31

X32

反応数

1

1

0

0

1

2

2

0

1

1

0

2

3

1

0

1

0

2

4

0

1

0

1

2

5

1

0

1

0

2

6

0

1

0

1

2

7

0

1

1

0

2

8

1

0

0

1

2

9

0

1

0

1

2

10

1

0

1

0

2

サンプル反応数

5

5

5

5

 

 

1. カテゴリスコア・サンプルスコアを求める。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


とする。

また

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

とする。aはサンプルスコア、bはカテゴリスコア、Xは固有ベクトルを求めるため行列である。

 

 

以上から   B-1/2D'A-1DB-1/2    を求める。

 

 

 

1.1.1 カテゴリスコアを求める。

  b = B-1/2Xより

 

 

 

 

 

 

 

 

 

 

 

 


求められたカテゴリスコアを更にその標準偏差で割って基準化すると

 

 

 

 

1.1.2 サンプルスコアを求める。

 

  a =  A-1Dbより

 

 

 

 

 

 

 

 

 

 

 

 

 


1.2  λ20.4 の時

X10.5  X2=−0.5  X3=−0.5  X40.5

 

1.2.1 カテゴリスコアを求める。

  b = B-1/2Xより

 

 

 

 

 

 

 

 

 

 

 

 


求められたカテゴリスコアを更にその標準偏差で割って基準化すると

  

 

1.2.2 サンプルスコアを求める。

 

  a =  A-1Dbより

 

 

 

 

 

 

 

 

 

 

 

 


以上をまとめると

カテゴリスコア

λ2

ニュース

スポーツ

充実

不充実

充実

不充実

b11

b12

b31

b32

0.6

0.5

0.5

0.5

0.5

0.4

0.5

0.5

0.5

0.5

 

 

 

カテゴリスコアをグラフ化する

λ20.6を横軸に、λ20.4を縦軸にとりカテゴリスコアをグラフ化する。

これを見ると、横軸の+方向に紙面の充実度の程度、縦軸+方向に専門紙指向、−方向に大衆紙指向の度合いと考えられる。

次にサンプルスコアを同様にグラフ化する。

 

 

 

 

λ20.6を横軸に、λ20.4を縦軸にとりサンプルをグラフ化する。

横軸の+方向に紙面の充実度の程度、縦軸+方向に専門紙指向、−方向に大衆紙指向の度合いと考えられるので、紙面の充実度の高いのは、3,5,103紙であり、不充実の紙は4,6,93紙である。専門紙志向が強いのは、1,82紙であり、大衆紙志向の強いのは、2,72紙である。

 

 

EXCEL多変量分析ホームページへ戻る