本章では、複数のカテゴリカル潜在変数を持つモデルのパラメータ化について 述べる。パラメータ化の方法は3つある。一連のロジスティック回帰に基づく非再帰的モデル、頻度表の対数線形モデリング、ロジットではなく確率を用いるパラメータ化、である。
以下では、PARAMETERIZATION = LOGITによるロジスティック回帰パラメータ化について述べる。次のモデルでは、MODELコマンドで2つのカテゴリカル潜在変数を指定している。それぞれの潜在変数は3クラスを持っている。
MODEL: %OVERALL% c2#1 ON c1#1; c2#1 ON c1#2; c2#2 ON c1#1; c2#2 ON c1#2;
一連のON文は、c1の下でのc2の条件つき分布におけるロジスティック回帰係数について述べている。c2とc1のそれぞれが3クラスを持つので、この条件つき分布は合計で6個のパラメータを持っている。そのうち2つはc2の切片であり、4つはMODELコマンドで指定されているロジスティック回帰係数である。
c1のあるクラスからc2のあるクラスへの遷移確率は、次の多項ロジスティック回帰表現で与えられる。c2のクラスをr=1,2,3としよう。
P(c2 = r |c1 = 1) = exp(a_r + b_{r1}) / sum_1 P(c2 = r |c1 = 2) = exp(a_r + b_{r2}) / sum_2 P(c2 = r |c1 = 3) = exp(a_r + b_{r3}) / sum_3
ただし a_3 = 0, b_{31} = 0, b_{32} = 0, b_{33} = 0である(最後のクラスは参照クラスだから)。sum_j は、c1=j (j=1,2,3) に関するc2のクラスを通じた指数の合計である。c2のあるクラスをc2の最後のクラスと比較する際の対数オッズは、下表となる。
c2 | ||||
1 | 2 | 3 | ||
---|---|---|---|---|
c1 | 1 | a1+b11 | a2+b21 | 0 |
2 | a1+b12 | a2+b22 | 0 | |
3 | a1 | a2 | 0 |
表のなかのパラメータは、MODELコマンドにおいて次の文で指定する。
a1 [c2#1]; a2 [c2#2]; b11 c2#1 on c1#1; b12 c2#1 on c1#2; b21 c2#2 on c1#1; b22 c2#2 on c1#2;
TYPE=MIXTURE, PARAMETERIZATION=LOGITとTECH15オプションとを併用すると、 周辺確率・条件つき確率を出力することができる。出力には カテゴリカル潜在変数の間の潜在遷移確率も含まれる。 潜在遷移確率などの条件つき確率を共変量のさまざまな値のもとで求めたい場合には、LTAカリキュレータを利用するとよい。MplusエディタのMplusメニューからLTA calculatorを選んで利用する。なお、共変量のロジット・パラメータ化についてはMuthen & Asparouhov(2011)をみよ。
以下では対数線形パラメータ化について述べる。 次のMODELコマンドでは2つのカテゴリカル潜在変数を指定している。それぞれの潜在変数は3クラスを持っている。
MODEL: %OVERALL% c2#1 WITH c1#1; c2#1 WITH c1#2; c2#2 WITH c1#1; c2#2 WITH c1#2;
一連のWITH文はc1とc2の関連性について述べている。パラメータとMODELコマンドの文との対応を示す。
a11 [c1#1]; a12 [c2#2]; a21 [c2#1]; a22 [c2#2]; w11 c2#1 WITH c1#1; w12 c2#1 WITH c1#2; w21 c2#2 WITH c1#1; w22 c2#2 WITH c1#2;
c1のクラスとc2のクラスの同時確率は、14.6節の多項ロジスティック回帰式で計算できる。つまり、下の表を9セルについて合計することになる。
c2 | ||||
1 | 2 | 3 | ||
---|---|---|---|---|
c1 | 1 | a11+a21+w11 | a11+a22+w22 | a11 |
2 | a12+a21+w12 | a12+a22+w22 | a12 | |
3 | a21 | a22 | 0 |
[たとえばP(c1=1 and c2=1)は、そのセルの指数 exp(a11+a21+w11) を9セルの指数の合計で割った値となる、ということであろう]
以下では確率パラメータ化について述べる。 次のMODELコマンドでは2つのカテゴリカル潜在変数を指定している。それぞれの潜在変数は3クラスを持っている。
MODEL: %OVERALL% c2#1 ON c1#1; c2#1 ON c1#2; c2#1 ON c1#3; c2#2 ON c1#1; c2#2 ON c1#2; c2#2 ON c1#3;
一連のON文は、c1の下でのc2の条件つき分布における確率パラメータについて述べている。c2とc1のそれぞれが3クラスを持つので、この条件つき分布は合計で6個のパラメータを持っている。c2の最後のクラスについては言及しない。なぜなら下の表で、各行の合計は1になるからだ。たとえばc1のクラス1において、c2のクラス3の確率は 1-(p11+p12)である。
c2 | ||||
1 | 2 | 3 | ||
---|---|---|---|---|
c1 | 1 | p11 | p12 | - |
2 | p21 | p22 | - | |
3 | p31 | p32 | - |
c1の周辺確率は次のようにあらわされる:
[c1#1]; [c1#2];