3 HLM6による分析の手順

3.1 今回の分析例

今回は,最も単純な2水準(2レベル)のモデルの分析例を示すために,High School and Beyond調査からのデータを利用する。このデータはHLM6をダウンロードすれば,サンプルデータとして提供されるものである 1。 このデータは,学校 $\rightarrow $ 生徒という2段階のサンプリングを経て得られたものであり,生徒個人の情報として数学の成績(MATHACH),また学校に関する情報として学校の区分(school SECTOR:カトリックか公立か)といった変数が含まれている。 また,各生徒について家庭の社会経済的地位を表す尺度の得点(Socio-Economic Status: SES)が測定されている他,それを各学校ごとに平均した値がその学校に通う生徒の平均的な社会経済的地位を表す変数(MEANSES)として計算されている。

今回は,生徒の数学の成績(MATHACH)が個々の生徒の家庭の社会経済的地位(SES),および生徒が属する学校の区分(SECTOR),そして学校に通う生徒の平均的社会経済的地位(MEANSES)からどのように説明されるかを2レベルの階層的線形モデルによってモデル化し,実際に分析を行う。 2

Table 1: 今回の分析で使用する変数

レベル1(生徒)

レベル2(学校)

MATHACH(数学の成績)

SECTOR(学校の区分)

SES(家庭の社会経済的地位)

MEANSES(SESの学校平均)

モデルについて

  レベル1:

ユニットは生徒(7185名)である。 3 このレベルでは,生徒の社会経済的地位(SES)を用いて数学の成績(MATHACH)を予測する回帰式を立てる。

  $\displaystyle  MATHACH_{ij} = \beta _{0j} + \beta _{1j} (SES_{ij} - \bar{SES_{.j}}) + r_{ij} \label{eq.level1}  $   (1)
  レベル2:

ユニットは学校(160校)である。 4 このレベルでは,レベル1の回帰式における学校ごとの切片と傾きを学校の区分(SECTOR)および学校の平均的な社会経済的地位(MEANSES)によって予測する回帰式を立てる。

5

  $\displaystyle  \beta _{0j} = \gamma _{00} + \gamma _{01} (SECTOR_ j) + \gamma _{02} (MEANSES_ j) + u_{0j} \label{eq.level2-1}  $   (5)
  $\displaystyle \beta _{1j} = \gamma _{10} + \gamma _{11} (SECTOR_ j) + \gamma _{12} (MEANSES_ j) + u_{1j} \label{eq.level2-2}  $   (6)

3.2 分析の手順

HLM6では,以下のような手順で分析を行う。 また,分析を行う過程で様々なファイルが作成される。

  1. データファイルの作成

  2. データファイルを読み込み,十分統計量を計算する

    • 分析に用いるモデルの選択(レベルの数など)

    • データファイルの読み込み,変数の指定など

    • MDMTファイル(.mdmt)を作成(MDMファイルで指定した内容を格納)

    • 十分統計量を計算し,MDMファイル(.mdm)として保存

    • STSファイル(.sts)を確認(基本統計量を格納)

  3. モデル式を指定し,出力や推定に関するオプションを指定

    • 指定した内容を,HLMファイル(.hlm)もしくはMLMファイル(.mlm)で保存

  4. 分析の実行

  5. 結果の確認

3.3 データファイルの作成

HLM6においては,データファイルはそれぞれのレベルごとに1つずつ作成する必要がある。 6 すなわち2レベルのモデルであれば2種類の,3レベルのモデルであれば3種類のデータファイルを作成することになる。

HLM6においてデータファイルを作成するには,以下の2つの方法がある。

  1. ASCII形式(通常のテキストファイル)を用いる方法

  2. 他の統計パッケージのファイルを入力として用いる方法7

以下,各々について説明する。

ASCII形式によるデータファイルの作成

データのフォーマット

HLM6では,データ入力のフォーマットが厳格に定められている。 以下にその規則のうち重要と思われるものを挙げる。

レベル1のデータファイル (HSB1.DAT)

\includegraphics[width=15cm]{hsb1.png}

レベル2のデータファイル (HSB2.DAT)

\includegraphics[width=15cm]{hsb2.ps}

SPSSファイルによるデータセットの作成

SPSSのデータファイル形式(.sav)によってデータセットを作成することもできる。 この方法では各セルに1つずつデータを入れることから,ASCIIのようにカラムをそろえるなどの配慮を行わなくてよく,後で説明するMDMファイルの作成もASCII形式のデータファイルを用いた場合よりも簡単にできるなど,何かと便利である。

その他の規則はASCIIによる方法のところで述べたのと同様である。

レベル1のデータファイル (HSB1.SAV)

\includegraphics[width=10cm]{hsb1-sav.ps}

レベル2のデータファイル (HSB2.SAV)

11

\includegraphics[width=12cm]{hsb2-sav.ps}

3.4 MDMファイルの作成

HLM6では,実際の分析は生データを直接用いるのではなく,それをいったん処理したMDM(Multivariate Data Matrix)ファイル(.mdm)の情報を用いて行われる。 12 従って,分析を行う前にまず生データを入力したファイルからMDMファイルを作成する必要がある。 また,いったんMDMファイルを作っておけば,その後の分析には生データファイルを直接用いることなく,すでに作ったMDMファイルを繰り返して使うことができる。

ここでは,前項で取り上げたASCII形式で作成されたデータファイル(.datファイル)およびSPSSによって作成されたデータファイル(.savファイル)からMDMファイルを作成する方法について解説する。

HLM6の起動

まず,HLM6のショートカットをダブルクリックしてHLM6を起動する。 13

\includegraphics[width=2cm]{kidou.ps}

すると,以下のようなウィンドウが立ち上がるはずである。 HLM6の操作は基本的にこのウィンドウから行うことになる。

\includegraphics[width=15cm]{kidougamen.ps}

ASCII形式によるデータファイルを用いたMDMファイルの作成

ここでは,ASCII形式で作成したデータファイルを用いてMDMファイルを作成する方法について説明する。

前項で,データファイルはモデルの水準の数だけ必要であると説明したが,MDMファイルは1つのモデルに1つ作ればよい。

まず,[File]-[Make new MDM file]-[ASCII input]とメニューを選択する。

\includegraphics[width=12cm]{makemdm-ascii1.ps}

次に,分析するモデルのタイプを選択し,[OK]をクリックする。

14

\includegraphics[width=6cm]{makemdm-ascii2.ps}

"Make MDM - HLM2"が開く。 ここで,データファイルからMDMファイルを作成するためのデータに関する情報を指定することになる。

以下に,各項目について入力・指定の方法について述べる。

\includegraphics[width=16cm]{makemdm-ascii3.ps}

MDM File Name

作成するMDMファイルの名前を拡張子つきで入力する。 15

Nesting of input data

データの種類が,「集団−個人」であるか「個人−測定」であるかを指定する。 16 分析の内容には直接関係ないが,後にモデル式の指定をする際にどちらを選択したかで記号の区別がなされることになる。

Level-1 Specification

ここでは,レベル1のデータセットについての情報を指定することになる。

    Level-1 File Name:

レベル1のデータファイルをフルパスで入力する。 17 あるいは,右にある"Browse"ボタンをクリックしてファイルを選択すれば,自動的にそのファイルのフルパスが入力される。

    Number of Variables:

18ID変数を除いた変数の数を半角で入力する。

    Missing Data:

データに欠側がある場合はここで宣言しておく。 19欠測値があれば,欠側のあるケースをどの段階で削除するか(MDMファイルを作る段階/分析を行う段階)を選択することになる。

    Data Format:

データのフォーマット(変数のカラム)の指定を行う。 20 その際の規則は以下のとおりである。

  • "A"はID変数を読み込むための記述子である。"A"の後に,ID変数が何桁あるかを数字で入力する。

  • "F"は実際のデータを読むための記述子である。21"F"の前にある数字は繰り返し数(ID変数を除く変数の数)である。"F"の後には,"[カラム数].[小数点以下の桁数]"を入力する。

  • "X"は,カラムを飛ばすための記述子である。22

  • "/"は,データの読み込みが2行以上にわたる際に改行を指定する記述子である。

  • 以上の各記述子は,カンマ(",")で区切る。

    Labels:

クリックしてウィンドウを開き,変数のラベル(変数名)を半角英数字で入力する。日本語で入力すると文字化けしてしまうので注意。23

\includegraphics[width=8cm]{makemdm-ascii4.ps}

Level-2 Specification

レベル2のデータファイルに関する情報を入力する。 24 基本的にレベル1の場合と同様に行えばよいが,欠測はレベル2以上では許容されないためこれに関しては指定を行わない。

Save mdmt file

[Save mdmt file]をクリックして,MDMT(MDM Template)ファイル(.mdmt)を作る。 MDMTファイルには,MDMファイルを作るために指定した情報25が格納される 26

Make MDM

[Make MDM]ボタンをクリックして,MDMファイルをつくる。 次のような画面が現れて,MDMファイルが作られたことがわかる。 27

\includegraphics[width=10cm]{prompt1.ps}

Check Stats

[Check Stats]ボタンをクリックすると,各変数の基本統計量を格納したSTSファイル(hlm2mdm.sts)を確認することができる。28

\includegraphics[width=15cm]{makemdm-ascii5.ps}

Done

[Done]ボタンをクリックすることでMDMファイルの作成段階は終了し,モデルの指定を行う画面が現れる。 29

SPSSによるデータファイルを用いたMDMファイルの作成

ここでは,SPSSによって作成した.sav形式によるデータファイルを用いてMDMファイルを作成する方法を解説する。

まず,[File]-[Make new MDM file]-[Stat package input]とメニューを選択する。

\includegraphics[width=12cm]{makemdm-spss1.ps}

次に,分析するモデルのタイプを選択し,[OK]をクリックする。

30

\includegraphics[width=6cm]{makemdm-ascii2.ps}

"Make MDM - HLM2"が開く。

\includegraphics[width=15cm]{makemdm-spss5.ps}

ここで,データファイルからMDMファイルを作成するためのデータに関する情報を指定することになる。

以下に,各項目について入力・指定の方法について述べる。

MDM File Name

作成するMDMファイルの名前を拡張子(.mdm)つきで入力する。 31

Input File Type

ここで,データファイルの形式をプルダウンメニューから選択する。 32

Nesting of input data

データの種類が,「集団−個人」であるか「個人−測定」であるかを指定する。 33

Level-1 Specification

ここでは,レベル1のデータファイルに関する指定を行う。

    Browse:

[Browse]ボタンをクリックしてファイルを選択し,34"Level-1 File Name: "の右側に,データファイルのフルパスが表示されるのを確認。

    Choose Variabes:

[Choose Variables]をクリックして,レベル1のデータファイルから読み込む変数の指定(四角をクリックしてチェックをつける)を行う。SPSSファイルではすでに変数名がつけられているので,ここではID変数およびMDMファイルに読み込む変数(分析の対象としたい変数)を指定するだけでよい。

\includegraphics[width=8cm]{makemdm-spss3.ps}
    欠測値に関する指定:

もし欠測値があれば "Missing Data?" で "Yes" を,なければ "No" を選択する。 35 "Yes"を選択した場合は,欠測値を含むケースをいずれの段階で除去するか(MDMファイルを作る段階 / 分析を行う段階),選択する。

Level-2 Specification

次に,レベル2のデータファイルに関する指定を行う。

    Browse:

[Browse]ボタンをクリックして,36レベル2のデータファイルを指定する。

    Choose Variables:

[Choose Variables]ボタンをクリックして,レベル2で読み込む変数の指定を行う。

\includegraphics[width=8cm]{makemdm-spss4.ps}

Save mdmt file

[Save mdmt file]をクリックして,MDMテンプレートファイルを保存する。 37

Make MDM

[Make MDM]をクリックして,MDMファイルを作成する。 次のような画面が現れて,MDMファイルが作られたことがわかる。 38

\includegraphics[width=8cm]{prompt1.ps}

Check Stats

[Check Stats]ボタンをクリックすると,各変数の基本統計量を格納したSTSファイル(hlm2mdm.sts)を確認することができる。39

\includegraphics[width=12cm]{makemdm-ascii5.ps}

Done

[Done]ボタンをクリックすることでMDMファイルの作成段階は終了し,モデルの指定を行う画面が現れる。

\includegraphics[width=10cm]{makehlm1.ps}

3.5 モデルの指定

MDMファイルを作成したあとは,それを元に実際に分析したい統計モデルを指定することになる。40

HLM6では,式(1)から式(6)に従って変数を指定していけばモデルの指定ができる。 こうした直感的な操作を可能にする優れたGUI機能を持つことがHLM6の大きな特徴となっている。

レベル1のモデル式

式(1)のとおり,ここでは,生徒の数学の成績(MATHACH)をその生徒の家庭の社会経済的地位(SES)で説明するモデル式を立てる。

まず,[Level-1]ボタンをクリックして,レベル1の入力モードにする(通常はすでになっている)。 下にレベル1のモデル式に投入するための変数の一覧が表示されているので,そこから"MATHACH"をクリックし,"Outcome variable"を選択する。

\includegraphics[width=10cm]{makehlm2.ps}

これで,"MATHACH"が従属変数に入ったモデル式が表示される。

\includegraphics[width=10cm]{makehlm3.ps}

次に,"SES"をクリックして,"add variable group centered"を選択する。 これを選択した場合,説明変数の部分が太字(ボールド体)で表示される。 41

\includegraphics[width=10cm]{makehlm4.ps}

レベル1のモデル式に説明変数として"SES"が投入されたのが確認できる。 もし間違った変数を投入してしまった際は,その変数をもう一度選択し,"Delete variable from model"を選択すればよい。

\includegraphics[width=15cm]{makehlm5.ps}

レベル2のモデル式

[Level-2]をクリックして,レベル2のモデルの入力モードに切り替える。 切り替えた直後は,レベル1のモデル式の切片($\beta _0$)を説明するモデル式の部分が黄色くなっており,まずこの部分の入力を行う。 式(5)を参照し,先ほどと同じように"SECTOR"および"MEANSES"を説明変数として投入する(ここではともに"uncenterd"を選択。この場合説明変数は細字で表示される。)。

次に,$\beta _1$を説明するモデル式のエリアをクリックして,ここを黄色くさせる。 式(6)を参照し,先ほどと同じように"SECTOR"および"MEANSES"を説明変数として投入する(ここではともに"uncenterd"を選択。)。

\includegraphics[width=15cm]{makehlm6.ps}

ここで,よく見るとレベル2の残差($u_1$)が灰色になっているのに気づく。 これは残差成分がモデル式に投入されていないことを示しているので,この部分をクリックして黒くする。これで$u_1$がモデルに投入された。 42

\includegraphics[width=15cm]{makehlm7.ps}

3.6 オプションの指定

次に,さまざまなオプションの設定を行う。 43

Basic Settings

[Basic Settings]メニューでは,従属変数の分布に関する指定,結果のファイルの名前,分析のタイトル,残差ファイル指定などを行うことができる。

まず,[Basic Setting]をクリックする。 44

\includegraphics[width=12cm]{basic1.ps}

残差ファイルの指定

ここでは,残差を出力するファイルの指定について説明する。 残差ファイルには,各レベルの残差だけでなくレベル1の切片や傾きの推定値など重要な情報がたくさん含まれている。 残差ファイルの設定は,各レベルごとに行う。

まず,レベル1の残差ファイルの設定を行うために,[Level-1 Residual File]をクリックする。

\includegraphics[width=12cm]{basic2.ps}

レベル1,レベル2それぞれの"Variables in residual file"に,モデルの設定のところで投入した変数がそのまま入っているはずである。 もし必要であればさらに変数をダブルクリックして投入することができる。 ただし,すでにモデルに投入ずみの変数は取り除くことができない。

ここではデフォルトのままとし,"Residual File Type"で"SPSS"を選択した。 45 ファイル名もデフォルトのまま,"resfil1.sav"とした。

[OK]をクリックしてこのウィンドウを閉じる。

次に,レベル2モデルの残差ファイルを指定する。 [Level-2 Residual File]をクリックする。

\includegraphics[width=8cm]{basic3.ps}

ここでも,"Variables in residual file"に,モデルの設定のところで投入したレベル2の変数がそのまま入っているはずである。 レベル1のときと同様,変数に関してはデフォルトのままとし,"Residual File Type"で"SPSS"を選択し,[OK]をクリックする。

これで,分析後"resfil1.sav"および"resfil2.sav"という2つの残差ファイルができるはずである。

タイトルと結果の出力ファイル名の指定

"Title"に,この分析のタイトルを入れる。 46

"Output file name"に,出力ファイルの名前をフルパスで入力する。 ここでは,デフォルトのままとした。

"Graph file name"に,グラフを作る際のファイルの名前をフルパスで入力する。 ここでは,デフォルトのままとした。

[OK]をクリックして,終了。

Other Settings

ここでは,反復計算,推定法,統計的検定に関する設定などを行うことができる。 今回はデフォルトのままにしておく。

3.7 HLMファイルの保存

ここまで設定した内容は,実際に分析を行う前にHLMファイル(.hlm)47として保存する必要がある。

[File]-[Save As]で適切なファイル名を指定し,HLMファイルを保存する。 48

3.8 分析の実行

[Run Analysis]をクリックする。 49

反復計算の過程を表す画面が表示される。 計算が終わると,自動的に消える。 50

\includegraphics[width=12cm]{prompt2.ps}

3.9 結果の確認

分析はここで終了したので,結果を確認する。 [File]-[View Output]とクリックすると,結果を格納したテキストファイルが自動的に立ち上がる。 51

\includegraphics[width=15cm]{result1.ps}

以下では,このファイルを見ながら結果の解釈を行うことになる。

52

基本的な情報


 SPECIFICATIONS FOR THIS HLM2 RUN

# 分析のタイトル #
  Problem Title: HSB-GD 

# 分析に使用したMDMファイル #
  The data source for this run  = hsb-gd.mdm

# モデルの指定を行った.hlmファイル #
  The command file for this run = C:\Program Files\HLM6S\Examples\AppendxA\hsb-gd.hlm 

# 出力ファイルの名前 #
  Output file name              = C:\Program Files\HLM6S\Examples\AppendxA\hlm2.txt

# サンプルサイズおよび指定した反復回数 #
  The maximum number of level-1 units = 7185
  The maximum number of level-2 units = 160
  The maximum number of iterations = 100

# 分散・共分散行列の推定の方法(デフォルトでは,制約つき最尤推定。) #
  Method of estimation: restricted maximum likelihood

# 重み付けに関する情報 #
 Weighting Specification
 -----------------------
                         Weight
                         Variable
            Weighting?   Name        Normalized?
 Level 1        no       
 Level 2        no       
 Precision      no  

モデルの確認


# 従属変数はMATHACH #
  The outcome variable is  MATHACH    

# モデルに含まれる切片および傾き(偏回帰係数)をレベルごとに表示 #
  The model specified for the fixed effects was:
 ----------------------------------------------------

   Level-1                  Level-2
   Coefficients             Predictors
 ----------------------   ---------------
         INTRCPT1, B0      INTRCPT2, G00   
                             SECTOR, G01   
                            MEANSES, G02   
 *      SES slope, B1      INTRCPT2, G10   
                             SECTOR, G11   
                            MEANSES, G12   

# SESは集団平均でセンタリングした。 #
'*' - This level-1 predictor has been centered around its group mean.

# 分散,共分散行列に関する指定 #
 The model specified for the covariance components was:
 ---------------------------------------------------------

         Sigma squared (constant across level-2 units)

         Tau dimensions
               INTRCPT1
                    SES slope

# 指定したモデル式を提示 #
 Summary of the model specified (in equation format)
 ---------------------------------------------------

Level-1 Model

	Y = B0 + B1*(SES) + R

Level-2 Model
	B0 = G00 + G01*(SECTOR) + G02*(MEANSES) + U0
	B1 = G10 + G11*(SECTOR) + G12*(MEANSES) + U1

分散・共分散行列の推定結果

# 収束するまでの反復数 #
Iterations stopped due to small change in likelihood function
******* ITERATION 61 *******

# レベル1の分散の推定値 #
 Sigma_squared =     36.70313

# レベル2の分散・共分散行列の推定値 #
 Tau
 INTRCPT1,B0      2.37996       0.19058 
      SES,B1      0.19058       0.14892 

# レベル2の分散・共分散行列を相関行列に直したもの #
Tau (as correlations)
 INTRCPT1,B0  1.000  0.320
      SES,B1  0.320  1.000

# レベル1の切片と傾きの推定値の信頼性 (Reliability) #
 ----------------------------------------------------
  Random level-1 coefficient   Reliability estimate
 ----------------------------------------------------
  INTRCPT1, B0                        0.733
       SES, B1                        0.073
 ----------------------------------------------------
# 信頼性の値が1に近いほど,レベル1の切片と傾きを推定する際にサンプル全体の情報に対して 
# 当該集団の情報を利用する割合が大きくなる。信頼性は集団ごとに算出されるものであるが, 
# ここでは全集団にわたって平均した値が報告されている。#

レベル2の切片と偏回帰係数の推定値


# 最終的な尤度関数の値 #
The value of the likelihood function at iteration 61 = -2.325094E+004

# レベル2の切片と偏回帰係数の推定値と検定統計量,有意性検定の結果 #
 The outcome variable is  MATHACH
 Final estimation of fixed effects:
 ----------------------------------------------------------------------------
                                       Standard             Approx.
    Fixed Effect         Coefficient   Error      T-ratio   d.f.     P-value
 ----------------------------------------------------------------------------
 For       INTRCPT1, B0
    INTRCPT2, G00          12.096006   0.198734    60.865       157    0.000
      SECTOR, G01           1.226384   0.306272     4.004       157    0.000
     MEANSES, G02           5.333056   0.369161    14.446       157    0.000
 For      SES slope, B1
    INTRCPT2, G10           2.937981   0.157135    18.697       157    0.000
      SECTOR, G11          -1.640954   0.242905    -6.756       157    0.000
     MEANSES, G12           1.034427   0.302566     3.419       157    0.001
 ----------------------------------------------------------------------------
 The outcome variable is  MATHACH

# 最高次のレベルのサンプルサイズが極めて大きい場合は,(特に分散共分散行列に関する設定が間違って
# いるかもしれないことを見越して)こちらの結果を採用するのが望ましいとされている。今回はこちらを
# 見ればよい。(こちらを参照する必要がない場合はそのような指示が表示される。)
 Final estimation of fixed effects
 (with robust standard errors)
 ----------------------------------------------------------------------------
                                       Standard             Approx.
    Fixed Effect         Coefficient   Error      T-ratio   d.f.     P-value
 ----------------------------------------------------------------------------
 For       INTRCPT1, B0
    INTRCPT2, G00          12.096006   0.173699    69.638       157    0.000
      SECTOR, G01           1.226384   0.308484     3.976       157    0.000
     MEANSES, G02           5.333056   0.334600    15.939       157    0.000
 For      SES slope, B1
    INTRCPT2, G10           2.937981   0.147620    19.902       157    0.000
      SECTOR, G11          -1.640954   0.237401    -6.912       157    0.000
     MEANSES, G12           1.034427   0.332785     3.108       157    0.003
 ----------------------------------------------------------------------------

最終的な分散の推定値


# 最終的な分散の推定値と検定結果 #
 Final estimation of variance components:
 -----------------------------------------------------------------------------
 Random Effect           Standard      Variance     df    Chi-square  P-value
                         Deviation     Component
 -----------------------------------------------------------------------------
 INTRCPT1,       U0        1.54271       2.37996   157     605.29503    0.000
      SES slope, U1        0.38590       0.14892   157     162.30867    0.369
  level-1,       R         6.05831      36.70313
 -----------------------------------------------------------------------------

Devianceなど


# Deviance #
 Statistics for current covariance components model
 --------------------------------------------------
 Deviance                       = 46501.875643
# 推定した分散・共分散の数 #
 Number of estimated parameters = 4

3.10 グラフの表示など

HLM6には,さまざまなグラフを表示させる機能がついている。 ここでは,例として式(1)で示したレベル1の回帰式が,学校の属性を表すSECTORによってどのように異なるのかグラフで示してみたい。

[File]-[Graph Equations]-[Level-1 equation graphing]を選択する。

\includegraphics[width=15cm]{graph1.ps}

レベル1のモデル式をグラフ化するためのウィンドウが立ち上がる。

\includegraphics[width=10cm]{graph2.ps}

X-focus

    Level-1:

レベル1の説明変数を投入する。ここでは,"SES"を選択。

    Number of groups:

表示するグループの数を選択する。ここでは,"All groups"を選択。

Z-focus

学校を分類する変数を選択。ここでは,"SECTOR"を選択。

[OK]をクリックすると,グラフが表示される。

\includegraphics[width=15cm]{graph3.ps}

このグラフを見ると,Cathoric(SECTOR=1)の学校のほうが切片の値は大きいが傾きは小さい傾向にあることがわかる。 これはSECTORにかかるレベル2の偏回帰係数の推定値の符号と一致している。

ここで,*ページに示したレベル2の偏回帰係数の推定結果の欄を次に再掲したのでグラフとの対応を確認されたい。

変数SECTORにかかる偏回帰係数の値に関して,切片("INTRCPT1, B0")欄では$1.226384$とプラスの値であるのに対し,傾き("SES slope, B1")欄では$-1.640954$とマイナスの値となっていることがわかる。

\includegraphics[width=15cm]{kekka.ps}

3.11 残差のチェック

HLM6では,結果の出力にレベル1の(この場合は学校ごとの)切片や傾きの推定値は出力されない。 これらについては残差ファイルの中に格納されているため,必要であればこちらを確認する必要がある。 また,残差の確認はモデルの仮定が成り立っているかどうかをチェックするためにも有効である。

デフォルトでは,MDMファイルを格納したフォルダに残差ファイルが格納されているはずである。 53

レベル1の残差ファイル

\includegraphics[width=14cm]{zansa1.ps}

"l1resid"とあるのが,レベル1の残差である。 "fitval"がモデル式によって予測された従属変数の値であり,これら2つの値を合計すると"mathach"と等しくなる。

レベル2の残差ファイル

\includegraphics[width=14cm]{zansa2.ps}

レベル2の残差ファイルにはかなり多くの情報が格納されているので,重要と思われるものだけを以下にピックアップして説明した。

  "eb・・・":

"ebintrcp"とあるのは, 54 レベル1の切片($\beta _{0j}$)の推定に経験ベイズ(empirical Bayes)法を用いた際の残差($u_{0j}$)である。 同様に"ebses"とあるのは,レベル1の傾き($\beta _{1j}$)に経験ベイズ法を用いた際の残差($u_{1j}$)である。

  "ol・・・":

"olintrcp","olses"とあるのは,それぞれレベル1の切片($\beta _{0j}$)および傾き($\beta _{1j}$)を(学校ごとに)通常の最小2乗(ordinary least-squares)法で推定した際の残差($u_{0j}$および$u_{1j}$)である。 55 この方法では経験ベイズ法の場合と異なりサンプル全体の情報を使っていないので,"eb・・・"で示した残差よりもこちらの方が残差(の絶対値)は大きくなっている。

  "fv・・・":

それぞれレベル1の切片と傾きのレベル2モデルによる予測値である。

  "ec・・・":

それぞれ 56 レベル1の切片と傾きの経験ベイズ推定値である。 これは,予測値("fv・・・")に残差の値("eb・・・")を足したものに等しい。

Footnotes

  1. 仮にHLM6をC:¥Program Files¥HLM6Sにインストールした場合,C:¥Program Files¥HLM6S¥Examples¥AppendxAにデータファイルが含まれる。
  2. 同じデータを使った同様の分析例がRaudenbush & Bryk(2002)に載っている。
  3. ここで,$i$は生徒,$j$は学校を表す。また,$\bar{SES_{.j}}$は,$j$番目の学校の生徒のSESの平均である。このようなセンタリングを行う方法および理由については後で述べる。
  4.   $\displaystyle  SECTOR= \begin{cases}  1 ~ (\text {Catholic}) \\ 0 ~ (\text {public}) \end{cases} \notag  $   (2)
  5. レベル2の式には確率的に変動する誤差成分($u_{0j}, \  u_{1j}$)が含まれている。 これは,レベル1の切片および傾きには今回用意した2つの説明変数(SECTOR,  MEANSES)のみでは説明できない独自の成分があるということを示している。
  6. 今回の分析例では2レベルのモデルを用いるため,必要となるデータファイルの数は2つである。
  7. SPSS, SAS, SYSTAT, STATAで作成したデータファイルが使える。
  8. 今回の分析例では,各生徒の所属する学校のIDである。生徒個人のIDではないことに注意。
  9. 同じ学校に所属する生徒はまとめて同じところに。
  10. 欠測値は"."で代用できるが,欠測値のあるケースは分析の途中で除外される。(*ページを参照。)
  11. プログラムとともに提供されているサンプルデータでは,小数点以下の桁を表示しないよう設定されているはずであるが,ここではわかりやすいようにASCII形式のデータと同じように表示されるよう設定を変えてある。データの内容そのものは同じである。
  12. MDMファイルに相当するものは,以前のバージョンであるHLM5までは,SSM(Sufficient Statistics Matrix)ファイルといっていたが,バージョン6への改定の際に変更された。
  13. もしショートカットがなければ,"HLM6S"フォルダ内の"WHLMS.exe"ファイルをダブルクリックしてもよい。 あるいは,"WHLMS.exe"を右クリックし,[送る]→[デスクトップ(ショートカットを作成)]で,デスクトップ上にショートカットを作成することができる。
  14. 今回の例では2レベルモデルなので,"HLM2"を選択する。
  15. ここでは,"hsb-gd.mdm"とした。
  16. ここでは,「学校という集団内の個人」を対象にしたデータであることから"persons within groups"を選択した。
  17. ここでは"C:¥Program Files¥HLM6S¥Examples¥AppendxA¥hsb1.dat" と入力するか,そのファイルを選択する。
  18. ここでは,"4"とした。
  19. 今回の例では欠測はないのでそのままでよい。デフォルトでは欠測はないものとして扱われる。
  20. ここでは"(A4,4F12.3)"と入力する。"(" や ")" を忘れると警告が出る。
  21. "4F12.3"は,12カラムを占める小数点以下3桁までのデータが4つあるという意味になる。実際にデータファイル"hsb1.dat"を確認されたい。
  22. 例えば"8X"であればデータ読み込みの際に8カラム飛ばすということになる。
  23. ここでは,順に"MINORITY", "FEMALE", "SES", "MATHACH"とする。
  24. データファイルは,C:¥Program Files¥HLM6S¥Examples¥AppendxA¥hsb2.dat と入力するか,そのファイルを選択する。 変数の数は6個で,Data Formatには"(A4,6F12.3)"と入力する。 また,変数名については順に"SIZE","SECTOR","PRACAD","DISCLIM","HIMINTY","MEANSES"とする。
  25. データファイルの種類や変数の数,カラム指定,欠測値に関する情報など。実際にテキストエディタで開いてみるとMDMファイルを作る際に指定した内容が確認できる。
  26. MDMTファイルを用いれば,以前に作成したMDMファイルを簡単に編集し直すことができる。[File]-[Make new MDM from old MDM template (.mdmt) file]メニューからMDMTファイルを指定すれば,MDMファイルを作成する画面に移動する。
  27. この画面は,数秒間現れたのち自動的に消える。
  28. STSファイルは自動的に作成され,あらかじめファイル名を指定することはできない。
  29. MDMファイルが指定された後は,[File]-[Display MDM stats]でMDMファイルに含まれる情報の一部を確認することができる。
  30. ASCII形式のときと同様,今回の例では2レベルモデルなので,"HLM2"を選択する。
  31. ここでは,"hsb-gd.mdm"とした。
  32. ここでは"SPSS/Windows"を選択(デフォルト)。
  33. ここでは,「学校という集団内の個人」を対象にしたデータであることから"persons within groups"を選択した。
  34. ここでは"C:¥Program Files¥HLM6S¥Examples¥AppendxA¥hsb1.sav" を選択した。
  35. hsb1.savには欠測値はないのでデフォルトのままでよい。
  36. ここでは"C:¥Program Files¥HLM6S¥Examples¥AppendxA¥hsb2.sav" を選択した。
  37. ここでは,"hsb-gd.mdmt"とした。
  38. この画面は,数秒間現れたのち自動的に消える。
  39. STSファイルは自動的に作成され,あらかじめファイル名を指定することはできない。
  40. 以前に作成したMDMファイルを再利用する際は,[File]-[Create a new model using an existing MDM file]メニューからMDMファイルを選択すれば,モデル指定の画面に移る。
  41. この場合,切片$\beta _0$は各学校における数学成績の平均の推定値となる。これは,レベル2モデルにSESの平均である"MEANSES"を入れることから,多重共線性を避けるための措置でもある。HLM6では,その他にも全体平均でのセンタリングを行うこともできる。センタリングを行った際は,切片の意味が代わってくることに注意する必要がある。
  42. 同様に,レベル2の他の誤差成分についてもその部分をクリックすることでモデルからはずしたり投入しなおしたりすることができる。レベル1の誤差成分ははずすことはできない。
  43. オプションであるので,必須というわけではないが,残差ファイルに関してはここで指定しないと作成されない。
  44. もしくは,[Level-1]の上の[Outcome]をクリックしてもよい。
  45. ここで仮に"Free Format"を選択し,テキストファイル(.txt)やCSVファイル(.csv)で保存すると,カンマ区切りの残差ファイルが作成される。SPSSがなければこのようにして作成した残差ファイルをあとでExcelなどで開けばよい。(テキストエディタで開いてもよいが,見づらい。)
  46. デフォルトでは"no title"となっている。このままでもよいが,今回は"HSB-GD"とした。
  47. 分析モデルのタイプとしてHMLMを選択した場合は,拡張子を".mlm"として保存するとよい。
  48. ここでは,"hsb-gd.hlm"とした。
  49. もしHLMファイルを保存し忘れた場合は,ここで保存するよう促される。
  50. もし指定した回数よりも多くの反復計算を必要とした場合は,所定の回数計算し終わった後,さらに続けるかどうか確認される。
  51. 今回は[Basing Settings]において結果のファイル名をデフォルトのままとしたので,ここでは"hlm2.txt"となっている。もしファイル名を指定していれば,そのファイルが自動的に立ち上がる。
  52. 以下,"#"〜"#"で囲んだ部分は,後から付け加えたコメントである。
  53. もちろん分析の際に指定しなければ作成されない。
  54. 経験ベイズ法では,レベル1の切片と傾きについて,学校ごとに最小2乗法を用いて推定した値(次に述べる"ol・・・"で示された値)とレベル2のモデル式にもとづく推定値とをそれぞれの信頼性で重み付けした値を最終的な推定値とする。
  55. "ebintrcp"と"olintrcp","ebses"と"olses"の値を実際に比較されたい。
  56. 今回の分析例では,学校ごとの切片($\beta _{0j}$)および傾き($\beta _{1j}$)の推定値となる。*ページで示したグラフは,こちらの値を用いて描かれたものである。