心理データ解析 第9回(1)
因子分析は何度も行う
- 因子分析には様々な手法がある。手もとにあるデータをうまく解釈するためには,何度も因子分析を行ってみる必要がある。
- また,因子分析結果の解釈のし方も1通りに決まるものではない。
- 解釈を行う際には,その背景にある理論と照らし合わせることが必要となる。
尺度を作成する
- 卒業研究などである概念を測定しようと思い,その概念を測定する適切な尺度が先行研究に見当たらない場合,新たな尺度を作成することがある。
- 自由記述をもとに尺度項目を作成したのだが,いくつの下位尺度に分かれるかを調べたい。
- 研究者が項目を作成したのだが,いくつの下位尺度に分かれるのかを検討したい。
- 先行研究の複数の尺度項目を組み合わせて新たな尺度を作成したのだが,その下位尺度を明らかにしたい。
- 事前に設定した下位尺度どおりに分かれるのかを検討したい。
- …といった場合,因子分析を行う必要がある(ただし,むやみやたらに行うものではない。先行研究で因子数が確定しており,それに疑問がないのであれば,再度行う必要もない)。
尺度を作成する際の因子分析の手順
- 因子分析の前に…項目のチェック
- 各項目の平均値,標準偏差をチェックし,天井効果やフロア(床)効果がある項目がないかどうかを検討する。
- 質問項目を作成する際には,事前にどのような分布となるかどうかを予想する。
- 一般の人びとに見られる心理的な個人差を測定する場合には,多くの人が「普通」の反応をし,極端に反応する人々は少ないと考えられる。したがって,中央付近に回答する人が多くなり,両極端の回答をする人は少なくなるだろう。
- 非行傾向や病理傾向など,多くの人が「なし」と反応する中で少数の「あり」と反応する人々を見つけ出したい場合がある。このような場合には,片方の端に多くの人々の回答が集まるような分布を示すだろう。
- たとえば,中央に回答が集まることを想定していたにもかかわらず…
- 多くの人の回答が右端(高い得点方向)に偏ってしまっている→天井効果
- 多くの人の回答が左端(低い得点方向)に偏ってしまっている→フロア効果
- また,事前に「中央付近の回答者が多いだろう」と予測したにもかかわらず,人数のピークが両端に見られるようなケースもある。「あるか,ないか」「するか,しないか」など二者択一的な質問項目の表現の際に,このような得点分布となりやすい。
- 回答が中央(「どちらともいえない」)に集中することもある。質問項目が難解な場合などにこのようなことが起こりやすい。
- 得点分布が事前の予想から大きくズレているような場合には,質問項目がうまく作成できていない可能性がある。
- 質問項目を作成する際には,何度か予備調査を行い,得点分布をチェックするのが望ましい。10名程度に予備調査をするだけでも,得点分布の目安を得ることができる。
- 分析→記述統計→探索的 を利用すると,基礎的な記述統計量とヒストグラムを一度に出力することができる。
- 初回の因子分析
- 固有値やスクリープロットを見て因子数をいくつにするか決定する。
- 因子数の決定
- 研究者が仮説から決める
- 固有値やスクリープロットを見て,固有値が大きく落ち込むところまでを採用する
- 固有値が1以上の因子数を採用する
- 累積寄与率がある程度の値を越えるところで判断する(50%など)
- 加えて,回転後に「解釈可能性」,つまり抽出された因子をうまく解釈することができるかどうかという観点が重要である。
- 2回目以降の因子分析
- 回転させる(直交回転:バリマックス回転など,斜交回転:プロマックス回転など)
- 想定する下位尺度間が相互に独立,つまり「互いに相関を仮定しない」場合は直交回転を行う。
- 想定する下位尺度間に「相関を仮定する」場合は斜交回転を行う。
- ただし,まず斜交回転を行い,相互に相関がみられなければ再度直交回転を行えばよい,と考える研究者もいる。なぜなら,心理的な因子を考える際に,相互に独立であると考えるよりも互いに何らかの関連性があると考えた方がよいともいえるからである。
- 項目の取捨選択を行う(いずれかの基準で)
- 共通性が.16以上であること(直交回転の場合,いずれかの因子に.40以上の負荷量を示すことが期待されるため)
- 一定の値の因子負荷量を基準とする
- 1つの項目が複数の因子に高い負荷量を示す場合には…
- 「尺度作成」が目的の因子分析の場合には,削除することがある。
- 因子構造を探る場合や因子得点を算出して後の分析に使用する場合には,削除しないこともある。
- 項目を削除したら,再度因子分析を行う。
- このあたりは試行錯誤しながら行う。
- たとえば…最も基準に合わない1項目を削除してみて再度因子分析→結果を見る→他の項目を削除して再度因子分析 など。
- ある項目を削除し,すでに削除していた項目を入れると,その項目の負荷量は削除するほどではない,という場合もある。因子分析はあくまでも「今あるデータに基づいて因子を推定する」ものである。
- 最終的な因子分析
- 何度も試行錯誤しながら因子分析を繰り返し,最終的な因子分析結果を出力する。
- 因子分析表を作成する。
- レポートや論文の「結果」の部分に因子分析の手順を記述する。
- 記述する必要があるもの
- 因子抽出法は何を使ったか(主因子法,重み付けのない最小2乗法,最尤法など)
- 因子数はどうやって決めたか
- 回転法は何を使ったか
- 項目の削除とその基準
- 因子名はどうやって決めたか
- 因子分析表(因子負荷量や因子間相関など)
- では,実際にやってみよう。
分析例
2003年度後期の基礎実習B(調査法),5A班が作成した「幼児性尺度」の尺度構成を行ってみよう。23項目で構成されており,項目内容は以下の通りである。「まったくあてはまらない(1)」から「非常によくあてはまる(5)」までの5件法で測定されている。調査対象は大学生111名である。
A01 人の話を黙って聞いていられない A02 自分はすぐ調子に乗るタイプだ A03 一人で行動することが好きではない A04 友達がやるからという理由で何をするか決めることが多い A05 気分によって考えがコロコロ変わる A06 分からないことがあったとき,まずは自分で考えたい A07 買い物に行ったとき,予定していなかった物まで買ってしまうことがある A08 他人のペースに合わせることができる A09 夏休みの宿題は終わりがけにあわててやっていた A10 自分の失敗を周りのせいにすることが多い A11 約束の時間によく遅刻をしてしまう A12 同じ失敗を繰り返してしまうことが多い A13 勉強をしているときに他のことに気をとられやすい A14 自分一人で何かを決めることが苦手だ A15 思っていることや感情が,ついつい表情に出てしまう A16 人に指図されるのは嫌いだ A17 自分のやりたくないことはやらないことが多い A18 授業中そわそわして落ち着かない A19 欲しいと思ったものは手に入らないと気が済まない A20 自分に都合が良くない考えは受け入れないことが多い A21 お金は先のことを考えて使っている A22 カッとなることがあっても冷静になって考え直すことができる A23 楽しいときにはどこでもはしゃぐ |
SPSSデータのダウンロード → ex09-01.sav (右クリック 各自のMOに保存 SPSSで開く)
Excelデータのダウンロード → data_youji.xls(データ名に入力される項目内容はラベルにコピーし,データ名を短いものに直してください)
因子分析の前に
- 23項目の平均値と標準偏差を算出し,得点の分布をチェックする。
- 分析 → 記述統計 → 探索的
- 「従属変数」欄に23項目すべてを指定する。
- 「作図」をクリック。
- 「記述統計」の「ヒストグラム」にチェックを入れる。
- 「続行」をクリック。
- 「OK」をクリック
- 記述統計量が出力されるので,各項目について確認していこう。
- ヒストグラムも出力される。
- 下は,1項目目「人の話を黙って聞いていられない」のヒストグラムである。得点がやや左方向に偏っているが,この程度であれば許容範囲内かもしれない。
- 次に,A09「夏休みの宿題は終わりがけにあわててやっていた」という質問項目に注目してみよう。
- 記述統計量は次のとおりである。
- ヒストグラムは次のようになる。「非常によくあてはまる」(5点)と回答した人数が多く,その他の回答(1~4)は同程度となっている。
- 本調査の前に予備調査をすることで,表現を調整する機会も得られる。 たとえばこの項目を,「夏休みの宿題はいつも最終日ギリギリにやっていた」という表現に変えると,得点のピークが低い方向へと移動するかもしれない(やってみないとわからないが……)。
- 質問項目のレベルで正規分布に完全に従わせることは極めて難しい。あまりに厳しい基準を設定すると,多くの質問項目が排除され,本来測定したい概念が測定できなくなる可能性があるので注意が必要である。
- 重要なことは得点分布そのものではなく,測定したい内容が測定できているかどうかである。この質問項目が「幼児性」を反映しており,子どもっぽい回答者とそうではない回答者を適切に見分けることができていれば問題はない。
- 以上のことに留意した上で,今回はすべての質問項目を用いてこれ以降の分析を進めていこう。
- なお,多くの出力を1つの表にすると,途中で省略されることがある。
- 表をダブルクリックし, 表示 → 表示する行を設定 を選択。
- 「表示する行」の枠内の数字を増やせば(たとえば100を1000とする),すべて表示することが可能になる。
初回の因子分析
- 分析 → データの分解 → 因子分析
- 「変数」に23項目すべてを指定
- 「因子抽出」→「方法」は「主因子法」,「表示」の「スクリープロット」にチェックを入れて「続行」
- 「OK」をクリック
- 因子数を決めるには
- 「初期の固有値」をみる。
- 固有値は第1因子より5.03, 2.03, 1.86, 1.49, 1.44, 1.17...と変化している。
- 第1因子と第2因子の差は2.99,第2因子と第3因子の差は.18,第3因子と第4因子の差は.36,第4因子と第5因子の差は.06,第5因子と第6因子の差は.27である。
- 第3因子と第4因子の差,第5因子と第6因子の差が,前後に比べて大きいようである。
- また,回転前の第4因子までの累積寄与率を見ると,第3因子までで31.79%,第5因子までで40.19%である。
- スクリープロットをみる。
- やはり,第3因子と第4因子の間,第5因子と第6因子の間の傾きが大きいように見える。
- これらを見ると,どうも3因子構造か5因子構造とするのが適当なようである。
- ちなみにこの班では4つの下位尺度を仮定していたのだが…どうもこのデータではそのように下位尺度が分かれないようだ。
- では暫定的に,因子数を「3因子」と決めて,次の分析を行ってみよう。
- なお5因子の場合はどうなるかについては,各自で分析を行ってみてほしい。
2回目の因子分析(項目の選定)
- 分析 → データの分解 → 因子分析
- 「変数」に23項目すべてを指定
- 「因子抽出」
- 「方法」は「主因子法」
- 「抽出の基準」の「因子数」をクリックし,枠に「3」と入力
- 「回転」→「プロマックス」を指定
- 「オプション」→「係数の表示書式」で「サイズによる並び替え」にチェックを入れる。
- 「OK」をクリック
- 結果
- まず因子抽出後の「共通性」をチェック
- 共通性が著しく低い項目,たとえばA08(.02)に注意する。
- 「パターン行列」を見る。
- パターン行列をExcelにうつしたものが下の表である。
- パターン行列を見ると,A05,A19,A10,A08,A23の5項目については,いずれの因子の負荷量も小さいことが分かる。
- ただし,A05の第1因子への負荷量は.32,A10の第2因子への負荷量は.33と,微妙な値である。
3回目の因子分析
- では次に,因子分析を行う際に,明らかに負荷量が低かったA19,A08,A23の3項目を分析から外し,再度因子分析(主因子法・プロマックス回転)を行ってみよう。
- 結果は…
- スクリープロットを見てみよう。先程よりも,第3因子と第4因子の傾きが大きくなっていることが分かるだろう。つまり,より明確に3因子構造を示すようになってきたことを意味する。
- やはりA05の負荷量は.35に満たないようである。
- 先ほどとは異なり,A10は第2因子に.35以上の数値を示している。
- 下の表では分かりづらいが,SPSSの出力ではA11の第1因子への負荷量は.349であり,ぎりぎり.35以下となっている。
- これも分かりづらいが,SPSSの出力ではA01の第2因子への負荷量は.346であり,こちらも.35以下となっている。
- また,A20は,第1因子と第2因子ともに.35以上の負荷量を示している。
さてどうする?
- さて,この辺りが今後の分析の分かれ道となるところである。
- A05はおそらく省いていく方針で考えても良いだろう。
- A11の第1因子への負荷量は.35を満たしていないが,.349あるので,外すかどうか微妙なところになっている。
- A01の第2因子への負荷量は.35を満たしていないが,.346はあるので,外すかどうか微妙なところになっている。
- A20は複数因子に高い負荷量を示しているとはいえ,第2因子に.44の負荷量を示している。
- もしかしたら,既に削った項目を再度含めてみると,どこかの因子に高い負荷量を示すようになるかもしれない。
- さあ,この後,どのように分析を進めていけばよいのであろうか?
- ここには「これが正解だ!」というものはない。
- 「こっちの方がより良いのではないか?」というものだけである。
- 各自で試行錯誤を繰り返してみてほしい。
因子を解釈する
- 因子分析はただ行えばよいというものではなく,結果が出たら「因子の解釈」をする。
- ここでいう因子の解釈とは,「因子を命名する」ことである。
- ただし名前をつける時には,それなりの理由,根拠,説得力が必要になる。自分だけに通用する名前をつけてはいけない。多くの人が項目内容を見て納得できる名前をつけることが重要である。そういう意味で,研究者のセンスが問われる部分にもなるだろう。
- たとえば上に示された3回目の因子分析結果を見ると…
- 第1因子には,「夏休みの宿題は終わりがけにあわててやっていた」「勉強をしているときに他のことに気をとられやすい」「自分はすぐ調子に乗るタイプだ」といった項目が正の負荷量,「お金は先のことを考えて使っている」という項目が負の負荷量を示している。どうも,後先考えずに行動する傾向を意味しているように思われるが,それを表現する簡潔な因子名は何だろうか?
- 第2因子には「人に指図されるのは嫌いだ」「思っていることや感情が,ついつい表情に出てしまう」といった項目が正の負荷量,「カッとなることがあっても冷静になって考え直すことができる」が負の負荷量を示している。その次の「授業中そわそわして落ち着かない」という項目の意味もあわせて考えると,この因子の名前はどうなるだろうか?。
- 第3因子は「友達がやるからという理由で何をするか決めることが多い」「自分一人で何かを決めることが苦手だ」「一人で行動することが好きではない」が正の負荷量,「分からないことがあったとき,まずは自分で考えたい」が負の負荷量を示している。比較的まとまりが良い因子であるが,どのような名前を付けるか?なお,5A班ではこのまとまりに「依存性」と名前を付けていたようである。
- さて,以上のことを考慮に入れながら,因子に名前をつけてみてほしい。
→次へ
心理データ解析トップ
小塩研究室