Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

100614 構造方程式モデリング基本の「き」

37,880 views

Published on

100614Twittcherの会勉強会資料

Published in: Education, Technology
  • Be the first to comment

100614 構造方程式モデリング基本の「き」

  1. 1. 構造方程式モデリング基本の「き」 2010 年 6 月 14 日 @ Twittcher 勉強会
  2. 2. Agenda <ul><li>超基本編 </li></ul><ul><ul><li>構造方程式モデリングって何ですか? </li></ul></ul><ul><ul><li>構造方程式モデリング基本の「き」 </li></ul></ul><ul><li>論よりrun!~実践編 </li></ul><ul><ul><li>どうやって分析するの? </li></ul></ul><ul><ul><li>分析結果を解釈してみよう </li></ul></ul><ul><li>事例紹介 </li></ul>
  3. 3. 今日の獲得目標 <ul><li>構造方程式モデリングを勉強する下地を作る </li></ul><ul><ul><li>一体、何ができるの? </li></ul></ul><ul><ul><li>勉強すると何がいいの? </li></ul></ul><ul><ul><li>どうやって分析・解釈するの? </li></ul></ul><ul><li>「ちょっといじってみるかな?」という気分になること </li></ul><ul><li>入門書を読む前のウォーミングアップ </li></ul><ul><li>※ 簡単のために数式をできるだけ使わず、若干な乱暴な説明をします。 </li></ul><ul><li> 正しい表現は入門書を読みながら身につけましょう! </li></ul>
  4. 4. 超基本編
  5. 5. 【構造方程式モデリングって何ですか?】 構造 方程式モデリング <ul><li>構造方程式モデリング(Structural Equation Modeling, SEM) </li></ul><ul><ul><li>共分散構造分析(Covariance Structure Analysis)ともいう </li></ul></ul><ul><ul><li>でも・・・構造方程式モデリングのほうが良い </li></ul></ul><ul><ul><ul><li>共分散だけでなく、平均を構造化する分析もあるため </li></ul></ul></ul>
  6. 6. 【構造方程式モデリングって何ですか?】 どういう特徴があるの? <ul><li>ざくっと言えば・・・ </li></ul><ul><li>変数間の関係を統計的に検証できる </li></ul><ul><li>潜在変数(構成概念)を導入した分析ができる </li></ul><ul><li>わかりやすいパス図を使ったビジュアル表現 </li></ul><ul><li>SEM を勉強すると色々な分析ができる </li></ul>
  7. 7. 【構造方程式モデリングって何ですか?】 変数の関係を統計的に検証する <ul><li>変数の間の関係を記述して、データとのあてはまりを評価する、統計的な分析方法 </li></ul>B A C データに あてはまってる? Data
  8. 8. 例えば・・・ 病気罹患と食品摂取の関係 カロリー 総摂取量 乳製品 摂取量 大腸がん 罹患率 誤差 誤差 データへの あてはまり評価 Data 影響力を推定する 変数の関係を描いて 同時に行う! + + -
  9. 9. 【構造方程式モデリングって何ですか?】 潜在変数を導入した分析ができる <ul><li>複数の変数で潜在変数(構成概念)を規定することができる </li></ul><ul><li>構成概念って? </li></ul><ul><ul><li>とりあえずその存在を仮定することによって、複雑に込み入った現象を比較的単純に理解することを目的に構成する概念 </li></ul></ul><ul><ul><li>「知能」、「抑うつ傾向」、「ブランドエクイティ」など・・ </li></ul></ul>数理力 数学 科学 物理 例えば・・・ ○○ 傾向 設問 1 設問 3 設問 2
  10. 10. 【構造方程式モデリングって何ですか?】 パス図を使ったビジュアル表現 <ul><li>変数間の関係をパス図をつかってビジュアル化 </li></ul><ul><ul><li>矢印は「もと」から「さき」へ向かっての影響を表現 </li></ul></ul><ul><ul><li>長方形や楕円は変数の特徴を表現 </li></ul></ul><ul><li>関係性がわかりやすい </li></ul><ul><ul><li>直感的に変数の関係がわかる! </li></ul></ul>e e e e e e ξ
  11. 11. 【構造方程式モデリングって何ですか?】 SEM を勉強すると色々な分析ができる <ul><li>伝統的な統計モデルを下位モデルとして含んでいる </li></ul><ul><li>第 2 世代の多変量解析モデル </li></ul>回帰分析 因子分析 分散分析 共分散分析 時系列分析 パス解析 不完全データ の解析 潜在曲線分析 全て SEM で 表現可能!
  12. 12. 【構造方程式モデリングって何ですか?】 よく因子分析と回帰分析の組み合わせとか説明される・・・ <ul><li>「因子のパス解析」とか </li></ul><ul><li>間違いではないけれど、SEMの一部を表現しているに過ぎない </li></ul><ul><li>もっといろんなことができるんです! </li></ul><ul><ul><li>今日はあんまり触れない・・・。 </li></ul></ul>
  13. 13. 【構造方程式モデリング基本の「き」】 SEMを勉強するにあたり <ul><li>以下の表現を覚えておきましょう。 </li></ul><ul><li>観測変数と潜在変数 </li></ul><ul><li>測定方程式と構造方程式 </li></ul><ul><li>モデルの適合 </li></ul>
  14. 14. 【構造方程式モデリング基本の「き」】 観測変数と潜在変数 <ul><li>直接に観測される変数を「観測変数」とよぶ </li></ul><ul><ul><li>身長、体重、テストの得点など・・・ </li></ul></ul><ul><li>構成概念を「潜在変数」とよぶ </li></ul><ul><ul><li>知能、ブランドエクイティ・・・ </li></ul></ul><ul><li>⇒ SEM はこの 2 種類の変数の関係を記述する </li></ul>パス図では・・・ 観測変数 潜在変数 観測変数は四角形で、潜在変数は円で表現する
  15. 15. 【構造方程式モデリング基本の「き」】 構造方程式と測定方程式 <ul><li>2種類の方程式を解くことで、変数間の関係を明らかにする </li></ul><ul><ul><li>構造方程式:因果関係を記述する方程式 </li></ul></ul><ul><ul><li>測定方程式:潜在変数とそれを構成する観測変数を記述する方程式 </li></ul></ul>V1 V2 e V2=α * V1+e 1 α f1 V1 V2 V3 e1 e2 e3 1 1 1 α1 α2 α3 V1=α1 * f1+e1 V2=α2 * f1+e2 V3=α3 * f1+e3 構造方程式 測定方程式 計算は機械がやってくれます・・・
  16. 16. 【構造方程式モデリング基本の「き」】 モデルの適合 <ul><li>解釈を行うためには、構成したモデルがデータに当てはまっている必要がある </li></ul><ul><li>データとモデルとのあてはまりを 「適合度指標」 を用いて評価する </li></ul>Data model 各種適合度指標であてはまりの良さを評価! (実践しながら説明します!)
  17. 17. 【構造方程式モデリング基本の「き」】 分析の流れ <ul><li>仮説を構築->モデルで表現->母数(パラメータの推定)->適合度評価->モデル修正->・・・・ </li></ul>Plan Do Check Action <ul><li>仮説を構築する </li></ul><ul><li>モデル(パス図)を作ってみる </li></ul><ul><li>分析用ソフトウェアを使ってモデルを記述 </li></ul><ul><li>影響力(母数)を推定する </li></ul><ul><li>適合度指標をみて、データの当てはまりの良さを確認する </li></ul><ul><li>【データ Fit 良い】 </li></ul><ul><li>結果の解釈を行う </li></ul><ul><li>【データ Fit 悪い】 </li></ul><ul><li>モデル修正の検討-> Plan へ </li></ul>
  18. 18. 論より RUN !~実践編
  19. 19. まずは分析環境 <ul><li>いろいろあって一長一短 </li></ul><ul><ul><li>AMOS がベスト。無料ならば AMOS の student 版、もしくは R で始める </li></ul></ul>AMOS R ( Package sem ) Mplus EQS SAS (CALIS) Mx インターフェース グラフィカル グラフィカル コマンド入力 コマンド入力 コマンド入力 ? 分析領域 ほぼカバー 一部未対応 一部未対応 ほぼカバー ほぼカバー ? 価格 有料 (無料版あり) 無料 有料 有料 有料 ? オススメ! オススメ!
  20. 20. AMOSのStudent版を利用 <ul><li>ここからダウンロード可能 </li></ul><ul><ul><li>http://www.amosdevelopment.com/download/ </li></ul></ul><ul><li>8 つの観測変数、 54 の母数に使用が制限されている </li></ul>
  21. 21. まずはパス解析をやってみよう <ul><li>共分散構造分析[AMOS編]より </li></ul><ul><ul><li>データ概要:結婚相談所において、女性が男性を自分の結婚相手としてどうかという観点から評価した架空のデータ4変数、210オブザベーション </li></ul></ul><ul><ul><li>変数 </li></ul></ul><ul><ul><ul><li>「学歴」:男性の教育水準 </li></ul></ul></ul><ul><ul><ul><li>「年収」:男性の年収(百万円) </li></ul></ul></ul><ul><ul><ul><li>「職業威信」:職業に対する主観的な地位の格付け </li></ul></ul></ul><ul><ul><ul><li>「結婚相手としての評価」:男性の結婚相手としての評価 </li></ul></ul></ul>
  22. 22. 仮説構築 <ul><li>こんな感じで考えてみる </li></ul><ul><li>通常は先行研究やコンセプトワークを行った結果が反映される </li></ul><ul><li>いきなり仮説作りはじめると・・・道に迷うことも多々あり </li></ul>学歴 年収 評価 職業威信 Plan
  23. 23. じゃぁ・・・AMOSを起動して実行 <ul><li>まずはパス図を描く </li></ul><ul><ul><li>誤差はしっかりつける </li></ul></ul><ul><li>その後・・・分析設定をする </li></ul>推定法( estimation )はとりあえず最尤法( maximum likelihood) 1 2 3 標準化解( Standard estimates) 間接効果、総合効果( Indirect ,total effects) 修正指標( Modification Indice) Do
  24. 24. 適合度を見てみよう <ul><li>GFI、AGFI、CFI </li></ul><ul><ul><li>0.90以上が当てはまりの目安 </li></ul></ul><ul><li>RMSEA </li></ul><ul><ul><li>0.05以下は良適合 </li></ul></ul><ul><ul><li>0.10未満はグレーゾーン </li></ul></ul><ul><ul><li>0.10以上は適合× </li></ul></ul>Check
  25. 25. 解釈してみよう~パス係数 <ul><li>非標準化係数:独立変数が1単位変化したときの従属変数の変動量 </li></ul><ul><li>標準化係数:標準化して相対的な影響力を表現したもの </li></ul>今回は変数間の相対的な関係に興味があるので、標準化係数を中心に解釈します Action
  26. 26. 解釈してみよう~直接効果と間接効果 <ul><li>直接効果:変数->変数の直接的な影響 </li></ul><ul><li>間接効果:変数を経由した間接的な影響 </li></ul><ul><li>総合効果:直接効果+間接効果 </li></ul>b a <職業威信から評価への効果> ■ 直接効果 a=0.30 ■ 間接効果 b=0.32*0.49=0.16 ■ 職業威信から評価への 総合効果 a+b=0.30+0.16=0.46 Action
  27. 27. 結果のまとめ <ul><li>結婚相手への評価に最も影響を与えるのは年収 </li></ul><ul><li>職業威信の直接効果は年収の直接効果より低い </li></ul><ul><ul><li>しかし、年収を経由した間接効果も合せて考慮するとほぼ年収と同等の影響力がある </li></ul></ul><ul><ul><li>単純な回帰分析では導き出せない考察! </li></ul></ul><ul><li>学歴->年収->評価の間接効果は0.26。 </li></ul><ul><ul><li>職業威信の直接効果より低い。 </li></ul></ul>
  28. 28. 因子を組み合わせた分析 <ul><li>共分散構造分析 [AMOS 編 ] :パソコンセミナーの受講後アンケートデータ( 5 件法) </li></ul><ul><ul><ul><li>目的一致:内容は目的と一致していたか </li></ul></ul></ul><ul><ul><ul><li>理解度:内容はどの程度理解できたか </li></ul></ul></ul><ul><ul><ul><li>テキスト:テキストについての評価 </li></ul></ul></ul><ul><ul><ul><li>ペース:講義内容のペースについての評価 </li></ul></ul></ul><ul><ul><ul><li>満足度:セミナー全体の満足度 </li></ul></ul></ul><ul><ul><ul><li>プレゼン:講師のプレゼンについての印象 </li></ul></ul></ul><ul><ul><ul><li>講師対処:質問の対処についての印象 </li></ul></ul></ul>
  29. 29. 仮説構築 <ul><li>「テキスト」、「プレゼン」、「ペース」、「講師対処」の背後に「講師の質」が存在すると想定 </li></ul><ul><li>「満足度」、「理解度」、「目的一致」の背後に「セミナー評価」が存在すると想定 </li></ul><ul><li>「講師の質」が「セミナー評価」に影響を与えていると想定 </li></ul>講師の質 テキスト プレゼン ペース 満足度 理解度 目的一致 セミナー評価 講師対処 1 2 3 Plan
  30. 30. 適合度 <ul><li>GFI、AGFI、CFI、RMSEA全てで適合良し。 </li></ul>Check
  31. 31. 結果の解釈 <ul><li>標準化解 </li></ul><ul><ul><li>講師の質は「プレゼン」の影響が最も高い </li></ul></ul><ul><ul><li>セミナー評価は「満足度」の影響が最も高い </li></ul></ul><ul><ul><li>講師の質->セミナー評価のパス係数も大きい * </li></ul></ul>Action
  32. 32. 事例紹介
  33. 33. 指導者が評価するサッカータレントの構造 <ul><li>サッカーコーチが評価するユース年代のサッカータレント構造を検証することを目的。 </li></ul><ul><ul><li>デルファイ法で仮説構築->調査票作成 </li></ul></ul><ul><ul><li>243名の 有資格サッカーコーチが,プロレベル156名,全国レベル175名,地域レベル173名,計504名のサッカー選手のユース年代におけるサッカータレント を評価 </li></ul></ul><ul><ul><li>SEMで検証を行う </li></ul></ul>http://www.taiiku.tsukuba.ac.jp/sc/1_1/09/index.html
  34. 34. まさに、王道! 仮説構築 SEM による検証 シンプレックス構造分析
  35. 35. 発信する顧客は優良顧客か? <ul><li>コミュニティユーザーがオンラインコミュニティのどの要因を評価してリピート訪問をしているのかを特定する </li></ul><ul><li>@ cosme ユーザーに対してアンケートを実施 </li></ul><ul><ul><li>併設オンラインショップ購買履歴データとのシングルソースデータ分析を行っている </li></ul></ul>http://www.journalarchive.jst.go.jp/english/ jnlabstract_en.php?cdjournal=acs1993&cdvol=11&noissue=1-2&startpage=35
  36. 36. <ul><li>先行研究より、サイト訪問目的の構成概念を図 1 のように整理 </li></ul><ul><li>その上で、以下の仮説を立てている </li></ul><ul><ul><li>サイトロイヤルティはサイト訪問目的の構成概念の関数 </li></ul></ul><ul><ul><li>サイトロイヤルティと優良顧客度との間に有意で正の関数がある </li></ul></ul>
  37. 37. コミュニティ上で書き込むユーザー ・ロイヤルティの源泉は購買前後サーチ、コンサマトリー、 B2C インタラクション(発信行為自体はロイヤルティへの影響は少ない) ・サイトロイヤルティから優良顧客へは正の影響 -0.018 0.040 0.232 0.240 0.604 0.449 0.215 購買データ
  38. 38. ブランドジャパン <ul><li>日経 BP コンサルティングが主体となり実施 </li></ul><ul><li>ブランドエクイティの測定 </li></ul><ul><ul><li>顧客から、一般社会からの評価を測定 </li></ul></ul><ul><ul><li>国内ブランドを一般消費者、ビジネスパーソンが評価 </li></ul></ul><ul><ul><li>2001 年から年 1 回のペースで実施し、経年の変化を追う </li></ul></ul><ul><ul><li>2003 年までは WEB 調査と郵送調査のハイブリッド </li></ul></ul><ul><ul><li>2004 年以降は WEB 調査のみとなり、傾向スコア補正している </li></ul></ul><ul><ul><li>構造方程式モデリングにより 2 つの観点からブランドエクティ(構成概念)をスコアリングしている </li></ul></ul>http://www.nikkeibpm.co.jp/bz/chosa/brand_j/index.html
  39. 39. BtoC モデル <ul><li>1 側面では測定できないブランドエクイティを 4 つの下位因子を構成して規定 </li></ul><ul><li>下位因子をまとめる g を総合指標としてブランドエクイティを規定 </li></ul>フレンドリ - イノベーティブ アウト スタンディング コンビニエント g
  40. 40. BtoB モデル <ul><li>5 つの下位因子と 5 つの観測変数で総合力「 g 」を規定 </li></ul>親和力 活力 先見力 信用力 人材力 g
  41. 41. スコアの推定 出典: http://consult.nikkeibp.co.jp/consult/release/bj_100409.pdf
  42. 42. 2010 年のコメント( BtoC 編) <ul><li>ブランド総合力 92.3 ポイントを獲得したユニクロが、今回はじめて首位となった。 過去 5 年間の結果をみると、確実にブランド力を上昇させてきたことが分かる。(中略)しか し最大の理由は、イノベーティブ因子のポイントが驚異的に伸びたことだ。(中略)第 2 位のグーグルとは、 18.2 ポイントという大差がついている。 </li></ul><ul><li>ブランド間のブランドエクイティ(構成概念スコア)を比較できる </li></ul><ul><li>時系列でのエクイティの変遷を追うことができる </li></ul><ul><li>下位因子を構成していることで、エクイティの要因分解を行うことができる </li></ul>
  43. 43. 今後の勉強のために・・・ <ul><li>初級 </li></ul><ul><ul><li>入門 共分散構造分析の実際(朝野・鈴木・小島) 講談社サイエンティフィック </li></ul></ul><ul><ul><li>共分散構造分析 [AMOS 編 ] (豊田編著) 東京図書 </li></ul></ul><ul><ul><li>はじめての共分散構造分析― Amos によるパス解析 (小塩) 東京図書 </li></ul></ul><ul><li>中級 </li></ul><ul><ul><li>グラフィカル多変量解析― AMOS 、 EQS 、 CALIS による 目で見る共分散構造分析 (狩野・三浦) 現代数学社 </li></ul></ul><ul><ul><li>共分散構造分析 [ 入門編](豊田) 朝倉書店 </li></ul></ul><ul><ul><li>共分散構造分析[事例編](豊田編著) 北大路書店 </li></ul></ul>
  44. 44. おまけ・・・ 質問に回答できなかった時系列分析 <ul><li>ラグつき変数の分散共分散行列(トープリッツ行列)を算出 し、そこから分析します。 </li></ul><ul><ul><li>自己回帰 AR ( 1 )モデルの方程式 </li></ul></ul><ul><ul><ul><li>V_t=α_t-1 * V_t-1 +e_t </li></ul></ul></ul><ul><ul><li>AR ( 2 )モデルの方程式 </li></ul></ul><ul><ul><ul><li>V_t=α_t-1 * V_t-1 + α_t-2 * V_t-2 +e_t </li></ul></ul></ul><ul><ul><li>移動平均 MA ( 1 )モデルの方程式 </li></ul></ul><ul><ul><ul><li>V_t=F_t – β_t-1 * F_t-1 </li></ul></ul></ul><ul><ul><li>ARMA モデルの方程式 </li></ul></ul><ul><ul><ul><li>V_t=Σα_t-r * V_t-r + Σβ_t-r’ * F_t-r’ </li></ul></ul></ul>*t が時系列をあらわす記号 詳しくは・・・豊田( 2000 )共分散構造分析[応用編]に記載があります

×