仮説とデータ解析の関係
-共分散構造分析の前にー
岡野 道太郎
1
自己紹介
• 東京学芸大学
– 教育心理で卒論
• 使った本 教育と心理のための推計学
• 放送大学 科目履修生
• 放送大学大学院
– 科目履修生、全科履修生(退学)
• トップエスイー
• 筑波大学大学院ビジネス科学研究科
– 大学のシラバスの調査で修論(経営学)
• 使った本 心理学論文の書き方
2
まずは、仮説とデータ解析の関係
• 仮説構築・仮説検証とデータ解析の関係
– 卒論・修論を仮説構築で止めるか、仮説検証までいく
かは、先生による
• 仮説の絞込みレベルも先生によるが、コミュニティの影響も
– 使える手法は、コミュニティによる
3
仮説構築におけるデータ処理
• どこまで、仮説構築で行くか
– 「はじめに」「関連研究」「提案」
– 仮説構築するだけの論文
• 提案までならアブダクションが使える可能性
– 例
• 一般に、こういわれている(データがある)
• でも、この調査では、このような結果が出ている
– 二次データ(毎年行われる調査など)が使える
– 提案で仮説を出し、それを検証する
• 仮説で終わる場合
– グラウンデッドセオリー(木下の修正版含め)
– (探索的)因子分析
– KJ法とか。他の方法を使ってOKかは、先生に・・・
検定せす、ク
ロス表・グラ
フでもOK
4
仮説検証におけるデータ処理
• 仮説の内容によって、処理が違う
– カテゴリー間の差を主張したい
• クロス表を作って、χ2検定
– 分類・分別したい
• 判別分析、クラスタリング(k-means等)
– 量的な差を検定して、仮説を主張(主に実験)
• t検定(2つのグループの平均)
• F検定(多くのグループ)
– 予測値を出したい:回帰
• 連続量:重回帰分析
• 生死・当たり外れ等の確率:ロジスティック回帰
• 質的データも含む:数量化1類
– モデルを作成し、その当てはまり
• 共分散構造分析(SEM)
実験でもモデル
が作れるなら
SEM可能
5
データ処理に行くまで
• 笹井氏の示した手順が分かりやすい
– https://www.youtube.com/watch?v=xu-XUie-Hbc (6:00~7:00)
– 着想・発想→実験実施→実験データ解析・図表作成→論文
• 実験が仮説内容によりいろいろ
– 本当に実験する
• 実験計画法:ラテン方格、直交表
– アンケートをとる
– 調査:データ収集
• 株価と何かの関係など
• 書き方なども型がある
– 研究法に詳しい本
6
データ処理手順
• データをざっくり見て、基本統計量をとる
– カテゴリーデータ:クロス表(統計量:件数)
– 量的データ:散布図・相関(統計量:平均・分散)
• データの加工&処理方法の注意点
– コーディングとかある場合も
– 欠測
• 仮説を主張する為の統計操作
– 例:検定の場合
• いいたいことの逆:帰無仮説の構築
• 帰無仮説は5%、1%以下しか起きない
• 「いいたいことの逆」は起きない→いいたいことが成り立つ
7
統計操作の例:共分散構造分析
• 観測できる変数から、モデルの当てはまりを
推定する
• 例:英語は理系能力が必要
– 文系能力・理系能力:潜在変数
– 国語・社会・英語・理科・数学:観測変数
赤い線があるのとないので、どちらが当てはまりがよいか見る
8
参考: (イメージです)
共分散構造分析は何をしている?
• 例えば英語は、以下の方程式が建てられる
• 同様にすべての観測変数を含む方程式をたて、
その方程式から全r,yが求められたとする
• 観測変数の実際の観測値は誤差を含む
– そこで誤差が最小になるようにr,yを調整する
実際には
行列
X3=r3y1+r4y2+誤差
9
参考:
全てを観測変数にした場合の比較
• 今、学力テスト、文系テスト、理系テストという
のが有った場合、すべてが観測変数となる
– このとき2つのモデルが考えられる
– どちらがよいか:誤差の累積の観点から考える
10
共分散構造分析まで
• 仮説を構築:
– 潜在変数と観測変数を決める
• 自分の知見
• 既存の学説(対立していると、より良い)
– パス図を作成
• 仮説を検証する:観測変数を測定する
– 観測変数が連続量で測定可能(時間・年齢)
• 測るべし
– 観測変数が感覚的なもの
• リッカートの簡便法(5件法など)、SD法等で数量に
11
共分散構造分析
• ソフトウェアを使って解析
– 手順
• パス図を描く
• データを入力する
• 結果が出てくるので検討する
– ソフトウェア
• SPSS Amos:分かりやすい。操作は知っておくと良
• R:semまたはlavaanパッケージ:むずかしいかも・・・
– 検討
• P値、AGFI(GFI)、RMSEAなど
• 2つモデル作成時:どちらの当てはまりがよいか議論
12

仮説とデータ解析の関係