SlideShare a Scribd company logo
4第 章
集計・分析
図解入門
How-nual
実査で集めたデータから何らかの結論を見つけだすには、
統計処理が必要です。膨大なデータの山を、人間の情報処理
能力で理解可能なものにまとめあげるのが、統計処理の目的
です。
本章では、まず集計・分析作業に入る前の準備作業を解説
した上で、どのような場合にどのような統計処理を行えばい
いのかを説明していきます。統計処理の説明では多少の数式
が出てきますが、実際の計算はコンピューターがやってくれ
るので、心配はいりません。あくまで考え方を理解すること
に重点をおいてください。
マケリサーチ第4章_v4 09.11.13 17:12 ページ101
第
4
章
集
計
・
分
析
¡記入漏れがないか。
¡回答の番号の○づけが適切か。例えば、2つの番号のどちらに○が付いている
のかがわかりにくかったり、選択肢から1つ選ぶ質問で2つの番号に○が付い
ていないか。
¡自由回答の文字や数字が読めるか。
その他、それぞれの調査で決められた調査票の記入上のチェック事項がある場合
は、それらもチェックします。これは、対象者が謝礼を受け取って会場を後にする
前、あるいは調査員が対象者のお宅を去る前の、僅かな時間で行う必要があります。
ただし、最近ではCAPI(コンピューター支援面接調査)やCATI(コンピュー
ター支援電話調査)と言って、コンピューターの端末を使って質問と回答の入力を
行うケースも多くなっています。これは、コンピューターの画面上に調査票が表記
され、事前にプログラムされた指示に従って、面接を進行し、回答を入力していく
というものです。このCAPIの場合は、コンピューターのプログラム上で、回答矛盾
や回答数の誤りを即時検知して再入力を促せるので、検票作業は省略できます。
4-1 エディティング作業
103102
4-1
エディティング作業エディティング作業
集計・分析に取りかかる前に、不備のあるデータがないかチェックし、必要であ
れば対処しておくことで、精度の高い結果を得ることができます。
回答漏れなどを発見・対処する「エディティング作業」
いずれのデータ収集法の調査の場合でも、分析・集計作業は、データ収集上のエ
ラーを少なくするために、まずデータのエディティング(Editing)から始めます。
この初期のエディティング作業を含めて、データを集計ソフトに入れるまでのデー
タ内容の点検作業を総称して、「データ・クリーニング」とも呼びます。
エディティングでは、集まったデータに対し、主に以下の点をチェックして、対
処します。
¡回答漏れ
¡回答の内容や記入の曖昧さ
¡異常値
¡回答の一貫性(回答の論理的矛盾)
¡調査協力の拒否(質問数が多い調査への途中回答拒否やいい加減な回答)
¡対象条件にあわない回答者などの特定
なお、エディティングの作業は、実際には、個々の調査直後に調査現場で行われ
る簡易的なものと、すべてのデータを集め終わった後にオフィスで行われるものの、
2段階に分けて行われています。順に、説明しましょう。
まずは調査現場でフィールド・エディティングを行う
訪問面接調査や会場テストでは、面接直後に、調査員や実査担当者(スーパーバ
イザー)によって簡単に調査票のチェック(検票)が行われます。この作業を、
フィールド・エディティングと呼びます。主なチェック事項は、以下の通りです。
集計・分析プロセス
エディティング(データクリーニング)
コーディング
データ入力
データ集計
データ分析
マケリサーチ第4章_v4 09.11.13 17:12 ページ102
第
4
章
集
計
・
分
析
エディティングは重要な品質管理のプロセスです。同時に、調査員の品質管理に
も活用されます。
そもそも実査終了後のこのような対応をできる限り最小限にするためにも、回答
漏れや記入ミスを引き起こさないわかりやすい調査票の作成や、調査員の質の向上、
実査管理の充実が望まれます。
4-1 エディティング作業
105104
データ不備への主な対応策
オフィスに調査票を持ち帰ったら、本格的なエディディング作業が始まります。
これを、セントラル・オフィス・エディティングと呼びます。
主なチェック項目は先述の通りです。また、エディティングで発見された、正確
でない調査票や各質問項目への対応としては、次のような方法があります。
¡再調査を行う
もう一度、同じ対象者に聞くことです。例えば、訪問面接調査では、インスペク
ション用にたずねた電話番号を使って、電話で聞くことができる場合もあります。
この方法はもっとも理想的ですが、現実的には、費用やタイミング的に難しい場
合があります。また、路上キャッチでの対象者の場合は、同一人物への再調査は不
可能です。
¡調査担当の判断で適切な回答に置き換える
例えば、状況から判断して正しい回答が明らかな場合や、論理的に考えて矛盾し
ない回答の場合、その回答に置き換えます。また、サンプル数や結果から判断して、
「どちらとも言えない」に分類を行ったり、「わからない(DK:Don't know)」「無
回答(NA:No answer)」「非該当(NA:Not applied)」に分類します。
なお、欠落した回答のことを欠損値(ミッシング・バリュー)と呼びます。欠損
値の存在やその数は、全体の結果に影響を与える可能性がありますので、その影響
を十分考慮して対応する必要があります。
¡不適切な質問だけを無効とする
不適切な質問だけを無効として、その部分を「無回答」で処理を行います。
¡票全体を無効票にする
これは、途中まで調査に協力した人の声を無視することになりますし、調査費用
も無駄になりますので、最後的手段です。
4-1 エディティング作業
データ不備への主な対応策
データ不備 エラーへの対応
調査協力の拒否(途中拒否、不適切な回答)、
対象条件にあわない回答者
回答漏れ 再調査を行う
回答の内容や記入の曖昧さ 適切な回答を付与する
異常値 DKやNA扱いとする
回答の一貫性(回答の論理矛盾) 一部の質問を無効とする
票全体を無効とする
マケリサーチ第4章_v4 09.11.13 17:12 ページ104
第
4
章
集
計
・
分
析
グ・ガイドに従って、コーダーと呼ばれる人が自由回答を分解し、コード番号を
振っていきます。
コーディング・ガイド作成上の注意点は、調査票作成時での選択肢の作り方と同
様です。つまり、
¡選択肢の数は多すぎず、少なすぎず、10個以内が望ましい。
¡類似した回答は1つの選択肢に入れるようにする。
¡選択肢間には明らかに違いがあるように分類する。
¡選択肢は重複しないように分類する。
¡選択肢は、重要なものを落とさないで、包括的にする。
となります。
実際には、トラッキング調査のような継続調査の場合には、これまで使ってきた
ガイドを基に、追加修正をしてガイドを作成することになります。継続調査でなく
ても、類似の調査や同様な製品カテゴリーの調査では、だいたい回答項目の予想が
付く場合があります。これらの場合には、調査票作成後、実査前か実査中に、ガイ
ドを作ることが可能です。
しかし、どのような回答が出てくるかさっぱり予想が付かない調査もあります。
このような場合は、実査が終了してから、実際の自由回答の一部を見ながら、コー
ディング・ガイドを作成していくことになります。いい加減に作ってしまうと、後
からコーディング・ガイドに含まれない「その他」の項目が増えたり、新たな項目
を追加する必要が出てきたりして、作業の効率が落ちることになります。よいガイ
ドの作成には一定の熟練が必要です。
自由回答データは扱いに注意!
なお、アフター・コーディング作業は、結構時間を取ります。対象者数が多く、
自由回答の箇所が多いプロジェクトだと、1週間もかかる場合があります。このよう
な場合は、自由回答のアフター・コーディングの部分だけ後で集計表に追加すると
いう措置が取られたりしますが、これも2度手間で、作業効率を下げることになりま
す。人件費として費用も多くかかります。
4-2 コーディング作業
107106
4-2
コーディング作業コーディング作業
自由回答を統計処理可能にするためには、コーディング作業を行っておく必要が
あります。
自由回答を統計処理するためのコーディング
コーディング(Coding)は、広い意味では、各質問の回答選択肢にコード
(code符号、記号)を割り当てる作業を表します。通常は数字をコードに使用しま
す。例えば、20代を1、30代を2、40代を3、50代以上を4とすることを指しま
す。これは、定性的なデータを集計・分析するために考えだされた便宜的方法です。
ただし、コーディング作業といった場合、通常は、実査終了後の自由回答*
の処理
作業を指します。これは厳密には、アフター・コーディングや、ポスト・コーディ
ングと呼ばれます。当然ですが、自由回答質問が含まれない調査では、通常、この
アフター・コーディング作業プロセスはありません。
これと関連して、調査票作成時に回答選択肢に最初から数字が使われている場合、
これをプリ・コーディングと呼びます。多くの調査では、プリ・コーディングが行
われているので、アフター・コーディング作業を行う必要がありません。時々、調
査に不慣れな人が、選択肢に「アイウエオ」や「abc」などを使ったアンケート用
紙を使う場合がありますが、このような時にはアフター・コーディングが必要に
なってしまいますので、手間を省くために、最初から数字を付けておくことをお勧
めします。
ちなみに、20代と30代を併せて1、40代と50代以上を併せて2とすることを
リコード(recode)と呼んだりします。
コーディング・ガイドが重要
アフター・コーディング作業は、リサーチャーによる「コーディング・ガイド」
(コーディング・スキーム)の作成から始まります。これは、どのような回答に対し
てどのようなコードを割り当てるかを指定したものです。そして、このコーディン
*自由回答 選択肢を選ぶのではなく、文章や数字などで自由に記入してもらった回答。OA(オープン・エンディ
ド・アンサー)やFA(フリーアンサー)と略される。
マケリサーチ第4章_v4 09.11.13 17:12 ページ106
第
4
章
集
計
・
分
析
4-2 コーディング作業
109108
そうした手間や費用をかけている割には、その結果の活用度はそれほど高いとは
言えないようです。
例えば、貴重な消費者の生の声を単純化しすぎるという批判があります。それゆ
え、コード化しないか、あるいはコード化と併せて、自由回答の全文をそのまま書
き抜き(ベタ打ち)してほしいというクライアントからのリクエストも多くありま
す。予算がない場合は、自由回答の部分だけのコピーのリクエストもあります。
こうした要求は、その意図はわかるのですが、定量調査に含まれる自由回答(定
性情報)の役割は、あくまで定量情報の補足だということを忘れてはいけません。
定性情報だけがほしいのなら、最初から定性調査をするべきです。調査企画の意図
から外れたデータの使い方をすると、判断を誤る可能性があります。
例えば、定量評価の評価項目に含まれていなかった新しい項目が自由回答の中に
多く出てきたとしたら、その回答が多いほど重要な発見ですが、そこから結論を導
くことは控えた方がよいでしょう。この場合、再度の定量評価が必要です。
4-2 コーディング作業
コーディング・ガイドの例(パスタソースのケース)
コード番号
001 おいしそう/好みの味
002 食べやすそう
003 酸味
004 甘そう
005 さっぱりしていそう
006 風味がよさそう
008 まろやかそう/マイルド
009 コクがありそう
010 クリーミー
011 本格的
012 目新しい
013 安心/信頼できる
014 見た目がよさそう
015 栄養がとれそう
016 手間が省ける
017 経済的
018 ……
全体好意度:好きな理由
自由回答データの活用法
製品テストの自由回答の読む際のコツとして、「その製品を好きだと評価した
人」の自由回答からは「その製品でよいと評価した点」を読み取ることが挙げら
れます。そうして読み取った点を強化したり、広告などのコミュニケーション活
動で前面に出すために使うのです。
もちろん、購入意向がある人の「その製品の気に入らない点」も、製品の改善
点を見つけるヒントになるかもしれません。しかし、その嫌いな点を上回る気に
入った点、好きな点が存在しているから、その人はその製品を買おうと思ったわ
けです。そちらを知った方が販売には役立ちます。
同様に、「嫌いだと評価した人」の自由回答からは、「気に入らないと評価した
点」すなわち「購買バリア」(購買阻害要因)を知ることによって、改善点を見つ
けたり、コミュニケーション上で補う点を見つけたりできます。
したがって、全体ベースで自由回答中に出現したよい点と悪い点の分布を見る
だけでなく、全体評価の評価値、つまり5点尺度評価ですと5点「非常によい」と
答えた人のよい点の自由回答の分布を見る必要があります。そのためには、自由
回答の書き抜きには必ず、その前の全体評価のスコアも転記しておく必要があり
ます。また、性・年代などの基本属性も付けておくと、さらによいでしょう。
最近では、テキスト・マイニングの手法を用いて、自由回答で挙げられた評価
項目間の関係性を見ることができるサービスが、いくつかの調査会社から提供さ
れています(例えばシノベイトのSyn−Textサービス、マクロミルのMindMillサ
ービスなど)。比較的安価で利用できますので、こうしたサービスを利用するのも
効果的でしょう。
こうしたサービスを活用すれば、単に自由回答の処理の手間が省けるだけでは
なく、評価項目間の関係性、すなわち仮説を簡単に見つけることができるように
なります。
✎COLUMN
マケリサーチ第4章_v4 09.11.13 17:12 ページ108
第
4
章
集
計
・
分
析
に理解し、活用すべきでしょう。
現実的には、集計・分析の計算自体は集計ソフトで行うため、専門的な数学の知
識がなくても問題ありません。ただし、その集計ソフトに集計や分析の指示を行っ
たり、出てきた結果を的確に読み取るためには、やはり最低限は統計処理の方法を
理解する必要があります。
データに応じて統計処理の方法を使い分けよう
なお、統計処理の方法は、対象とする変数の数や、分析の目的、データの種類
(量的あるいは質的データ)によって、異なります。
1つの変数(調査項目)を対象として、その分布を知る目的の場合、データが質的
な場合は、「度数分布」を使います。量的な場合は、平均値や標準偏差などを用いま
す(質的、量的の意味についてはコラム参照)。
また、対象とする変数が2変数になると、その分析目的が2変数間の関係を知るこ
とになります。そのためには、質的データではクロス表、量的データでは相関係数、
単回帰分析などが用いられます。
さらに、変数が3つ以上になれば、変数間の関係性や全体の構造を知る目的で「多
変量解析」の登場になります。
それでは、次節以降で、順に説明していきましょう。
4-3 統計処理の概要
111110
4-3
統計処理の概要統計処理の概要
どのようなデータを取り扱うかによって、適した統計処理の方法は違います。こ
こでは、どんな統計処理の方法があるかを確認しましょう。
ミスのないデータ入力を
エディティングやコーディングなどのデータ集計準備作業が完了すれば、いよい
よデータを集計ソフトで読み込んで、集計・分析作業に入ります。
その際には、まず、データを集計ソフトに読み込めるように、パソコンに入力す
る必要があります。データ入力の正確性を期するために、費用はかかりますが、ダ
ブル入力の方法を取ることもあります。2人のデータ入力者が、同時にデータを入力
して、間違いがないかをチェックする方法です。
ただし、インターネット調査やCATI、CAPIによる調査の場合は、調査現場で即
時データが入力されているため、このようなプロセスは必要ありません(調査現場
での対象者や調査員の回答入力ミスがないことが大前提ですが)。
なぜ統計処理が必要なのか?
データ入力が済んだら、集計・分析を行います。集計・分析では具体的に何をす
るのかと言うと、集めたデータを統計処理します。
なぜ、統計処理が必要なのでしょうか? 例えば、100人に100の質問を行っ
た場合、1万通りの回答があるわけです。それをそのまま報告書の形にするのは、作
成する方も読む方も大変です。回答や回答者の共通性や、回答の分布を見つけたり
して、情報の圧縮、シンプル化を図る必要があります。人間の情報処理能力で理解
可能なものにまとめあげるのが、統計処理の目的です。
とはいえ、「難しい数学的知識が必要なのか」と心配しすぎる必要はありません。
我々は統計の専門家ではないので、その分析の方法の詳細や、数学的証明は、専門
家に任せればよいことです。リサーチャーとしては、統計解析がマーケティング現
象を記述し、説明し、因果関係を解明できる役立つ有効な手段である限り、積極的
統計処理の方法
1
3つ以上
2
対象とする
変数の数
分析目的
分析方法
質的データ
変数の分布を知る
変数間の関係を知る
他の変数の影響を除いて
変数間の関係を知る、変
数間の構造を知る
量的データ
度数分布表
度数分布表、
平均値、分散、
標準偏差など
相関係数、
関連性係数、
回帰係数など
多変量解析
クロス表
マケリサーチ第4章_v4 09.11.13 17:12 ページ110
第
4
章
集
計
・
分
析
113112
*変数 測定値が名義尺度や順序尺度で表されている変数を定性的変数、間隔尺度や比率尺度で表されている変数を
定量的変数と呼びます。
因果関係を読み解く基礎・測定論③質的尺度と量的尺度
調査によって得られた測定値は、その数的な特性によって、大きく質的な尺度
のデータと、量的な尺度のデータの2つに分類できます(ここで言う「尺度」は、
56ページで説明した回答形式を示す尺度とは別物です)。
質的というのは、簡単に言えば「見た目は数字だけれども、数字としての性質
は持っていない、定性的な内容の」という意味です。自由回答をコーディングし
たデータを思い浮かべると、わかりやすいでしょう。質的な尺度には、名義尺度
と順序尺度があります。
一方、量的というのは、「数字の性質を持つ、定量的な内容の」という意味で
す。量的な尺度には、間隔尺度と比率尺度があります。
それぞれの尺度の具体的な意味については、図を見てください。
さて、リサーチャーとして、このような「測定水準の区分」を理解することが
なぜ重要かと言うと、それによって適用できる演算の種類や統計的分析の種類が
異なってくるからです。
例えば、名義尺度や順序尺度で測定された変数*
は、四則演算ができません。
見かけ上は可能ですが、正しく言うと、四則演算をしてはいけません。
これは、よく考えれば当たり前のことです。調査で「男性を1、女性を2」とし
て性別をたずねますが、この男性の1と女性の2を加減乗除しても、その結果には
意味などないでしょう。順序尺度で測定した学歴(例えば、1.大卒、2.高卒、
3.中卒)の場合も、同様のことが言えます。
一方、間隔尺度では加減が、比率尺度では、加減乗除の演算が可能になります。
また、2つの変数間の関係の強さを表す「相関係数」も、2つの変数が共に間隔尺
度か比率尺度でなければいけません。
なお、具体的な尺度の種類は図の通りですが、この図中の①∼④の順で「尺度
の水準が高くなる」と言います。高い水準の尺度は、低い水準の尺度よりも多く
の条件を満たす尺度であり、多くの情報量を持つと言えます。
例えば、比率尺度は、間隔尺度にはない「絶対的な原点」を持ちます。また、
間隔尺度は、順序尺度の特徴である「数値の順序性」を持っています。
✎COLUMN
尺度が高い水準で測定できるものは、できるだけ高い水準で測定するのが鉄則
です。大は小を兼ねるからです。つまり、年齢は、例えば10才区切りで聞くより
は、実年齢で聞いた方がデータ分析上での応用範囲が広くなると言えます。また、
後で10才区切りに分類することも可能です。
各尺度の該当
質的尺度 属性と属性の区別・識別をします。大小
関係や倍数関係を表しません。値はあく
まで識別をするラベルです。例えば、性
別(男性・女性)や製品名などをコー
ディングした場合のデータが該当します。
大小や優劣などの一定の序列を表します。
順序が意味を持ちます。しかし、数字の
等間隔性は保証していません。例えば
「次の5つの製品に、好きな順に番号を
振ってください」などの質問の回答デー
タが該当します。
量的尺度 値の等間隔性が保障された尺度です。た
だし、絶対的な原点(0)は持ちません。
足し算が可能です。例えば、好意度や賛
成・反対などの5点尺度のデータなどが
該当します。平均値や通常よく使われる
「相関係数」の算出や、多変量解析の適用
が可能になる点が大きな特徴です。
絶対的な原点(0)を持ち、等間隔性も
保証されている尺度です。掛け算が可能
です。例えば、年齢や収入、価格などの
データが該当します。
①名義尺度
(nominal scale)
②順序尺度
(ordinal scale)
④比率尺度
(ratio scale)
③間隔尺度
(interval scale)
マケリサーチ第4章_v4 09.11.13 17:12 ページ112
第
4
章
集
計
・
分
析
ちなみに年収は比率尺度ですので、次に説明する平均値を算出することができま
す。他方、学歴については、測定水準が名義尺度ですので、平均値を算出できませ
ん(計算しても意味がありません)。
4-4 度数分布表と集団特性値
115114
4-4
度数分布表と集団特性値度数分布表と集団特性値
測定値の分布を知る方法には、「度数分布表」と、分布の特性を示す「集団特性値」
があります。
測定値の分布状況を概観する「度数分布表」
データの測定値の分布を知るためには、度数分布表やクロス表を使います。
度数分布表とクロス表の違いは、対象とする変数が1つか、あるいは2つであるか
ということです。つまり、1つの場合は度数分布表(調査では、単純集計表やホール
カウントという呼び方もあります)で、2つの場合はクロス表(クロス集計表)で
す。ちなみに、3つの場合は、「3重クロス表」と呼びます。
いずれにしても、本来は名義尺度や順序尺度のデータ用ですが、間隔尺度や比率
尺度のデータにも使うことができます。
度数分布表には、人数を表す「度数」と、それを総度数(合計)を100とする百
分比(パーセンテージ)に直した「相対度数」、さらに、累積を示した「累積相対度
数*
」が含まれます。
右の図は、ある調査の対象者の学歴と年収を表した度数分布表です。対象者の学
歴の分布は、%の相対度数で表すと、すっきりわかりやすくなりました。
一方、年収金額については、それを1円刻みで度数分布表にしたとしても、結果は
見やすくなりません。このような場合、年収を適当な幅(インターバル)に区切っ
て階級(クラス)を設け、階級ごとに度数分布表を作成します。この階級を設ける
場合の注意点としては、以下のものが挙げられます。
¡階級の幅を等しくする
¡意味のある区切り方にする
¡階級の境界を明確にする
¡階級の数を適正にする
*累積相対度数 調査会社ではGT(グランド・トータル)表と呼んでいます。
度数分布表の例
度数 相対度数(%) 累積相対度数(%)
中卒 20 13.3 13.3
高卒 40 26.7 40.0
大卒 90 60.0 100.0
計 150 100.0
学歴
度数 相対度数(%) 累積相対度数(%)
500万円未満 70 46.7 46.7
500∼1,000万未満 60 40.0 86.7
1,000万円以上 20 13.3 100.0
計 150 100.0
年収
平均年収 760万円
マケリサーチ第4章_v4 09.11.13 17:12 ページ114
第
4
章
集
計
・
分
析
差になります。
標準偏差と分散という考え方は、因果関係を統計的に検証する上で非常に重要な
考え方ですので、もう少しわかりやすく説明しましょう。
平均値からの散らばりの具合を見る標準偏差は、それぞれの観測値の平均値から
の差(偏差と呼ぶ)の平均値ということです。
偏差とは、平均値x
_
と観測値xとの差、つまりx−x
_
です。プラスの場合もあればマ
イナスの場合もあるので、偏差を2乗することによってプラス、マイナスを考える必
要がないようにします(例えば−5の2乗は25で、マイナス記号がなくなります)。
さらに、偏差の平均的な(標準的な)大きさを取るために、例えば観測値(対象
者数)が50あれば、50個のそれぞれの偏差を合算して、観測値の50で割ります。
これが分散です。
そして、最初に2乗にしたものを1乗に戻すために√を使い、標準偏差が求まるの
です。
4-4 度数分布表と集団特性値
117116
分布の特性を1つの値で示す「集団特性値」
度数分布は、1つのグループだけの場合はわかりやすいのですが、グループが2つ
以上あった場合(つまりクロス表の場合)、各項目の比較がわかりづらくなります。
度数分布よりは、そのグループを表す何か1つの指標があればと便利だと思います。
そのような数字が、「集団特性値」です。分布の特性を表す数値で、統計測度とも
呼ばれます。よく使われる集団特性値としては、分布の中心を表す「代表値」、散ら
ばり具合を表す「分散」や「標準偏差」などがあります。
¡代表値
分布の中心を表す統計測度を代表値と呼びます。代表値には
¡一般に平均値と呼ばれる「算術平均」
¡測定値を小さい値(あるいは大きい値)から順に並べた時に、全体の真ん中に
くる「中央値」
¡もっとも度数(頻度)が高い測定値である「最頻値」
などがあります。
¡分散と標準偏差
測定値の散らばり具合を意味する散布度を表す統計測度として
¡分散
¡標準偏差
などがあります。両者は、平均値を基準とした測定値の散らばり具合(平均値から
の隔たりの大きさ)を示すものです。
具体的には、平均からの偏差(観測値と平均値の差)の2乗平均が分散になりま
す。分散の平方根が標準偏差です。つまり、標準偏差は、分散の値よりも小さくな
ります。例えば分散が400の場合、400の平方根(√400)である20が標準偏
4-4 度数分布表と集団特性値
分散と標準偏差
偏差 = 観測値 − 平均値
標準偏差  = 分散s
分散 =
(偏差1)+ … +(偏差50)2
50
※観測値が50の場合
v
i=1
n
(xi−x)2
Σn
1
=
マケリサーチ第4章_v4 09.11.13 17:12 ページ116
第
4
章
集
計
・
分
析
そして、回帰関係を数式で表すことを、回帰分析と言います。回帰分析は、説明
や推測、予測に役立つすぐれものです。
ちなみに、回帰関係で求めた数式を、回帰式(図参照)と言います。回帰式の求
め方の1つとして最小二乗法があります。残差(回帰式の直線と個々のデータとの間
にあるy軸方向の距離)の2乗を合計したものが最小になるように、回帰係数を求め
る方法です。
このように、統計分析というのは、「変動」を分解し、その変動の原因を特定する
作業でもあります。
より詳しく変動を考えた場合、すべての現象は、原因となる変動で説明できる部
分と、どの原因によるものでもない変動に分かれます。後者の変動を残差変動と呼
びます。つまり「変動=原因による変動+残差変動」で表せます。
例えば、「ブランドの全体評価(Y)の変動=高級感評価(X)という原因の変
動+残差変動」となります。高級感がよいと思ったすべての人が、全体評価もよい
とは限りませんので、残差変動が存在するわけです。このように、最終的にどの原
因にも帰因させことができない変動が存在することを理解しておくことも大切です。
散布図と相関係数
また、2変数間の関係を見る場合、回帰分析を行う前に、まず「散布図」によって
視覚化するとわかりやすくなります。横軸に独立変数(X)、縦軸に従属変数(Y)
4-5 回帰分析と相関分析
119118
4-5
回帰分析と相関分析回帰分析と相関分析
統計学を使って、原因と結果を読み解くには、変数(調査項目)間の関係を調べ
る必要があります。その基本となるのが、回帰分析と相関分析です。
原因と結果の関係は「分散」で説明可能
前節の単純分布を見ただけでは、変数(調査項目)間の原因と結果を読み解くこ
とは困難です。そこで登場するのが、これから説明する「原因と結果を読み解く統
計分析」です。
「統計学を使って、原因と結果を読み解く」とは、どういうことでしょうか?
「変数Xが変数Yの結果の原因である」という関係を統計学的に表すと、「結果で
ある現象Yの変動が、原因となる現象Xの変動によって影響を受ける」あるいは「X
の変動によってYの変動が生じる」ということです。
ここで言う「変数の変動」は、前節で説明した分散で測ることになります。それ
ゆえに、原因と結果を読み解く上で、変数の分散という考え方が非常に重要になる
わけです。上の説明を分散を使って言い変えると、「Yの分散がXの分散の影響を受
ける」となります。つまり、原因とは「分散を生じさせること」なのです。例えば、
高級感(X)がブランドの全体評価(Y)を決めるかどうかを考える場合は、Xの分
散によってYの分散がどれだけ起こっているかを調べる必要があります。
ちなみに、「原因である独立変数Xによって決定される結果の従属変数Yの変動」
を「結果の従属変数Yの変動」で割った値を決定係数(R2
)と呼びます。決定係数
は0∼1の値を取り、1に近いほど「Yに対するXの影響が強い」、つまり決定する度
合いが大きいことを表します。
因果関係は回帰関係
このような「従属変数Yの平均的な値が、独立変数Xによって決まる」という関係
を、統計学では「回帰関係」と呼びます。原因が1つの場合の回帰を「単(純)回帰」(一
元回帰)と呼びます。原因を2つ以上ある場合を「重回帰」(多元回帰)と呼びます。
決定係数
決定係数(R2
)=
結果の従属変数Yの変動
原因である独立変数Xによって
決定される結果の従属変数Yの変動
0∼1の値を取り、1に近いほどYに対するXの影響が
強いことを表す
マケリサーチ第4章_v4 09.11.13 17:12 ページ118
第
4
章
集
計
・
分
析
4-5 回帰分析と相関分析
121120
を取り、変数間の関係を図示したものが散布図です。
味覚評価の例で考えますと、甘みの評価(X)が上がるとともに、味覚の全体好意
度(Y)も上昇すれば、両者の間に「正の相関関係」があると言います。逆に、甘み
の評価が上がるとともに、全体好意度が下がった場合、両者には「負の相関関係」
があると言います。両者に何の関係もない時は、「無相関」と言います。
この量的データの2変数間の関係が強いか弱いかを数字で表したものが、相関係数*
です。変数間の関係の強さをランク付ける統計量です。−1∼1の間の値を取り、完
全相関(正の相関関係)の場合は1、完全逆相関(負の相関関係)の場合は−1、無
相関の場合は0となります。実際の調査では相関係数が1になることはありません
が、相関係数が0.8くらいであれば、強い相関があると言えます。
ただし、通常のリサーチの場合、2変数間の関係を検討する際でも、2変数だけで
現象が成り立っているわけではありませんので、2変数間へのその他の変数の影響も
考慮する必要があります。第3変数の存在によって、2変数間に見せかけの相関関係
(疑似相関)が見られたり、逆に相関を見えなくしていることがあります。そのため
に第3の変数の影響を取り除いた関係性を表す統計量として、偏相関係数というもの
があります。他の条件を一定とした場合の、2変数の純粋な相関関係の強さを表しま
す。
なお、相関係数は直線的関係を前提としています。非直線的関係の場合は、関係
が存在しても、相関係数では表すことができません。つまり関係があるのに相関係
数が0になることがあります。この場合は、散布図で分布の直線性をチェックする必
要があります。また、異常値がある場合も、異常値が相関係数を高める恐れがあり
ますので、注意が必要です。
「相関関係=因果関係」でないことに注意
以上、「原因と結果を読み解く」統計分析の基礎として、回帰分析と相関分析によ
る2変数間の関係性の特定、つまり2変数間の仮説の検証の方法を説明しました。
ただし、これらの分析の結果は「XによってYが引き起こされる」という真の意味
の因果関係を表してはいないという点には注意してください。これらの結果は単に
「XとYが同時に観察されている」という相関関係を表しているだけです。
もちろん、相関関係は、因果関係を示唆する有力な証拠で、相関なくして因果関
*相関係数 一般に相関係数というと、ピアソンの積率相関係数(correlation coefficient)を意味し、小文字のrで表
します。
4-5 回帰分析と相関分析
回帰分析
x
x
x
y
_
y
_
=a+bx
x
_
x
_
:
Sy2
Sy.x2
Sy
2:
y
x
xx
x
x
x
x
x
x
x
x x x
x
y のx への回帰直線
x の平均
y
_
: y の平均
y の分散
b: x のy への影響力を表す回帰係数
a: 回帰定数。x が0のときのy の予測値(y 切片)。
Sy.x
2 =x がある特定の値である時のyの分散
=x の値についての条件つきのyの分散(分散ですので2乗になっている)
決定係数 =1−
Sy2
Sy.x
2
注:
Sy
2Sy.x
2 <
係はないわけですが、その他の背景的情報やその分野の既存理論も加味して、因果
関係についての仮説を立てて、両者の関係性を調べ、後述する相関関係の検定など
を行うことによって、因果関係の検証をしていかなければいけません。
実際、自然現象と異なり、マーケティングにおける因果関係を調査データで実証
することは容易ではありません。顕在的なあるいは潜在的な、多くのコントロール
できない変数の影響を受けるからです。またその関係性の間に人間の意思が働き、
関係を歪める可能性もあります。
ただ、マーケティング・リサーチは、学術研究ではありませんので、真の因果関
係の発見の必要はありません。売上拡大と関係のある信頼性の高い「仮説」を作り、
それらを消費・購買の現場で検証する、実践的な姿勢が重要だと考えます。
マケリサーチ第4章_v4 09.11.13 17:12 ページ120
第
4
章
集
計
・
分
析
123122
4-5 回帰分析と相関分析
相関
正の相関
負の相関
相関ゼロ=無相関
変数思考と仮説思考
マーケティング現象の原因と結果を、統計学によって読み解くためには、現象
を変数として捉える必要があります。例えば、「顧客満足度が高いと、その製品を
買い続ける可能性が高い」という場合、顧客満足度という変数と、リピート購入
率という変数の間に因果関係があると捉えるわけです。すなわち、企画書で設定
した調査項目こそが、その調査における変数となります。
変数は「他の変数に影響を与えるもの」と「他の変数から影響を受けるもの」
に分類されます。前者を「独立変数(あるいは、説明変数、要因)」、後者を「従
属変数(あるいは、基準変数、目的変数、応答変数)」と呼びます。因果関係で言
えば、独立変数が「原因」にあたり、従属変数が「結果」にあたります。
通常、結果である従属変数は1つですが、原因にあたる独立変数は1つだけでな
く、2つ以上の場合もあります。例えば、上の因果関係の例で言うと購入意向度
が従属変数で、顧客満足度が独立変数になりますが、購入意向(結果)に影響を
与える要因(原因)が1つだけであることはありません。製品そのものや、店頭
の販売促進、広告、口コミ、WEBなど、現実の世界では様々な要因が、消費者の
購買意思決定に影響を与えていますので、これらも独立変数になりえます。
そして、調査項目を変数として捉え、「調査項目間の関係性」を「変数と変数と
の関係」という形で表したものが「仮説」です。したがって、例えば「ブランド
の売上が低迷しているので、その打開策を探る」という調査を行う場合、ブラン
ドの全体評価をキーの従属変数として、それに影響を与えている独立変数を探る
必要があります。このように、的確に仮説を設定するには、まず課題における現
象を従属変数と独立変数に分解することが重要です。
なお、変数間に因果関係が存在するには、「2つの変数が同時に変化する共変動
が起こっていること」「原因の変数→結果の変数の順序に現象が起こるか、あるい
は少なくとも同時に発生していること」「原因となるその他の要因が存在していな
いこと」の3つの条件が成り立つことが必要です。
✎COLUMN
マケリサーチ第4章_v4 09.11.13 17:12 ページ122
第
4
章
集
計
・
分
析
4-6 クロス表分析
125124
4-6
クロス表分析クロス表分析
クロス表を使えば、質的データについて、2変数間の関係や、グループ別の度数分
布を調べられます。
質的データの場合はクロス表分析を使う
前節で説明した回帰分析と相関分析は、定量的データの原因と結果を読み解く方
法の基礎として使われます。名義尺度のような質的データの場合は、クロス表を分
析することによって2変数間の関係性の特定、つまり2変数間の仮説の検証を行いま
す。
調査での集計作業の主なアウトプットは、このクロス表*
(クロス・タビュレー
ションとか、分割表とも呼ばれます)が連結した形の「クロス集計表」と呼ばれる
ものになります。クロス集計表には、1変数の度数分布表である単純集計結果も付い
ていますので、単純集計表だけでなく、クロス集計表を出すことによって、結果の
多くの部分を見ることができます。2変数間の場合を単純クロス表、3変数以上を多
重クロス表(例えば、3重クロス表)と呼ぶ場合もあります。
飲料の調査のクロス表分析
それでは、クロス表の分析について、実例で解説しましょう。
例えば、ある飲料の購入意向をより高めるにはどうすればよいかの改善点を知る
ために、製品テストを行ったとします。対象者全員の150人の内、この製品の購入
意向は、「買いたいと思う」人が57%、「買いたいと思わない」人が43%でした。
そこで、結果である「購入意向」と、購入意向の原因となっていると思われる「後
味」の関係性をクロス表で調べて見ました(説明をわかりやすくするために、「どち
らとも言えない」を除いたシンプルな2×2のクロス表を使っています)。
図の①の表が、対象者150人の実数で回答の分布を示したものです。表の左サイ
ドを「表側」、右上を「表頭」と呼びます。また、表の横を「行(ロー)」、縦を「列
(カラム)」と呼びます。いわゆる行列です。この図では、表側に後味の評価、表頭
*クロス表 正確には、調査会社ではクロス表ではなく、193ページにあるような「バナーフォーマット」を使用しま
す。調査項目と選択肢を表す表側の横に全対象者の結果、その右側に連続したサブグループ(バナーある
いはカラム・ヘッド)の結果を表示します。
クロス集計表
①実数を用いたクロス表(人)
X/Y 買ってみたい 買いたくない 計(N)
後味が良い 64 16 80
後味がよくない 21 49 70
計 85 65 150
②相対度数(横%)を用いたクロス表(%)
X/Y 買ってみたい 買いたくない 計(N)
後味が良い 80 20 100(80)
後味がよくない 30 70 100(70)
計 57 43 100(150)
③相対度数(縦%)を用いたクロス表(%)
X/Y 買ってみたい 買いたくない 計
後味が良い 75 25 53
後味がよくない 25 75 47
計 100 100 100
(N) (85) (65) (150)
④ 相対度数(全体%)を用いたクロス表(%)
X/Y 買ってみたい いたくない 計
後味が良い 43 11 53
後味がよくない 14 33 47
計 57 43 100
(N) (85) (65) (150)
表
側
表頭
a
行
d
列
マケリサーチ第4章_v4 09.11.13 17:12 ページ124
第
4
章
集
計
・
分
析
4-6 クロス表分析
127
*3重クロス表 このように第3の変数を導入して関連の実態を明らかにすることをエラボレーション(精緻化)と呼びます。
126
に購入意向を取っています。
ただ、対象者数が150人ですので、少し分布が見づらいかもしれません。そこで
全体が100になるように%表示に直しました。それが②の表です。
%表示は比較を容易にし、2変数間の関係性を把握しやすくしてくれます。②の表
からは、この飲料の後味がよいと思った人(全体で57%であった買いたい人の割合
が80%に上昇)の方が、思わなかった人(30%に下降)よりも、この製品の購入
意向が高いことがわかります。つまり、「この製品を買ってみたい」と「買ってみた
くない」との差を引き起こした原因が「後味」であることが、よりクリアに見えて
きました。
このように、%表示は、ある種の因果関係性を示唆してくれる役割があります。
なお、質的データの2つの変数の関係*
を見るためのクロス表では、原因(ここで
は後味)の方向にパーセントの数字(この場合は横100%。後味と購入意向の表側
と表頭の位置を変えた場合は逆)を計算すると、より明快な情報が得られます。さ
らに、原因をより明らかにするクロス表のタイトルの付け方として、原因の後に
「××別」と付けると、よりわかりやすくなります。この場合ですと、「後味の評価
別の購入意向」となります。
ちなみに、この場合、後味が原因で、購入意向が結果であることは、容易に予想
できます。「この飲料を買ってみたいから、後味がよいと思う」という人はあまりい
ないでしょう。「後味が好きだから、この飲料を買ってみよう」と思うのが自然な考
え方です。だから、②の横100%の表が分析に有効なわけです。参考に付けた③の
縦100%の表では、②ほど購入意向と後味の関係がクリアには見えてきません。④
の表は全体で100%で見たもので、後味がよいと思って買いたいと思った人が全体
で何%いるかを知りたい時に使います。
この他にも、%表示には、対象者数による影響力の大きさを標準化する役割があ
ります。実数で見ると対象者数が多い方が評価が高いと見られますが、すべてのグ
ループの対象者数のベースを100にすることによって、平等な比較を可能にするの
です。
なお%表示は、特別な理由がない場合は、図の表のように小数点以下なしか、少
数点第1位までの表記が理解しやすいでしょう。1位以下まで表記をした方が見た目
は精度が高いように感じるかもしれませんが、誤差の範囲を考えれば、なくても十
*変数の関係 定量データの相関係数のように、クロス表にも変数間の関係の強弱、関連度を表す係数としてχ2
(カ
イ2乗)やクラマーのVなどがあります。
4-6 クロス表分析
分だと思われます。四捨五入でまるめておきましょう。%が100を超える場合は、
分布に大きな影響の出ない項目(例えばもっとも小さな項目や、「その他」など)で
調整する方法が一般的です。
変数の内容によっては注意が必要
なお、ここでは原因に後味を取りましたが、原因に性別や年代別など、対象者の
属性を取る場合もあります。
この場合注意しなければいけないことは、例えば「男性の方が女性よりもこの飲
料の購入意向が高い」とクロス表から結論づける場合には、男性サンプルや女性サ
ンプルが代表サンプルになっていることが必要だということです。これが例えば、
ある年代層に極端に偏った男性グループですと、さらに年代別のクロス表を検討す
る必要があります。
3つ以上の変数の場合のクロス表分析
また、後味の評価と購入意向の関係を、さらに、例えば性別や年代別でどのよう
に異なるかを知らべたい場合は、どうすればいいのでしょうか? もしかすると甘
みが好きな女性の間では、後味の評価はそう悪くなく、購入意向も高い可能性があ
るかもしれません。この飲料が女性がターゲットであった場合、これを調べておく
価値はあります。
そのような場合は、いわゆる3重クロス表*
を作成することになります。
ただし、実際のテストでは購入意向と後味だけ調べているわけではありません。
また、購入意向の判断に影響を与えている味覚要素は、後味だけではありません。
飲料の香りや色が単独で購入意向に影響しているかもしれません。甘みや苦みが後
味に影響して、購入意向に影響を与えているかもしれません。こういった要素をす
べてクロス表で分析しようとすると、何重ものクロス表を作らなくてはならなくな
ります。
単純分布や2変数間のクロス表の検討も非常に大切な分析作業ですが、スピードが
要求されるビジネス調査では、このような2変数間のデータの吟味は、とてもやって
られないというクレームが聞こえてきそうです。ご安心ください。これを瞬時に検
討・判断してくれるのが、次節で説明する「多変量解析」なのです。
マケリサーチ第4章_v4 09.11.13 17:12 ページ126
第
4
章
集
計
・
分
析
多変量解析は2つの目的別に使い分ける
このように、多変量解析には数多くの種類がありますので、直面した課題の内容
に応じて、適切な解析法を選べるようになることが大切です。そのためには、各多
変量解析の分析目的を理解することが重要です。大きくは、次の2つに分類して考え
るといいでしょう。
①どの変数が原因側、どの変数が結果側かがすでに特定できている場合の多変量
解析
②まだ特定できていない場合の多変量解析
①には、重回帰分析など、ほとんどの多変量解析が含まれます。これらの手法は、
従属変数が存在することが特徴です。すなわち、従属変数(結果)と複数の独立変
数(原因)との関係性を明らかにするのが目的で、後はデータの種類(測定水準、
4-7 多変量解析
129
*分散分析  分散分析は、独立変数の値(カテゴリー)によって従属変数の平均値に有意差が生じるかどうかを明ら
かにする手法。実験計画で必須の分析方法。
*重回帰分析 重回帰分析の多重共線性(マルチコ)の問題を克服した手法にPLS回帰分析があります。
128
4-7
多変量解析多変量解析
多変量解析は、多数の要因が存在する複雑な現象の原因と結果を、シンプルに読
み解くための、統計分析の切り札です。
複数の変数について関係性を解明する「多変量解析」
既にお気付きかと思いますが、これまで述べてきた相関分析やクロス表分析など2
変数間の統計分析では、本書が対象としているマーケティング現象の「原因と結果
を読み解く」上では不十分であることは明らかです。
というのも、実際には、製品テストの味覚評価や使用評価では、調べる変数は多
くの場合10以上もあります。ブランドの評価や顧客満足の評価でも同様です。とて
も2変数ずつ検討してる時間はありません。また2変数だけの関係を見ていると、全
体の相互関係も見落とす可能性が大きいと言えます。
そこで、「多変量解析」の登場になります。多変量解析は、複数の変数について、
何らかの「関係性」を解明する手法と言えます。その分析目的と、データの種類
(定量か定性データ)によって、様々な方法があります。
まず、分析において、従属変数が存在しているかどうかで、大きく2つに分かれま
す。次に、その従属変数と独立変数がそれぞれ、定量データであるか、定性データ
であるかによって、それぞれ2つに分類されます。ここでの定量データとは、相関係
数が算出することができる変数を意味しています。
独立変数と従属変数共に定量データの場合は、重回帰分析やパス解析が使われま
す。独立変数のみが定性データの場合、分散分析、数量化理論I類などが使われます。
さらに、従属変数が定性の場合、判別分析を選びます。従属、独立変数とも定性
データの場合、数量化理論II類を使用することができます。変数間に独立・従属の関
係が設定されていなくて定量の場合は因子分析、定性の場合はクラスター分析や、
多次元尺度法、数量化理論III類などがあります。
入門書という性格と紙幅の関係で、各分析の詳細は他に譲りますが、SPSS*
等
を使って、実際にデータ分析を行いながら修得することを推奨します。
*SPSS 統計解析用として、プロによく使われているソフトウェア。
多変量解析の分類
はい はい はい
従属変数(Y)の
有無
いいえ
いいえ はい
いいえ
いいえ はい
いいえ
従属変数(Y)が
量的
独立変数(X)が
量的
多変量解析
回帰分析、パス解析
重回帰分析*、判別分析
数量化理論II類
因子分析、主成分分析
クラスター分析や、
多次元尺度法、
数量化理論III類など
分散分析*
数量化理論I類
マケリサーチ第4章_v4 09.11.13 17:12 ページ128
第
4
章
集
計
・
分
析
て、「相関行列」があります。SPSSなどの解析ソフトで、簡単に出すことができま
す。これを見れば、全変数の関係性を理解することができます。
特に、従属変数となる全体評価や購入意向と、他の独立変数との相関関係を見る
ことが重要です。例えば、味覚の全体好意度と酸味の相関が高いということは、酸
味を高く評価した人は、製品全体の好意度も高くなっていることを表しています。
つまり、酸味を気に入った人が多かったわけです。酸味の評価がこの製品の好意度
を上げたことになります。
ちなみに、この相関行列を元にして、複数の変数間の関係を図示してくれる「グ
ラフィカル・モデリング*
」という便利な手法もあります。具体的には、偏相関係数
の値をベースに、従属変数と関連性の高い独立変数をプロットし、因果関係的な図
を作ってくれます。
これを利用すると、従属変数と独立変数間の関係性だけでなく、独立変数間の関
係も明らかにしてくれます。また、相関行列からだけではわからない位置的関係性
(どの独立変数の影響が大きいか)もわかり、時には予想もしていなかった独立変数
の発見をもたらしてくれます。さらに、他の方法で抽出した製品の味覚や、ブラン
ド評価、満足度などの改善点の優先順位付けを行う場合にも活用できます。
4-7 多変量解析
131
*グラフィカル・モデリング 豊田秀樹編著『購買心理を読み解く統計学』(2006年、東京図書)参照。さらに複雑な
因果関係を適切に説明できるモデルとして「共分散構造分析」がある。
130
つまり質的か量的データか)によって、手法を使い分けていきます。例えば、ブラ
ンドAを買う人とそうでない人(結果)を区分する変数(原因)を調べる数量化II類
などがあります。
他方、②は従属変数がなく、独立変数だけが存在する手法です。複数ある独立変
数を、それらの関係性に注目して、いくつかにまとめて、より少ない独立変数に置
き換えたり、分類したりします。独立変数のブラッシュ・アップ法として捉えられ
ます。これらには、因子分析や主成分分析、クラスター分析が含まれます。
このように、目的別に2つに分けて考えれば、多変量解析も、多少は理解しやすく
なるのではないでしょうか?
複数の多変量分析を組み合わせて使う
ちなみに、実際には、まず②を行ってから①の分析を行うこともあります。例え
ば、ブランドに対する数多くのイメージを、因子分析によっていくつかの共通イ
メージにまとめることによって独立変数を少なくしてから、重回帰分析を行ってブ
ランド評価における重要な要因を特定することも、よく行われてます。そのため、
②は①のサブ分析とも考えられます。
ブランドの全体評価を数多くの変数で説明するよりは、同じようなものをまとめた
方が、シンプルで理解しやすくなります。調査結果を実際のマーケティング活動に具
体化する場合においても、より効率的になる可能性もあります。例えば、ビールの評
価の原因である味の属性の評価なら、いくつもの要素を考えるより、「コク」と「キ
レ」という2次元*
で捉えた方が、全体評価を改善するには効果的かもしれません。
このような場合、主成分分析によって、味の次元を2つの独立変数に集約させます。
また、グループ分けをすることも、効果や効率を上げることになります。まずク
ラスター分析によって、数多くあるブランドをより少なくグループ化したり、消費
者をブランドの使用や評価からセグメント化してから、そのグループやセグメント
の中で原因と結果を読み解いた方が、全体をいきなり解析するよりは、よりクリア
で有効な因果関係結果を得ることができるかもしれません。
相関行列とグラフィカル・モデリングも活用する
なお、多変量解析に入る前に、複数の変数間の関係性を見る上で便利なものとし
*2次元 このように2次元上に製品やブランドをプロットした図を「知覚マップ」と呼びます。コレスポンデンス分析
や多次元尺度構成法(MDS)、バイプロット分析などで描くことができます。
4-7 多変量解析
相関行列の例
味覚の全体好意度 1.00 0.52 0.43 0.33 0.39 0.48 0.25 0.27 0.38
コーヒーの味 0.52 1.00 0.56 0.29 0.41 0.35 0.30 0.32 0.29
苦味 0.43 0.56 1.00 0.34 0.36 0.28 0.30 0.29 0.34
甘さ 0.33 0.29 0.34 1.00 0.36 0.16 -0.07 0.05 0.26
ミルク味 0.39 0.41 0.36 0.36 1.00 0.23 0.02 0.24 0.36
酸味 0.48 0.35 0.28 0.16 0.23 1.00 0.41 0.26 0.18
コーヒーの香り 0.25 0.30 0.30 -0.07 0.02 0.41 1.00 0.64 0.14
飲み物の色 0.27 0.32 0.29 0.05 0.24 0.26 0.64 1.00 0.28
甘い香り 0.38 0.29 0.34 0.26 0.36 0.18 0.14 0.28 1.00
味覚の
全体
好意度
コーヒー
の味
苦味 甘さ ミルク味
コーヒー
の香り
飲み物
の色
甘い香り酸味
マケリサーチ第4章_v4 09.11.13 17:12 ページ130
第
4
章
集
計
・
分
析
説を採択するか、棄却するかの決定を行うというものです。
仮説検定を行う場合、「仮説が正しい」と主張するためには、「その仮説が正しく
ない」という最初から捨てるために作られた帰無仮説(H0)と、「正しい」と主張し
たい対立仮説(H1)を設定するという、まわりくどい手続きを取ります。
例えば、母平均の差を検定する場合、対立仮説を「標本平均μと、母平均μ0の間
に差がある」(H1:μ≠μ0)とした場合、帰無仮説は「標本平均と、母平均の間に
差がない」になります。この場合、正と負の両方の差を見る必要がありますから
「両側検定」を行います。
また、対立仮説が「標本平均が、母平均を上回っている(あるいは下回っている)」
(H1:μ>μ0あるいはH1:μ<μ0)とした場合、帰無仮説は同様に「標本平均と、
母平均の間に差がない」になります。この場合、正と負のいずれかの差しか見る必
要がないので「片側検定」を行います。
この時、帰無仮説が棄却されたとき「統計的に有意である」と言います。棄却し
たことが誤りになる確率を危険率あるいは有意水準と呼び、通常5%とか1%を取り
ます。
母平均の検定以外にも、検定にはさまざな種類があります*
。マーケティング・リ
サーチでは、製品テストにおいて製品評価の値を比較する場合に、「平均値の差の検
定(t 検定)」がよく使われます。
4-8 推定と検定
133
*検定の種類 詳細については、姉妹図書である竹内光悦、元治恵子、山口和範『図解入門ビジネス アンケート調査
とデータ解析の仕組みがよーくわかる本』(2005年、秀和システム)、岩佐英彦、宿久洋『授業評価・
市場調査のための「アンケート」調査・分析ができる本』(2009年、秀和システム)を参照のこと。
132
4-8
推定と検定推定と検定
標本調査の場合は、母数の推定と、母集団についての仮説検定を考慮する必要が
あります。
標本調査には標本誤差がある
例えば、主婦200人に洗濯用洗剤についてたずねた調査の結果を見た場合、それ
があたかも絶対に正しいかのように思いこんでしまうことがあります。しかし、そ
れは早計です。
なぜなら、第2章で、調査は通常、母集団の値(母集団統計量)を知るために標本
の値(標本統計量)を測定する標本調査であることを述べました。標本調査では、
その結果から母集団の真の値(母数)を推計する場合、推計値には標本誤差が含ま
れています。
数字だけ見ていると全くわかりません。忘れがちです。それゆえに、推定や統計
的仮説検定という方法が統計学*
で決められています。ここでは、その基本的な考え
を紹介しましょう。
推定とは?
推定とは、標本調査から得たデータから、母数(母集団の値)を推測することで
す。区間推定と点推定があります。
区間推定では、始めに確率である「信頼係数」(95%とか99%の値)を決めて、
「信頼区間」という形で、「推定値は、ある数字とある数字の間である」というよう
に推定します。母平均(母集団の平均)や母比率などの推定があります。
一方、「ズバリいくつ」というように、1つの値によって推定する場合は、点推定
と呼びます。
仮説検定とは?
仮説検定とは、母数についてある仮説を設定し、得られた標本に基づいてその仮
*統計学 結果を一般化するために必要な統計処理を「推測統計」と言います。前出の度数分布や代表値などの統計
処理を「記述統計」と言います。
帰無仮説の採否と第1種・第2種の誤り
仮説H0を棄却
第1種の誤り(α) 正しい決定
(対立仮説)
仮説の採否 仮説H0が真である時 仮説H0が偽であるとき
仮説H0を採択
正しい決定 第2種の誤り(β)
(帰無仮説)
マケリサーチ第4章_v4 09.11.13 17:12 ページ132
達人たちのリサーチ観
マーケティングや経営の達人たちは、マーケティング・リサーチにも一家言あり
ます。ここでは、著者が特に心に残っている言葉を紹介させていただきます。
・フィリップ・コトラー(マーケティングの世界的権威)
『マーケティグ・リサーチャーの力量にムラがある。マネジャーの中には、マーケ
ティング・リサーチを事務作業とたいして変わらないと考え、リサーチャーにそれな
りの待遇しか与えない人がいる。結果として、有能さに欠けるリサーチャーが雇わ
れることになる。そのようなリサーチャーはきちんとした訓練を受けておらず、創造
性にも欠けるため、それなりの調査結果しか出ない。調査結果に失望した経営陣は
マーケティング・リサーチへの偏見をさらに強める。そしてリサーチャーへの報酬を
抑え続け、根本的な問題は解決されないままとなる。』(コトラーとケラー『マーケ
ティング・マネジメント』2008年、ピアソン・エデュケーション)
・本田宗一郎(ホンダの創始者)
『市場調査はあてにならない。……市場調査は、もしそれを解読できない人がや
るのだったら、やらない場合の方がよっぽどいいということだ。だいたい自分の商
売のことを人に聞かなきゃいられないという人自体、市場調査をやってもむだじゃ
ないか。……こういうふうにやったら、今度はこうやればなおいいだろう、というこ
とで、毎日毎日が市場調査である。』(本田宗一郎『愛蔵版 俺の考え』2003年、実
業之日本社)
・高原慶一朗(ユニチャーム創始者)
『答えは現場にある。……困ったときには、あらためて現場に目を向け、耳を傾け
る。するとそこに、必ず最適の答えが見出せるはずです。世界でいちばんすぐれた
教師。それが現場で、現場に立ってアンテナを全開にしていると、ほかならない、
その現場、現物のほうから、「こうしたらいい」と改良や解決のヒントを教えてくれる
ものなのです。……現場での観察が何よりも大切になってきます。……「よい仕事
はいつも顧客に近づくことから生まれる」という現場主義が息づいている。』(高原
慶一朗『理屈はいつも死んでいる』2006年、サンマーク出版)
134
マケリサーチ第4章_v4 09.11.13 17:12 ページ134

More Related Content

More from MROC Japan

Jmrx esomar-apac2017 report 061
Jmrx esomar-apac2017 report 061Jmrx esomar-apac2017 report 061
Jmrx esomar-apac2017 report 061
MROC Japan
 
オンライン定性調査の現在と未来
オンライン定性調査の現在と未来オンライン定性調査の現在と未来
オンライン定性調査の現在と未来
MROC Japan
 
How to-market-research-webinar jmrx63
How to-market-research-webinar jmrx63How to-market-research-webinar jmrx63
How to-market-research-webinar jmrx63
MROC Japan
 
Jmrx grit sneak peek v1
Jmrx   grit sneak peek v1Jmrx   grit sneak peek v1
Jmrx grit sneak peek v1
MROC Japan
 
mr and the rise of the machines
mr and the rise of the machinesmr and the rise of the machines
mr and the rise of the machines
MROC Japan
 
Finding the story qualitative
Finding the story   qualitativeFinding the story   qualitative
Finding the story qualitative
MROC Japan
 
Ray poynter from data to storytelling
Ray poynter from data to storytellingRay poynter from data to storytelling
Ray poynter from data to storytelling
MROC Japan
 
Ray poynter trends in presenting
Ray poynter trends in presentingRay poynter trends in presenting
Ray poynter trends in presenting
MROC Japan
 
Jmrx 時系列データを用いた広告効果測定の実際20150529公開版
Jmrx 時系列データを用いた広告効果測定の実際20150529公開版Jmrx 時系列データを用いた広告効果測定の実際20150529公開版
Jmrx 時系列データを用いた広告効果測定の実際20150529公開版
MROC Japan
 
Ray poynter big data and advanced analytics
Ray poynter big data and advanced analyticsRay poynter big data and advanced analytics
Ray poynter big data and advanced analytics
MROC Japan
 
Ray poynter what is hot in market research
Ray poynter what is hot in market researchRay poynter what is hot in market research
Ray poynter what is hot in market researchMROC Japan
 
20150319 jmrx 50th_behavioural_economics_v2_kokai
20150319 jmrx 50th_behavioural_economics_v2_kokai20150319 jmrx 50th_behavioural_economics_v2_kokai
20150319 jmrx 50th_behavioural_economics_v2_kokai
MROC Japan
 
Jmrx2014年12月
Jmrx2014年12月Jmrx2014年12月
Jmrx2014年12月MROC Japan
 
Iiexsydneyflier
IiexsydneyflierIiexsydneyflier
IiexsydneyflierMROC Japan
 
Esomar a pac
Esomar a pacEsomar a pac
Esomar a pac
MROC Japan
 
Jmrx20140910
Jmrx20140910Jmrx20140910
Jmrx20140910
MROC Japan
 
The latest trends in mobile market research
The latest trends in mobile market researchThe latest trends in mobile market research
The latest trends in mobile market researchMROC Japan
 

More from MROC Japan (20)

Jmrx esomar-apac2017 report 061
Jmrx esomar-apac2017 report 061Jmrx esomar-apac2017 report 061
Jmrx esomar-apac2017 report 061
 
オンライン定性調査の現在と未来
オンライン定性調査の現在と未来オンライン定性調査の現在と未来
オンライン定性調査の現在と未来
 
How to-market-research-webinar jmrx63
How to-market-research-webinar jmrx63How to-market-research-webinar jmrx63
How to-market-research-webinar jmrx63
 
Jmrx grit sneak peek v1
Jmrx   grit sneak peek v1Jmrx   grit sneak peek v1
Jmrx grit sneak peek v1
 
mr and the rise of the machines
mr and the rise of the machinesmr and the rise of the machines
mr and the rise of the machines
 
Finding the story qualitative
Finding the story   qualitativeFinding the story   qualitative
Finding the story qualitative
 
Ray poynter from data to storytelling
Ray poynter from data to storytellingRay poynter from data to storytelling
Ray poynter from data to storytelling
 
Ray poynter trends in presenting
Ray poynter trends in presentingRay poynter trends in presenting
Ray poynter trends in presenting
 
Jmrx 時系列データを用いた広告効果測定の実際20150529公開版
Jmrx 時系列データを用いた広告効果測定の実際20150529公開版Jmrx 時系列データを用いた広告効果測定の実際20150529公開版
Jmrx 時系列データを用いた広告効果測定の実際20150529公開版
 
Ray poynter big data and advanced analytics
Ray poynter big data and advanced analyticsRay poynter big data and advanced analytics
Ray poynter big data and advanced analytics
 
Ray poynter what is hot in market research
Ray poynter what is hot in market researchRay poynter what is hot in market research
Ray poynter what is hot in market research
 
20150319 jmrx 50th_behavioural_economics_v2_kokai
20150319 jmrx 50th_behavioural_economics_v2_kokai20150319 jmrx 50th_behavioural_economics_v2_kokai
20150319 jmrx 50th_behavioural_economics_v2_kokai
 
Jmrx 141217
Jmrx 141217Jmrx 141217
Jmrx 141217
 
Jmrx2014年12月
Jmrx2014年12月Jmrx2014年12月
Jmrx2014年12月
 
Iiexsydneyflier
IiexsydneyflierIiexsydneyflier
Iiexsydneyflier
 
Esomar a pac
Esomar a pacEsomar a pac
Esomar a pac
 
Jmrx20140910
Jmrx20140910Jmrx20140910
Jmrx20140910
 
The latest trends in mobile market research
The latest trends in mobile market researchThe latest trends in mobile market research
The latest trends in mobile market research
 
Jmrx2
Jmrx2Jmrx2
Jmrx2
 
Ushido
UshidoUshido
Ushido
 

図解入門最新マーケティング・リサーチがよーくわかる本(6)