マーケティングリサーチについての情報発信を早くから行っており、今もfacebookでの情報発信を活発に続けられている、「マーケティングリサーチの寺子屋」の鈴木敦詞氏より、「マーケティングリサーチの基礎」というテーマで全4回で連載を行ないます。第三回は分析の考え方をご紹介します。
“Garbage in , Garbage out”ということ
分析を考える際に、まず覚えておきたい言葉があります。それは、“Garbage in , Garbage out”=「ゴミを入れても、ゴミしか得られない」、分析への戒めを示す言葉です。たとえば、「多変量解析をすれば何か出てくるだろう」とか、「多変量解析をして、なんかかっこいいアウトプットを作りたい」などという話を聞くことも少なくありません。しかし、ゴミみたいなデータで分析をしても、ゴミのような結果、つまり役に立たない結果しか得られないというこの言葉の教訓は、多変量解析はもちろんのこと、どんな分析においても、すべからく当てはまります。分析は無から有を導き出す魔法の箱ではないのです。
前回の設計の考え方にもつながるのですが、分析は設計の段階から始まっているといっても過言ではありません。データによってアウトプットは制約を受け、できる分析も限られてきます。そこで、分析の基本的なフローを確認していきます。
まずは、分析の目的(これはリサーチの目的、課題とも重なります)やアウトプットのイメージを固めることが重要です。分析の目的やアウトプットによって、必要とするデータ項目や分析手法が決まりますし、分析手法が決まれば必要なデータ形式も決まってきます。これは設計のところでも述べていますが、リサーチを行う上では忘れてはいけないポイントになりますので、繰り返しておきます。
ついで、目的、アウトプットにあわせてデータを収集します。ここで注意したいのは、データを収集しても、すぐには集計・分析に入ることはできないということです。必ず、データの背景やデータの状況を確認します。どんなに設計がしっかりしていても、データが意図通りに完璧に集まることは少ないでしょう。そこで、集まったデータがどのような背景を持つデータなのかを確認するのが、第一歩になります。また、分析に影響を与える値、異常値や欠損値がないかを確認するのがつぎのステップです。そして、異常値や欠損値と思われるデータをどのように扱うのかについても、データの性格を考えながら決めていかなければなりません。このステップを疎かにすると、アウトプットが出た後で、結果のおかしさに気づき最初から集計・分析をやり直すことになったり、結果の解釈を誤ることにつながります。
この過程を経て、分析に使うデータがゴミではなくなります。データを、宝を生み出す原石にするには、それなりの準備や過程が必要なのです。
分析のステップへ
データの確認とクリーニングが終わると、集計・分析に進みます。このときにも、いきなり多変量解析のような高次の分析に進むのではなく、順を追ってステップを踏んでいくことが大切です。
まずは単純集計(GT集計)で全体の概要をつかむことから始めるのが基本です。今回確認したいテーマは、どのような結果になっているのかについて、大枠で確認します。たとえば、評価テストでしたらプラス評価とマイナス評価の分布がどうなっているのか、ポジショニングでしたら各商品の基本的なイメージはどんな構造になっているのか、クラスター分析でしたら分類の基礎になる価値観や意識がどのような構造になっているのか、などを確認します。この過程を踏むことで、今一度、データの背景や状況を確認することができますし、これから進める分析の方向性やアウトプットについてのイメージを掴むことができます。
単純集計で概要を掴んだら、クロス集計に進みます。クロス集計は、データをあるグループにわけて結果を見たときに、そこにどのような差異があるのかを確認するための集計です。たとえば、評価の差は、どのようなグループ(年代の差、商品ロイヤリティによる差、健康意識による差など)で差があるのかを、仮説やマーケティング課題などに従って確認していきます。この時に意識しないといけないのは「原因と結果」についてです。基本となるのは、原因と思われる項目で、ブレイクダウンすることです。たとえば、「○○によって、××の評価に差がある」という仮説がある場合は、「○○」が原因ということになり、「○○」にあたる項目でブレイクダウンすることが必要になります。
クロス集計を終えると、今回のリサーチ結果の方向性が見えてきます。そこで、さらにリサーチテーマの核心に迫るための分析、次につながる知見を得るための分析へと進みます。このような結果になった真の原因は何か、つぎの施策につながるポイントはどこにあるのか、全体の構造をもっとわかりやすく説明できないか、2つの項目間だけでは見逃してしまう要因はないのか、などといったテーマについて、分析の深堀を行っていきます。この時に役立つのが、多変量解析です。多変量解析については多くの手法があり、ここで個別の手法について説明をすることはできません。それに、すべての手法を理解する必要はないとも言えます。「何をしたいのか」「どのようなことを明らかにしたいのか」が明確になっていれば、その目的に合う手法の選択や設計時の注意点はプロであるリサーチャーに委ねればいいでしょう。(コレクシアの分析手法一覧)
結果の解釈には統計の基本が大切
データ集計・分析が終わると、結果を解釈しなければなりません。この時にも、いくつかの注意点があります。
まず、統計の基本を理解しておくことが必須です。平均値、標準偏差、相関係数など、よくお目にかかる値については、それがどのような値で、読み取りの際にどのような注意が必要なのかを理解しておくことが大切です。また%についても、その%が、どのような計算で求められたのか、分母にあたる数字は何か、について意識をしないと、数字の読み取りを誤ることになります。「平均や%なんて、小学生でも知っているよ」と言う人も少なくないですが、そんなに簡単な値ではありません。もう一度、基礎を確認しておくことが大切でしょう。
さらに、クロス集計も単純に読むことができないことがあります。2つのクロス表の結果を結び付けて、安易にひとつの結論を導く例も見受けられますが、これは基本的にNGです。たとえば、つぎのような例です。
この2つの表を見ると、性別では女性で、年齢では35歳未満で使用率が高いので、「商品Aの使用率は、女性の35歳未満で高い」と言いたくなります。しかし、このように2つの結果を単純に「かつ」で結び付けて結論を導くのは誤りです。この場合、性別×年齢という新たなブレイクダウンを用いて集計をしてみることが必要です。今回は、つぎのようになりました。
結果は、男性でも35歳未満では高い使用率ですし、女性の35歳以上でも使用率が高いです。つまり、「男性の35歳以上を除く属性で使用率が高い」ということになります。
また、ある商品を受容する人としない人のクロス集計をして、差がある属性を確認し、ターゲット像を探る場合があります。この場合も、得られた結果の属性が単純にターゲットを示すとは限りません。なぜなら、ぞれぞれの属性間の関連性によって、見かけ上の重要属性としてピックアップされる場合もあるからです。この事例については、こちらに詳しい解説がありますので参考にしてください。この事例をみるとわかるように、多くの変数を扱う場合は、多変量解析を活用することで、よりクリアな結果を得られることが少なくありません。
統計的な結果と実務上の活用のギャップ
このように、分析結果の解釈には統計的な基本を理解しておくことが大切です。しかし、統計的な結果自体を鵜呑みにできない場合もあるので厄介です。たとえば、検定の限界についての問題や、原因と結果の問題があります。
検定は、得られた結果について、真に差があるのかを確認するための作業です。たとえば、商品PとQの評価を行い、商品Pの評価が高いという結果が得られたとしても、ほんとうに商品Pの評価が高いと言えるのか、を確認するためのものです。しかし、検定はサンプルの大きさに影響され、サンプルが大きい場合は差があるという結果が出やすいですし、サンプルが小さいと差があるとはいえないという結果が出やすいです。しかし、大サンプルで行った結果、%の差が1ポイントでも「差がある」という検定結果が出た場合にマーケティングの実務上での差があると判断してもいいのか、逆に小サンプルで行った結果、差が10ポイントでも「差がない」という結果が出た場合に実務上の差がないと判断してもよいのか、という問題が残ります。もちろん、検定で確認することは大切なことですが、その結果を鵜呑みにせずに、実務上の判断も行うことが求められます。
同様に、原因と結果についての難しさもあります。クロス集計や相関係数を求めた結果、2つの変数に関係があるとした場合に、いずれかが原因で、いずれかが結果だと単純に結論づけるのが難しい場合が少なくありません。たとえば、新聞の閲覧状況と選挙での投票行動の関係を調べたとします。新聞を読んでいる人で選挙への投票率が高かったとして、新聞を読むことが投票行動に影響を与えるのか、そもそも投票する=政治への関心が高いから新聞を読むのか、ということを単純に判断することはできません。原因と結果には、相互に依存している場合や、原因と結果の間に別の真の要因がある場合、他の要因が絡んで見かけ上の関係を示している場合、などがあるので、単に「関係があるから」ということで原因と結果を解釈することは慎まなければなりません。
このように、分析結果が得られ、その数値が統計的に正しいものだとしても、実務上の観点から検討を行い、解釈をすることが大切です。結果を単純に読むのではなく、真の要因を探るという姿勢が求められます。また、どんな結果でも、なんらかの理屈で正しい解釈であるかのような読み取り、いわゆる事後解釈の危険性が常にあります。どんな結果でも、一度は疑ってみる、多面的に確認してみるという姿勢も大切です。
市場調査クリニックの最新情報は、「市場調査クリニック Facebookページ」にて、先駆けて情報公開しています。
鈴木 敦詞 (すずき あつし)
<略歴>
りんく考房代表。マーケティングエージェンシーや調査会社を経て、2006年に独立し現在に至る。マーケティングリサーチの研修、企画・分析を手がける傍ら、「マーケティングリサーチの寺子屋」で情報を発信する。日本マーケティングリサーチ協会個人賛助会員。2009年多摩大学大学院修士課程(経営情報学)修了。
鈴木敦詞氏の記事一覧
マーケティングリサーチの寺子屋 インタビュー 第1回 前編
マーケティングリサーチの寺子屋 インタビュー 第1回 後編
マーケティングリサーチの寺子屋 インタビュー 第2回 前編
マーケティングリサーチの寺子屋 インタビュー 第2回 後編
マーケティングリサーチの基礎 第1回 企画を考える
マーケティングリサーチの基礎 第2回 リサーチデザインを考える
マーケティングリサーチの基礎 第3回 分析を考える
マーケティングリサーチの基礎 第4回 報告書を考える