アンケート調査結果の統計解析:2つの質問に注目する
前回の記事では、アンケート調査の結果を分析する最初のステップとして、「質問ごとに回答結果を整理する」ということを解説しました。
今回の記事では、2つの質問の回答に注目して、その関連性を統計学的に調べる方法についてまとめます。質問の回答データが、名義尺度・順序尺度・数量データ(間隔尺度・比例尺度)のどれに該当するかによって解析方法や作成するグラフの種類が変わってきますので、データタイプを分類しながらまとめていきます。
名義尺度・順序尺度・数量データ(間隔尺度・比例尺度)については、こちらの記事をご覧ください。
名義尺度と名義尺度
名義尺度と名義尺度の回答ペアが得られるのは、例えば次のような質問の場合です。
- 質問1. あなたの性別は?(男・女)
- 質問2. 商品Aについてどう思いますか?(好き・嫌い)
質問1も質問2も、名義尺度の回答です。性別と商品Aの好き・嫌いの関連性を調べるためには、まず性別ごとに「好き」「嫌い」と答えた人数をクロス集計表(分割表)にまとめます。そして、「好き」「嫌い」と答えた人の割合が性別によって有意に異なるかどうかを、カイ二乗検定(あるいはフィッシャーの正確確率検定)で解析します。
次のように、同じ人に複数回のアンケート調査を行い、回答の変化を調べたい場合はマクネマー検定を行います。
- 授業前:Aという意見についてどう思いますか?(賛成・反対)
- 授業後:Aという意見についてどう思いますか?(賛成・反対)
グラフを作ってデータを視覚化したい場合、各選択肢を選んだ人数の割合を示す、帯グラフが良いでしょう。
名義尺度と順序尺度
名義尺度と順序尺度の回答ペアが得られるのは、例えば次のような質問の場合です。
- 質問1. あなたの性別は?(男・女)
- 質問2. 商品Aの満足度は?(1非常に不満・2不満・3普通・4満足・5非常に満足)
性別と満足度の関連性を調べるためには、まず性別ごとに各満足度を選択した人数をクロス集計表にまとめます。性別によって回答傾向が異なるかどうかを知りたいわけですが、満足度という順序尺度に対して正規分布を仮定することはできないので、性別間の有意差を調べるにはマン・ホイットニのU検定(ウィルコクソンの順位和検定)を行うと良いでしょう。
次のように比較するグループが3群以上ある場合は、クラスカル・ウォリス検定を行います。
- 質問1. あなたの年齢層は?(20代・30代・40代)
- 質問2. 商品Aの満足度は?(1非常に不満・2不満・3普通・4満足・5非常に満足)
データの視覚化についてですが、満足度のような順序尺度をグラフで表したい場合は、箱ひげ図はふさわしくありません。最大値や最小値が決まっているので(上記の場合は、それぞれ5と1)、比較するグループ間でひげの長さがほとんど同じになってしまうことが多いからです。各選択肢を選んだ人数の割合を示す、帯グラフのほうが良いでしょう。
名義尺度と数量データ
名義尺度と数量データの回答ペアが得られるのは、例えば次のような質問の場合です。
- 質問1. あなたの性別は?(男・女)
- 質問2. あなたの身長は?(・・・cm)
性別と身長の関連性を調べるためには、性別ごとに身長データをまとめ、男性と女性を比較します。データが正規分布している場合は、平均値や標準偏差を示す棒グラフを作成し、スチューデントのt検定で性別間の有意差を調べます。正規分布していない場合は、箱ひげ図で中央値や四分位範囲を示し、マン・ホイットニのU検定(ウィルコクソンの順位和検定)で性別間の有意差を検定します。
質問1では選択肢の数が2つ(男・女)だけですが、選択肢の数が3つ以上の場合は、一元配置の分散分析やクラスカル・ウォリス検定を行います。
順序尺度と順序尺度
順序尺度と順序尺度の回答ペアは、例えば次のような質問から得られます。
- 質問1. 商品Aの満足度は?(1非常に不満・2不満・3普通・4満足・5非常に満足)
- 質問2. 商品Bの満足度は?(1非常に不満・2不満・3普通・4満足・5非常に満足)
商品Aの満足度とBの満足度の関連性を調べるためには、まず各選択肢を選んだ人数をクロス集計表にまとめます。データを可視化するためには、散布図を応用したバブルチャートが良いでしょう。
そして、二つの質問の回答結果に相関があるかどうか(増加傾向か減少傾向か)を調べるために、スピアマン(あるいはケンドール)の順位相関分析を行います。
数量データと順序尺度
数量データと順序尺度の回答ペアは、例えば次のような質問から得られます。
- 質問1. あなたの身長は?(・・・cm)
- 質問2. 商品Aの満足度は?(1非常に不満・2不満・3普通・4満足・5非常に満足)
身長と商品Aの満足度の間に関連性があるかどうか調べるには、まず身長をx軸(説明変数)、商品Aの満足度をy軸(目的変数)として散布図を描き、両者の関係を可視化します。相関がある(増加傾向あるいは減少傾向)と思えば、スピアマン(あるいはケンドール)の順位相関分析を行い、統計学的に検証します。
数量データと順序尺度の関係が逆だったらどうでしょうか?例えば次のような質問の場合です。
- 質問1. 卵をどれくらい食べますか?(1. 食べない、2. 毎日1個、3. 毎日2個以上)
- 質問2. あなたの身長は?(・・・cm)
質問1は、個数を3つのカテゴリーに分類した順序尺度です(個数を数字で記入してもらえば数量データになります)。食べている卵の個数と身長の間に関連性があるかどうか調べたいケースですが、この場合もやはり、まずは散布図を描いて全体の傾向を視覚的に把握し、その後でスピアマン(あるいはケンドール)の順位相関分析を行います。
数量データと数量データ
数量データと数量データの回答ペアは、例えば次のような質問から得られます。
- 質問1. あなたの身長は?(・・・cm)
- 質問2. あなたの靴のサイズは?(・・・cm)
身長と靴のサイズの関連性を調べるためには、一方をx軸(説明変数)、もう一方をy軸(目的変数)としてまずは散布図を描き、両者の関係を可視化します。直線的に増加する傾向が見られる場合は単回帰分析、直線的ではないけども単調に増加・減少している傾向が見られるならスピアマン(あるいはケンドール)の順位相関分析を行います。
ただし、回帰分析を行う際は、残差の正規性や等分散性などの条件を満たす必要があり、この辺りについては別の記事にまとめたいと思います。
まとめ
今回の記事では、二つのアンケート質問に対する回答結果を統計学的に解析する方法をまとめました。統計解析は自分の仮説を検証する作業なので、アンケート質問がどんな回答形式だとしても、まずは結果を集計表にまとめたり、グラフを作成したりして、回答データの傾向を把握することが大切です。傾向を把握すると仮説が立てやすくなり、どんな統計解析を行えば良いのか明確になるでしょう。
この記事を書いた人
田中泰章 博士
Yasuaki Tanaka Ph.D.
プロフィール
環境問題や教育制度などについて広い視点から考える自然科学者。2008年に東京大学大学院で博士号(環境学)を取得した後、東京大学、琉球大学、米国オハイオ州立大学、ブルネイ大学など、国内外の大学で研究と教育に約15年間携わってきました。これまでに30報以上の学術論文を筆頭著者として執筆し、国際的な科学雑誌の査読者として多数の論文審査も行っています。
アカデミックラウンジでは、
論文の作成やデータ解析、
研究計画などに関する
ご相談を承っております。
サービス案内
お問い合わせ
お見積もりやサービス内容へのご質問など、
お気軽にお問い合わせください。
contact@academiclounge.jp