3群以上を比較するノンパラメトリック統計解析
前回の記事では、2つのグループを比較するための統計解析について解説しました。
今回(そして次回)は、3つ以上のグループを比較するための統計解析について見ていきます。
名義尺度や順序尺度を統計解析する場合、あるいは数量データでも正規分布を仮定できない場合は、データをランキング化して解析する、いわゆるノンパラメトリックな解析を行います。それに対し、正規分布を仮定できるデータの場合はパラメトリックな解析になり、解析方法が大きく変わってきます。
そこで今回は前者(ノンパラメトリックな解析)に焦点を当て、後者(パラメトリックな解析)については次回の記事でまとめたいと思います。
名義尺度、順序尺度、正規分布を仮定できない数量データ
→ ノンパラメトリックな解析
正規分布を仮定できる数量データ
→ パラメトリックな解析
名義尺度で3グループ以上が独立しているとき
例えば次のようなケースを考えます。
20代から40代の人、それぞれ50人ずつ(計150人)にアンケート質問をして、ある考え方について「賛成」「どちらでもない」「反対」の中から選んで回答してもらいました。この調査の結果、回答者の人数は次のような3×3のクロス集計表(分割表)にまとめることができます。年代が上がるにつれて反対する人の割合が増えているように見えますが、年代と意見の間には関係があると言えるでしょうか?
年代 | 賛成 | どちらでもない | 反対 |
---|---|---|---|
20代 | 31 | 12 | 7 |
30代 | 29 | 11 | 10 |
40代 | 22 | 8 | 20 |
「20代」「30代」「40代」は異なる人たちですから、独立した3つのグループを比較することになります。このようなデータの解析では、2×2集計表の場合と同じく、カイ二乗検定またはフィッシャー(Fisher)の正確確率検定(直接法、直接確率検定)を行います。
検定を行った結果、p=0.041という結果が得られましたので、「年代間で意見に差がある」と言えます。
さらにどの年代間で差があるのか調べたいときは、比較するグループだけを取り出した2×2のクロス集計表(分割表)を作り、再度カイ二乗検定やフィッシャーの正確確率検定を行います。
今回は「20代」「30代」「40代」すべて50人ずつに設定しましたが、人数(サンプル数)はグループ間で異なっても構いません。
名義尺度で3グループ以上が対応しているとき
30人の社員を対象にして、研修会の前、直後、そして1年後にアンケート調査を行いました。ある考え方について「賛成」と答えた人数、「反対」と答えた人数を調べたところ、次のようなクロス集計表が得られたとします。時期によって回答者の考え方に変化があったと言えるでしょうか?
時期 | 賛成 | 反対 |
---|---|---|
研修会の前 | 25 | 5 |
研修会の直後 | 15 | 15 |
研修会の1年後 | 19 | 11 |
上の表は次のようなデータがもとになっています。
回答者 | 研修会の前 | 研修会の直後 | 研修会の1年後 |
---|---|---|---|
回答者1 | 賛成 | 反対 | 反対 |
回答者2 | 賛成 | 反対 | 賛成 |
回答者3 | 反対 | 反対 | 反対 |
回答者4 | 賛成 | 賛成 | 反対 |
回答者5 | 賛成 | 反対 | 賛成 |
(続く) |
この調査では、毎回同じ人が質問に回答しているので、「研修会の前」「研修会の直後」「研修会の1年後」という3つのグループ(それぞれ30人ずつ)は「対応している」と考えられます。このような対応している3つ以上のグループ間で、2値データを比較するときは、コクラン(Cochran)のQ検定を使用します。
2値データとは、「はい・いいえ」「ある・ない」「賛成・反対」「男性・女性」のように、2つの結果しかないデータです。
コクランのQ検定で有意と判定されると、「すべてのグループが同じとは言えない」、つまり「グループ間に差がある」と言えますが、どのグループ間に差があるのかまでは分かりません。どのグループ間に差があるのか知りたいときは、前回の記事で紹介した、マクネマー(McNemar)検定を行うことになります。
2値データではなく、「はい・どちらとも言えない・いいえ」のように3つ以上の選択肢がある場合は、各選択肢に「3・2・1」のような番号を振ることによってデータを順序尺度として扱い、後述するフリードマン(Friedman)検定を行います。
順序尺度で3グループ以上が独立しているとき
ある会社でAサービス、Bサービス、Cサービスの顧客満足度を、次の5段階でアンケート調査し、3つのサービスを比較したいとします。
- 非常に満足
- 満足
- 普通
- 不満
- 非常に不満
各サービスの利用者は同じではなく、例えばAサービスしか利用していない人や、Bサービスしか利用していない人も大勢います。アンケートの結果、次のような人数分布が得られました。サービスによって顧客満足度が異なると言えるでしょうか?
満足度 | Aサービス | Bサービス | Cサービス |
---|---|---|---|
5. 非常に満足 | 15 | 12 | 10 |
4. 満足 | 48 | 52 | 36 |
3. 普通 | 19 | 23 | 25 |
2. 不満 | 11 | 10 | 18 |
1. 非常に不満 | 3 | 5 | 7 |
集計表のもとになっているデータは、次のような形式で表すことができます。
回答者 | 利用サービス | 満足度 |
---|---|---|
回答者1 | Aサービス | 5. 非常に満足 |
回答者2 | Aサービス | 4. 満足 |
回答者3 | Cサービス | 2. 不満 |
回答者4 | Bサービス | 4. 満足 |
回答者5 | Bサービス | 5. 非常に満足 |
(続く) |
ここではAサービスについて回答した人のグループ、Bサービスについて回答した人のグループ、Cサービスについて回答した人のグループは同じではないため、独立した(異なる)3つのグループ(回答者)の比較となります。各グループの回答者数は同じでなくても構いません。
このように、独立した3つ以上のグループ間で順序尺度を比較するときは、クラスカル・ウォリス(Kruskal-Wallis)検定を行います。
クラスカル・ウォリス検定で「有意」と判定されれば、すべてのグループが同じではない、つまり「グループ間に差がある」と言えます。しかし、どのグループ間に差があるのかということまでは分かりません。どのグループ間に差があるのか調べるためには、スティール・ドゥアス(Steel-Dwass)検定、あるいはスティール(Steel)検定を行います。
スティール・ドゥアス検定は、すべてのグループ間を比較する方法です。上の例で言えば、Aサービス対Bサービス、Aサービス対Cサービス、Bサービス対Cサービスの比較です。
スティール検定では、特定の対照群とそれ以外のグループを比較します。上の例でAサービスを対照群とすると、Aサービス対Bサービス、Aサービス対Cサービスの比較です。
数量データで正規分布が仮定できないような3つ以上のグループを比較するときも、各グループが独立していれば、これらの方法を利用します。
順序尺度で3グループ以上が対応しているとき
先ほどと同じように、ある会社でAサービス、Bサービス、Cサービスの顧客満足度を次の5段階でアンケート調査し、3つのサービスを比較したいとします。
- 非常に満足
- 満足
- 普通
- 不満
- 非常に不満
ただし、今回はAサービス、Bサービス、Cサービスをすべて利用している人を対象にして調査を行い、その結果、次のような人数分布が得られたとします。サービスによって顧客満足度が異なると言えるでしょうか?
満足度 | Aサービス | Bサービス | Cサービス |
---|---|---|---|
5. 非常に満足 | 15 | 10 | 10 |
4. 満足 | 48 | 52 | 40 |
3. 普通 | 21 | 23 | 25 |
2. 不満 | 13 | 10 | 18 |
1. 非常に不満 | 3 | 5 | 7 |
集計表のもとになっているデータは次のような形式で表せます。各回答者がすべてのサービスを利用しているというのがポイントです。
回答者 | Aサービス | Bサービス | Cサービス |
---|---|---|---|
回答者1 | 4. 満足 | 5. 非常に満足 | 3. 普通 |
回答者2 | 5. 非常に満足 | 4. 満足 | 3. 普通 |
回答者3 | 3. 普通 | 3. 普通 | 4. 満足 |
回答者4 | 4. 満足 | 4. 満足 | 3. 普通 |
回答者5 | 4. 満足 | 3. 普通 | 2. 不満 |
(続く) |
ここではAサービスについて回答した人のグループ、Bサービスについて回答した人のグループ、Cサービスについて回答した人のグループは全く同じなので、対応する3つのグループの比較となります。
このように、対応した3つ以上のグループ間で順序尺度を比較するときは、フリードマン(Friedmann)検定を行います。
フリードマン検定で有意と判定されると、「すべてのグループが同じとは言えない」、つまり「グループ間に差がある」と言えますが、どのグループ間に差があるのかまでは分かりません。どのグループ間に差があるのか知りたいときは、前回の記事で紹介した、ウィルコクソン(Wilcoxon)の符号付順位和検定を行うことになります。
数量データで正規分布が仮定できないような3つ以上のグループを比較するときも、各グループが対応していれば、これらの方法を利用します。
まとめ
以上が3つ以上のグループを比較するためのノンパラメトリックな解析方法でした。どのケースでも、まずは全体を対象としてグループ間に差があるかどうかを調べ、差があると分かれば、具体的にどのグループとどのグループの間に差があるのか調べています(事後検定)。事後検定では多重性の問題が生じるため、有意水準(p値)を厳しめに設定しなければなりませんが、この辺りについては別の記事でまとめたいと思います。
前回の2群の比較と合わせて系統図にまとめると、次のようになります。
次回は、3群以上のパラメトリックな解析についてまとめてみたいと思います。
<参考文献>
田久浩志(2019)『統計解析なんかこわくない−データ整理から学会発表まで』、医学書院
内田治(2022)『アンケート調査の計画と解析』、日科技連出版
この記事を書いた人
田中泰章 博士
Yasuaki Tanaka Ph.D.
プロフィール
環境問題や教育制度などについて広い視点から考える自然科学者。2008年に東京大学大学院で博士号(環境学)を取得した後、東京大学、琉球大学、米国オハイオ州立大学、ブルネイ大学など、国内外の大学で研究と教育に約15年間携わってきました。これまでに30報以上の学術論文を筆頭著者として執筆し、国際的な科学雑誌の査読者として多数の論文審査も行っています。
アカデミックラウンジでは、
論文の作成やデータ解析、
研究計画などに関する
ご相談を承っております。
サービス案内
お問い合わせ
お見積もりやサービス内容へのご質問など、
お気軽にお問い合わせください。
contact@academiclounge.jp