3群以上を比較するノンパラメトリック統計解析のまとめ

前回の記事では、2つのグループを比較するための統計解析について解説しました。

論文を書くための統計解析:2つのグループを比較するには?

論文やレポートを書くときに最もよく使われる統計解析は、2つのグループの比較です。「2つのグループを比較したい、でもどんな統計解析をすればいいのか分からない」とい…

今回(そして次回)は、3つ以上のグループを比較するための統計解析について見ていきます。

名義尺度や順序尺度を統計解析する場合、あるいは数量データでも正規分布を仮定できない場合は、データをランキング化して解析する、いわゆるノンパラメトリックな解析を行います。それに対し、正規分布を仮定できるデータの場合はパラメトリックな解析になり、解析方法が大きく変わってきます。

そこで今回は前者(ノンパラメトリックな解析)に焦点を当て、後者(パラメトリックな解析)については次回の記事でまとめたいと思います。

名義尺度、順序尺度、正規分布を仮定できない数量データ
→ ノンパラメトリックな解析
正規分布を仮定できる数量データ
→ パラメトリックな解析

名義尺度で3グループ以上が独立しているとき

例えば次のようなケースを考えます。

20代から40代の人、それぞれ50人ずつ(計150人)にアンケート質問をして、ある考え方について「賛成」「どちらでもない」「反対」の中から選んで回答してもらいました。この調査の結果、回答者の人数は次のような3×3のクロス集計表(分割表)にまとめることができます。年代が上がるにつれて反対する人の割合が増えているように見えますが、年代と意見の間には関係があると言えるでしょうか?

賛成どちらでもない反対
20代31127
30代291110
40代22820

「20代」「30代」「40代」は異なる人たちですから、独立した3つのグループを比較することになります。このようなデータの解析では、2×2集計表の場合と同じく、カイ二乗検定またはフィッシャー(Fisher)の正確確率検定(直接法、直接確率検定)を行います。

検定を行った結果、p=0.041という結果が得られましたので、「年代間で意見に差がある」と言えます。

さらにどの年代間で差があるのか調べたいときは、比較する年代だけを取り出した2×2のクロス集計表(分割表)を作り、再度カイ二乗検定やフィッシャーの正確確率検定を行います。

今回は「20代」「30代」「40代」すべて50人ずつに設定しましたが、人数(サンプル数)はグループ間で異なっても構いません。

名義尺度で3グループ以上が対応しているとき

30人の社員を対象にして、研修会の前、直後、そして1年後にアンケート調査を行いました。ある考え方について「賛成」と答えた人数、「反対」と答えた人数を調べたところ、次のようなクロス集計表が得られたとします。時期によって回答者の考え方に変化があったと言えるでしょうか?

賛成反対
研修会の前255
研修会の直後1515
研修会の1年後1911

上の表は次のようなデータがもとになっています。

研修会の前研修会の直後研修会の1年後
回答者1賛成反対反対
回答者2賛成反対賛成
回答者3反対反対反対
回答者4賛成賛成反対
回答者5賛成反対賛成
(続く)

この調査では、毎回同じ人が質問に回答しているので、「研修会の前」「研修会の直後」「研修会の1年後」という3つのグループ(それぞれ30人ずつ)は「対応している」と考えられます。このような対応している3つ以上のグループ間で、2値データを比較するときは、コクラン(Cochran)のQ検定を使用します。

2値データとは、「はい・いいえ」「ある・ない」「賛成・反対」「男性・女性」のように、2つの結果しかないデータです。

コクランのQ検定で有意と判定されると、「すべてのグループが同じとは言えない」、つまり「グループ間に差がある」と言えますが、どのグループ間に差があるのかまでは分かりません。どのグループ間に差があるのか知りたいときは、前回の記事で紹介した、マクネマー(McNemar)検定を行うことになります。

論文を書くための統計解析:2つのグループを比較するには?

論文やレポートを書くときに最もよく使われる統計解析は、2つのグループの比較です。「2つのグループを比較したい、でもどんな統計解析をすればいいのか分からない」とい…

2値データではなく、「はい・どちらとも言えない・いいえ」のように3つ以上の選択肢がある場合は、各選択肢に「3・2・1」のような番号を振ることによってデータを順序尺度として扱い、後述するフリードマン(Friedman)検定を行います。

順序尺度で3グループ以上が独立しているとき

ある会社でAサービス、Bサービス、Cサービスの顧客満足度を、次の5段階でアンケート調査し、3つのサービスを比較したいとします。

  1. 非常に満足
  2. 満足
  3. 普通
  4. 不満
  5. 非常に不満

各サービスの利用者は同じではなく、例えばAサービスしか利用していない人や、Bサービスしか利用していない人も大勢います。アンケートの結果、次のような人数分布が得られました。サービスによって顧客満足度が異なると言えるでしょうか?

AサービスBサービスCサービス
5. 非常に満足151210
4. 満足485236
3. 普通192325
2. 不満111018
1. 非常に不満357
(続く)

集計表のもとになっているデータは、次のような形式で表すことができます。

利用サービス回答結果
回答者1Aサービス5. 非常に満足
回答者2Aサービス4. 満足
回答者3Cサービス2. 不満
回答者4Bサービス4. 満足
回答者5Bサービス3. 普通
(続く)

ここではAサービスについて回答した人のグループ、Bサービスについて回答した人のグループ、Cサービスについて回答した人のグループは同じではないため、独立した(異なる)3つのグループ(回答者)の比較となります。各グループの回答者数は同じでなくても構いません。

このように、独立した3つ以上のグループ間で順序尺度を比較するときは、クラスカル・ウォリス(Kruskal-Wallis)検定を行います。

クラスカル・ウォリス検定で「有意」と判定されれば、すべてのグループが同じではない、つまり「グループ間に差がある」と言えます。しかし、どのグループ間に差があるのかということまでは分かりません。どのグループ間に差があるのか調べるためには、スティール・ドゥアス(Steel-Dwass)検定、あるいはスティール(Steel)検定を行います。

スティール・ドゥアス検定は、すべてのグループ間を比較する方法です。上の例で言えば、Aサービス対Bサービス、Aサービス対Cサービス、Bサービス対Cサービスの比較です。

スティール検定では、特定の対照群とそれ以外のグループを比較します。上の例でAサービスを対照群とすると、Aサービス対Bサービス、Aサービス対Cサービスの比較です。

数量データで正規分布が仮定できないような3つ以上のグループを比較するときも、各グループが独立していれば、これらの方法を利用します。

順序尺度で3グループ以上が対応しているとき

先ほどと同じように、ある会社でAサービス、Bサービス、Cサービスの顧客満足度を次の5段階でアンケート調査し、3つのサービスを比較したいとします。

  1. 非常に満足
  2. 満足
  3. 普通
  4. 不満
  5. 非常に不満

ただし、今回はAサービス、Bサービス、Cサービスをすべて利用している人を対象にして調査を行い、その結果、次のような人数分布が得られたとします。サービスによって顧客満足度が異なると言えるでしょうか?

AサービスBサービスCサービス
5. 非常に満足151010
4. 満足485240
3. 普通212325
2. 不満131018
1. 非常に不満357
(続く)

集計表のもとになっているデータは次のような形式で表せます。各回答者がすべてのサービスを利用しているというのがポイントです。

AサービスBサービスCサービス
回答者14. 満足5. 非常に満足3. 普通
回答者23. 普通4. 満足3. 普通
回答者33. 普通3. 普通4. 満足
回答者42. 不満4. 満足2. 不満
回答者54. 満足3. 普通1. 非常に不満
(続く)

ここではAサービスについて回答した人のグループ、Bサービスについて回答した人のグループ、Cサービスについて回答した人のグループは全く同じなので、対応する3つのグループの比較となります。

このように、対応した3つ以上のグループ間で順序尺度を比較するときは、フリードマン(Friedmann)検定を行います。

フリードマン検定で有意と判定されると、「すべてのグループが同じとは言えない」、つまり「グループ間に差がある」と言えますが、どのグループ間に差があるのかまでは分かりません。どのグループ間に差があるのか知りたいときは、前回の記事で紹介した、ウィルコクソン(Wilcoxon)の符号付順位和検定を行うことになります。

論文を書くための統計解析:2つのグループを比較するには?

論文やレポートを書くときに最もよく使われる統計解析は、2つのグループの比較です。「2つのグループを比較したい、でもどんな統計解析をすればいいのか分からない」とい…

数量データで正規分布が仮定できないような3つ以上のグループを比較するときも、各グループが対応していれば、これらの方法を利用します。

まとめ

以上が3つ以上のグループを比較するためのノンパラメトリックな解析方法でした。どのケースでも、まずは全体を対象としてグループ間に差があるかどうかを調べ、差があると分かれば、具体的にどのグループとどのグループの間に差があるのか調べています(事後検定)。事後検定では多重性の問題が生じるため、有意水準(p値)を厳しめに設定しなければなりませんが、この辺りについては別の記事でまとめたいと思います。

前回の2群の比較と合わせて系統図にまとめると、次のようになります。

次回は、3群以上のパラメトリックな解析についてまとめてみたいと思います。

<参考文献>
田久浩志(2019)『統計解析なんかこわくない−データ整理から学会発表まで』、医学書院
内田治(2022)『アンケート調査の計画と解析』、日科技連出版

楽天ブックス
¥3,190 (2024/06/23 17:24時点 | 楽天市場調べ)

この記事を書いた人

田中泰章 博士

Yasuaki Tanaka Ph.D.

プロフィール
環境問題や教育制度などについて広い視点から考える自然科学者。2008年に東京大学大学院で博士号(環境学)を取得した後、東京大学、琉球大学、米国オハイオ州立大学、ブルネイ大学など、国内外の大学で研究と教育に約15年間携わってきました。これまでに30報以上の学術論文を筆頭著者として執筆し、国際的な科学雑誌の査読者として多数の論文審査も行っています。