3群以上を比較するパラメトリック統計解析のまとめ

前回の記事では、3群以上を比較するノンパラメトリックな解析について解説しました。

3群以上を比較するノンパラメトリック統計解析のまとめ

3つ以上のグループを比較するためのノンパラメトリックな解析についてまとめます。カイ二乗検定、フィッシャー(Fisher)の正確確率検定(直接法、直接確率検定)、コクラ…

今回は、3群以上を比較するパラメトリックな解析についてまとめてみたいと思います。パラメトリックな解析というのは、正規性が仮定できる数量データについて行います。データの正規性について知りたい方は、まずこちらの記事をご覧ください。

論文を書くための統計解析:データの正規性とは?

計数データ(重さ、長さ、速度、個数など)の統計解析は、基本的にデータが正規分布していることが前提条件となります。グループ間を比較するにしても相関関係を調べるに…

データ解析を大きく二つに分けると

ノンパラメトリックな解析・・・名義尺度、順序尺度、正規分布を仮定できない数量データなどの解析

パラメトリックな解析・・・正規分布を仮定できる数量データの解析

対応のない3群以上の比較

20代、30代、40代、50代の男性をそれぞれ50人ずつ選び、ある測定項目(計量データ)と年代との関係を調べたいケースを想定します。データを集計した結果、次のような平均値と標準偏差でまとめることができたと仮定しましょう。(架空のデータです)

年代測定値標準偏差
20代3.740.53
30代4.161.05
40代5.541.07
50代7.820.83

ここでは、20代・30代・40代・50代の人たちは異なるため、独立した4つのグループ(年齢層)の比較となります。

このようなデータの解析では、一元配置分散分析チューキー(チューキー・クレーマー)検定、ダネット検定などを行います。それぞれについてもう少し詳しく解説します。

一元配置分散分析(ANOVA、analysis of variance)とは、すべてのグループが同じかどうかを調べる方法です。ANOVAで「有意」と判定されると、すべてのグループが同じではない、つまり「グループ間に差がある」と言うことができます。ただし、どのグループとどのグループの間に差があるのかまでは分かりません。そこで次のような多重比較検定を行います。

チューキー(Tukey)検定は、すべてのグループ間を比較する方法です。上の例では、「20代」対「30代」、「20代」対「40代」、「20代」対「50代」、「30代」対「40代」、「30代」対「50代」、「40代」対「50代」という6ペアの比較を行います。チューキー検定では、各グループのサンプル数が同じである必要があります。

チューキー・クレーマー(Tukey-Kramer)検定も同じようにすべてのグループ間を比較する方法ですが、サンプル数がグループ間で異なるときにも使えます。サンプル数が同じ場合、結果はチューキー検定と同じになるので、グループのサンプル数を気にせずに使える方法です。

ダネット(Dunnett)検定は、すべてのグループ間を比較するのではなく、ある特定のグループ(対照群、コントロール)との比較をする方法です。例えば「20代」を対照群とすると、「20代」対「30代」、「20代」対「40代」、「20代」対「50代」という3ペアを比較します。

すべてのグループ間を比較するのか、対照群との比較をするのかについては、研究の目的やデータから主張したいことによって変わってきます。

対応のある3群以上の比較

対応のある3群以上の比較とは、例えば次のような場合です。調査対象者50人に対して、2024年1月、3月、5月、7月の4回、体重を測定してもらいました。冬から夏にかけて体重がどのように変化するのか、傾向を調べたいとします。

調査対象者2024年1月2024年3月2024年5月2024年7月
A63.264.363.561.8
B72.173.273.070.8
C61.962.062.061.5
D58.358.958.558.5
E60.362.161.558.6
(続く)    

ここでは同じ人たちを追跡調査しているため、対応のある4つのグループ(時期)の比較をすることになります。

このような時系列データの解析は、反復測定分散分析(Repeated measures ANOVA)を行います。

通常の一元配置分散分析と同じように、反復測定分散分析ではグループ間に差があるかどうかということは分かりますが、どのグループとどのグループの間に差があるのかということまでは分かりません。そこで事後検定として、ボンフェローニ(Bonferroni)法やホルム(Holm)法などで多重比較を行います。

まとめ

以上が、3群以上のパラメトリックデータを比較する代表的な解析方法です。前回までに作成してきた系統図に追加すると次のようになります。

すべての解析方法を網羅しているわけではありませんが、論文でよく登場する基本的な手法になりますので、困ったときは参考にしてみてください。

この記事を書いた人

田中泰章 博士

Yasuaki Tanaka Ph.D.

プロフィール
環境問題や教育制度などについて広い視点から考える自然科学者。2008年に東京大学大学院で博士号(環境学)を取得した後、東京大学、琉球大学、米国オハイオ州立大学、ブルネイ大学など、国内外の大学で研究と教育に約15年間携わってきました。これまでに30報以上の学術論文を筆頭著者として執筆し、国際的な科学雑誌の査読者として多数の論文審査も行っています。