傾向スコア(プロペンシティスコア)を使って2群を比較する方法

前回の記事では、傾向スコアマッチング(プロペンシティスコアマッチング)について解説しました。

傾向スコアマッチング(プロペンシティスコアマッチング)の基本的な手順を解説

傾向スコアマッチング(プロペンシティスコアマッチング)はどういうときに使うのか、そしてどういう手順でマッチングさせていくのかについて解説します。ランダム化と同…

今回はその続きとして、傾向スコアを使って2群を比較する方法について紹介します。マッチングさせて解析する方法と、マッチングさせずに解析する方法がありますので、それぞれを見ていきます。

マッチングさせてから解析する

前回の記事では、バイアス(A1〜A5)を除いた二つのXグループ(講座を受講した・受講していない)を作るところまで解説しました。この二つのグループ間で、目的とする効果Yに有意な差があるかどうかを調べます。今回の例では、Yは二値(生活習慣が変わった・変わらなかった)の名義尺度なので、カイ二乗検定を行います(サンプル数が少ないときは、フィッシャーの正確検定になります)。

ちなみに、Yが連続尺度のときは、スチューデントのt検定(正規性を仮定できるとき)やマン・ホイットニーのU検定(正規性を仮定できないとき)を行います。

カイ二乗検定の結果を図1に示します。p値が0.05より大きいことから、XとYに有意な関連性はないことが分かりました。つまり、講座の受講(X)と生活習慣の変化(Y)は関係がないということです。

図1 傾向スコアマッチング後にカイ二乗検定を行った結果

マッチングさせずに解析する

前回の記事では傾向スコアマッチングを取り上げたので、まずはマッチングしてから解析する方法を書きましたが、マッチングさせずに2群を比較することもできます。

というのも、マッチングさせるデメリットの一つとして、サンプル数が減ってしまうことが挙げられます。うまくマッチングしなかったデータは、その後の群間比較に使われません。そこでマッチングを行わず、傾向スコアをうまく利用することによって、バイアスを除いた群間比較を行うこともできます。ここでは二つの方法を挙げておきます。

(1)層別解析

傾向スコアを使って全サンプルをいくつかの層に分け、各層について二つのXグループ間でYを比較します。例えば、傾向スコア0〜0.25、0.25〜0.50、0.50〜0.75、0.75〜1.0の4つの層に分けることで、傾向スコアが似たサンプル同士を比較することができます。

ただし、傾向スコアが高い層にはXが1のサンプルが多く入っていますし、傾向スコアが低い層にはXが0のサンプルが多く入っています。そのため、2群間でサンプル数が異なってしまうのが欠点です。

(2)回帰モデル

回帰モデルは、マッチングをせずに、層にも分けずに解析する方法です。Xと傾向スコアを説明変数、Yを目的変数として回帰モデルを作成します。今回のデータについて、回帰モデルで解析してみると図2のようになりました。

回帰式全体のp値が0.0017、係数のp値が0.0191であることから、X(講座の受講)とY(生活習慣の変化)は有意に関連していると言えます。

図2 傾向スコアを使って回帰モデルを作成した結果

傾向スコアマッチング後にカイ二乗検定を行ったときは、XとYに有意な関連性が見られませんでしたが、マッチングせずに回帰モデルで検定すると有意な関連性が見つかりました。なぜこのようなことが起こるかというと、理由は2つ考えられます。

一つはサンプル数の問題です。今回のデータ全体のサンプル数は181でしたが、傾向スコアマッチングすることで84まで減ってしまいました。サンプル数が減ると検出力が低下するので、2群間で有意差が出にくくなってしまいます。

もう一つは解析方法の違いです。カイ二乗検定ではXとYの情報だけでその関連性を探るのに対し、回帰モデルではXと傾向スコアの情報から、XとYの関連性を探ります。そのため、(今回はたまたまかもしれませんが)回帰モデルだけが有意な関連性を検出したのだと思います。

まとめ

今回は傾向スコアを使った2群の比較について解説しました。傾向スコアマッチングはバイアスを除くには便利な方法ですが、傾向スコアを算出しても必ずしもマッチングさせる必要はありません。マッチングさせるとデータ数が減ってしまうからです。自分のデータの状況を見ながら、マッチングさせるかどうか考えてみましょう。

傾向スコアマッチング(プロペンシティスコアマッチング)の基本的な手順を解説

傾向スコアマッチング(プロペンシティスコアマッチング)はどういうときに使うのか、そしてどういう手順でマッチングさせていくのかについて解説します。ランダム化と同…

この記事を書いた人

田中泰章 博士

Yasuaki Tanaka Ph.D.

プロフィール
環境問題や教育制度などについて広い視点から考える自然科学者。2008年に東京大学大学院で博士号(環境学)を取得した後、東京大学、琉球大学、米国オハイオ州立大学、ブルネイ大学など、国内外の大学で研究と教育に約15年間携わってきました。これまでに30報以上の学術論文を筆頭著者として執筆し、国際的な科学雑誌の査読者として多数の論文審査も行っています。

アカデミックラウンジでは、
論文の作成やデータ解析、
研究計画などに関する
ご相談を承っております。

サービス案内

統計解析サービス

データ可視化サービス

論文/レポート添削サービス

小論文添削サービス

日本語論文校正サービス

論文投稿相談サービス

論文作成講座

大学院入試対策講座