順序ロジスティック回帰分析の基本:データの形式、前提条件、分析結果の解釈

前回は二項ロジスティック回帰分析についてまとめましたが、今回は順序ロジスティック回帰分析を取り上げます。数式や細かい理論は省き、どういうデータの何を知りたいときに順序ロジスティック回帰分析を行うのか、前提条件は何か、分析結果をどのように解釈するのか、などについて解説していきます。

どういうデータ?

順序ロジスティック回帰分析は、目的変数が順序尺度のときに行います。順序尺度なので、正規性や等分散性などの前提条件は求められません。

説明変数は連続データ(数量データ)である必要があるので、順序尺度の場合はデータを連続データとして扱い、名義尺度の場合はダミー変数(0・1)に置き換えます。順序尺度を連続データとして扱うのは統計学的には問題がありますが、実際にはよく行われています。それが許容されるかどうかは分野によりますので、事前に調べておくと良いでしょう。

何を知りたい?

下の表は、ある電化製品についてユーザーの満足度をアンケート調査した結果の例です(『アンケート調査の計画と解析』のデータ表を改変)。「デザイン」や「機能性」、「総合評価」などの各項目について、1:非常に不満、2:不満、3:やや不満、4:中間、5:やや満足、6:満足:7:非常に満足、という7段階の評定尺度で集計しています。

回答者デザイン機能性操作性携帯性持続性総合評価
1753366
2735377
3423243
4211132
5234112
6442644
7144263
8234111
9536634
10434536
11443632
12341243
13654555
14552444
15134212
16374455
17142321
18413744
19367635
20313131
『アンケート調査の計画と解析』内田治、2022年、日科技連

ここで、「総合評価」に最も強く影響している要素は何かを調べたいとき、総合評価を目的変数、それ以外を説明変数として、順序ロジスティック回帰分析を行います。

結果の解釈

上の表のデータを、統計ソフトJMPを使って順序ロジスティック回帰分析した結果を示します。

まず「モデル全体の検定」を見ると、p値が十分に小さい(<0.0001)ので、今回の回帰式が有意である、つまり目的変数を予測・説明するのに役立つと言えます。

次に「パラメータ推定値」(回帰係数の推定値)を見ると、「デザイン」と「持続性」のp値が0.05未満なので、これらが「総合評価」を説明するのに有効な説明変数ということになります。それ以外の説明変数のp値は0.05よりも大きいので、「総合評価」とは有意に関連していません。

「下限95%」「上限95%」というのは、「推定値(回帰係数)」の信頼区間のことです。信頼区間を見ると分かるように、回帰係数が有意(p値が0.05未満)というのは、95%信頼区間が0をまたがず、回帰係数が正の値か負の値のどちらかだろうということです。逆に、回帰係数の95%信頼区間が0をまたぎ、正の値をとるか負の値をとるか分からない(ゼロかもしれない)とき、有意ではないと判定されます。回帰係数がゼロなら、説明変数と目的変数の間に相関はないことになるからです。

まとめ

順序ロジスティック回帰分析は目的変数が順序尺度のときに行い、目的変数に強く関連している説明変数を見つけるための解析方法です。選択式アンケート調査の解析でよく使われますが、実はそれ以外の調査・実験データでも使えます。重回帰分析をしようと思ったけれど、目的変数の正規性や等分散性が仮定できない場合です。そんなときは、目的変数をいくつかのグループに分割して順序ロジスティック回帰分析を行うか、2つのグループに分けて二項ロジスティック回帰分析を行います。

二項ロジスティック回帰分析の基本:データの形式、前提条件、分析結果の解釈

数式や細かい理論は省き、どういうデータの何を知りたいときに二項ロジスティック回帰分析を行うのか、前提条件は何か、分析結果をどのように解釈するのか、などについて…

この記事を書いた人

田中泰章 博士

Yasuaki Tanaka Ph.D.

プロフィール
環境問題や教育制度などについて広い視点から考える自然科学者。2008年に東京大学大学院で博士号(環境学)を取得した後、東京大学、琉球大学、米国オハイオ州立大学、ブルネイ大学など、国内外の大学で研究と教育に約15年間携わってきました。これまでに30報以上の学術論文を筆頭著者として執筆し、国際的な科学雑誌の査読者として多数の論文審査も行っています。