論文でよく見る「未調整の結果」と
「多変量調整済みの結果」:
なぜ両方示す必要があるの?

「多変量調整の意味はわかるけど、未調整の結果って必要?」そんな疑問に答えます!


統計解析の目的:「原因と結果」の関係を正確に知りたい!

私たちは、ある現象の原因と結果の間にどのような関係があるのかを知りたいと常々考えています。例えば、「新しい薬は本当に病気を治す効果があるのか?」「ある食生活は将来の病気のリスクを高めるのか?」といった疑問に対し、統計解析は客観的なデータに基づいて答えを導き出すための強力なツールです。

しかし、世の中の現象は非常に複雑で、一つの原因が直接的に一つの結果を引き起こすことは稀です。多くの場合、複数の要因が絡み合って結果に影響を与えています。この「複数の要因が絡み合う」ことが、統計解析において非常にやっかいな問題となります。

「交絡(こうらく)」というワナ:見せかけの関係に騙されないで!

ここで登場するのが「交絡(こうらく)」という概念です。交絡とは、原因と結果の両方に影響を与える第三の要因が存在し、そのせいで見せかけの関係が生まれてしまう現象を指します。

【具体例】コーヒーと肺がんのリスク

あなたは「コーヒーをたくさん飲む人は肺がんになりやすい」という噂を聞きました。そこで、実際にデータを用いて、コーヒー摂取量と肺がんのリスクに本当に因果関係があるのかを調べようとしました。

データを集めて分析したところ、驚くべきことに「コーヒーを多く飲む人ほど、肺がんになるリスクが高い」という結果が出ました(未調整の結果)。

しかし、ここで疑問に思います。「コーヒーが直接肺がんを引き起こすのだろうか?」と。冷静に考えてみると、あることに気づきました。

喫煙習慣」です。

もしかしたら、コーヒーを多く飲む人の中には、タバコを吸う人が多いのではないでしょうか?そして、タバコは肺がんの強力な原因となることはよく知られています。

この状況を図にすると、以下のようになります。

コーヒー摂取量 肺がん 喫煙習慣 原因候補 交絡因子 結果

この図では、

となります。

ここで問題が起きています!

もしコーヒー摂取量と肺がんの間に本当は因果関係がなかったとしても、喫煙習慣という交絡因子が存在するために、以下のような見せかけの関係が生じてしまいます。

  1. コーヒーをよく飲む人は、喫煙者である可能性が高い。
  2. 喫煙者は、肺がんになる可能性が高い。
  3. 結果として、コーヒーをよく飲む人は、肺がんになる可能性が高いように「見えてしまう」。

この場合、あなたが最初に得た「コーヒーを多く飲む人ほど、肺がんになるリスクが高い」という結果は、コーヒーそのものの影響ではなく、喫煙習慣の影響が混ざってしまっている(交絡している)ために見られた、見せかけの関係である可能性が高いのです。

多変量調整の役割:交絡因子の影響を取り除く!

ここで「多変量調整」の出番です。多変量調整とは、統計モデル(特に回帰分析)を用いて、検討したい原因(今回の例ではコーヒー摂取量)と結果(肺がん)の関係から、交絡因子の影響を統計的に「取り除く」操作のことです。

先の例で言えば、喫煙習慣の影響を統計的に取り除いて、「もし喫煙習慣が同じだったとしたら、コーヒー摂取量と肺がんのリスクにはどのような関係があるのか?」という問いに答えるのが多変量調整です。

多変量調整を行うことで、コーヒー摂取量と肺がんの間に、喫煙習慣とは独立した真の関係があるのかどうかをより正確に知ることができます。

もし多変量調整の結果、「コーヒー摂取量と肺がんのリスクには、もはや統計的に有意な関係が見られなくなった」となれば、最初に観察された関係は喫煙習慣による交絡であった、という結論に至ります。逆に、調整後もなお関係が見られるのであれば、それは喫煙習慣以外の、コーヒーそのものの影響がある可能性を示唆します。

「未調整の結果」と「多変量調整済みの結果」を両方示す最大のメリット:"変化"から真の関係を探る

統計を学んでいる皆さんの中には、「多変量調整の重要性はわかった。でも、なぜわざわざ未調整の結果も一緒に載せる必要があるの?」と感じる方もいるかもしれません。

重要なのは「変化」を見ること!

実は、この「未調整の結果」と「多変量調整済みの結果」を並べて見ることが、研究結果を深く理解するために非常に重要なんです。なぜなら、未調整の結果から多変量調整済みの結果へ、数値がどのように「変化」したかを見ることで、交絡因子の影響の大きさや、真の関係性の確からしさを判断できるからです。

  1. 交絡の影響度合いを「見える化」する:
    未調整の結果は、現実世界でそのまま観察された「生の」関係を示します。ここには、あなたが調べたい要因以外の、あらゆる要因(交絡因子も含む)の影響が混ざっています。一方、多変量調整済みの結果は、特定の交絡因子を取り除いた後の「より純粋な」関係です。

    両者を比較することで、「この交絡因子を入れたら、元の関係性がこれだけ変わった!」という交絡の影響の大きさを明確に把握できます。もし、未調整の結果では強い関連が見られたのに、調整後は関連がほとんどなくなった場合、それは「最初に見た強い関連は、実は交絡因子による見せかけだったんだ」と、その因子の影響の大きさを実感できるのです。

  2. 結果の頑健性(ロバストネス)を評価する:
    複数の交絡因子で調整してもなお、検討したい原因と結果の間に統計的に有意な関係が見られる場合、その関係は様々な要因に左右されにくい、「頑健な」関係である可能性が高いと判断できます。つまり、多少別の要因が絡んでも、この関係は揺るがないだろう、という信頼性が高まるわけです。

    未調整からほとんど結果が変わらない、あるいは変化はしても依然として有意な関係が残る場合、「この関連性は、他の要因に邪魔されない、しっかりした関係だ」と自信を持って言えるようになります。

  3. 情報提供の透明性を高める:
    両方の結果を示すことで、研究者がどのような分析を行い、どのような結論に至ったのかを、読者がより深く理解できるようになります。研究のプロセスと結果の解釈における透明性が確保されます。


まとめ

多変量調整のポイント

統計解析における「多変量調整」は、私たちが本当に知りたい「原因と結果」の純粋な関係を見つけ出すための非常に重要なステップです。交絡というワナに惑わされることなく、より正確な情報を得るために不可欠な操作と言えるでしょう。

そして、論文で「未調整の結果」と「多変量調整済みの結果」が併記されているのは、単に二つの数値を示すためではありません。「生のデータから得られた関係が、交絡因子を除外することでどのように変化したのか」というプロセス自体が、その研究結果の信頼性や示唆するところを深く理解するためのカギなのです。

統計記事一覧に戻る