因果推論とは?
1. 因果推論とは何か?
因果推論は、「AをするとBがどうなるか」を科学的に明らかにする方法です。単に「AとBが一緒に起こる」という相関関係を見るだけでなく、「AがBの原因となっているか」という因果関係を解明することを目指します。
相関と因果:アイスクリームと溺死者の例
相関関係と因果関係の違いを理解するために、面白い例を見てみましょう。
月 | アイスクリーム売上(万円) | 溺死者数(人) |
---|---|---|
6月 | 100 | 5 |
7月 | 150 | 8 |
8月 | 200 | 12 |
このデータを見ると、アイスクリームの売上が増えるほど溺死者数も増えているように見えます。でも、アイスクリームを食べると溺れやすくなる...なんてことはありませんよね?
実は、この二つの間には直接の因果関係はありません。両方に影響を与えている別の要因(この場合は気温)があるのです。このような要因を交絡因子と呼びます。
以下の表は、気温を含めた完全なデータです。気温が交絡因子として作用していることがわかります。
月 | 気温(℃) | アイスクリーム売上(万円) | 溺死者数(人) |
---|---|---|---|
6月 | 25 | 100 | 5 |
7月 | 30 | 150 | 8 |
8月 | 35 | 200 | 12 |
- 気温が上がると:
- 暑くなるのでアイスクリームの売上が増える 🍦↑
- 海やプールに行く人が増え、結果として溺死者数も増える 🏊↑
つまり、アイスクリーム売上と溺死者数の間には擬相関があるだけで、本当の原因は気温なのです。
擬相関とは、見た目上は二つの変数間に相関があるように見えるが、実際には第三の要因によって引き起こされている相関のことを指します。
2. 広告効果を測る:因果推論の実践
では、因果推論を使って広告効果を測定する方法を見てみましょう。
例:新しいスニーカーのCM効果
あなたは靴メーカーのマーケティング担当者です。新しいスニーカーのテレビCMを放映した後、売上が増加しました。しかし、本当にこの売上増加がCMのおかげなのでしょうか?
考えられる他の要因
- 季節の変化(運動しやすい季節になった)
- 競合他社の価格変更
- SNSでの口コミ拡散
因果推論を使えば、これらの要因を考慮しつつ、CMの真の効果を測定できます。
3. 因果推論の根本問題:観測できない「もしも」の世界
広告効果を正確に測定するには、本来なら「同じ人がCMを見た場合の購買行動」と「同じ人がCMを見なかった場合の購買行動」の差を見るべきです。つまり、理想的なCMの効果は次のように定義されます:
\[
\begin{align*}
\text{CM効果} &= \text{(CMを見た場合の売上)} \\
&\quad - \text{(CMを見なかった場合の売上)}
\end{align*}
\]
しかし、現実世界では、同じ人に対して「CMを見せる」か「CMを見せない」かのどちらか一方しか実行できません。もう一方の状況は観測することができません。この観測できない、「もしも別の選択をしていたら」という仮想的な結果のことを反事実(カウンターファクチュアル)と呼びます。
そして、同じ対象に対して、処置(例:CM視聴)を行った場合と行わなかった場合の両方の結果を同時に観測できないことを、因果推論の根本問題と呼びます。
この図では、山田さんがCMを見た世界(現実)と見なかった世界(反事実)を示しています。私たちが観測できるのは、現実の世界の結果だけです。反事実の世界(点線で表示)は観測することができません。
この「反事実を観測できない」という問題が、因果関係を直接的に測定することを難しくしているのです。そのため、因果推論では様々な工夫を凝らして、この因果推論の根本問題を克服しようとします。
4. セレクションバイアス:単純比較の落とし穴
前節で説明した因果推論の根本問題により、理想的なCM効果の測定(同一人物のCM視聴有無による結果の差)は不可能です。そのため、実際のデータ分析では、CMを見たグループと見ていないグループの結果を比較することで効果を推定しようとします。
しかし、この単純な比較には大きな落とし穴があります。それがセレクションバイアスです。
セレクションバイアスとは
セレクションバイアスとは、CMを見たグループと見ていないグループの間に、もともと何らかの違いがある場合に発生するバイアスのことです。このバイアスにより、CMの効果を過大評価してしまう可能性があります。
セレクションバイアスが発生する理由
セレクションバイアスが発生する主な理由には以下のようなものがあります:
- 自己選択バイアス: CMを自主的に視聴する人は、もともとその商品に興味がある可能性が高い。
- メディア接触の偏り: CMをよく見る人は、テレビをよく見る人であり、特定の属性(例:年齢層、生活様式)に偏りがある可能性がある。
- ターゲティング: 広告主が特定の属性を持つ人々にCMを多く見せるようにしている場合がある。
これらの要因により、CM視聴群と非視聴群の間にもともとの違いが生じ、単純な比較では正確なCM効果を測定できなくなります。
セレクションバイアスの例
以下の図は、セレクションバイアスがある場合の広告効果測定の例を示しています:
グループ | 人数 | 購入者数 | 平均購入金額 | グループ全体の平均 |
---|---|---|---|---|
CM視聴群 | 400 | 200 | 15,000円 | 7,500円 |
非視聴群 | 600 | 180 | 12,000円 | 3,600円 |
単純計算: CM効果 = 7,500円 - 3,600円 = 3,900円
一見すると、CMには3,900円の効果があるように見えます。しかし、この差がすべてCMの効果とは限りません。例えば:
- CM視聴群には元々高価なスニーカーに興味がある人が多かった可能性がある。
- CM視聴群はテレビをよく見る人で、可処分所得が高い可能性がある。
これらの要因により、CM視聴群はもともと購入確率が高く、また購入する際により高額な商品を選ぶ傾向があった可能性があります。そのため、3,900円という差はCMの真の効果を過大評価している可能性が高いのです。
セレクションバイアスの存在は、広告効果の測定を難しくする大きな要因の一つです。このバイアスを克服し、より正確な効果測定を行うための方法が次節以降で説明する手法です。
5. 平均処置効果(ATE):理想の比較方法
セレクションバイアスを克服し、真の広告効果を測定するための指標が平均処置効果(Average Treatment Effect, ATE)です。
ATEは以下のように定義されます:
\[ \text{ATE} = E[Y(1) - Y(0)] \]
ここで、
- Y(1): CMを見た場合の結果
- Y(0): CMを見なかった場合の結果
- E[ ]: 期待値(平均)
理想的には、同じ人に対してCMを見た場合と見なかった場合の両方の結果を観察できれば、正確なATEを計算できます。しかし、現実にはこれは不可能です(前述の反事実の問題)。
6. ランダム化比較試験(RCT):科学的な広告効果測定法
ランダム化比較試験(Randomized Controlled Trial, RCT)は、セレクションバイアスを解決し、ATEを正確に推定するための強力な方法です。
RCTの手順
- 対象者をランダムに2グループに分ける
- これにより、両グループの特性が平均的に同じになります。
- 一方のグループにのみCMを見せる(処置群)
- もう一方のグループにはCMを見せない(対照群)
- 両グループの購買行動を比較する
RCTの結果例
グループ | 人数 | 平均購入額(円) |
---|---|---|
CM視聴群 | 500 | 5,200 |
非視聴群 | 500 | 4,800 |
ATEの計算:
\[ \text{ATE} = 5,200円 - 4,800円 = 400円 \]
この結果から、CMは平均して1人あたり400円の売上増加効果があったと推定できます。
まとめ:因果推論で広告効果を科学的に測定
因果推論を使うことで、単なる相関関係ではなく、真の因果関係を明らかにすることができます。特に広告効果の測定など、ビジネスの現場で重要な役割を果たします。
- 相関≠因果: アイスクリームと溺死者の例のように、見せかけの相関に惑わされないことが大切です。
- セレクションバイアスに注意: 単純な比較では真の効果が分からないことがあります。
- ランダム化比較試験(RCT)の威力: 科学的な方法で広告効果を正確に測定できます。
因果推論の基本を理解することで、より効果的なマーケティング戦略を立てることができるでしょう。データに基づいた意思決定で、ビジネスの成功につなげていきましょう!