« 卓球大会の組合せと賞品決定(山川義介) | メイン | 2010年夏の職能テスト(山川義介) »
2010年07月05日
シンプソンのパラドックス(山川義介)
posted by Yoshisuke Yamakawa
毎週木曜日に行なっているデータ分析勉強会は、既に7回が終わっているが、ブログにアップすることをさぼっていて、ブログでは第2回目となってしまった。今日は『シンプソンのパラドックス』という有名な統計的パラドックスの話をしたい。
その前に、「パラドックス」とは何か?ということなのだが、パラドックスとは「逆説」の意味で、常識とは逆と説明されるが、少し分かりづらい。もう少しくだいていうと、あたかも正しいそうな仮説に基づいて構築された説明なのに、どう考えても納得できないような結論が出ることをいう。
例えば足の速いアキレスは前を歩く亀を追い抜けないという有名な「アキレスと亀のパラドックス」。亀はアキレスより前を歩いている。アキレスが亀がいた位置に到達した時には亀は前に進んでいる。再度アキレスが亀の位置に到達したときには亀はさらに前に進んでいる。こうしていつまでたってもアキレスは亀に追いつけないというものだ。結論は到底納得できないにもかかわらず、結論を導く論証過程自体は正しそうに見えるのでこれを正しく論破するのは難しい。
さて、今日のお題であるシンプソンのパラドックスだが、これはE.H.シンプソンによる統計学的なパラドックスで、母集団での相関と、母集団を分割した集団での相関は、異なっている場合があるというものだ。アンケート調査で、クロス集計(層別)をすると全体集計(GT)では見られなかった傾向が現れることがあるが、それとは全く別物であり、到底納得できない結果が出るのである。
あるメーカーが口内炎に効く新商品を開発したとしよう。既存商品との違いを確かめるために、それぞれ口内炎を患う100人を抽出しテストを行なった。その結果が以下の表である。(社長の上村がこのテストに参加したかは定かではない)
この表を見ると、良いとした患者が既存商品では55%だったのに対し、新商品は58%と3ポイントアップしていた。「よし、新商品は開発に成功した!」と考えて良いのだろうか。3ポイントに有意差があるかはここでは議論しないとして、ごくあたりまえの商品企画や開発担当者やリサーチャーであれば、いやもう少しブレークダウンして男女別に見るべきだとか、より詳細な分析をするだろう。そこで男女別に見たのが以下の表だ。
この表を見ると、予想通り新商品は男性には効果があったようだが、女性には既存商品のほうが良さそうである。このまま発売していたら、女性には効き目の弱い商品を発売してしまうことになっていた。
ここまでは、ごく普通のクロス集計の考えで、よくある話である。パラドックスはここから始まる。念のために年代別にはどうなるかを見てみたのが次の表だ。
さて、この表を見て皆さんは何を発見するだろうか。もちろんテストは今回行なったそれぞれ100名に対する結果だ。先ほどは男女で効果がある、ないが分かれた。しかし年代別に見ると、20代は45%と既存商品のほうが3ポイント良い結果になっており、30代を見ても67%と1ポイント良い結果になっている。
合計すれば明らかに新商品のほうが3ポイント良かったものが、年代別に見たら、どちらも既存商品のほうが良くなってしまっている。これはどういうことなのだろうか。まさに、「母集団での相関と、母集団を分割した集団での相関は、異なっている場合がある」の実例だ。分割した集団の両方で悪いものが、合計すると良くなることがある。何となく狐につままれたような消化不良な話しかと思うが、なぜこのようなことが起きるのか、皆さんで考えてみていだだきたい。回答やご意見はツイッター@ygiskeで(w)。
2010年07月05日 02:14
