シンプソンのパラドックスは1951年にE.H.シンプソンによって記述された統計学的なパラドックスである。 母集団での相関と母集団を分割した集団での相関は異なっている場合がある。 つまり集団を2つに分けた場合にある仮説が成立しても、集団全体では正反対の仮説が成立することがある。
例:A君とB君が1回目と2回目で合わせて110問を解くというテストを受けた。最初のテストでは、A君は100問を解き60問正解で、B君は10問中9問が正解であった。次のテストでは、A君は10問中1問、B君は100問中30問が正解だった。
この例について考えてみる。話を整理するためにいくつかの記号を導入する。
このパラドックスでは、計算の方法が考慮されていない。もし、SB(1) > SA(1) かつ SB(2) > SA(2)であれば、私たちは SB は SAよりも大きいに違いない、と思いこみがちである。 しかし、各々の総得点を計算する際に異なった加重を与えてみるとどうなるだろうか。A君の最初のテストの加重は100/110でありB君では10/110である。2回目のテストの加重は各々、A君 10/110、B君 100/110となる。
SA = 100/110 SA(1) + 10/110 SA(2).
SB = 10/110 SB(1) + 100/110 SB(2).
加重を与えることによってAの総得点率は約60%、Bの総得点率は約30%と計算できる。
このように、計算方法によりパラドックスを見抜くことが出来る。しかし、依然として個人の成績と全体の成績の間には矛盾が残る。A君とB君のどちらが上なのだろうか?総得点に基づくとA君の方が上だと考えられる。しかし、次の例のようにB君の方が上であるかのように話を持って行くことは可能である。
上の話では、A君とB君の状況を先ほどのテストの話から何も改変していない。 これらの問題は近年の文献でシンプソンのパラドックスとして議論された問題である。 統計学者にとっては1世紀以上前からこの現象は既知であったが、哲学者、コンピュータを扱う科学者、疫学者、経済学者らは最近でもこのパラドックスに対する議論を行っている。
Simpson-Paradoxon | Simpson's paradox | Paradoja de Simpson | Paradoxe de Simpson | Paradosso di Simpson | Simpsons paradox | Simpson's paradox | 辛普森悖论
This article is licensed under the GNU Free Documentation License.
It uses material from the
"シンプソンのパラドックス".
Home Page • arts • business • computers • games • health • hospitals • home • kids & teens • news • physicians • recreation• reference • regional • science • shopping • society • sports • world