18.2 定義と記法
式 \(\operatorname{Pr}[X \, | \, Y]\) は事象 \(Y\) に属する結果が起こったという条件 (前提) が存在するときに事象 \(X\) に属する結果が起きる確率を表す。前節の例では \(X\) が事象 [ドアを変更して車を獲得] で、\(Y\) が事象 [ドア \(A\) を選択 \(\operatorname{\text{\footnotesize AND}}\) ドア \(B\) にヤギ] だった。\(\operatorname{Pr}[X \, | \, Y]\) の計算方法から、条件付き確率の値の定義が分かる:
\(X\), \(Y\) が事象で、\(Y\) の確率が \(0\) でないとする。条件付き確率 (conditional probability) \(\operatorname{Pr}[X \, | \, Y]\) は次のように定義される:
事象 \(Y\) の確率が \(0\) のとき条件付き確率 \(\operatorname{Pr}[X \, | \, Y]\) は定義されない。自明な前提条件に何度も言及するのを避けるために、これからは条件付き確率の条件となる事象の確率は \(0\) でないという暗黙の仮定を置く。
純粋な確率でさえ非直感的であるにもかかわらず、条件付き確率はさらに直感から離れる。条件が加わると確率が少しだけ変化し、乱択アルゴリズムやコンピューターシステム、あるいはギャンブルで予想外の結果が得られることがある。しかし定義 18.2.1 自体は非常に単純で、何も難しいところはない ── 難しいのは「正しく適用する」部分である。
18.2.1 何が間違いだったか
第 18.1 節で示した式変形が全て数学的に正しいのであれば、第 17.2 節と異なる結論が得られたのはどうしてだろうか? 原因は次のよくある間違いである: 数式で使った条件が考えている条件と異なる。問題の説明では、私たちはヤギの位置を Carol がドア \(B\) を開けたときに知らされる。これに対して、数式が使った条件は事象 [ドア \(A\) を選択 \(\operatorname{\text{\footnotesize AND}}\) ドア \(B\) にヤギ] であり、これは Carol がドア \(C\) を開ける結果 \((A, A, C)\) を含む! 求めるべき正しい条件付き確率は「プレイヤーがドア \(A\) を選び、Carol がドア \(B\) を開けたときに、ドアの選択を変更して車が獲得できる確率」である。つまり条件に既知の情報が全て反映されていないために、結果に余計な値が加わってしまっている。正しい条件を表す事象の確率は次の通りである:
そして正しい条件付き確率は次のように計算できる:
こうすれば、第 17.2 節で樹形図 (図 \(\text{17.3}\)) を使って得たのと同じ結論が得られる。
New York Times のオピニオン記事で、Steven Strogatz は O. J. Simpson 裁判を条件付き確率が誤用された例として示した。元フットボール選手である O. J. Simpson は、妻の Nicole Brown Simpson を殺害した罪で起訴された (後に無罪となった)。この裁判は大きな注目を集め、「今世紀最大の裁判」と言われるまでになった。人々の興味を捉えたのは人種的な問題、警察による不正捜査の疑い、当時新しかった DNA 鑑定などのテーマだった。しかし Strogatz は、数学者・作家である I. J. Good を引用して、次の目立たない点を批判した: O. J. が持っていた妻に対する DV (家庭内暴力) の前歴に関する議論である。
検察側は DV の前歴を持つ人物はランダムな人物より \(10\) 倍も殺人を犯すというデータを示し、DV と殺人には高い関連性があると主張した。これに対して弁護側は、DV を行う夫が妻を殺害するケースは \(1/2500\) しかないというデータを示し、これは「無視できるほどに小さい」と反論した。このデータを見ると、確かに DV の前歴と殺人の関係は薄いように思える。証拠能力を持たない DV の経歴を持ち出すことは Simpson に不利な偏見を生むだけであり、これ以上の議論は慎むべきだと弁護側は述べた。
このとき弁護側が使ったのは条件付き確率である。つまり、夫が妻に DV を行うという条件の下で夫が妻を殺害する確率が低い事実が利用された。しかし、この確率が考慮していない決定的な情報がある: Nicole Brown Simpson は殺害されている。弁護側が示した数字と当時の犯罪統計から計算すると、DV を受けている妻が殺害されたという条件の下で夫が妻を殺害した確率は約 \(80\%\) だと Strogatz は指摘した。
Strogatz の記事は \(80\%\) という数字の計算方法を詳しく解説している。しかしここで強調したいのは、条件付き確率は頻繁に利用されるものの誤用が非常に多く、公的機関でさえ誤ることがあるという事実である。