17.2 四ステップ法

確率の問題にはランダム性を含む実験・処理・ゲームなどが登場する。そういった問題を解くには、二つの異なる質問に答える必要がある:

  1. どうすれば状況を数学的にモデル化できるか?

  2. モデル化の結果として生じる数学的問題をどのように解くか?

本節では、「 \(\cdots\) の確率は?」の形をした問題を四つのステップを通して解く四ステップ法 (four step method) と呼ばれる手法を説明する。四ステップ法を使うと、確率モデルを一歩ずつ着実に作成し、考えている問題をそのモデルの言葉で形式化できる。注目すべき点として、混乱を引き起こすことで有名な多くの問題に対する解答も四ステップ法で簡単に得られる。例えば、Monty Hall 問題に関する混乱・疑問は四ステップ法にかかれば Ginsu 製の包丁で切るかのように鮮やかに解決される。

17.2.1 ステップ 1: 標本空間を見つける

まずは試行の結果全体の集合を見つけることが目標となる。考えている実験・処理・ゲームなどを試行 (experiment) と呼ぶ。典型的な試行では、ランダムに決まる値が存在する。例えば Monty Hall 問題の試行では、上述したように次の三つの値がランダムに決まる:

こういったランダムに決まる値の可能な組み合わせを試行の結果 (outcome) と呼ぶ。結果全体の集合を試行の標本空間 (sample space) と呼ぶ。

樹形図 (tree diagram) は四ステップ法で利用される視覚的ツールであり、結果がそれほど多くない場合や問題が分かりやすい構造を持つ場合に重宝する。具体的には、樹形図を使うと標本空間を理解しやすくなる。例えば Monty Hall 問題では、車が隠されたドアの位置が最初に決まる。この事実は \(3\) 個の枝を持つ樹形図 (図 \(\text{17.1}\)) で表現される。この樹形図では \(3\) 個のドアがそれぞれ \(A\), \(B\), \(C\) と呼ばれる。数字 \(1\), \(2\), \(3\) を使わないのは、以降で樹形図に他の数字が書き加えられるからである。

Monty Hall 問題を表す樹形図の最初の列: それぞれの枝が車の隠されたドアに対応する。
図 17.1Monty Hall 問題を表す樹形図の最初の列: それぞれの枝が車の隠されたドアに対応する。

車の隠されたドアが決まると、プレイヤーが \(3\) 個のドアのいずれかを選択する。この事実は樹形図に二つ目の列を書き加えることで表現される。同様に、司会者が開けるドアの選択は三つ目の列で表現される。これらの列を書き加えた完全な樹形図を図 \(\text{17.2}\) に示す。

Monty Hall 問題を表す完全な樹形図: 二つ目の列はプレイヤーが選ぶドアを、三つ目の列は司会者が選ぶドアを表す。
図 17.2Monty Hall 問題を表す完全な樹形図: 二つ目の列はプレイヤーが選ぶドアを、三つ目の列は司会者が選ぶドアを表す。

三つ目の列において、司会者が開けるドアの選択肢の個数がプレイヤーの選択に応じて \(1\) 個または \(2\) 個である事実が表現されていることに注目してほしい。例えば、車の隠されたドアが \(A\) でプレイヤーの選択が \(B\) なら、司会者は必ず \(C\) のドアを開けなければならない。一方、車の隠されたドアが \(A\) でプレイヤーの選択も \(A\) なら、司会者は \(B\) または \(C\) のドアを開けることができる。

この樹形図を先ほど定義した用語と関連付けよう: 樹形図の葉は試行の結果を表し、葉全体の集合が標本空間を表す。よって、この Monty Hall 問題の試行では標本空間が \(12\) 個の結果から構成される。結果を表す列を葉の隣に書き加えた樹形図を図 \(\text{17.3}\) に示す。

Monty Hall 問題を表す樹形図の葉に結果を書き加えた図: それぞれの結果は根から葉までの路に対応する。例えば、結果 (A, A, B) は「車がドア A に隠され、プレイヤーがドア A を選び、司会者がドア B を開ける」試行に対応する。
図 17.3Monty Hall 問題を表す樹形図の葉に結果を書き加えた図: それぞれの結果は根から葉までの路に対応する。例えば、結果 \((A, A, B)\) は「車がドア \(A\) に隠され、プレイヤーがドア \(A\) を選び、司会者がドア \(B\) を開ける」試行に対応する。

それぞれの結果は三要素列で表され、次の意味を持つ:

\[ (\text{車の隠されたドア},\ \text{プレイヤーが選ぶドア},\ \text{司会者が開けるドア}) \]

この表現を使うとき、標本空間は次の集合となる:

\[ S = \left\{ \substack{ \displaystyle (A, A, B),\ (A, A, C),\ (A, B, C),\ (A, C, B),\ (B, A, C),\ (B, B, A), \\[7pt] \displaystyle (B, B, C),\ (B, C, A),\ (C, A, B),\ (C, B, A),\ (C, C, A),\ (C, C, B) } \right\} \]

樹形図には異なる解釈もある: 試行そのものを、樹形図の根から葉へ向かう路を構築する操作と考えることができる。このとき各頂点では「ランダムに」次の枝が選択される。この解釈は以降で使うので憶えておいてほしい。

17.2.2 ステップ 2: 注目する事象を定義する

私たちの目標は「 \(\cdots\) の確率は?」の形をした質問に答えることだった。「 \(\cdots\) 」の部分には例えば「プレイヤーがドアを変更すると車を獲得できる」「プレイヤーが最初に車の隠されたドアを選択する」「車の隠されたドアが \(C\) である」が入る。

結果の集合を事象 (event) と呼ぶ。前段落で示した例はどれも事象を定義する。例えば事象 [車の隠されたドアが \(C\) である] は次の事象を意味する:

\[ {\small \left\{ (C, A, B),\ (C, B, A),\ (C, C, A),\ (C, C, B) \right\}} \]

また、事象 [プレイヤーが最初に車の隠されたドアを選択する] は次の事象を意味する:

\[ {\small \left\{ (A, A, B),\ (A, A, C),\ (B, B, A),\ (B, B, C),\ (C, C, A),\ (C, C, B) \right\}} \]

ここで [\(P\)] は性質 \(P\) を満たす結果全体からなる事象を意味する記法である。

これから注目するのは最後の事象 [プレイヤーがドアを変更すると車を獲得できる] であり、これは次の集合に等しい:

\[ {\small \left\{ (A, B, C),\ (A, C, B),\ (B, A, C),\ (B, C, A),\ (C, A, B),\ (C, B, A) \right\}} \tag{17.1}\]

この事象に含まれる結果の横にチェックマークを書き加えた樹形図を図 \(\text{17.4}\) に示す。

Monty Hall 問題の樹形図: プレイヤーがドアを変更すると車を獲得できる結果の横にチェックマークが付いている。
図 17.4Monty Hall 問題の樹形図: プレイヤーがドアを変更すると車を獲得できる結果の横にチェックマークが付いている。

図 \(\text{17.4}\) からは、\(12\) 個ある結果のちょうど半分にあたる \(6\) 個の結果にチェックマークが付いていることが分かる。ここからプレイヤーがドアを変更したとき車を獲得できる確率は \(1/2\) だと結論したくなるかもしれないが、それは間違っている。なぜなら、すぐに見るように、結果ごとに得られる確率が異なるからである。

17.2.3 ステップ 3: 結果の確率を計算する

これまでのステップで試行の結果が全て分かったので、続いてそれぞれの結果の確率を求める。ここで特定の結果の確率とは、試行を何度も実行したときにその結果が起こる回数の割合を意味する。試行を実行すると必ず何らかの結果が得られる事実に対応して、結果の確率の和は \(1\) となる。

それぞれの結果の確率はモデル化している現象によって定まるので、数学的に導出できる値ではない。ただ、数学を使うと少数の基礎的なパラメータで全ての結果に確率を割り当てることが可能になる。具体的には、このステップはさらに二つに分かれる:

辺に確率を割り当てる

まず、樹形図のに確率を割り当てる。この確率は試行の中でランダムに決まる値が特定の値になる確率を表す。例えば Monty Hall 問題では、辺の確率は最初に示した仮定から決定する: 車が隠されるドアは \(3\) 個のドアの中から等しい確率で選ばれ、プレイヤーは \(3\) 個のドアの中から等しい確率でドアを選び、司会者は開けられるドアの中から等しい確率で開けるドアを選ぶ。司会者が開くドアの選択肢を持たないとき、対応する唯一の辺には \(1\) の確率が割り当てられる。辺に確率を割り当てた樹形図を図 \(\text{17.5}\) に示す。

辺に重みを割り当てた Monty Hall 問題の樹形図: それぞれの辺の重みは根に近い方の端点でその辺が「選択」される確率を表す。例えば、車がドア A の後ろに隠されるとき、プレイヤーの最初の選択がドア B である確率は 1/3 である。右端の列は Monty Hall 問題の試行におけるそれぞれの結果の確率を示す。結果の確率は根から結果に対応する葉への路に含まれる辺の確率の積に等しい。
図 17.5辺に重みを割り当てた Monty Hall 問題の樹形図: それぞれの辺の重みは根に近い方の端点でその辺が「選択」される確率を表す。例えば、車がドア \(A\) の後ろに隠されるとき、プレイヤーの最初の選択がドア \(B\) である確率は \(1/3\) である。右端の列は Monty Hall 問題の試行におけるそれぞれの結果の確率を示す。結果の確率は根から結果に対応する葉への路に含まれる辺の確率の積に等しい。

結果の確率を計算する

続いて、辺の確率を利用して結果の確率を計算する。これは次の事実を利用する完全に機械的なプロセスである:

樹形図における根から葉への路に含まれる辺の確率の積を計算すると、葉に対応する結果の確率が得られる。

この事実の厳密な正当化は第 18.4 節で見る。ここでは簡単で直感的な正当化を示しておく: 試行でランダムに値を選択することは樹形図を根から葉に向かって進むことに対応する。選択されるランダムな値の「ランダム性」は辺に書かれた確率によってモデル化されているから、根から葉への任意の路に含まれる辺の確率の積は、その葉に対応する結果が得られる確率に等しい。

例えば、結果 \((A, A, B)\) の確率は図 \(\text{17.5}\) より次の値に等しい:

\[ \frac{1}{3} \cdot \frac{1}{3} \cdot \frac{1}{2} = \frac{1}{18} \tag{17.2}\]

図 \(\text{17.5}\) には全ての結果の確率が書き加えられている。

それぞれの結果に確率を割り当てるとき、結果を確率に移す関数が定義される。この関数は \(\operatorname{Pr}[\,\cdot\,]\) と表記されることが多い。つまり、このステップで求めた事実は次のように表せる:

\[ \begin{aligned} \operatorname{Pr}[(A, A, B)] &= \frac{1}{18} \\ \operatorname{Pr}[(A, A, C)] &= \frac{1}{18} \\ \operatorname{Pr}[(A, B, C)] &= \frac{1}{9} \\ &\vdots \end{aligned} \]

17.2.4 ステップ 4: 事象の確率を求める

ステップ 3 では結果の確率を求めたものの、知りたいのは事象の確率だった。事象 \(E\) の確率は \(\operatorname{Pr}[E]\) と表記され、その値は \(E\) に含まれる結果の確率の和に等しい。例えば、事象 [プレイヤーがドアを変更すると車を獲得できる] は集合 \(\text{(17.1)}\) なので、その確率は次のように計算できる:

\[ \begin{aligned} & \operatorname{Pr}[\text{プレイヤーがドアを変更すると車を獲得できる}] \\ &\quad = \operatorname{Pr}[(A, B, C)] + \operatorname{Pr}[(A, C, B)] + \operatorname{Pr}[(B, A, C)] \\[3pt] &\quad \qquad + \operatorname{Pr}[(B, C, A)] + \operatorname{Pr}[(C, A, B)] + \operatorname{Pr}[(C, B, A)] \\[4pt] &\quad = \frac{1}{9} + \frac{1}{9} + \frac{1}{9} + \frac{1}{9} + \frac{1}{9} + \frac{1}{9} \\[9pt] &\quad = \frac{2}{3} \end{aligned} \]

Marilyn の解答は正しかったようだ! ドアの選択を変更したプレイヤーは \(2/3\) の確率で車を獲得できる。これに対して、最初と選択と同じドアを選び続けたプレイヤーは \(1/3\) の確率でしか車を獲得できない。この事実はドアの選択を変更しないで車を獲得できるのはドアの選択を変更して車を獲得できないとき、かつそのときに限ることから分かる。

これで Monty Hall 問題が解けた! 直感や巧妙な類推に頼る必要はなかった。実際、使った数学は分数の加算と乗算だけであり、唯一難しいのは「直感的に明らかな」解答に飛びつかないように自分を律することだけだった。

17.2.5 Monty Hall 問題の異なる解釈

Marilyn は本当に正しかったのだろうか? ここまでの解析は彼女が正しかったと示している。ただし、彼女の解釈の下では彼女は正しい、と言った方が正確となる。Marilyn の解答が間違いになる同程度にもっともらしい解釈も存在する。Marilyn が受け取った Craig Whitaker からの手紙では、司会者が必ずヤギのいるドアを開け、選択を変更する権利をプレイヤーに提供するとは書かれていない点に注目してほしい。実際に放映された Let's Make a Deal では、プレイヤーが最初に選択したドアを Monty Hall (司会者) が開けることもあった。そのため、少なくとも理論上 Monty はプレイヤーが最初に正解のドアを選んだときにだけ選択を変更するかどうかを参加者に尋ねることもできた。もしそうしたら、選択を変更して車を獲得できる確率は \(0\) になる!

広告