19.4 大いなる期待値
確率変数の期待値 (expectation, expected value) は、最も単純なケースでは平均値に等しくなる。例えば試験の答案が返されたとき、あなたが最初に確認するのは平均点だろう。この平均点はランダムな生徒の点数の期待値に等しい。
一般に、期待値は確率変数の取る可能性のある値の確率で重み付けした平均値である。このため、確率変数の取る任意の値と確率を表す実数の積が計算できるときに限って期待値は存在する。この条件は確率変数の取る値が全て実数のとき明らかに成り立つ。議論を簡単にするために、これからは確率変数が非負実数の値だけを取ると仮定する。この仮定の下で、期待値は次のように定義される:
\(R\) は標本空間 \(\mathcal{S}\) 上の確率変数で、\(R\) の値域には非負実数だけが含まれるとする。このとき \(R\) の期待値 (expectation, expected value) \(\operatorname{Ex}[R]\) は次のように定義される:
確率変数の期待値は平均 (mean) とも呼ばれる。
以降では、そうでないと明示しない限り確率変数の値域には非負実数だけが含まれると仮定する。
いくつか例を見ていこう。
19.4.1 一様確率変数の期待値
公平な六面サイコロを振って出る目を表す確率変数を \(R\) とする。\(R\) は一様確率変数であり、その期待値は定義 \(\text{(19.2)}\) を使って次のように計算できる:
この計算からは、期待値という用語が多少ミスリーディングだと分かる: サイコロを振って出る目が \(7/2\) になると期待する人などいない! 確率変数の期待値がその値域に含まれるとは限らない。
一般に、\(R_{n}\) が実数の集合 \(\left\{ a_{1}, a_{2}, \ldots, a_{n} \right\}\) 上の一様確率変数なら、\(R_{n}\) の期待値は \(a_{1}\), \(a_{2}\), \(\ldots\), \(a_{n}\) の平均に等しい:
19.4.2 一様確率変数の逆数の期待値
公平な六面サイコロを振って出る目の逆数を表す確率変数 \(S\) とする。つまり \(S = 1/R\) と定める。このとき次の等式が成り立つ:
ここまでの結果から次の関係が分かる:
両者が等しいと思ってしまうのはよくある間違いである。
19.4.3 指示確率変数の期待値
指示確率変数 (第 19.1.1 項) の期待値は、対応する事象の確率に等しい:
\(I_{A}\) を事象 \(A\) に対応する指示確率変数とする。このとき次の等式が成り立つ:
証明
■
例えば、確率 \(p\) で表を向く偏ったコインを投げたとき表を向く事象を \(A\) とするとき、\(\operatorname{Ex}[I_{A}] = \operatorname{Pr}[I_{A} = 1] = p\) が成り立つ。
19.4.4 期待値の異なる定義
期待値には標準的な定義がもう一つある:
任意の確率変数 \(R\) に対して、次の等式が成り立つ:
定理 19.4.3 の証明では、本章で見る期待値の性質の初等的な証明の多くと同様に、等式 \(\text{(19.2)}\) を展開して和の順序を並び替えるアプローチが用いられる。
証明 \(R\) が定義される標本空間を \(\mathcal{S}\) とする。このとき \(\operatorname{Ex}[R]\) は次のように変形できる:
最初の式変形は、集合族 \(\left\{ [R = x] \; | \; x \in \operatorname{range}(R) \right\}\) が標本空間 \(\mathcal{S}\) の分割である事実から分かる。 ■
一般に、等式 \(\text{(19.3)}\) は期待値の計算で本書の定義 \(\text{(19.2)}\) より有用になる場合が多い。また、確率変数の定義域だけが使われているので標本空間を考える必要がない利点もある。一方で、期待値の基本的な性質を示すときは全ての結果に関する総和で表された等式 \(\text{(19.2)}\) を使うと証明が簡単になる場合が多い。
等式 \(\text{(19.2)}\), \(\text{(19.3)}\) の総和は順番を明示しておらず、定理 19.4.3 の証明 (そして以降で示す多くの証明) では和の順序を自由に変更している点に注目してほしい。これは加算個の非負実数の和に関する次の有名な性質によって正当化される:
加算個の非負実数の和は、項を足す順番に関係なく常に同じ値に収束するか、そうでなければ常に発散する。
期待値の定義 \(\text{(19.2)}\) にある無限和の収束する値が項をどのように並び替えても変わらないなら、負の値を取る確率変数 \(R\) を考えに入れることもできる。そのとき \(\operatorname{Ex} [R]\) は well-defined となり、以降で示す基本的な性質も全て成り立つ。しかし、正の項と負の項を含む無限和は一般に項を並び替えると収束する値が変化する (問題 14.14, 問題 14.16) ので、実数の値を取る任意の確率変数に対して期待値を意味ある形で定義することはできない。
19.4.5 条件付き期待値
事象の確率と同様に、期待値に対しても事象による条件付けが可能である。事象 \(A\) で条件付けた確率変数 \(R\) の期待値は、\(A\) に属する結果だけを考えたときの、\(R\) の値を確率で重み付けした平均値に等しい。より正確には:
空でない事象 \(A\) で条件付けた確率変数 \(R\) の条件付き期待値 (conditional expectation) \(\operatorname{Ex}[R \, | \, A]\) は次のように定義される:
例えば、公平なサイコロを振って出る目を表す確率変数を \(R\) とする。このとき「\(4\) 以上の目が出た」と分かっている場合の \(R\) の条件付き期待値は次のように計算できる:
条件付き期待値は複雑な期待値の計算を単純なケースに分割するとき有用となる。単純なケースに関する期待値を個別に計算してから、それらのケースの確率を重みとする平均値を求めれば期待値が計算できる。
例えば、世界人口の \(49.6\%\) が男性で、それ以外は女性だとしよう ── これは実際の値にほぼ等しい。さらに、ランダムに選択された男性の身長の期待値は \(180~\text{cm}\) で、ランダムに選択された女性の身長の期待値は \(165~\text{cm}\) だと仮定する。このとき、ランダムに選択された人物の身長の期待値はどうすれば計算できるだろうか? ランダムに選択された人物を固定し、\(M\) を事象 [その人物が男性] として、\(F\) を事象 [その人物が女性] とする。このとき求めたい期待値 \(H\) は男性だけおよび女性だけを考えたときの身長の期待値を使って次のように計算できる:
この手法は次の定理によって正当化される:
\(R\) を標本空間 \(S\) 上の確率変数、\(A_{1}\), \(A_{2}\), \(\ldots\) を \(S\) の分割とする。このとき次の等式が成り立つ:
証明
■
19.4.6 幾何分布
あるプログラムは \(1\) 時間が経過するごとに確率 \(p\) でクラッシュするという。このプログラムが初めてクラッシュする時刻の期待値はいくつだろうか? この計算では全期待値の法則 (定理 19.4.6) が利用できる。初めてクラッシュする時刻を表す確率変数を \(C\) として、期待値 \(\operatorname{Ex}[C]\) を求めよう。その上で条件「最初の \(1\) 時間でプログラムがクラッシュするか?」を利用する。
\(A\) を事象 [最初の \(1\) 時間でプログラムがクラッシュする] とする。このとき \(A\) の余事象 \(\overline{\mathstrut A}\) は [最初の \(1\) 時間でプログラムがクラッシュしない] となる。これらの事象を使うと、最初のクラッシュまでの時間の期待値 \(\operatorname{Ex}[C]\) は次のように表せる:
事象 \(A\) が成り立つときプログラムは最初の \(1\) 時間でクラッシュするので、次の等式が分かる:
事象 \(\overline{\mathstrut A}\) が成り立つときプログラムは最初の \(1\) 時間でクラッシュしない。よって \(\overline{\mathstrut A}\) で条件付けた \(C\) の期待値は、条件付けのない \(C\) の期待値に \(1\) を加えた値に等しい。つまり次の等式が成り立つ:
等式 \(\text{(19.6)}\), \(\text{(19.7)}\) を等式 \(\text{(19.5)}\) に代入すれば次の等式を得る:
整理すれば次の結論が得られる:
以上の議論を一般化した次の事実は記憶しておく価値がある:
各ステップで障害を起こす確率が \(p\) のシステムが初めて障害を起こすまでの平均ステップ数は \(1/p\) である。
例えば、プログラムが \(1\) 時間ごとに \(1\%\) の確率でクラッシュするなら、プログラムがクラッシュするまでの時間の期待値は
と計算できる。
もう一つ異なる例を示す。男の子が産まれるまで子供を産み続ける夫婦がいるとき、女の子は何人産まれるだろうか? 議論を簡単にするため、男の子と女の子は同じ確率で産まれるとする。
これは前問と本質的に同一の問題である。つまり「平均して何時間後にプログラムは初めてクラッシュするか?」と「平均して何人目に男の子が初めて生まれるか?」は数学的に同じことを尋ねている。後者の問題では男の子が産まれることが「クラッシュ」に対応するので、\(p = 1/2\) となる。そして上記の結果より、平均すると \(1/p = 2\) 人目の子供が男の子になる。この平均的なケースにおいて、\(1\) 人目の子供は女の子である。つまり、全ての夫婦が男の子を産むまで子供を産み続けたとしても、その社会の男女比は \(1\) 対 \(1\) に保たれる。
障害までの平均ステップ数に関する等式 \(\text{(19.8)}\) は、次の直感的な議論からも導ける。システムが障害を起こすたびに再起動されると仮定する。このとき障害までの平均ステップ数は、ある障害から次の障害までのステップ数の平均に等しい。各ステップで障害が起きる確率が \(p\) なので、\(n\) ステップの間に障害は平均して \(np\) 回起こる。よって、ある障害から次の障害までのステップ数は定義より \(n/pn = 1/p\) と分かる。
最後に、この結果を数学的に表明しておく。障害までのステップ数を表す確率変数が従う確率分布は幾何分布 (geometric distribution) と呼ばれる:
確率変数 \(C\) がパラメータ \(p\) の幾何分布 (geometric distribution) に従うとは、\(\operatorname{codomain}(C) = \mathbb{Z}^{+}\) であり、次の等式が成り立つことを意味する:
ここで \(q ::= 1 - p\) である。
確率変数 \(C\) がパラメータ \(p\) の幾何分布に従うなら、次の等式が成り立つ:
19.4.7 ギャンブルの期待収益
期待値を使うと非常に興味深い性質が示せるギャンブルを使った例があるので紹介しよう。確率 \(p\) で \(w\) ドルを獲得でき、確率 \(q ::= 1 - p\) で \(x\) ドルを失う簡単なゲームがあるとする。このゲームの期待収益 (expected return) あるいは期待獲得金 (expected winning)と呼ばれる値は簡単に計算でき、次に等しい:
例えば、公平なコインを投げて表が出たら \(\$1\) 獲得でき、裏が出たら \(\$1\) 失うゲームの期待収益は
となる。こういった期待収益が \(0\) のゲームを公平 (fair) なゲームと呼ぶことにする。
スプリットポット
続いて異なるゲームを考える。このゲームは公平である ── ように思える。
金曜の深夜、近所の繁華街をぶらついていたところ、あなたは初対面のバイク乗りの男 Eric と Nick に呼び止められ、単純なゲームで賭けをしないかと提案された。このゲームでは公平なコインを投げた結果を予想する。最初 \(3\) 人のプレイヤーはそれぞれ \(\$2\) を机の上に置き、ナプキンに「表」または「裏」と (他の人から見えないように) 書く。その後あなたがコインを投げ、その結果がナプキンに書いた予想と一致したプレイヤーに賭け金が「山分け (等分)」される。こういった「賭け金の山分け」はポーカー、ベッティングプール、宝くじといったギャンブルで採用される仕組みであり、スプリットポット (split pot) とも呼ばれる1。
このゲームは公平な気がする。しかし、あなたは以前に奇妙なサイコロを持ったバイク乗りに大負けした経験 (第 17.3 節) があるので、バイク乗りとのギャンブルに軽々と乗るべきではないと考えた。そこで勝負を受ける前に、四ステップ法と樹形図を使って期待収益を計算することにした。このゲームの樹形図を図 \(\text{19.6}\) に示す。
図 \(\text{19.6}\) の「あなたの収益」は、計 \(\$6\) の賭け金を予想が正しかった人物で山分けし、そこから最初の賭け金 \(\$2\) を引いたとき手元に残る金額を表す。例えば、\(3\) 人のプレイヤー全員の予想が正しいとき、あなたは賭け金を取り戻せるだけなので収益は \(\$0\) となる。また、あなたと Nick の予想が正しく、Eric の予想が外れた場合、あなたの収益は次のように計算できる:
また、全員の予想が外れた場合は賭け金を全員で山分けする (収益は \(\$0\) とする) ことにあなたは合意した。
期待収益は等式 \(\text{(19.3)}\) を使えば計算できる:
ここから、このゲームは公平だと分かる。あなたはバイク乗りとの縁を感じていたので、「奇妙なギャンブルゲームに手を出さない」という厳粛な誓いを破って勝負を受けることにした。
結託の効果
言うまでもなく、あなたの思った通りにゲームは進まなかった。ゲームをプレイすればするほど所持金は減っていく。\(1000\) 回目のゲームが終わると負けは \(\$500\) に達した。Nick と Eric があなたの「運の悪さ」を慰めている間に、あなたは賭け金が \(\$2\) の公平なゲーム \(1000\) 回で \(\$500\) 負ける確率がとてつもなく低いことを大ざっぱな計算で確認した。
もしかしたら、あなたの運がとてつもなく悪いのかもしれない。しかし、それよりは二人のバイク乗りが何らかのイカサマをしている可能性の方が高く思える。図 \(\text{19.6}\) の樹形図はゲームのモデルとして正しくないのかもしれない。
「何らかのイカサマ」とは Nick と Eric による結託 (collusion) である。コインは公平なので、Nick と Eric はコイン投げの結果を \(1/2\) の確率でしか正しく予想できない。しかし、これまでの \(1000\) 回のゲームを思い出すと、Eric と Nick が一度も同じ予想をしていないことにあなたは気が付いた。つまり Nick が「裏」と予想するとき Eric は必ず「表」と予想し、その逆も成り立っていた。この事実をモデルに組み込むと、図 \(\text{19.7}\) に示す少しだけ異なる樹形図が得られる。
図 \(\text{19.6}\) と図 \(\text{19.7}\) で「あなたの収益」の列に書かれた値は変わらない。しかし、対応する結果の確率は異なる。例えば、Nick と Eric が異なる予想をするとき \(3\) 人全員が正しい予想をすることはない。さらに重要な点として、あなたの収益が \(\$4\) になる結果の確率は \(0\) になる。また、必ず Nick と Eric のちょうど一方は予想が正しく、賭け金の一部を受け取る。あなたの想像通り、この状況は絶望的である!
この結託シナリオにおける期待収益を等式 \(\text{(19.3)}\) で計算すると、次を得る:
やはりバイク乗りの男には警戒するべきだった! 結託して賭け方を工夫することで、Nick と Eric はゲームのたびに平均して \(\$0.5\) をあなたから奪っていた。あなたが \(1000\) 回の勝負で \(\$500\) を失ったことには何の不思議もない。
宝くじで儲ける方法
こういった結託が可能なギャンブルは多くある。例えば、一週間にわたるサッカーの試合結果を予想するベッティングプールと呼ばれるギャンブルでは、参加者全員が \(\$10\) を賭け、最も多くの試合結果を当てた参加者に総賭け金が山分けされる方式が典型的である。この方式は図 \(\text{19.6}\) のように考えれば公平であるものの、二人以上の参加者が結託して常に異なる賭け方をすると「不公平」になり、結託した参加者たちは他の参加者から賭け金を奪うことができる!
逆に、不利になる結託が意図せず発生する場合、それを利用して儲けることもできる。例えば、ずいぶん昔の話の話になるが、MIT の数学科教授 Herman Chernoff は州営宝くじで儲ける方法を発見した。宝くじで当選者が受け取るのは賭け金の総額そのものではなく、そこから運営者の取り分を差し引いた金額なので、期待収益は非常に低い。そのため儲けるなど不可能に思える。Chernoff はどんな方法を見つけたのだろうか? 何も難しいところはない!
典型的な州営宝くじは次のルールで行われる:
-
参加者は \(\$1\) を支払い、\(1\) 以上 \(36\) 以下の異なる数字を \(4\) 個選ぶ。
-
運営者は \(1\) 以上 \(36\) 以下の異なる数字を一様ランダムに \(4\) 個選ぶ。
-
運営者は賭け金の総額の半分を州の収益にして、もう半分を予測が正しかった参加者で山分けする。
参加者と選択肢が大幅に増えている点を除けば、これは Nick と Eric が提案したゲームと本質的に変わらない。Chernoff が発見したのは「参加者が選択する数字には大きな偏りがある」という事実である。多くの参加者はレッドソックスの平均勝率や現在日時といった決まった数字を選んでおり、Nick と Eric とは逆だった。結果的に、そういった参加者は意図せず負けるために結託していた。多くの人が選ぶ数字が当選番号になったとしても、山分け後の当選金は非常に小さくなってしまう。一様ランダムに数字を選ぶとき、そういった「人気」の数字が選ばれる確率は低い。その上で当選すれば、賭け金の大きな割合が手に入る! Chernoff は実際の州営宝くじのデータを解析し、平均して \(1\) ドルにつき \(7\) セントの儲けを得られると結論付けた。言い換えれば、普通に考えれば上記の宝くじの期待収益は \(-\$0.5\) であるのに対して、実際には \(+\$0.07\) だと彼は示した。意図しない結託はベッティングプールで頻繁に発生し、実際に利用できる現象である2。