19.5 期待値の線形性
期待値は線形性 (linearity) と呼ばれる単純かつ非常に有用な性質を持つ。一言で言えば、確率変数の和の期待値はそれぞれの確率変数の期待値の和に等しい:
任意の確率変数 \(R_{1}\), \(R_{2}\) に対して次の等式が成り立つ:
証明 \(T ::= R_{1} + R_{2}\) とする。期待値の定義 \(\text{(19.2)}\) を変形すれば次の関係が分かる:
■
本質的に同じ証明から次の定理も分かる:
任意の確率変数 \(R_{1}\), \(R_{2}\) と定数 \(a_{1}, a_{2} \in \mathbb{R}\) に対して次の等式が成り立つ:
言い換えれば、期待値は線形関数である。数学的帰納法を使った機械的な証明からは、\(3\) 個以上の確率変数に対する結果が得られる:
任意の確率変数 \(R_{1}\), \(\ldots\), \(R_{k}\) と定数 \(a_{1}, \ldots, a_{k} \in \mathbb{R}\) に対して、次の等式が成り立つ:
期待値の線形性に関して素晴らしいのが独立性が仮定されないことである。独立かどうかを確かめるのは面倒であり、独立でない確率変数を扱う必要がある場面も多いので、この事実は非常に有用となる。
例として、公平な \(2\) 個のサイコロを振ったときの目を考えよう。
19.5.1 \(2\) 個のサイコロの目の和の期待値
公平な \(2\) 個のサイコロを振ったとき、出る目の和の期待値はいくつだろうか?
一つ目のサイコロの目を表す確率変数を \(R_{1}\) として、二つ目のサイコロの目を表す確率変数を \(R_{2}\) とする。一つのサイコロを振ったときに出る目の期待値は \(3.5\) だと以前に計算したので、期待値の線形性を使えば目の和の期待値を計算できる:
二つのサイコロの目が独立という仮定があるなら、樹形図を使っても \(R_{1} + R_{2}\) の期待値が \(7\) であることは示せる。しかし、\(36\) 個の葉を持つ樹形図を書くには手間がかかる。また、独立性が仮定できないときは樹形図によるアプローチを使う方法が明らかでない。これに対して、上記の計算では二つのサイコロが独立と仮定されていない点に注目してほしい。例えば、二つ目のサイコロの目が一つ目のサイコロと同じになる仕掛けがある場合でも、同じ計算で二つの目の和の期待値は \(7\) だと示せる。
19.5.2 指示確率変数の和
期待値の線形性は指示確率変数の和を考えるとき特に有用となる。この事実が分かる例として、こんな問題を考えよう: \(n\) 人の男性が出席する夕食会がある。出席者は会場に入るときロビーに帽子を預ける。しかしロビーの係員が帽子の持ち主を記録するのを忘れたので、夕食を終えた出席者はランダムな帽子を持って帰ることになった。それぞれの男性が自身の帽子を受け取る確率は \(1/n\) で等しいと仮定するとき、自身の帽子を手にして会場を後にする参加者の人数の期待値はいくつだろうか?
自身の帽子を手にする参加者の人数を表す確率変数を \(G\) とする。求めたいのは \(G\) の期待値である。しかし、\(G\) に関しては「それぞれの男性が自身の帽子を手に入れる確率が \(1/n\)」という事実しか分かっていない。この性質を満たす帽子の置換の確率分布は数多く存在するので、等式 \(\text{(19.2)}\), \(\text{(19.3)}\) を使って期待値を計算するには情報が不足している。期待値の線形性を使うと、この問題を回避できる。
これから期待値の線形性を応用する上で有用となる標準的なテクニックを紹介する。それは「考えている確率変数を指示確率変数の和として表す」である。今考えている問題では、\(G_{i}\) を事象 [\(i\) 番目の男性が自身の帽子を手にする] に対応する指示確率変数と定める (\(i\) 番目男性が自身の帽子を手にするなら \(G_{i} = 1\) であり、そうでなければ \(G_{i} = 0\) である)。このとき、自身の帽子を手にする男性の人数を表す確率変数 \(G\) を指示確率変数 \(G_{i}\) の和として表せる:
指示確率変数 \(G_{1}\), \(G_{2}\), \(\ldots\), \(G_{n}\) は相互独立でない。例えば、もし \(n - 1\) 人の男性全員が自身の帽子を手にするなら、最後の \(1\) 人も必ず自身の帽子を手にする。しかし先ほども強調したように、期待値の線形性を利用する上で独立性は問題にならない。
\(G_{i}\) は指示確率変数なので、補題 19.4.2 から次の等式が分かる:
期待値の線形性と等式 \(\text{(19.9)}\) を使えば、\(G\) の期待値が求まる:
帽子がどのように入れ替わるかに関する情報は限られているものの、自分の帽子を手にできるのは男性の人数に関係なく平均して \(1\) 人だけだと判明した!
この議論を一般化すると、起きる事象の個数の期待値を与える非常に有用な定理が得られる:
事象 \(A_{1}\), \(A_{2}\), \(\ldots\), \(A_{n}\) の中で起きる事象の個数の期待値は次の式で表される:
先ほどの例では \(A_{i}\) が事象 [\(i\) 番目の男性が自身の帽子を手にする] だった。しかし一般に \(A_{i}\) は標本空間の任意の部分集合で構わない。集合論の言葉を使うと、「起きる事象の個数」は「ランダムにサンプルした結果を含む事象の個数」に等しい。
証明 \(A_{i}\) に対応する指示確率変数を \(R_{i}\) とする。つまり \(\omega \in A_{i}\) なら \(R_{i}(\omega) = 1\) であり、\(\omega \notin A_{i}\) なら \(R_{i}(\omega) = 0\) である。さらに \(R = R_{1} + R_{2} + \cdots + R_{n}\) と定める。このとき次の等式が分かる:
■
よって、いくつかの事象の中で起こる事象の個数の期待値を求めたいときは、それぞれの事象が起きる確率を求めて足せばよい。そのとき独立性は必要ない。
19.5.3 二項分布に従う確率変数の期待値
確率 \(p\) で表を向く公平でないコインを相互独立に \(n\) 回投げるとする。表を向く回数の期待値を求めてみよう。
表を向く回数を表す確率変数を \(J\) とする。このとき \(J\) はパラメータが \(n\), \(p\) の二項分布に従う。つまり、任意の \(k \in [0..n]\) に対して次の等式が成り立つ:
ここで \(q ::= 1 - p\) である。等式 \(\text{(19.3)}\) に代入すれば、次の等式を得る:
とても複雑な見た目をした総和が得られた。しかし、期待値の線形性を利用すれば閉形式の単純な式が求まる。そのために、\(J\) を指示確率変数の和として書き換える。これは難しくない: \(J_{i}\) を事象 [\(i\) 回目に投げたコインが表を向く] に対応する指示確率変数とする。つまり次のように定める:
このとき、表を向く回数は起こった \(J_{i}\) の個数に等しい。つまり次の等式が成り立つ:
よって定理 19.5.4 より \(J\) の期待値が求まる:
期待値がとても簡単に求まった。確率 \(p\) で表を向くコインを相互独立に \(n\) 回投げると、表を向く回数は平均 \(pn\) となる。よってパラメータ \(n\), \(p\) の二項分布に従う確率変数の期待値は \(pn\) に等しい。
では、もし \(n\) 回のコイン投げが相互独立でなかったら? その場合でも問題はない ── 期待値の線形性と定理 19.5.4 は独立性を仮定しないので、答えは \(pn\) で変わらない。
期待値の線形性と定理 19.5.4 の有用性に納得していないなら、次の事実を考えてみてほしい: 等式 \(\text{(19.11)}\), \(\text{(19.12)}\) から、複雑な見た目をした等式
が何もせずとも得られる (問題 19.31)。
次項を読めば、期待値に関する難しい問題を解く上で線形性が強力なツールであることをさらに納得できるだろう。
19.5.4 クーポンコレクター問題
タコスチェーン店 Baco Tell では、子供向けセットを頼むと「レーシングロケット」と呼ばれる車のおもちゃと、車を高速で射出できる発射台がもらえる。子供の喜びようといったらない。
レーシングロケットには色違いが何種類かある。子供向けセットを注文したとき受け取れるレーシングロケットの色は Baco Tell の親切な店員が一様ランダムに選んでいるように思える。全ての色のレーシングロケットを集めたいとき、購入しなければならない子供向けセットの個数の期待値はいくつだろうか?
同様の数学的問題は様々な形で現れる: 例えば、全ての日付に対してその日が誕生日の人物を見つけたいとき、誕生日を訪ねる必要がある人数の期待値はいくつだろうか? 一般的な問題はさらに別の解釈からクーポンコレクター問題 (coupon collector problem) と呼ばれる。
期待値の線形性を賢く応用すると、この問題の解答が簡単に得られる。レーシングロケットに \(5\) 種類の色違いがあり、あなたの受け取った色が順に次の通りだったとする:
この列を次のように \(5\) 個の区間に分割する:
この区間は「新しい色が手に入ったら次の区間が始まる」という規則で並んでいる。例えば、\(X_{2}\) は「赤」が初めて手に入ったとき終わり、その次の \(X_{3}\) は「オレンジ」が手に入ったとき終わる。このように考えると、全ての色を集める問題をいくつかの段階に分割できる。後はそれぞれの段階を個別に考えれば、結果を期待値の線形性を使って組み合わせることで全体の問題に対する解答が得られる。
問題を一般化して、レーシングロケットの色違いは \(n\) 種類存在するとしよう。\(k\) 番目の区間の長さを \(X_{k}\) とするとき、全ての色違いを入手するまでに購入する必要がある子供向けセットの個数 \(T\) は全ての区間の長さの和となる:
\(X_{k}\) の値を考えよう。\(k\) 番目の区間が始まる時点で入手済みの色は \(k\) 種類であり、\(k\) 番目の区間は新しい色が手に入ると終了する。\(k\) 種類の色が集まっているとき、\(1\) 個の子供向けセットを購入して入手済みの色が手に入る確率は \(k/n\) であり、新しい色が手に入る確率は \(1 - k/n = (n - k)/n\) である。従って補題 19.4.8 より、新しい色が手に入るまでに購入しなければならない子供向けセットの個数の期待値は \(n/(n-k)\) と分かる。これは次の等式を意味する:
この事実と期待値の線形性を使えば、クーポンコレクター問題に対する解答が求まる:
素晴らしい! 最後の変形では調和数 (第 14.4.2 項) がまた登場した。
等式 \(\text{(19.14)}\) を使うと具体的な質問にも答えられる。例えば、サイコロを振って \(1\) から \(6\) の目を全て得るには、平均して次の回数だけサイコロを振らなければならない:
また、全ての日付に対してその日が誕生日の人物を見つけたいとき、誕生日を訪ねる必要がある人数の期待値は次のように計算できる:
19.5.5 期待値の無限和
期待値の線形性は絶対収束の基準が満たされるなら無限個の確率変数に対しても成り立つ。
\(R_{0}\), \(R_{1}\), \(\ldots\) が確率変数で、次の無限和が収束すると仮定する:
このとき、次の等式が成り立つ:
証明 \(T ::= \sum_{i=0}^{\infty} R_{i}\) と定める。仮定された絶対収束性の下で次の変形に登場する総和が全て絶対収束することの確認は省略する。絶対収束していれば、無限和の項の並び替えが正当化される。
■
19.5.6 倍賭けのパラドックス
カジノで可能な最も単純な賭けの一つに、ルーレットの「赤」と「黒」に対する賭けがある。ルーレットには一定時間ごとに小さなボールが投入され、そのボールは赤・黒・緑のマスのどれかに入る。ボールが入るマスと同じ色に賭けていると、賭け金と同じだけの儲けが得られる。例えば「赤」に \(\$10\) 賭けた上でボールが赤のマスに入ったら、賭け金の \(\$10\) に儲けの \(\$10\) を加えた合計 \(\$20\) が返ってくる。
カジノは緑マスの分だけ有利である。つまり、赤または青のマスにボールが入る確率はそれぞれ \(1/2\) より小さい。アメリカのカジノでは赤および青のマスが \(18\) 個ずつ、緑のマスが \(2\) 個あるので、赤または青のマスに賭けたとき勝率は \(18/38 \approx 0.473\) である。ヨーロッパのカジノでは緑のマスが \(1\) 個だけなので、勝率は少し上がって \(18/37 \approx 0.486\) となる ── しかし \(1/2\) よりは小さい。
もちろん、たとえ公平なルーレット盤を使ったとしても、この賭けで儲けることはできない。公平なルーレット盤を使うとき勝つ確率と負ける確率がどちらも \(1/2\) なので、期待収益は常に \(0\) である。よって賭けをどれだけ続けようと、全体の期待値は個別の期待値の和 \(0\) に等しい。
この事実があるにもかかわらず、ギャンブラーは不公平なルーレットで確実に勝つ戦略を見つけようと努力を続けている。倍賭け (bet doubling) と呼ばれる有名な戦略では、勝つまで賭け金を倍にし続ける。例えば、最初のスピンで \(\$10\) を「赤」に賭けたとする。もし最初のスピンで「赤」が出たなら、\(\$10\) を儲けてカジノを去る。最初のスピンで「赤」が出なかったら、賭け金を倍の \(\$20\) にしてもう一度「赤」に賭ける。二度目のスピンで勝ったなら、あなたは \(\$40\) を受け取ってカジノを去る。このときの儲けは \(\$40 - \$20 - \$10 = \$10\) となる。以下同様であり、もし三度目のスピンで勝ったなら儲けは \(\$80 - \$40 - \$20 - \$10 = \$10\) となる。
公平なルーレット盤にさえどうやっても勝てないと先ほど説明したので、この戦略を不公平なルーレット盤に対して使ったとしても勝てるはずはない。しかし本当だろうか? ヨーロッパ式のルーレット盤では「赤」が出る確率が \(0.486\) なので、初めて「赤」が出るまでのスピン回数の期待値は \(3\) 未満である。さらに、何度も勝負したときいずれ「赤」が出る確率は \(1\) である。そして一度でも「赤」が出れば \(\$10\) の儲けが得られる。言い換えれば、倍賭けを使うとき確実に \(\$10\) が得られる。つまり期待収益は \(\$10\) であって \(\$0\) ではない!
何かがおかしい。
19.5.7 パラドックスの解決
「公平なルーレット盤を使うとき期待収益は \(0\) である」と示した議論では、期待値の線形性が無限和に対して間違った形で暗黙に使われている。
この事実を注意深く説明するために、先述した倍賭けの戦略を使うとき \(n\) 回目の賭けの収益を表す確率変数を \(B_{n}\) とする。ただし \(n\) 回目の賭けを行わない (\(n\) 回目より前に「赤」が出た) 場合は \(B_{n} = 0\) と定める。このとき、ギャンブラーの総収益は
である。そして期待収益は次の式で表せる:
さらに、ルーレット盤が公平だと仮定しているので \(\operatorname{Ex} [B_{n}] = 0\) が成り立つ。ここから次の等式を得る:
先ほどの議論に含まれる間違いは、期待値の線形性を利用して和の期待値 \(\text{(19.15)}\) が期待値の和 \(\text{(19.16)}\) に等しいと結論したことにある。この状況では期待値が線形性を持たない ── 和の期待値 \(\text{(19.15)}\) は \(10\) で期待値の和 \(\text{(19.16)}\) は収束するにもかかわらず、両者が等しいことは要請されない。ここでの問題は収益の期待値の絶対値の和が収束しない、つまり和 \(\text{(19.16)}\) が絶対収束しないために期待値の線形性 (定理 19.5.5) で必要な仮定が満たされないことである。実際、\(\$10\) から始める倍賭けでは \(n\) 回目の賭け金が \(10 \cdot 2^{n-1}\) で、賭けが \(n\) 回目まで進行する確率は \(2^{-n}\) である。よって次の等式が分かる:
よって期待値の絶対値の和 (次式) は発散する:
つまり公平なゲームで儲けることはできないという仮定、そしてその結論を導くために示した議論は間違っていた: 倍賭けを使えば、必ず儲けを手にしてカジノを後にできる。確率論から一見すると不合理な結論が得られてしまった!
しかし確率論を見放すのはまだ早い。賭けられる金額が有限の場合 ── 例えば \(k\) 回目のスピンまでに勝てないと破産する場合 ── には、期待値は \(B_{1} + B_{2} + \cdots + B_{k}\) と計算するのが正しい。このとき期待値はルーレット盤が公平なら \(0\) になり、不公平なら負になる。言い換えれば、倍賭けを実行に移すには無限の資金が必要となる。つまり倍賭けが実行可能と仮定すること自体が不合理であり、不合理な仮定から不合理な結論が得られたとしても心配はいらない。
19.5.8 積の期待値
和の期待値は期待値の和に等しい一方で、積に対する同じ関係は一般に成り立たない。例えば、公平な六面サイコロを振って出る目を表す確率変数を \(R\) とする。このとき \(\operatorname{Ex} [R \cdot R] = \operatorname{Ex} [R] \cdot \operatorname{Ex} [R]\) は成り立つだろうか?
以前に示したように \(\operatorname{Ex} [R] = 7/2\) なので \(\operatorname{Ex} [R] \cdot \operatorname{Ex} [R] = 49/4\) が分かる。\(\operatorname{Ex} [R \cdot R]\) を計算してみよう:
よって \(\operatorname{Ex}[R \cdot R] \neq \operatorname{Ex} [R] \cdot \operatorname{Ex} [R]\) が分かった。つまり、積の期待値が期待値の積に等しいとは限らない。
ただし、等号が成り立つ場合もある。二つの確率変数が独立なら、積の期待値と期待値の積は等しい:
確率変数 \(R_{1}\), \(R_{2}\) が独立なら、次の等式が成り立つ:
証明は \(\operatorname{Ex} [R_{1} \cdot R_{2}]\) を定義通りに展開してから項を並び替えることで行う。詳細は問題 19.29 に示した。定理 19.5.6 は相互独立な \(n\) 個の変数に関する等式に当然ながら拡張できる:
確率変数 \(R_{1}\), \(R_{2}\), \(\ldots\), \(R_{k}\) が相互独立なら、次の等式が成り立つ: