第 20 章 期待値からの偏差
前章では期待値の有用性を当然とみなし、期待値を計算する様々なテクニックを紹介した。しかし、この値に注目すべき理由は何だろうか? 確率変数が期待値に近い値をほとんど取らない場合もある。
期待値に注目すべき最も重要な理由は、サンプリングによる推定が期待値と密接な関連を持つ事実である。例えば、人口全体を考えたときの年齢・収入・世帯人数といった値の平均値を推定したいなら、次のようにすればよい。まず、ランダムな人物を選択する処理 ── 例えば国勢調査の結果を並べたリストにダーツを投げる ── を決める。この処理によって選択される人物の年齢や収入といった値を表す確率変数を考えると、その平均値は全人口の実際の平均値に等しい。よってランダムな人物を何人かサンプルして期待値を計算すれば、それが全人口の平均値の推定となる。
しかし、サンプリングによる平均値の推定を実用するには「推定された値にはどの程度の信頼が置けるか?」「特定の信頼度を達成するにはどれだけの大きさのサンプルが必要か?」といった質問に答えられる必要がある。こういった問題に関する理論は全ての実験科学の基礎を支えている ── 同じ量を何度も測定したときにランダムな誤差 (ノイズ) が全く同じになることはまずあり得ない。実験における計測の信頼度は科学における根源的かつ普遍的な概念である。サンプリングや測定の正確性を厳密に議論すると、期待値からの偏差 (deviation, 逸脱) が特定の値になる確率を求める問題が現れる。
似た問題はエンジニアリングでも姿を現す。例えば、堤防の設計では少なくとも今後一世紀に発生する津波に高確率で耐えられるだけの強度はどれくらいかを知る必要があるかもしれない。コンピューターネットワークを構築するときは、メンテナンスを受けない状態で一か月以上の動作を可能にするには同時にどれだけのコンポーネント障害に耐えるべきかを大まかに見積もることになる可能性がある。あるいは保険業界で働いているなら、これからの \(30\) 年で保険金をまず間違いなく支払える状態を保つには資金を手元にどれだけ残しておくべきかを知っておいた方がいい。こういった問題は期待値からの極端な偏差が発生する確率を求める問題に帰着される。
この期待値からの偏差が本章のテーマとなる。