第 IV 部 確率
確率は科学で最も重要な概念の一つであるとともに、最も誤解されている概念の一つでもある。
情報科学で確率は特に重要となる ── 情報科学の事実上全ての分野で確率は姿を現す。例えばアルゴリズムの設計とゲーム理論では、特定のステップにランダムな選択が含まれるアルゴリズムや戦略が決定的なものより優れることがよくある。情報理論と信号処理では、ノイズの除去とデータの圧縮にランダム性の理解が欠かせない。他にも例は多くある。
確率は情報科学でこれほど重要であるにもかかわらず、多くの人が確率を誤解しているのは奇妙なことである。問題は、ランダムな事象が関係する問題を解く上で「常識的な」直感が全く信頼できない事実にある。その結果、多くの学生は確率を恐れてしまう。非常に複雑な計算問題は解けるのに、最も簡単な確率の問題には答えられない学生を大学院入試の口頭試験で何人も見てきた。「 \(\cdots\) の確率はいくつだろう?」と尋ねただけで顔をしかめる教員さえいる。
以降の章での目標は、基本的な確率の問題に自信を持って簡単に解答できるようになるテクニックの使い方を習得することである。
第 17 章では基本的な定義と「四ステップ法」と呼ばれる基礎的な手法を説明する。四ステップ法を使うと、特定の事象が発生する確率を簡単に計算できる。直感的に考えるとおそらく間違う問題を四ステップ法で解く例も示す。第 18 章では条件付き確率と独立性という重要な概念が実際の問題における利用例 (そして誤った利用例) を交えて説明される: 病気の診断検査が陽性のとき本当に病気である確率、そして事件現場で見つかった血液と同じ血液型を持つ容疑者が有罪である確率を考える。
第 19 章で説明される確率変数を使うと、ランダムな事象をさらに定量的に測定できる。例えば、雨が降る確率ではなく振る雨の量や長さに関する確率的な議論が可能になる。確率変数の期待値という非常に重要な概念も説明され、その基本的な性質も示される。
第 20 章では確率変数が期待値から大きく離れる確率を議論する。この議論は科学、工学、人間関係で欠かせないサンプリングによる推定の理論的基礎を提供する。実際のエンジニアリングでも大きな意味を持つ。なぜなら、物事が期待通りに振る舞っているときに問題が起こらないのは当然として、期待していない事象が起こる確率を非常に低くすることも求められるからである。
最後の第 21 章では、第 IV 部で学ぶ確率に関するテクニックを総動員して複雑な問題を解く方法を説明する。カジノを出し抜くのが不可能な理由、そしてグラフ理論と確率理論を応用して優れたウェブ検索エンジンを構築することで二人の Stanford 大学院生が億万長者になった理由を理解できるだろう。