以前の「【数学A】条件付き確率は『個数』で解け!苦手な『原因の確率』を公式なしで攻略する方法」で学んだやり方を使って、今回はさらに面白い、そして少し怖い(?)有名な問題に挑戦してみよう。
まだ前回の記事を読んでいない人は、ぜひそちらをご覧になってから下の問題を考えてみてほしい。
1.今回の挑戦状(問題)
【問題】
罹患率(病気にかかっている人の割合)が $0.01\%$ である病気があります。
この病気にかかっているかを調べる検査機械があり、その精度は $99\%$ です。(病気にかかっていない人が受ければ $99\%$ の確率で「陰性」、かかっている人が受ければ $99\%$ の確率で「陽性」と正しく判定してくれる)。
さて、あなたがこの機械で診断を受けた結果、悲しくも「陽性」と判定されてしまったとき、本当にその病気にかかっている確率はいくつか?
答えは、もちろん $99\%$ ではありません。
非常に有名な問題なので、答えを知っている人もいるかもしれない。そして、その答えが自分の直感・想像とかけ離れた値であることもご存じのはずだ。
初めて見る人は、答えを見ても「えっ、嘘でしょ!?」と信じられないと感じるだろう。ぜひ、最後まで読んでみてほしい。確率の裏にある「新たな発見」があるはずだ。
2.この問題の「何が」難しいのか?
この問題文を読んで「あ、条件付き確率(原因の確率)だ!」と気が付く人は、かなり確率の演習を積んでいる優等生だ。
「ということは、今回も全体の通り数が簡単には分からないんだな」と考えるだろう。その通り。しかも、前回の問題との最大の違いは、問題文に具体的な個数(人数)が1つも書いていない点にある。
そのため、ほとんどの問題集の解答では、確率の乗法定理
$$P(A|B) = \displaystyle \frac{P(A \cap B)}{P(B)}$$
を用いて、Bという条件(陽性)のもとでA(実際にかかっている)が起こる確率を計算している。
しかし、この式の右辺を見てほしい。分母も分子も「確率(分数や小数)」なので、分数のなかに分数が入るような複雑な計算式になってしまう。
もうここで投げ出したくなってしまいそうになるが、もうちょっと頑張ってほしい。
中学数学まで「確率は $\displaystyle \frac{\text{該当する通り数}}{\text{すべての通り数}}$ だよ」と教えられてきたのに、高校に入っていきなりこんな抽象的な式を見せられても、戸惑うのは当然だ。
だから今回も、公式は一切使わない。
きちんと「整数(人数)」で分母と分子をシンプルに考えられる最強のやり方で解説していこう。
3.解説・解答:勝手に100万人の町を作ってしまおう
この問題を具体的に整数で解くマジック、それは「勝手に人数を設定してしまう」ことだ。
割合($0.01\%$)のままだから難しく見える。だったら、ここに「1,000,000人(100万人)の町」があると仮定して、実際に全員が検査を受けたらどうなるかをシミュレーションしてしまえばいいのだ。
まず、罹患率 $0.01\%$ ということは、100万人の中で本当に病気にかかっている人は、わずか 100人 だ。
- 病気にかかっている人: 100人
- 病気にかかっていない人: 999,900人
この100万人が全員検査を受けたとき、どのような結果になるか、4つのグループに分けて人数をすべて書き出してみよう。
📊 運命の4つのグループ(100万人の内訳)

【A】病気にかかっていて、正しく「陽性」と診断された人(真陽性)
本当に病気にかかっている100人のうち、$99\%$ の人が正しく陽性と判定される。
$$100 \times 0.99 = 99 \quad \rightarrow \quad \mathbf{99\text{人}}$$
【B】病気にかかっているのに、誤って「陰性」と診断された人(偽陰性)
本当に病気にかかっている100人のうち、残りの $1\%$ は見逃されて陰性になってしまう。
$$100 \times 0.01 = 1 \quad \rightarrow \quad \mathbf{1\text{人}}$$
【C】病気にかかっていないのに、誤って「陽性」と診断された人(偽陽性)
健康な 999,900 人のうち、機械のエラー($1\%$)のせいで間違って陽性と判定されてしまう。
$$999,900 \times 0.01 = 9,999 \quad \rightarrow \quad \mathbf{9,999\text{人}}$$
【D】病気にかかっていなくて、正しく「陰性」と診断された人(真陰性)
健康な 999,900 人のうち、$99\%$ の人が正しく陰性と判定される。
$$999,900 \times 0.99 = 989,901 \quad \rightarrow \quad \mathbf{989,901\text{人}}$$
4.求めたい確率を計算する
4つのグループの人数が出揃えば、勝ちゲームだ。
条件付き確率を考えるときの「分母(全体の人数)」は、問題文の「〜のとき」に着目すればよかったはず。
今回の問題文には「『陽性』と判定されたとき」と書かれている。
つまり、分母になるのは「実際に検査で陽性反応が出た人」の合計、すなわち 【A】と【C】を合わせた人数 になる。
- 陽性と判定された全人数(分母):$$99 + 9,999 = 10,098\text{人}$$
そして、その「陽性と判定された 10,098人」の中で、「本当に病気にかかっている人(分子)」は【A】の 99人 しかいない。
したがって、求める確率は次のようになる。
$$\displaystyle \frac{99}{10,098} = \frac{1}{102} \fallingdotseq 0.98\%$$
なんと、約 $0.98\%$ ──。$1\%$ にすら満たないのだ。
5.まとめ:感覚を裏切る確率の正体
いかがだっただろうか。実際に具体数で計算してみると、自分の直感とは大きくズレた衝撃的な値になったのではないだろうか。
「精度 $99\%$ のすごい機械で陽性と言われたのに、実際に病気である確率は $1\%$ 未満」なのだ。
なぜこんなことが起きるのか?
鋭い人は気づいたかもしれないが、この原因は「検査機械の精度が低いから」ではない。
分母の計算をよく見てほしい。
本当に病気で陽性になった人(99人)よりも、「健康なのに、たった $1\%$ の確率で誤作動を起こして陽性になってしまった人(9,999人)」のほうが圧倒的に多いのだ。もともとの病気の罹患率($0.01\%$)が低すぎるため、健康な人の数が多すぎて、エラーの人数が本物の病人の数を簡単に飲み込んでしまうのである。
(※この計算結果は、機械の精度よりも、その病気がどれだけ珍しいかという「罹患率」に大きく左右される。この深い話はまた後ほど。)
精密検査で一度「陽性」が出たときに、お医者さんが「念のためもう一度別の検査をしましょう」と再検査を勧めるのは、医療ミスを防ぐためだけでなく、確率的にこれほど多くの「偽陽性(人違い)」が含まれていることを知っているからなのだ。
これからも、教科書の公式丸暗記では見えてこない、人間の感覚を心地よく裏切る面白い確率の世界を見ていこう。


コメント