以前「原因の確率の考え方」で学んだやり方で次の問題を考えてみたいと思います。なので,「原因の確率の考え方」をまだ読んでいない人はぜひ,そちらをご覧になってから下の問題を解いてみてください。
問題
罹患率(病気にかかっている人の確率)が0.01%である病気があります。この病気にかかっているかを診断する機械があり,その精度は99%の確率で陰性(病気にかかっていない)であれば陰性と,陽性(病気にかかっている)であれば陽性と判定してくれる。さて,あなたはこの機械で診断受けた結果「陽性」と判定されたとき,本当に陽性である確率はいくつか?
答えはもちろん99%ではありません。有名な問題なので知っている人もいるかと思います。そして,答えが自分の想像とかけ離れた値であることもご存じかと思います。知らない人は答えを見ても信じられないと感じると思います。ぜひ,最後まで読んでみると新たな発見があるかもしれません。
考え方
この問題文を読んで条件付き確率だと気が付く人はもう、確率の演習をきちんと積んでいる優等生です。なので,この問題も全体の通り数が簡単には分からないんだなと考えるでしょう。その通りです。しかも前回の問題との違いは具体的な個数(この問題文では人数)が書いていないんです。なので,ほとんどの問題集の解答では確率の乗法定理$$P(A|B)=\frac{P(A\cap{B})}{P(B)}$$を用いて,Bという条件のもとAが起こる確率を計算しているものが多いです。この式の右辺を見れば分かりますが,分母分子ともに確率なので分数です。確率は$$P(A)=\frac{Aが起こる通り数}{全体の通り数}$$であると学習してきていきなりこんな式を見せられても戸惑いしかおきません。なので今回もきちんと整数で分母分子を考えられるやり方を解説していきます。
解説・解答
この問題を具体的に整数で解く方法は人数を自分で設定してしまうということです。つまり,罹患率0.01%ではなくて,1000000人(100万人)がいて実際に病気にかかっている人が100人いる。としてしまうのです。そして,この1000000人(かかっている人数100人,かかっていない人数999900人)が検査を受けたらどんな検査結果になるかをすべて計算してしまうことです。まずは,どんなグループができるかを理解することが重要です。そして,そのグループは4つに分かれます。(下の図を参照)そしてそれぞれのグループの人数を書き込んでいけばおのずとこの問題が解けてしまいます。
A: 病気にかかっていて陽性と診断された人(真陽性) 病気にかかっている人は100人で正しく陽性と判定される確率は99%だから$$100\times0.99=99$$よって 99人 | B: 病気にかかっていて陰性と診断された人(偽陰性) 病気にかかっている人は100人で誤って陽性と判定される確率は1%だから$$100\times0.01=1$$よって 1人 |
C: 病気にかかっていなく陽性と診断された人(偽陽性) 病気にかかっていない人は999900人で誤って陽性と判定される確率は1%だから$$999900\times0.01=9999$$よって 9999人 | D: 病気にかかっていなく陽性と診断された人(真陰性) 病気にかかっていない人は999900人で正しく陰性と判定される確率は99%だから$$999900\times0.99=989901$$よって 9899901人 |
この関係ができてしまえばあとは簡単です。全体の通り数(人数)はどうなるかというと,条件付き確率のときの全体の通り数は問題文中の「○○のとき」に着目すればよかったんでしたよね。つまり「「陽性」と判定されたとき」と問題文に書いてありますから全体の通り数は陽性と判定されているAとCを合わせた人数である,$99+9999=10098$人である。そして,そのAとCの中で実際に病気にかかっている人が99人だからこの問題の確率は$$\frac{99}{10098}=\frac{1}{102}\fallingdotseq0.98%$$となります。
まとめ
いかがでしたか,実際に計算してみると自分の感覚とは大きくずれた値になったのではないでしょうか。99%の精度である機械で陽性と診断されても実際に罹患している確率は1%未満です。(鋭い人は気付いているかと思いますが,この計算は精度99%でも間違うから気にする必要はないといっているのではありません。この計算結果は精度よりも罹患率に大きく左右されます。その話はまた,後ほど。)なので,よく陽性だった場合に再検査をするのは,例え精度が高い機会でもこれほど偽陽性がでてしまうからなんですね。これからも,感覚とは異なる確率の世界をご紹介できれば思います。
コメント