マスコミは統計でウソをつくなんていうページも作ってみるかな〜と画策中。
確率統計に精通すると、判断力が養われる。これは僕が勝手に思っていることだが、間違いなく判断力がつく。それって本当に起こるのか。起こるとするとどのくらいの確率で起こるのか。その起こる確率って、実際に僕が目にする頻度だろうか、体験する頻度だろうか。とか。
また、そのアンケート調査はなぜそういう結果が出たのか。母集団はどれくらいで、サンプルはどのくらい取り、回収率はどのくらいだったか。ちまたにあふれる「アンケート」とやらは、たいていが「結果を新聞社の主張にあわせたものにしたい」という新聞社(を中心とするマスコミ)の操作である、ということに気がつく。
その他ABO血液型の嘘、占星術の嘘、詐欺被害の回避、という実用的なものから人間観察、話のネタまで。確率統計に精通すると、判断力が養われるだけでなく人生も豊かになる。というのは大げさでしょうか。
『統計でウソをつく法』(ダレルハフ著、講談社ブルーバックス刊)を絶対に読め。話はそれからだ。amazonにリンクしたから今すぐ買え。この他にも「統計はこうやって人をだます」という趣旨の本が多く出回っているけれど、それらに手を出す前に、まずこのダレルハフの統計でウソをつく法をまず真っ先に読むべき。
ある町のタクシーの15%は青で85%は赤である。ひき逃げ事件が起き、証言によると轢いたのは青タクシーだという。この目撃者は事件発生時の状況では80%の確率で正しい色を見分けられ、20%は逆の色を言ってしまうことが分かった。さて、証言通り青タクシーが犯人である確率はいくつか。
詳細計算式は割愛。事前確率を無視すれば、8割方青っぽいが、実はそうでもないのである、というお話。これはちょっと納得がいかなかった。
僕はある町で殺人事件を犯した。町の人口は5千万人で、僕はそのうちの一人だ。僕が殺人事件を犯しているのを見たという証人が現れた。その証人は事件当日の状況で80%の確率で僕と見分けられることがわかった。さて、僕が犯人である確率はどれくらいか。
僕が犯人である確率はこのベイズの定理に当てはめるとざーっと計算したところ5000万分の4くらいになる。(と思う。計算に自信なし)人口比で5千万分の1で僕が犯人であるという確率をまず考えなければならないのだから、当然こんな確率になる。
8割の確率で「貴様が犯人だ」と証言する人物が現れても、僕を裁くことはできないということか。さて、本当にそうなのだろうか。
僕的に全く納得がいかないので、下記のような問題を作成し、自己解決を図ることとした。
青と赤の二色のビー玉が大量に詰まった箱がある。85%が赤ビー玉で15%が青ビー玉。ある業者がこれを80%の確率で選別する機械を開発した。この機械を通すと、青のビー玉は青バケツに、赤のビー玉は赤バケツに勝手に入れてくれる。
このビー玉選別機械は、赤バケツには結構な量で赤ビー玉が入っている。こちらは89%きちんと赤のビー玉が入っている。しかし、青バケツには赤バケツにくらべるとそんなに量は入っていないし、しかも青バケツには41%の青ビー玉しか入っていないのだ。半分以上赤ビー玉が入っている!!
・・・・という話に単純化できるわけだ。、この機械のセールスマンは、80%の確率で選別するというふれこみでこの機械を開発したというのにだ。
「証言」というと、ご大層なものだが、この選別機械の仕組みが分かれば、なんとなくそういう話として理解できる。
証言というものがこの選別機械と同様なわけがなく、タクシー問題で言うと正しく80%の確率で青タクシーであるという証言をする証人は存在しない。そしてやっぱり僕は殺人犯として起訴されるだろう。
このタクシー問題は、犯罪者の詭弁としての利用価値しかない。薬品の判定、機械などの判断について考える時にのみ有効と思う。もちろん、人間は間違うものだし記憶というものは曖昧なものだから、それだけで審判するのは危険であるという警句ともとれる。しかしそんなことはこのタクシー問題を出すまでもなく、すでに知られていることだ。
3つの扉がある。このうちのどれかひとつの扉のうらには高額商品が隠されている。のこり2つはスカ。さて、この企画に参加したあなたは、一つの扉を選び、その前に立った。
そのときである。司会者が「さて、あなたはその扉を選びました。よかったですねえ、こちらの扉ははずれでしたよ」と、選んでいない扉のうち一つを開け、はずれ扉であることを示した。
「さあ、そのまま今立っている前の扉を開けますか?それとも残りの一つの扉に移りますか?」
そのまま開けたら確率は3分の1だが、もう一つの扉に移動すれば、なんと確率は3分の2に跳ね上がるのだ。このくらいはちょっと考えると分かるかも。分からなければ、実際シミュレートしてみると良い。5〜6回もさいころを振れば理解できるはず。
A,B,Cの3人の死刑囚がいる。このうちの一人だけか恩赦にて助かることになった。恩赦で助かる確率はA,B,C等しく3分の1。囚人Bが看守に「AとC,どちらかは必ず死刑になるんだからどっちが死刑になるかは教えてくれよ」と言い、看守は「Cは死刑になるよ」と教えてくれた。さて、囚人Bが助かる確率はどれくらいか
3分の1でかわらない。計算としては、「看守が「Cが死刑になる」と言う確率」は
そもそもの恩赦になる確率は全員3分の1。で、これらをベイズ定理に当てはめると3分の1という確率が求められる。分母が100%÷3+50%÷3、分子が50%÷3なので。
A,B,Cの3人の死刑囚がいる。このうちの一人がくじで恩赦で助かることになった。それぞれ罪の重さにより助かる確率はA,B,Cそれぞれ2分の1、4分の1、4分の1である。囚人Bが看守に「AとC,どちらかは必ず死刑になるんだからどっちが死刑になるかは教えてくれよ」と言い、看守は「Cは死刑になるよ」と教えてくれた。さて、囚人Bが助かる確率はどれくらいか
5分の1になる。聞く前と聞いた後では、確率が下がってしまう。分母は100%÷2+50%÷4、分子が50%÷4なので。 さて、この問題は『考えることの科学』(中公新書刊、市川伸一著)からの引用で、著者は「この問題を作成した私たち自身が驚いてしまった」だそうである。
僕としては確率に精通している著者(精通しているというかこれでメシを食っている著者)が驚いたことが驚きに値する。囚人Bの気持ちになってみれば分かる。助かる確率はAが2分の1で圧倒的に高いんだから、囚人Aが死刑になってくれればうれしかったはず。そうすれば残り1つの椅子は助かる確率が同率の囚人Cとで分け合うことになるはずだったんだから。
仮に「Aが死刑だよ」と看守が教えてくれた場合の確率をベイズの定理にあてはめて計算してみると 分母は100%÷4+50%÷4、分子が50%÷4で、3分の1。
つまりもし「囚人Aが死刑になる」と看守が言っていたら4分の1から3分の1へ確率は上がったのだ。(囚人Bとすれば、こんなややこしい計算をするまでもなく看守がそう言ってくれることを祈りつつ聞いたはずである(笑))確率が下がることもあり得るのであれば、逆に確率が下がることだって(感覚的にも)別に不思議じゃない。
だいたい、囚人Bの気持ちになれないことも問題だけれども、5分の1とか4分の1とかいう確率で考えていたから混乱しただけなんじゃない?一人は90%の確率で助かり、残りは5%の確率しかない。こんな極端な状況を考えれば、不思議でも何ともなくなると思うけれども。囚人問題その1をやってからその2をやると、確かにちょっと不思議に感じることは確かだけれど。
マンガを読んでいて面白いのがあった。合コンしたいブサ男がイケメン男に相談する。イケメン男『合コンなんてそううまくいくモノではない。気に入った女の子が来る確率は1/10、その気に入った子がこっちを気に入ってくれる確率は1/5、つまり成功率は1/50くらいなんだよ』という。
それを聞いたブサ男Aは、『あのイケメンでさえ1/50なんじゃ、俺たちなんて…』ブサ男B『しかし、それは前提確率が間違っているぞ!俺たちブサ男にとって、気に入った子が来る確率は7/10位、つまり7倍くらいにはなるだろう!』『おお、そういえばそうだそうだ!』『しかし問題はその子がこっちを気に入ってくれる確率だが、それは…1/35くらいか?!」『ふむふむ』『計算すると…やはり1/50か!!』『おお!』『これはつまり、イケメンのメリットが帳消しになっていると言うことだ!!』
と、主人公たちは妙に自信を深めて合コンに望むのだった。と言う話。おもしろかった。
「事故に遭う子供の80%は、自宅から80m以内で事故に遭っている」のだそうです。ふーん。だからいったいなんだっつうんでしょうか。「事故に遭う子供」が特別な抽出でなくて、外で遊んでいる子供を単に無作為抽出しても80%は自宅から80m以内で検出されることでしょう。単に母集団の割合を示すことにしかならい場合も十分に考えられる。
偉い人=アタマがいい=確率統計に精通している、という等式は成り立つことはなく、むしろ簡単にだまされているのがとても可笑しい。ただ、僕の勤め先は行政機関。「統計でウソをつく方」を用いてみんなをだまそうとしているのかも知れませんよ。国民の皆さんはだまされないように僕たちを監視してくださいね。こんな僕でも楽勝で論破できるような変なウソをつく偉い人は結構いっぱいいる。