一連の確率問題の解説 via 「2つの封筒問題」続き

とにもかくにも、「トランプと3つの箱」「2つの封筒問題」に解答して終わろうと思う。

「2つの封筒問題」 2009-08-05より

封筒問題というのは、2つの封筒があって、片方にはもう片方の2倍の金額が入っている。最初にどちらかの封筒を選んで、中を見てから別の封筒に交換することができるが、交換したほうが得かどうか。

100円の場合の解説の後、以下のように指摘されています。

選んだ封筒に入っている金額が幾らであった場合でも、上の説明は成り立ちます。100円でなく、200円でも1000円であっても、封筒を交換したほうが得です。中身を見た場合の金額に関わらず交換した方が期待値が高くなるのだから、中身を見るまでもなく交換したほうが良いとなりそうですが、これは少し変です。最初にどちらの封筒を選んだとしても、交換したほうが得だなんてことがあるのでしょうか。それに、いったん交換してからもう一度同じ考え方を適用すると、また交換したほうが期待値は高くなるということになり、これまた矛盾しています。

本当でしょうか。

100円の時

例えば、最初に選んだ封筒に100円が入っていた場合、

前回のおさらいです。情報が得られたら、どんなことが起きたらこの情報が出てくるか、道筋をつけるのでした。選んだ封筒に100円が入っているのを見るためには、何が起きればいいか考えてみましょう。

まず、あなたが選ぶ段階で、偶然にも100円の入っている方を選ぶ必要があったわけですね。もう一方を選んでいたら、100円とは出会えませんでした。さらに出題者が偶然にも、(50円,100円) or (100円,200円)を封筒に入れることを選ぶ必要があったわけです。他の金額を選んでいたら、やはり100円には出会えませんでした。これだけの厳しい条件をくぐり抜けて、この100円はあなたの前に姿を現したのです。

そんなわけで道筋は、

  1. 出題者が入れる金額を(50円,100円)に決め、あなたが100円の入った方の封筒を選ぶ。
  2. 出題者が入れる金額を(100円,200円)に決め、あなたが100円の入った方の封筒を選ぶ。

の2本になります。

それぞれの確率を計算したいわけですけれども、出題者が金額を決めるときの確率はよくわかりませんね。なので、そこは文字でおいておきます。ついでに、「例えば」ということで決めた100円も、変数にしてしまいましょう。

一般形
  • あなたが最初に選んだ封筒にはa円が入っていた。
  • 出題者が(x円, 2x円)を封筒に入れる確率をf(x)とおく。

先ほどと同じく、あなたが選んだ封筒にa円が入っているための道筋は

  1. 出題者が入れる金額を(a/2円,a円)に決め (f(a/2)) × あなたが100円の入った方の封筒を選ぶ (1/2) = f(a/2)/2
  2. 出題者が入れる金額を(a円,2a円)に決め (f(a)) × あなたが100円の入った方の封筒を選ぶ (1/2) = f(a)/2

の2本です。この2つを足して、f(a/2)/2 + f(a)/2 が、あなたが選んだ封筒にa円が入っている確率だったことがわかります。
そして、各ルートの貢献度=各ルートを通ってきた確率は

  1. \frac{\frac{1}{2}f(a/2)}{\frac{1}{2}f(a/2)+\frac{1}{2}f(a)} = \frac{1}{1+\frac{f(a)}{f(a/2)}}
  2. \frac{\frac{1}{2}f(a)}{\frac{1}{2}f(a/2)+\frac{1}{2}f(a)} = \frac{1}{\frac{f(a/2)}{f(a)}+1}

です。それぞれのルートで封筒を交換する場合、得られる金額は1.ならa/2円、2.なら2a円。それに各ルートを通ってきた確率を掛けて足せば、封筒を交換する場合に得られる金額の期待値
\frac{a/2}{1+\frac{f(a)}{f(a/2)}} + \frac{2a}{\frac{f(a/2)}{f(a)}+1}
となります。これと、封筒を交換しない場合に得られる金額 a と、どちらが大きいかが問題です。

ということで、「封筒を交換した方がお得」という条件から出発して、それがどういう時なのか見てみましょう。
\frac{a/2}{1+\frac{f(a)}{f(a/2)}} + \frac{2a}{\frac{f(a/2)}{f(a)}+1} > a
P:=\frac{f(a)}{f(a/2)}とおいて変形していくと
\frac{a/2}{1+P} + \frac{2a}{P^{-1}+1} > a
\frac{1}{1+P} + \frac{4P}{1+P} > 2
1+ 4P > 2(1+P)
2P > 1
2\frac{f(a)}{f(a/2)} > 1
f(a) > \frac{1}{2}f(a/2)
となります。

まとめ

「封筒を交換した方がお得」\Leftrightarrow f(a) > \frac{1}{2}f(a/2)
つまり、『あなたは、あなたが最初に選んだ封筒に a 円が入っているのを見た。このとき、出題者が (a円,2a円) を入れる確率が、(a/2円,a円) を入れる確率の半分より大きければ、封筒を交換すべき。』これが結論です。

実際、出題者が入れることのできる金額には限界があるし、そうそう高い金額を入れたがるわけもないので、この条件を満たさなくなるaが必ず存在します。後は、f(x)をいかにうまく推定するかという話になってきます。綺麗にまとまりました。

しかし、最後にちょっと心に留めておいてほしいことは、期待値は、必ずしも我々が望むものとは限らない、ということです。特に、試行回数に限度があったり、分散が高すぎる場合など。嬉しさが金額に比例して増すか?という話もありますしね。

関連:wikipedia:サンクトペテルブルクのパラドックス