ガシャポンのパラドックス

ガシャポンで、1/6の確率で出てくる当たりを狙っているとする。
ガシャポンの嫌なところは、今まで外れてきた実績が蓄積されない点だ。
これだけ外れたから次は当たりやすい、ということがない。
(ここではそういう前提で話をする)
さて、無限の所持金を用意し、当たりが出るまで粘ることにした。
当たりを引くまでの平均回数は6回である。1回100円なら600円かかる。
ここでふと、自分が来る前に出た直近の当たりは何回前だろうと考える。
当然だが、これも平均6回前である。
ちょっと待て、そうすると、「直前の当たり」と「自分が引くことになる当たり」の平均間隔(連続で当たった場合の間隔は1)は、11ということになる。
一例として、●が当たり、○がハズレとして↓のようになっている。●と●の距離は11だ。

過去●○○○○○現在○○○○○●未来

確率が1/6だから、当たりと当たりの平均間隔は6であるはずなのに、11とはどういうことだ。

答え

平均間隔が6であることは本当。
平均間隔が11に見えたのは、間隔の選び方がランダムでなかったからだ。
例えば、下のような状況を考える。

●(1)○(2)○(3)○(4)○(5)○(6)○(7)○(8)○(9)●(10)●

自分がガシャポンをしに訪れたときに、「直前の当たり」と「自分が引くことになる当たり」の間隔を調べると、間隔が1であるのは時刻(10)に訪れたときのみであり、(1)〜(9)の場合は全て間隔9を観測する。自分が感じる平均間隔は(1+9+9+9+9+9+9+9+9+9)/10=8.2だ。
しかし、ここでの本当の平均間隔は(9+1)/2=5である。
つまり、長い間隔は長いがために自分が出くわしやすいのだ。
自分が観測する当たりの平均間隔は11だが、
自分が観測する次の当たりまでの平均回数は6のままなので安心していい。
例えば、上図で(9)の時刻に開始すると、間隔は9だが、1回で当たる。

計算

この11という数字は、面倒な計算からも出すことができる。
まず、通常の平均間隔を計算してみる。
間隔kが出現するというのは、k-1回のハズレの後に当たることなので、
(\frac{5}{6})^{k-1}\cdot\frac{1}{6}という確率で現れる。
よって、平均間隔は、次のようになる。
\sum^\infty_{k=1}k\cdot(\frac{5}{6})^{k-1}\cdot\frac{1}{6}=6
次に、間隔ではなく時刻(回数)をランダムに選んだときの平均間隔を求める。
間隔の長さに比例して選ばれやすくなるので、元の確率にkをかけた加重平均をとる。

\frac{\sum^\infty_{k=1}k\cdot k\cdot(\frac{5}{6})^{k-1}\cdot\frac{1}{6}}{\sum^\infty_{k=1}k\cdot(\frac{5}{6})^{k-1}\cdot\frac{1}{6}}=11
この分子の計算は最初恐れをなしたが、分母の計算に使った手法を重ねるだけで済んだ。
以下のように、多少長いが終わってみれば簡単である。
\begin{tabular}{rr}S= & 1+2^2x+3^2x^2+4^2x^3+\cdots \\xS= & x+2^2x^2+3^2x^3+\cdots \\(1-x)S= & 1+3x+5x^2+7x^3+\cdots \\x(1-x)S= & x+3x^2+5x^3+\cdots \\(1-x)^2S= & 1+2x+2x^2+2x^3+\cdots \\x(1-x)^2S= & x+2x^2+2x^3+\cdots \end{tabular}
(1-x)^3S=1+x \\S=\frac{1+x}{(1-x)^3}
計算するにはきっちり考える必要があるので、11という数の持つ意味もわかりやすくなった。
元ネタは、以前聞いた話で、タクシーの平均待ち時間の話だった。
ガシャポンの方が普通の人にとってランダムのイメージがしやすいかと思ったが、
離散的になったので計算が面倒になってしまった(タクシーの場合は積分する)。