【数理統計学入門】無限の猿定理(ボレル・カンテリの補題)【データサイエンス・機械学習】

こんにちはたくまろです。今回は無限の猿定理について紹介します。そもそも、無限の猿定理とは何か知っているでしょうか?猿が無限にいるわけではありません。(笑)これは、猿がランダムにタイプライターを打ったらいつか文章になるのか?という問題に関する定理です。実はこの問題は数学的に明確に答えが与えられています。それが、無限の猿定理につながります。

無限の猿定理の歴史

この無限の猿定理は、無限の取り扱いに関する定理です。20世紀のはじめ、統計力学の専門家であったエルミート・ボレルとアーサー・エディントンが猿が偶然にもシェイクスピアの作品をタイプライターで打つことができるのか?という問題を提唱しました。おそらく、そのような偶然はまずあり得ないです。

例えば、タイプライターのキーが100個あるとします。このとき”hello”という言葉を打つと考えた時に、ランダムにキーを押して”hello”になる確率は\((1/100)^5=10^{-10}\)という途轍もない低い確率です。高々、5文字程度でこのぐらい低い確率になるため、シェイクスピアの作品のような長い文章になるとおそらく、天文学的な数値になるでしょう。

では、十分に長い時間の中で何度もランダムにタイプライターを打ち続けたらいずれ、シェイクスピアの作品になるのではないか?というのが無限の猿の問題です。少しイメージがつきにくいですが、十分に長い時間で考えれば、必ずシェイクスピアの作品になることがあります。これが無限の猿定理です。

十分に長い時間無限の考え方に対応しています。たとえどんなに小さな確率だとしてもそれは必ず0より大きい有限な値なので無限回繰り返せば必ず、シェイクスピアの作品になりそうですよね。おそらく、現実世界でやろうと思っても、宇宙の誕生から現在までの46億年タイプライターを打ち続けても、シェイクスピアの作品になることはないでしょう。それぐらい、無限というのは巨大なものを考えています。

無限の猿定理の拡張

先の例ではタイプライターのキーの数は固定でしたが、時代を経るごとにキーの数はどんどん増えていますよね。PCのキーボードを見てください。おそらく100個以上のキーボードが並んでいますよね。というわけで、タイプライターのキーの数が少しずつ増えるとどうなるでしょう

具体的には、1回目は100個のキーで打つ、2回目は101個のキーで打つ、…n回目は100+(n-1)個のキーで打つ、…といった具合で試行回数を増やすごとにキーの数を増やします。そうすると、後半になればなるほどシェイクスピアの作品になる確率はどんどん低くなるでしょう。

では、このようにキーの数が増える場合でも無限回繰り返せばシェイクスピアの作品になるのでしょうか?その疑問に答えたのがボレル・カンテリ(Borel-Cantelli)の補題です。では、少し数学的な記述になりますが、ボレル・カンテリの補題についてみてみましょう。

ボレル・カンテリ(Borel-Cantelli)の補題

\(A_1,A_2,…\) : 事象の列. P(A_j):事象\(A_j\)が起こる確率. このとき,

$$\sum_{j=1}^{\infty}P(A_j)<\infty$$

ならば, 試行を無限回繰り返しても, 事象\(A_j\)が無限回起きる確率は0に近づく. また,

$$\sum_{j=1}^{\infty}P(A_j)=\infty$$

かつ\(A_j\)が独立ならば, 試行を無限回繰り返したら, 事象\(A_j\)が無限回起きる確率は1に近づく.

やや数学の言葉で書いているので分かりにくいかもしれません。\(A_j\)を\(j\)回目に猿がタイプライターでシェイクスピアの作品を書く事象とみます。

例えば、
タイプライターのキーの数:\(100\)
作品のワード数:\(M\)
とします。すると、\(j\)回目に偶然文章になる確率\(P(A_j)=(1/100)^M,\ j=1,2,…\)になります。\((1/100)^M\)は\(j\)によらない定数なので、

$$\sum_{j=1}^{\infty}P(A_j)=\infty$$

となります。なので、事象\(A_j\)つまり猿がタイプライターで偶然シェイクスピアの作品を売ってしまう事象は無限回おこります。つまり試行回数を増やせば、いずれ作品になる可能性が高いと考えられます。

しかしながらキーの数が試行回数を増やすごとに\(1\)つ増えるとした場合、\(j\)回目にはキーの数が\(100+(j-1)\)回になります。ゆえに\(P(A_j)=(1/(100+(j-1)))^M,\ j=1,2,…\)になるので、

$$\sum_{j=1}^{\infty}P(A_j)=\sum_{j=1}^{\infty}(1/(100+(j-1)))^M<\infty$$

となります。収束することはダランベールの収束判定を使えばわかります。つまり、キーの数が一つづつ増える場合は、試行回数を増やしても、作品が出来上がる可能性は限りなく0になると考えられます。

この補題があることによって、十分に長い時間かければ猿がタイプライターを打って偶然作品になるか、ならないか、判定することが出来ます。無限の猿定理はボレル・カンテリの補題の特別な場合と見ることが出来ますね。

まとめ

今回は無限に関する話題として、無限の猿定理について紹介しました。無限が絡むと直感に反することが多々あります。数学の力を使って理論的な枠組みでとらえることで、無限の扱いを克服してきました。他にも、僕のブログでは数学研究が役に立つ理由についても記事を書いています。よかったらご覧ください。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です