【文系でもわかる!】数学研究が役に立つ理由教えます

こんにちはたくまろです。よく、自分が数学専攻であることを紹介すると大体の人は

何を研究しているの?

数学ってなんの役に立つの?

統計学と数学の関係とは?

などいろいろと聞かれます。よくセールで割合の計算とか、お金を借りたときに金利の計算をすると時に簡単な数学を使ったりするのでするとは思います。しかしながら、大学院まで数学の研究をやる必要ってあるの?そう思う人は多いのではないでしょうか。僕も大学に入るまで数学の研究は全くイメージがつきませんでした。今回は少しでも、数学研究の重要性をわかってもらうためにこの記事を書いています。

数学は大きく分けると4種類

数学は大きく分けるとこの4種類。

  1. 代数学
  2. 幾何学
  3. 解析学
  4. 応用数学

そして、1~3をまとめて純粋数学と呼びます。ぶっちゃけ僕は純粋数学の分野はよくわかりません。基礎的な部分は勉強しましたが深い部分はやっていないです。純粋数学は数学的理論を厳密な証明のもと作っています。理論を作るまでが純粋数学の仕事のような側面を持っています。

応用数学は、どちらかというとより現実的な問題を数学的に解くことを考えています。私の専門である数理統計学はこの応用数学の分野の1つになります。次のセクションでは数理統計学についてもっと詳しく紹介したいと思います。

数学と統計学の関係とは?

統計学は未知の物を予測したりすることに使われます。

コイントスを10回繰り返すと大体、表が出る回数が5回、裏が出る回数が5回になりそうですよね。実際には、偏りが出るのできっぱりと1:1にはならないでしょう。しかしながら、回数を10回、100回、1000回、…、と増やせば、表と裏がでる数が1:1に近づくでしょう。このように試行の回数を増やすことによって、真の確率に近づいていく現象をこれを大数の法則といいます。

では、次の場合はどうでしょう。1000回コイントスをして表が689回、裏が311回出ました。このとき、表と裏が出る確率はほんとに1:1なのでしょうか。表の出る確率が多いので、もしかしたらコインは曲がっていて表と裏が出る確率が1:1ではないのではないか?と考えることが出来ます。

直感的には1:1じゃない気がしますよね。では、このコインの出る目が1:1ではない可能性は何%なのでしょうか?この可能性を定量的に計算するときに数学の知識を使います。ちなみに、この場合だと95%以上の確率でのこのコインの出る目は1:1ではありません。

もちろん、このような問題はコイントスに限った話ではありません。例えば、12月31日に雪が降る確率などを知りたい場合に、過去のデータを使って12月31日に雪が降る確率を予測することが出来ます。他にも、大きな災害の後に株価が下がる確率はどれぐらいか、過去のデータを使って予測することが出来ます。

統計学は物事を予測する上で必要不可欠な学問ですが、それをより定量的な結果で与えるために数学の知識が必要になります。より理論的に統計的な性質を数式で記述した学問を数理統計学と呼びます。

現代科学における統計的な問題

先ほどの問題は比較的簡単なのですが、実際現代科学においてどのような研究がされているのでしょうか?真っ先に思い浮かぶのが機械学習ですよね。

例えば、ロボットに猫とイヌを判別させたいとします。まず、ロボットが見た猫やイヌの画像データを一つ一つの画素に分解をします。例えば8Kテレビだと約3200万画素数あります。その画素一つ一つを色の濃淡や明るさななどで数値化します。すると、画像データが約3200万個の数値のデータとみることが出来ます。一つのデータに含まれる数値の数を次元数と呼びます。今回の場合だと3200万が次元数です。

この約3200万の数値データをたくさん集めて、ロボットに学習させることで猫とイヌの画像データの特徴を数値的に計算できるようになるので、猫かイヌかを判別することが出来ます。猫かイヌかを予測するという面で、機械学習の理論は統計学を使っています。

しかし、画像データのように次元数が高いデータは解析が難しく理論的にはよく分かっていない部分も多いです。その為、データの数を増やすことによって予測の精度を上げています。データ数を増やすことによって大数の法則によって、真の結果に近づくから予測の精度が良くなります。

画像データの場合、数万個のデータを集めることが出来ますが、いつでもそのような状態になるとは限りません。

例えば、ある病気のDNAデータや、超新星爆発の観測データは次元数(データの情報量)が高い反面、データを集めることが難しいです。このような場合だと、データ数を増やして解析ができるようにすることが出来ません。そこでデータ数が少ない場合でも通用する方法を考える必要があります。

数学的な研究が必要になる理由

前述の通り、次元数が高く理論的に不明瞭なものはデータ数増やすことによって精度を上げていました。しかし、データ数が十分にない場合誤った結果を導くことが分かっています。そこで、どれぐらいのデータ数があれば、正しい結果を導くことができるか計算する必要があります。

そこで必要になるのが数学の知識です。特に漸近理論というものをよく使います。漸近理論は極限に関する概念を扱った理論です。この理論を使うことによって、次元数に対してどれぐらいデータ数があれば精度を保障できるのか数学的に導くことが出来ます。また漸近理論を応用すれば、よりデータ数が少なくてすむような方法を考えることが出来ます。

数学研究によって理論的な部分が明らかになり、その結果必要なデータの数を予測したり、理論的な新しい解析方法を考えることが出来ます。これが数学研究が必要になる理由です。

どんな研究をしているの?

上記の通り、僕は漸近理論を使った新たな方法を考えています。(通常、漸近理論といえばサンプル数が無限大の場合考えますが、ここでは次元数が無限大である状況を考えています。)データ数が少ない状況でも使えるような方法論を考えることが出来きれば、DNAのデータや超新星爆発の観測データのようなものへの応用が可能になります。直接的ではないものの数学の知識を使った研究を用いることで、実問題への役に立つことが何となくわかっていただけたでしょうか?

理論的な部分がわかることによってより緩い条件のもとで解析ができるため、余計にデータを集める手間が省けるため、数学の研究は非常に重要です。

まとめ

  • 数学は物事を定量的にとらえる上で重要であり、統計学を考える上で必要不可欠
  • 機械学習の分野では理論的にわかっていない部分が多い
  • 次元数が高いようなデータの解析は漸近理論というものが必要になる
  • 数学の研究によって理論的な部分を明らかにすることが出来るため、データ数がどれぐらい必要なのか求めることができるため、データ数が少ないものにも応用できる

 

2 COMMENTS

田辺輝真

大きな可能性を感じる研究ですね!
コインも∞大回数やれば1:1になるはずと伺ってますがいったい何回やるのか理論で貴重な研究ですね!恥ずかしながら、不勉強で。引き続き勉強させてください!

返信する
Takumaro

田辺輝真 さん
コメントありがとうございます。
とりあげてほしいテーマなどありましたら、ブログで書かせていただきます。
常時、ネタ切れ状態なのでもらえるとありがたいです。
こちらこそよろしくお願いします!

返信する

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です