今回は、統計学を学ぶモチベーションについて、大学院で統計学の研究をした者として詳しく説明したいと思います。
「統計学で何がわかるの?」
「統計学で学ぶ内容を簡単に教えて!」
このような疑問や意見について、お答えしたいと思います。
これから、統計学について学ぶ方は是非ご覧ください!
統計学で分かることは?
答えは”定量性”です
ズバリ、統計学を学んで分かることは”定量性”だと思っています。
では、何の定量性か?気になりますよね。
それは、出来事に対する発生確率に対する定量性です。
例えば、降水確率や生命保険料の計算などで、定量性が求められます。
分からないものを推定する
世論調査を例に、説明したいと思います。
男女100人に、新たな育児休業制度に関するアンケートを行いました。
男性の支持率64%で女性の支持率は68%でした。
この結果をみると、女性の支持率が高いので、
「女性の社会進出を推進させているのではないか?」
ということが思い浮かぶかもしれませんね。
しかし、実際にアンケートをしているのは100人だけで、日本に住むすべての人に聞いているわけではありません。
もしかしら、たまたま支持している人が多いだけで、実際は女性の支持率はもっと低いという可能性もあります。
そうなると、
「男性の支持率も女性の支持率も大きく差がないのでは?」
といった疑問が生まれます。
しかし、日本中の人全員に聞くことはかなり難しいですよね。
そこで、分からないものを推定するために統計学の力が必要になります。
統計学は100%ではない
上記の問題を解決するため、魔法のような方法で日本にいる人全員にアンケート出来ないかぎり、100%断言することは出来ません。
そのため、統計学に出来ることは
「〇〇%で男性の支持率と女性の支持率に差があるといえる」
といった、確率を使った定量的な表現をすることです。
ちなみに今回の世論調査の結果から、比率の検定というものを行えば、90%以上の確率で男女の支持率に差があることがわかります。ただし、男性と女性はそれぞれ50人だったとします。
この90%という定量的な結果を求めるために、統計学というものがあると言えます。
統計学って何を学ぶの?
ざっくり、この2つの性質や計算がはじめて統計学を学ぶ上で重要です。
統計学の大事な概念① 母集団と標本集合
もしかしたら、知っている人もいるかもしれませんね。
先の例では、母集団が日本に住んでいるすべての人で、標本集合が世論調査をした100人です。
母集団の情報は分からなくて、標本集合の情報は分かっています。
なので、標本集合から母集団の情報を推定・推測するのが、統計学の一つの目的です。
その為に、母集団と標本集合の関係性や性質をよく理解していないといけません。
例えば、大数の法則なども母集団と標本集合をつなぐ性質の一つです。
これらの性質を利用して、母集団の推定を行っていきます。
大数の法則は、標本集合の数が多くなればなるほど、母集団の情報に近づくという法則です。
たとえば、先程の世論調査の人数が、100人→1000人→10000人→….と増えたら、データの偏りがなくなっていき、日本中全員に調査をした結果に近づきます。
これが、大数の法則のざっくりとした説明です。サンプル数を増やせば、増やすほど、標本集合の結果が母集団の結果に近づくという、標本集合と母集団をつなげる性質の一つとも言えます。
統計学の大事な概念② 確率
言うまでもないと思いますが、確率という概念が分かってないといけません。
先程計算した、90%も確率の計算が必要です。
しかし、ここでは計算をする力よりも、どうすれば値をもとめることができるか?を理解する方が大切です。
手計算でコツコツ求めても良いのですが、具体的な計算はほぼパソコンや計算機に任せることがほとんどだからです。
なので、どうゆう風にすれば確率の計算ができるのかということが分かっていれば、プログラミングをするときも役に立つでしょう。
まとめ
今回は統計学のモチベーションについて、まとめてみました。
Takumaro’s blogでは、はじめて統計学を学ぶ方向けにさまざまな本を紹介しています。幅広く学ぶことができる良書を集めているので、興味がある方はこちらもご覧ください。
【初心者におすすめ】はじめての統計学におすすめの本【統計学入門書】
【数学専攻がおすすめ】数理統計学おすすめの本10選【数理統計学入門】
【初心者におすすめ】統計学のための数学おすすめの本5選【統計学入門書】