こんにちは、たくまろ(@takumaroblog)です。
いざ統計学の勉強をしようとするとき、自分のレベルに合った本を見つけるのって難しいですよね。
そこで、今回は2022年最新版「統計学おすすめの本100選」を紹介したいと思います。
私がこれまで統計学の方法論について研究をしていました。
その中で「得られるものが多かった本」「わかりやすかった本」を気合で100冊選びました。
簡単な本から専門性が高い本まで、たくさん用意しました。
これを読めば、あなたに合った一冊が見つかるでしょう!
文系OK!統計学超入門
ここでは、前提知識0で話を進めてくれる、数学NGな文系の方でも読みやすいおすすめの本を厳選しました。
「数学が苦手」「理論的なことはなるべくやりたくない」「ほかの入門書で挫折した」
こんな事を思っている方におすすめです。
完全独習統計学入門
価格:1,980円 |
- 中学数学までの内容で検定やパラメータ推定の内容を網羅!
- マーケティング調査や株取引のリスクとリターン、選挙の出口調査までが体系的に理解できる!
よくある統計学入門の本で、挫折してしまっている人におすすめ!
まさに、入門書の入門書と言っても過言ではありません。
数学の知識がなくても、統計学を使ってみたい人におすすめの本となります。
統計学の図鑑
価格:2,728円 |
- オールカラーとふんだんな図で、とても丁寧な説明!
- 馴染みのある言葉でも、意味や定義を一つ一つ解説!
「割合」や「平均」といった馴染みのある単語でも、図や表を用いて説明がされているので、より深い理解をすることができます。
もちろん、簡単なものばかりではありません。「母集団」や「分布」など統計学で現れるような専門用語も分かりやすく説明しています。
どちらかというと、大人よりも中高生向けに、分かりやすい内容になっています。
文系の私に超わかりやすく統計学を教えてください!
データ分析の先生!文系の私に超わかりやすく統計学を教えてください! [ 高橋 信 ] 価格:1,650円 |
- 数式がほとんど登場しない!
- Kindle Unlimitedで無料で読むことができる!
統計学の「文系のための翻訳書」として登場した本です。
数字やデータを使いこなすためにまずは統計学とやらを学んでみよう!と入門書を手にとってみるも、数学的な難しさから門前払いされてしまう……。本書はそんな方々のために書かれた言わば「統計学の翻訳書」です。
母集団の推定や重回帰分析まで、わかりやすくていねいに解説。数字が苦手な「文系人間」を自負する方々はもちろん、統計学の初学者や独学で挫折してしまった方、過去に学んだものの実は理解に不安が残る方にもおすすめです。
マンガでわかる統計学
マンガでわかる統計学 素朴な疑問からゆる〜く解説 (サイエンス・アイ新書) [ 大上丈彦 ] 価格:1,047円 |
- サクサク読み進めることができる!
- イラストを使った直感を大切にした説明!
マンガというかイラストみたいな感じですけど、難しいものを簡単そうに書いているのが最大のポイント。
大事なポイントに絞った解説で、万人が理解できるような説明が人気の理由かもしれません。
「統計学ってなに」?という素朴な疑問から、マンガでゆる~く解説し、読み終わったときには、知らないうちに統計学が身に付いているという、いままでにない統計学の入門書です。
ビジネスで本当に使える 超 統計学
ビジネスで本当に使える 超 統計学【電子書籍】[ 村上知也 ] 価格:2,178円 |
- 具体的な問題を取り上げたビジネス向きの本!
- テーマが明確で、何がしたいのかイメージしやすい!
この本では、具体的な問題に対して、統計学をどのように使うか?ということに注目しています。
「経営不振のラーメン屋をどうやって立て直すか?」をテーマに、ビジネスで使えるような統計学の使い方を教えてくれます。
ただ、統計学を学ぶだけでなく、どうやって使うのか知りたい方におすすめの本です。
統計学のための数学
統計学をきちんと定量的に学ぶには数学が大切です。
そのための準備で必要になるであろう、数学の知識を補ってくれる本をいくつか紹介します。
中学レベルからはじめる!やさしくわかる統計学のための数学
中学レベルからはじめる!やさしくわかる統計学のための数学 [ ノマド・ワークス ] 価格:2,420円 |
- 四則演算ができればOK!
- 小中の数学を最短で思い出せる親切設計!
ルートや指数などの中学数学の説明や、シグマ(Σ)や微積分といった高校数学の内容も、やさしく説明されています。
統計学に必要な数学の知識のみをピックアップして、直感的な説明がされているので、頭に入りやすい中身になっています。
特に標準偏差や偏差値などの説明は、数学を習っていない人でも、非常に分かりやすいと思います。
他にも、複雑な関数の説明も、嚙み砕いて教えています。
数学が苦手でも、わかった気になれると思います。
1から学び直す時間がない方におすすめの一冊です。
やさしく学ぶ 機械学習を理解するための数学のきほん
やさしく学ぶ 機械学習を理解するための数学のきほん アヤノ&ミオと一緒に少しずつ学ぶ 機械学習の理論と数学、実装まで [ LINE Fukuoka株式会社 立石 賢吾 ] 価格:2,838円 |
- 対話形式、かつ一つずつ順を追った解説!
- トピックを絞った構成で、学習効率が高い!
統計的機械学習で必要な数学入門で最もおすすめな一冊です。
回帰を中心にした内容になっており、回帰分析で必要な数学の知識を優しく教えてくれます。
はじめて機械学習に触れる方だけではなく、数学的な復習や理解の一助にもなると思います。
統計学のための数学教室
統計学のための数学教室 この1冊で腑に落ちる [ 永野裕之 ] 価格:2,640円 |
- 小学生でもわかるような、割り算の説明から始まる!
- 上記2冊よりも、数学に寄った内容!
この本は、どちらかと言うと、数学をやさしく学びたい人向けといえるでしょう。
レベル的には、高校数学で扱う『データの整理』に相当することを、学ぶことが出来ます。
本書は小学生でもわかるような、割り算の説明から始まり、正規分布や2項分布といった、確率密度関数までの内容を網羅しています。
個人的には、確率変数の説明がすごい丁寧なので、ぜひ読んでみて!
AI・データサイエンのための図解でわかる数学プログラミング
AI・データサイエンスのための 図解でわかる数学プログラミング [ 松田雄馬 ] 価格:3,278円 |
- 現場で必要になる数学の知識が満載!
- Pythonを使ったソースコードにも解説付き!
機械学習(人工知能)における数学に入門する際に最もおすすめな一冊です。
この本は数式よりも実践を重視していて、数学に明るくなくとも今の現場で求められる技術の全貌を把握し、ちょっとずつかじることができる良書です。
Pythonによる実装も、コードの意味を説明しているので、理解しながら書くことができます。
統計学のための数学入門30講
統計学のための数学入門30講 (科学のことばとしての数学) [ 永田靖 ] 価格:3,190円 |
- 30回の講義で線形代数や微積分を復習!
- 例題や演習問題の解説が充実!
高校数学(微積分、数列、組み合わせ)が前提として大学数学の内容に踏み込んだ内容で、上記の本に比べるとより高度な内容になります。
本書では、統計学で必要になる、線形代数や微積分について学ぶことができます。
線形代数や微積分の教科書を読んでもいいのですが、統計学を学ぶ上で必要ない内容も含まれているので、手っ取り早く学びたいならおすすめです。
線形代数では、基本的な行列操作と固有値分解
微積分では、極限操作と重積分
に焦点をあてて、30回の講義形式でまとめられています。
一つのトピックが短くまとめられているので、勉強がしやすい構成になっています。
統計学のための線形代数
価格:9,680円 |
- 統計で必要になる線形代数の知識をほぼ網羅!
- 数学的な問題で分からない時に役立つ!
基本的な線形代数の知識が要求される、少しレベルの高い本ですが、中身はとても充実しています。
この本は、より詳しい証明や、高度な内容にも触れており、学部の3年生や、大学院向きといった感じですね。
おそらく、この1冊あれば、必要な数学の知識は補完できると言っても、過言ではないです。
基本的な固有値分解、特異値分解の内容はもちろん、
テンソル積、行列の微分、2次形式など
をこの本では扱っています。
この本を使って1から勉強するよりも、分からない部分だけ、拾い読みをするのにおすすめです。
数理統計学・伝統的な統計学
数理統計学というのは、数学の一分野で、確率論を応用させた学問と言えます。
統計学をより定量的に扱うためには、必要不可欠な分野といえるでしょう。
数理統計学はこれから、多変量解析や機械学習を学ぶ上でも基礎的な内容になっています。
ふわっとした統計学からカチッとした統計学に進化できる良書を集めました。
統計学入門(東京大学出版会)
価格:3,080円 |
- 基本的な内容をじっくりと解説!
- 見やすい数式と文章量!
この本は学部の2年生ぐらいで初めて、初めて(数理)統計学を学びたい方におすすめの1冊です。
どうしても、ちゃんと数学的に定義しようとすると、線形代数や微積分の知識が必要にはなります。
この本は1つ1つの概念を数式だけでなく、言葉による説明も丁寧に補足されています。
一つ一つの概念をじっくりと解説して、必要知識を付けさせてくれます。
入門数理統計学
【送料無料】 入門数理統計学 / パウル・ゲルハルト・ホーエル 【本】 価格:5,280円 |
- 論理的説明だけでなく、イメージも大切にしてる!
- 教科書の教科書になってるぐらい数理統計学のエッセンスが詰まってる!
数学的理論的理解とイメージ・概念的理解の両方に優れた名著といわれています。
元祖、入門数理統計学と呼ばれいるぐらい昔からある本で、この本を参考に作られた本も沢山あります。
基本的な数理統計学のエッセンスが学べて、理論的と直感的な説明のバランスが良い内容です。
私も大学院の入学試験でよく使った本です。
入門統計解析
価格:2,750円 |
- 演習多めの入門書!
- 要点が整理されていて見やすい!
数学的な補足や導入がとても丁寧な本です。
例題と演習も豊富で、数学的な操作に対応できる力がつきやすいです。
数学的な厳密性よりも、演習などで慣れながら理解したい人におすすめの1冊です。
ゼロから学ぶ統計解析
【送料無料】 ゼロから学ぶ統計解析 / 小寺平治 【全集・双書】 価格:2,750円 |
- 数理統計学の本の中ではやさしめ!
- サクサク読み進めることができる!
この本は、ほんとにゼロベースの知識でもわかるような数理統計学を展開しています。
小寺先生の本は、分かりやすさ重視の本が多く、これもその1冊です。
内容的にも易しく、短期間でも読めてしまえるような構成になっています。
他の本であまり理解できなかった人におすすめしたい一冊です。
新装改訂版 現代数理統計学
価格:2,970円 |
- 定義、命題、定理、証明的な書き方ではなく、口語ベースの書き!
- 知識の幅が広がる!
文章が多めで、読み物として理解を深めることができる本です。
そのため行間が空いており、式変形に慣れていないと読破が厳しいかもしれません。
しかしながら、「どうしてこのような考えが生まれたの?」といった知識の補強に役立ちます。
数学書のような構成が苦手な方に読んでもらいたい一冊です。
統計解析入門
OD>統計解析入門 (新数学入門シリーズ) [ 赤平昌文 ] 価格:3,520円 |
- 発展的な内容もカバー!
- 付則が充実している!
自分が学部生の時に読んでいた本です。
はっきり言って、はじめて数理統計学を学ぶ人向きではないと思います。
しかし、補足や関連事項の説明が豊富で、知識の完備には必要な存在です。
あまり耳にしない、UMVUEや十分統計学って何だっけ?と思ったときに読んでいます。
より、ニッチな専門用語を学びたいならおすすめの一冊です。
入門統計解析法
価格:3,190円 |
- 他の本に比べて、数学的な厳密性が高い!
- 品質管理に関する資格「QC検定」の勉強にも役立つ!
この本は、ある程度数学的な知識を求められる場面があるのですが、証明が非常に丁寧に書かれています。厳密性に富んでおり、数学科の人なら読みたくなる一冊です。
イメージではなく、理論的な正しさを求めることがこの本のモチベーションですね。
数学的な証明や緻密な議論が好きな方におすすめしたい一冊です。
現代数理統計学の基礎
現代数理統計学の基礎 (共立講座 数学の魅力 11) [ 久保川 達也 ] 価格:3,520円 |
- 測度論を用いた確率論的な議論!
- 確率過程をわかりやすく学べる!
統計学だけやっていると、すっ飛ばしてしまう測度論について言及した本です。
測度論は、確率的な事象を定量的に扱う、確率論の一分野です。
測度論を用いた厳密性を求める数理統計学や、時系列データも学びたいならこの本がおすすめです。
統計学の演習書
おそらく、演習というのは一人でやることが多いと思います。そんな時、答えに導いてくれるヒントをくれるのが、例題です。
例題の問題を理解しながら、読み進めていくことも重要な演習です。
そこで今回は、例題がしっかりとした統計学演習の本を4つ紹介したいと思います。
主に、大学の2,3年で扱う(数理)統計学で使えるような演習書をそろえてみました。
統計学演習
価格:2,420円 |
- 例題が多く、一人で勉強しやすい!
- 難しすぎず、簡単すぎないちょうどいい問題設定!
説明と例題と演習の量がちょうどいいのでおすすめです。
確率の基本性質→特殊な分布→標本分布→点推定・区間推定→検定→回帰
というベーシックな流れで、講義の復習にピッタリですね。
値段は高めですが、例題と演習問題がほぼ同じ数用意されているため、とても良心的な作り。
基本的な事項を中心にしているため、サクサク解けると思います。
入門・演習 数理統計
価格:3,850円 |
- 基本から発展まで幅広くカバー!
- 少しニッチな公式や定理も紹介!
私が学部生の時に使っていた本です。
上記の本と内容が似ている本ですが、こちらの方がより詳しい内容に踏み込んでいます。
完備十分統計量/効率/UMVUE/最強力検定といった、やや難しめの内容にも触れています。
とはいっても、ほとんど基本的な内容なので、難しい部分は飛ばして読んでも、さほど遜色ないです。
より、専門的なことを理解したい時に役立つ演習書といえるでしょう。
明解演習 数理統計学
価格:2,640円 |
- 予備校のテキストのよう感覚!
- 公式などの要点が整理されていて、分かりやすい!
この本は、公式や大事な数式を使って、例題を解いているため、大事なポイントを容量良く学ぶことができます。
覚えなきゃいけない、定理や定義が分かりやすいので、テスト前の勉強で使うと良いかもしれません。
要点を抑えて学びたい人におすすめの一冊です。
やさしい多変量解析
基本的な統計学の内容(1~15の本)では扱っているデータは1次元もしくは2次元程度でした。
しかし、実際に扱うデータのほとんどが3次元以上であることがほとんどです。
このような次元数が多いデータを多変量データと呼び、多変量解析は多変量データに関する基本的な方法論の総称です。
ただし、多変量データを扱うとなると、ベクトルや行列の知識が必要になり、少し難しくなります。
ここでは、極力難しい理論的な部分を省いた多変量解析の本を紹介します。
意味がわかる多変量解析
まずはこの一冊から 意味がわかる多変量解析【電子書籍】[ 石井俊全 ] 価格:1,760円 |
- 基本的な事項に中心に構成!
- 前提として必要となる線形代数や微積分の基礎知識も盛り込まれている!
多変量解析の入門中の入門的な立ち位置。
相関分析から回帰分析、判別分析、主成分分析、因子分析など,カバー範囲は広いです。
読み進めるには、ある程度の計算力が要求されますが、数学が苦手な人には証明等を読み飛ばしても理解できるように配慮されています。
数式を使った解説と統計量の意味を掴むための大枠の説明のバランスが非常によく独習にも最適。
統計学がわかる【回帰分析・因子分析編】
新品価格 |
- 基本的な統計の知識から「回帰分析」「因子分析」までカバー!
- アイスクリームの売上をテーマにした具体的な問題解決!
多変量解析で大事な部分はおそらく、「主成分分析」「回帰分析」「因子分析」の3つです。
その内の2つ(実質3つ)をカバーしているので、手っ取り早く多変量解析を学びはじめたいのなら、おすすめです。
具体例を用いて、数式をなるべく使わず説明されているので、数学が苦手な方でも読めるよう工夫されています。
多変量解析のはなし
多変量解析のはなし改訂版 複雑さから本質を探る (Best selected business books) [ 大村平 ] 価格:2,200円 |
- 多変量データで大切な「相関」を詳しく説明!
- ごく簡単な例題を用いて、高等数学を避けている!
この本は文章が中心で、平易な言葉使いで例え話や例をたくさん用いているので読みやすいです。
多変量解析の解説本でありながら、多くの分量を単回帰や相関に当てており
最初につまづくであろう初歩の部分の説明に力を割いている点です。
理論重視の多変量解析
数理統計学の次のステップとして古典的な多変量解析があります。
理論的には線形代数などの知識を使うため、大学1年生で学んだ内容を必要とします。
今回紹介する本は、線形代数の知識を補いつつ、理論的な部分にもしっかりと踏み込んだ内容になっています。
数学科で統計を専門にしている方や機械学習を理論的に学びたい方におすすめです。
多変量データ解析
新品価格 |
- 数式がとっても見やすい!
- 基本的な内容をまんべんなくカバー!
今回は4冊選んでいますが、私が一番おすすめしたいのはこの本です。
多変量解析で押さえたい、主成分分析,判別分析,重回帰分析,因子分析,正準相関分析,モデルの選択方法など重要なポイントを、まんべんなく押さえています。
他の多変量解析の本に比べて、トピックを詰め込みすぎていないのが分かりやすいポイントの一つです。
特に、情報量基準の導出や意味合いを、ちゃんと説明できている本はなかなかないので、是非一度読んで欲しいです。
多変量解析入門
価格:3,850円 |
- 内容のレベルは高いが、理論的が簡潔にまとまっている!
- ちゃんと理解できれば、論理的思考力がつく!
ともかく、理論的な説明がメインで、数学的には少し難しいかもしれません。
最低限、大学の教養レベルの数学は分かってないと厳しいです。
しかし、これを読み終えた後の達成感は半端ない。
回帰モデルやベイズ判別、主成分分析、サポートベクターマシーンによる判別法などさまざまな解析手法について、単変量から多変量、二群から多群、線形から非線形への展開しています。
多変量解析法入門
多変量解析法入門/永田靖/棟近雅彦【1000円以上送料無料】 価格:2,420円 |
- 他の本に比べて、値段が安い!
- 様々な手法を、コンパクトに紹介!
短時間で全体像を掴むことができ、コンパクトな語り口がこの本の利点です。
詳細の説明は、上記の2冊に比べると劣っていますが、その分簡潔にまとまっているイメージです。
理論的な部分を気にしなければ、サクサク読めるのではないでしょうか。
今回紹介している4冊の中では一番簡単で読みやすいと思います。
カーネル多変量解析
カーネル多変量解析 非線形データ解析の新しい展開 シリーズ確率と情報の科学 / 赤穂昭太郎 【全集・双書】 価格:3,850円 |
- 非線形と特徴を捉えたカーネル法の理論的入門書!
- より、機械学習に近い多変量解析を学べる!
カーネル法は非線形の特徴を捉える上で、重要な方法の一つです。
ニューラルネットワークなど機械学習のベースになる理論にもカーネル法は使われています。
カーネル法は扱うのは簡単なのですが、「その背景に何が起こっているのか?」という説明をしている本は少ないです。
この本は序盤はカーネル関数を使った、回帰分析などを解説しています。6章では再生核ヒルベルト空間について、7章では学習理論について述べられています。
似たような本がない分、得られるものが多かったですね。
ベイズ統計学入門
ベイズ統計学は近年注目を集めている統計学の考え方です。
これまでは、得られたデータのみで判別をする考え方を頻度主義が一般的でした。
しかし近年の統計学ならびに機械学習の分野では事前確率と得られたデータで判別する考え方をベイズ主義が導入されるようになりました。
事前確率は、データではなく主観的に決定されたもので、証拠がない確率と呼ばれたりもします。
事前確率の導入によって、より現実に則した推論ができるようになることが多くなりました。
ベイズ統計学は数学的に優しい本も多く、その中でもおすすめの本を5冊選びました。
図解・ベイズ統計「超」入門
図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術 涌井貞美/著 価格:1,320円 |
- 2, 3日、早ければ1日で読める!
- 数式なしなので、知識0でも大丈夫!
まさに入門書の入門としておすすめの一冊。
本書では複雑な数式は一切使わずに、ベイズ統計を理解するために必要な基本中の基本(ベイズの定理、ベイズ更新等)が非常にわかりやすく説明されています。
統計学の前知識が無くても読め、ベイズ統計がどういったもので、どのような問題に適用できるのかが多数の図を利用して、会話形式で紹介されているので、初学者に最適な本だと思います。
完全独習ベイズ統計学入門
【新品】完全独習ベイズ統計学入門 小島寛之/著 ダイヤモンド社 小島寛之/著 価格:1,980円 |
- 頻度主義とベイズ主義の違いが分かりやすい!
- 成り立ちの歴史やコラムで歴史的も学べる!
「完全独習 統計学入門」同様、入門書として非常に分かりやすかったです。
成り立ちの歴史やコラムで歴史的にもスッキリ感を感じることができ、他の本では得られないような知識も掲載!
尤度と事後確率の違いを丁寧に説明されており、ベイズ主義の考え方を理解できること間違いなし。
小島先生の本は、初学者目線で書かれた本が多いですね。
ベイズ推論による機械学習入門
機械学習スタートアップシリーズ ベイズ推論による機械学習入門 新品価格 |
- ベイズ統計に関する方法論が網羅的に載っている!
- 式の導出が丁寧!
機械学習の最前線で活躍する須山先生の書かれたこの本はベイズに関する様々な知識を紹介してくれます。
特に、「共役事前分布の説明が良い」という意見が多いですね。
何を変数として、何を定数として議論を進めているのか?そこを意識して読むとさらに理解が深まるのではないでしょうか。
初学者がつまずきやすいポイントがよく分かっているなぁと感じた一冊です。
データ解析のための統計モデリング入門
データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC (シリーズ確率と情報の科学) [ 久保拓弥 ] 価格:4,180円 |
- 一般化線形モデルの基礎を前半で解説!
- 基本的なベイズの考えからMCMCまでの流れがスムーズ!
この本では、モデリングをメインに話が進められています。
一般化線形モデルの基礎を読者に分かってもらうことで、後半にあるベイズ的な考えをすんなり理解してもらう構成。
そして、この本を読めば「これから何を掘り下げて勉強すれば良いのか」ということがよくわかります。
ベイズ統計をより実践的に扱ってみたい方にオススメです。
ゼロからできるMCMC
【新品】ゼロからできるMCMC マルコフ連鎖モンテカルロ法の実践的入門 花田政範/著 松浦壮/著 価格:3,300円 |
- MCMCに特化した入門書!
- Pythonによる実データ解析の方法も紹介!
マルコフ連鎖モンテカルロ法は「複雑な積分をしたい複雑な確率の計算をしたい」という時に力を発揮する手法です。
歴史的には物理学の分野で広く用いられてきましたが、最近では統計学の重要な道具として定着し、統計学的手法が重要な機械学習,金融などの分野でも用いられるようになっています。
この本はマルコフ連鎖モンテカルロ法を基本から実用レベルまで順を追ってわかりやすく書いているの最大のポイントであり、他のMCMCの教科書の違いです。
また著者によるpythonのサンプルコードがgithubに公開されており、コードを確認しながら読み進めることができるのでとてもよい。
Rで学ぶ統計学入門
統計解析を研究や仕事でやる際、必要になるであろう言語の1つにR言語があがります。
今では、Pythonのライブラリーも増えたおかげて、Pythonを使う人がいる一方で、根強いR信者も多いです。
私も、研究ではRを使っていました。
Rは行列やベクトルなどのデータが扱いやすく、理論的な研究をするときにはPythonよりもおすすめです。
そのためRと統計学の勉強はとても相性が良いと言えるでしょう。
今回はおすすめ「Rで学ぶ統計学入門書」を6つ選びました。
Rによるやさしい統計学
価格:2,970円 |
- Rと統計の両方の入門書!
- t検定、カイ二乗、分散分析はもちろん、線形回帰、因子分析など幅広い範囲をカバー!
Rの標準的な入門向け教科書です。
散布図やヒストグラムの描き方も分かり、t検定、カイ二乗、分散分析はもちろん、線形回帰、因子分析など大体の検定、機械学習のいくつかの手法についても網羅されています。
値段の割にボリュームがありました。
初学者の方は序盤の本(1~5あたり)を読んでから、これを読むと更に理解が深まると思います。
はじめてのR
はじめてのR: ごく初歩の操作から統計解析の導入まで [単行本(ソフトカバー)] 村井 潤一郎9784762828201【中古】 価格:1,229円 |
- Rの初心者がまず読むべき内容が詰まってる!
- データ分析が主で分かりやすい!
どちらかというと上記の本よりもRによった内容。
ある程度Rについて知っている状態でこの本を読んだのですが、「こんなことができるんだ!」という発見がたくさんありました。
特に、データの読み込みや表示など、Rに仕様に関する説明が丁寧にされていたので、「データが上手くインポートできない!」という時などに役立ちます。
他にも、実践的なパッケージや関数を紹介しています。
実践入門!ゼロから学ぶR言語
新品価格 |
- Rの基本的な使い方を高速で学べる!
- Kindle Unlimitedで無料!
統計解析というよりもRの使い方をまずは学びたい人むけにコンパクトな内容になっています。
Rはどんな言語だろう?お試しで使ってみるのもいいかもしれません。
ちなみに、Kindle Unlimitedでは無料で読むことができます。
Rではじめるデータサイエンス
Rではじめるデータサイエンス [ Hadley Wickham ] 価格:4,400円 |
- データ処理の方法が詳しく学べる!
- 著者が凄い人!
Rプログラミングを通してデータサイエンスの理解と知識を深めるための一冊になっています。
Rにある程度慣れている人が、実務で役立つような細かい処理の仕方が豊富に載っています。
ggplot2、dplyrといったRを代表するパッケージやRStudioの開発で知られる「Rの神様」ハドリー・ウィッカムと、『RStudioではじめるRプログラミング入門』の著者ギャレット・グロールマンドによって書かれています。
Rの機能と威力を知り尽くし、また、統計とデータサイエンス教育のプロフェッショナルでもある著者たちによるわかりやすくクリアな説明は、既存のデータサイエンス入門書とは一線を画します。
Rによる多変量解析入門
新品価格 |
楽天市場 Amazon
- 実際に手を動かして理解できる多変量解析!
- データ解析技術を習得したい人にとっての必携書!
理論的な部分よりも、実際に手を動かして理解したいと思っている人に、おすすめの本です。
教育測定やアンケートデータを用いた、具体的な解析をRを使って行っています。
内容もボリュームがあるため、この一冊で、R言語を使った解析のほとんどを網羅できると思います。
多変量解析手法の理論と実践をバランスよく解説することで、統計が得意ではない大学生や実務者にも利用しやすい構成とし、本書1冊で多変量解析手法を実務に応用できるまで習得できる内容となっています。
理論派の人間でも、R言語の練習としてこの本を使っても良いですね。
Rによる機械学習入門
価格:2,860円 |
- 数式とコード共に見やすい!
- 理論的な部分は簡潔にまとまっている!
基本的な統計手法、予測に対する誤差の測り方、統計モデルによる機械学習、機械学習における主要なアルゴリズム、スパース学習などていねいに解説されています。
個人的に金森先生の本は数式が見やすく、無駄がない構成が特徴的な本が多いです。
ベクトルや行列がよく出てくるので、初学者向きではないですが、ある程度数学の知識があれば問題なく読めるレベルです。
Pythonで学ぶ統計学入門
Pythomは2022年現在最も人気のあるプログラミング言語と有名ですね。
Pythonでできないことはないんじゃないの?ってぐらい色んなことができますね。
Python自体がシンプルで可読性が高い上に逐次実行できるため初心者でも理解しやすいと言えます。
これ以外にも、Pythonは統計解析に関するライブラリが充実しており、
複雑な計算やグラフの描画がかんたんにできます。
Rに比べると、Pythonは実装しやすく案件も多いです。
今回は、「Pythonで学ぶ統計学入門書」を7冊紹介します。
Pythonで理解する統計解析の基礎
Pythonで理解する統計解析の基礎/谷合廣紀/辻真吾【3000円以上送料無料】 価格:3,278円 |
- 数式を交えつつPythonを学べる!
- 統計解析に必要なライブラリになれることができる!
統計学の基礎理論の復習かつ、Pythonの学習にもなる一石二鳥な本です。
基本的な四則演算から回帰までの基本的な内容をカバー。
難しすぎず、簡単すぎないのがこの本が人気の理由なのでしょう。
Pythonの学習のためだけに本書を活用するというより統計学の復習がてらPythonを学びたい人におすすめ!
Python実装を通して学ぶ、統計モデリング入門
【Kindle限定改訂版】Python実装を通して学ぶ、統計モデリング入門 新品価格 |
- コンパクトかつ凝縮された内容!
- Kindle Umlimitedで無料で読める!
100ページ程度と短めではあるのですが、基本的な内容を凝集させており、速習するのにおすすめ!
現状Kindle版しかないが、価格もかなり安めで手が出しやすい!
更に、サンプルコードも充実してるので、とても良心的な一冊になっています。
Pythonによるデータ分析入門
Pythonによるデータ分析入門 第2版 NumPy、pandasを使ったデータ処理ー [ Wes McKinney ] 価格:4,180円 |
- 様々なパッケージの仕様について学べる!
- オリジナルの英語版はレビュー★4.6!
現在、この本の日本語版はAmazonで86件のレビューに対して星4ぐらいとかなり良い評価。
一方、オリジナルの英語版は1000件以上のレビューに対して星4.6という驚異的な高評価。
データ分析に関する、あらゆる知識が詰め込まれています。
この本一冊あれば、強い味方になること間違いなし!
Pythonで体験するベイズ推論
Pythonで体験するベイズ推論 PyMCによるMCMC入門 [ キャメロン・デビッドソン=ピロン ] 価格:3,520円 |
- Pythonで学べる、ベイズ推論特化型の本!
- PyMCに関する数少ない参考書!
「PyMC」は、NumPy, SciPy, Matplotlibなどのツールとも高い親和性をもつ、MCMC(マルコフ連鎖モンテカルロ法)を用いたベイズ推論のためのPythonモジュールです。
PyMCの登場によってベイズ推論を用いた解析がやりやすくなりました。
統計モデルをPyMCで実装する方法を解説しつつ、ベイズ推論とMCMCの考え方と威力について分かりやすく述べられいます。
PyMCに興味を持っている方におすすめです!
Pythonで学ぶ実験計画法入門
Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析 (KS情報科学専門書) [ 金子 弘昌 ] 価格:3,300円 |
- 超実践的な内容ですぐに現場で使える!
- すぐに試せるサンプルデータセット・サンプルコード付き!
実験計画は効率よく研究・開発を進める条件を考える手法です
実験計画をするかしないかで、実験に対する疲労度が大きく変わります。
ベイズ最適化とPythonを駆使して、データ解析の初歩から、モデルの設計、実践的な応用事例までを解説されています!
実験時間や人数が限られる今、絶対に役立つスキルが身につくこと間違いなし!
Pythonで学ぶ統計的機械学習
Pythonで学ぶ統計的機械学習/金森敬文【3000円以上送料無料】 価格:3,080円 |
- 数式とコード共に見やすい!
- 理論的な部分は簡潔にまとまっている!
再び金森先生の本を取り上げました。
ともかくこの本は速習がしやすいです。
ページ数はそこそこありますが、コードの部分が半分ぐらいなので、二週間もかからずに読むことが可能です。
Pythonに慣れている人なら一週間で読み終えれるでしょう。
手を動かして学びたい人、速習したい人におすすめの一冊です。
Python機械学習プログラミング
[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (top gear) [ Sebastian Raschka;Vahid Mirjalili ] 価格:4,400円 |
- 数式よりも図やイラストなどで機械学習を理解!
- 第3版では、最新の手法を紹介!
本書は、機械学習コンセプト全般をカバーし、理論的背景とPythonコーディングの実際を解説しています。
初歩的な線形回帰から始め、ディープラーニング(CNN/RNN)、敵対的生成ネットワーク、強化学習などを取り上げ、scikit-learnやTensorFlowなどPythonライブラリを使って解説しています。
第3版では13~16章の内容をほとんど刷新し、敵対的生成ネットワークと強化学習の章を新たに追加。機械学習プログラミングの本格的な理解と実践に向けて大きく飛躍できる一冊です。
Excelデータ分析
「プログラミングが苦手!」
「高度な統計解析は求めていない!」
そのように感じている方におすすめなのが、Excelです。
Officeのアップデートに伴いExcelでも統計解析がやりやすくなってきました。
ともかく、Excelはデータの整理や編集がしやすく、難しいコードを書く必要もないです。
今回は「Excelデータ分析入門書」を3冊紹介します。
統計学の基礎から学ぶ Excelデータ分析の全知識
統計学の基礎から学ぶ Excelデータ分析の全知識(できるビジネス) [ 堅田 洋資 ] 価格:1,980円 |
- 業務に活用しやすい!
- 練習用ファイルが豊富!
PythonやRなどのプログラム言語習得や環境準備などをしなくとも、使い慣れたExcelだけでここまでのことができるのだと思わせてくれる一冊。
初学者向けに分かりやすく書かれているものの、理論や技術などがしっかりと書かれており、データ分析を学んだことがある人にも理解度のアップや復習などに役立ちます。
分析業務がはじめての方に是非とも読んでもらいたい1冊ですね。
やさしく学ぶExcel統計入門
できるやさしく学ぶExcel統計入門 難しいことはパソコンにまかせて仕事で役立つデータ分析ができる本/羽山博/できるシリーズ編集部【3000円以上送料無料】 価格:2,178円 |
- Excel初心者向き!
- Kindle Umlimitedで無料で読める!
統計の初心者にやさしい」感じではなく、「Excelの初心者にやさしい」感じの本と言えます。
カラーでわかりやすい言葉が使われており、Excelの手順も丁寧に解説されているのでExcelに不慣れな方でもギリギリ分かるレベル。
また、サンプルのExcelデータをネットからダウンロードすることができます。
やさしく学ぶ データ分析に必要な統計の教科書
やさ学ぶ データ分析に必要な統計の教科書 できるビジネスシリーズ 新品価格 |
- データ分析の目的や出発点から丁寧に解説!
- Kindle Umlimitedで無料で読める!
そこで本書は、豊富な図解をまじえたり、3人の登場人物とストーリーを通したりして、統計の基本をやさしく、ていねいに学んでいきます。
また、難しい計算などはExcelを使っているため、プログラミンが苦手な人でも心配もありません。
統計をはじめて学ぶ人も、学びやすく、実践的なスキルを手に入れられる一冊です。
情報理論
統計学において、統計モデルの選択は非常に重要な問題の一つです。
モデルのパラメーターの推定などで用いられる、最尤法やAIC(赤池情報量基準)、フィッシャー情報量、K-L(カルバック・ライブラー)情報量などは情報理論を基に考えられています。
他にも、計量学習の分野でも情報理論が使われております。
また、情報理論は数学的な要素が強く、多様体など大学数学が必要になります。
情報理論
新品価格 |
- 著者である、甘利先生は情報幾何学の第一人者!
- 難しい部分をなるべくカット!
甘利先生は微分幾何学を元に、統計多様体を数学的に定義しました。情報幾何は他の統計理論に比べ、数学的に扱いやすいため、統計力学や学習理論への応用がされています。
この本では文章による導入が丁寧で可読性が高いです。もちろんある程度の知識は必要ですが、理論的に難しい証明は省かれており、どちらかというと読み物を読んでいるような感覚です。こ抽象的な数式を踏まえて、そのあとに具体例がよく出てきます。この具体例が情報理論の難しさを中和してくれています。
入門 情報幾何
入門 情報幾何 統計的モデルをひもとく微分幾何学 [ 藤岡 敦 ] 価格:3,630円 |
- 2021に出版された新しい情報満載の一冊!
- 微分幾何学を中心にわかりやすく学べる!
情報理論の中でも重要になる情報幾何について言及している、2021年に出版された比較的新しい本です。
統計よりも純粋数学に寄った内容になっており、理論的な部分を突き詰めたいならおすすめです。
微分幾何学の入門としても読みやすいです。
情報幾何の方法
岩波講座 応用数学 [対象12] 情報幾何の方法 (岩波オンデマンドブックス) 新品価格 |
- 情報幾何の専門書!
- 理論的にしっかりとした内容!
こちらも甘利先生が執筆している本です。
少し専門性が高いので、初学者の方にはおすすめできないです。
この本では、微分幾何学をもとに情報量基準や計量学習について書かれています。
難易度は高めですが、情報幾何を学ぶなら、合わせて読んで欲しい一冊です。
因果推論・グラフィカルモデリング
因果関係(原因とそれによって生じる結果との関係)を統計的に推定していく考え方のことを因果推論と呼びます。
実は因果推論を用いた政策効果の測定がノーベル経済学賞を受賞したこともあり、近年注目されている手法の一つです。
例えば、夏の暑い時期にアイスの広告や宣伝をいつもより多くしたとしましょう。
すると、思惑通りアイスの売り上げが伸び、広告や宣伝の効果があったように感じます。
しかし、実際はただ夏の暑い時期だったから売上が上がっただけかもしれません。
このように広告とアイスの売上に因果関係があるのか調べる方法として因果推論が必要とされています。
更に、変数が多いようなデータだと1つ1つの因果を考えると大変です。
そこで、目で見て分かりやすい形にしたものがグラフィカルモデリングです。
ここでは、因果推論とグラフィカルモデリングのおすすめの入門書を8個紹介したいと思います。
入門統計的因果推論
入門統計的因果推論 Judea Pearl/〔著〕 Madelyn Glymour/〔著〕 Nicholas P.Jewell/〔著〕 落海浩/訳 価格:3,630円 |
- 具体例とともに説明があってわかりやすい!
- 正しい理解と本質的な説明!
因果推論の勉強をするなら、まず読んで欲しい一冊です。
他の本に比べて本質的な説明がされており、因果推進の基本的な考え方が身に付くこと間違いなし!
研究でもビジネスでもどちらの側面でも読むべき本だと感じました。
この教科書に載っているような方法を理解できれば、データサイエンスの幅が広がるでしょう!
効果検証入門
効果検証入門〜正しい比較のための因果推論/計量経済学の基礎 [ 著=安井翔太、監修=株式会社ホクソエム ] 価格:2,948円 |
- ビジネスの世界で起こりうる誤った解析に警鐘!
- マーケティングに役立つ!
直感的な判断で生まれる、結果のずれについてこの本では強く主張されています。
データが生まれるプロセスに人の意思が関わる場合、単純な集計では判断ミスとなる可能性があります。
わずかな計算の狂いでも後々のビジネスにおいて大きな影響を及ぼすことになるため、バイアスのない状態で効果検証できることが望まれるのです。
本書では「単純に比較すると間違った結論に導くデータ」から、より正しい結果を導くための分析手法と考え方について解説されています。
統計的因果推論
価格:3,960円 |
- 理論をきちんと解説し、体系化できている貴重な因果推論の入門書!
- 研究などに使える知識が多く学生向け!
因果推論の分野では有名な岩崎先生の著書ですね。
群間比較の統計数理/統計的因果推論の枠組み/傾向スコア/マッチング/層別/操作変数法/ケースコントロール研究の内容が本書で収められています。
読者のターゲットとしては大学の専門課程の大学院の学生や、データ解析の業務に携わる統計家を想定しています。
大学初年級の確率・統計の基礎知識があれば問題なく読むことができます。
理論的にしっかりしているので、方法論の研究をしている方にもおすすめです。
統計的因果探索
統計的因果探索 (機械学習プロフェッショナルシリーズ) [ 清水 昌平 ] 価格:3,080円 |
- 機械学習へ応用を考えた手法を多数紹介!
- 既存の因果推論の本には載っていない手法もあり面白い!
「LiNGAM」(線形非ガウス非巡回モデル)を開発した第一線の研究者が、基礎事項から発展的話題まで平易に説明した本です。
基礎的な内容から始まりLiNGAMを終着点とて議論が展開されています。
セミパラメトリックアプローチを因果探索法の中で使っているのが他の本との最大の違いです。
データサイエンス分野で研究を始めようとしている大学生・大学院生、および、機械学習技術を基礎科学や産業に応用しようとしている研究者・技術者におすすめです。
統計的因果推論の理論と実装
統計的因果推論の理論と実装 潜在的結果変数と欠測データ (Wonderful R 5) [ 高橋 将宜 ] 価格:3,850円 |
- 理論(数理的メカニズム)と実装(Rによる数値解析)の両方をカバー!
- 高校レベルの数学で理解できるレベル設定!
この本で登場する数理的な理論解説は高校数学レベルで理解できるように工夫されています。
微積分や線形代数もほぼ登場しない代わりに、必要な数学的知識は登場する箇所で解説を与えています。
数式とRコードとの対応関係をRの初心者も理解できるように書かれています。
記載のRコードと一緒に活用することで、統計的因果推論を実践的に学ぶことができるます。
Pythonによる因果分析
つくりながら学ぶ! Pythonによる因果分析【電子書籍】[ 小川雄太郎 ] 価格:3,168円 |
- Google Colaboratoryを使っているので環境構築が簡単!
- 実践的な因果探索の方法をPythonで解説!
中身は基本的な因果推論+LiNGAM、ベイジアンネットワーク、ディープラーニングを用いた因果探索の2部構成になっています。実行環境Google Colaboratory、機械学習ライブラリscikit-learn、PyTorchで実際に手を動かしながら実装し、習得していきます。
因果探索に関するモデルはデータサイエンス領域では頻繁に用いることが多いです。
そのため、Pythonでの実装やパッケージの仕様に関する説明を纏めたこのような本があると非常に重宝します。
面白いトピックもいくつかあり、拾い読みしてもいいですね。
グラフィカルモデル
グラフィカルモデル (機械学習プロフェッショナルシリーズ) [ 渡辺 有祐 ] 価格:3,080円 |
- 有向グラフと無向グラフの両方をコンパクトにまとめられている!
- グラフィカルモデリングをサクッと学べる!
グラフィカルモデリングは、変数間の関係性を表したグラフを考えるモデリングです。
ここで登場するグラフは関数などを図示したものではなく、ノードとエッジによって構成された図です。
詳しくはグラフ理論(Wiki)をご覧ください。
グラフィカルモデリングは大きく分けて2つあります。
1つは因果関係がある有向グラフ、もう1つは因果までは言及していない無向グラフです。
この本では、それぞれのグラフの図示の仕方や意味合いなどをコンパクトにまとめており、サクサク読み進めることができます。理論的にしっかりとやりやいならば、次の本がおすすめです。
グラフィカルモデリング
【送料無料】 グラフィカルモデリング 統計ライブラリー / 宮川雅巳 【全集・双書】 価格:4,180円 |
- グラフィカルモデリングの理論的な入門書!
- 直接相関と間接相関の違いを力説!
上記の本では、グラフィカルモデルの作り方の手順についてわかりやすく説明していました。
この本では、なぜグラフィカルモデルを作ることで変数間の相関が現れるのか?について理論的に説明がされています。
やや内容が古典的ではありますが、その分、理論的にはとても分かりやすいです。
特に、グラフィカルモデルのベースとなる「相関」に関しては、理論的にも直感的にも分かる説明が展開されています。
じっくりとグラフィカルモデルについて学びたい人ににおすすめです。
Excelで学ぶ共分散構造分析とグラフィカルモデリング
【送料無料】 Excelで学ぶ共分散構造分析とグラフィカルモデリング Excel2013 / 2010 / 2007対応版 / 小島隆矢 【本】 価格:4,180円 |
- Excelってこんなことも出来るの!?
- パス図などを出力できるマクロを解説!
Excelってこんなことも出来るの!?と思ったので紹介します。
内容的にはある程度の数学と統計の知識が必要にはなるのですが、Excelを使っている分データの値が見やすく、何をやっているのか理解しやすいと思います。
ベースなる共分散構造分析をExcelの関数で紹介した後に、実際に変数間の因果関係を矢線で表した「パス図」をプロットするマクロの組み方を紹介しています。
時系列分析
時系列分析とは、時間の経過に伴い変化するデータを分析することです。
この時の経過とともに観察されたデータのことを時系列データと呼びます。
時系列データにはどのようなものがあるのでしょうか?
- 毎月の売り上げ
- 音声や画像データ
- コロナウイルスの感染者数の推移
など、様々なデータが時間経過に伴って変化していることがわかります。
時系列データは時間に関する従属性があるため、古典的な統計学だけでは太刀打ちできません。
ここでは、「時系列分析の入門」書を7冊紹介します。
現場ですぐ使える時系列データ分析
現場ですぐ使える時系列データ分析 データサイエンティストのための基礎知識 [ 横内大介 ] 価格:2,178円 |
- 分析初心者でもわかりやすい!
- 古典的な理論に絞ってをじっくりと解説!
時系列分析の取っ掛かりとしては最適な本です。
統計的な基礎知識もそこまで必要としないので、分析初心者でも難なく読めるレベルです。
時系列モデルの基本となる自己回帰モデルを使った解析などを紹介しています。
フリーソフトウェアRを使って視覚的、対話的にデータ分析を進めており、最後まで読みやすいと思います。
まず時系列分析について、お試して読んでみるなら、おすすめの本です。
Rによる時系列モデリング入門
価格:4,180円 |
- Rによる時系列分析の決定版!
- TSSSの使用法と解析例を紹介!
時系列分析と状態空間モデルの基礎
時系列分析と状態空間モデルの基礎 RとStanで学ぶ理論と実装[本/雑誌] / 馬場真哉/著 価格:2,750円 |
- サンプルコードがわかりやすい!
- コード説明のみならず、理論的な説明も丁寧!
Box-Jenkins法から状態空間モデルまで基礎から丁寧に解説された、分析のフレームワークを体系的に学べる良書です。
その名の通り、時系列分析の基礎と状態空間モデルについて学ぶことができます。
状態空間モデルは、古典的なパラメトリックなモデルに比べて、汎用性が高く幅広い解析で使われているモデルです。
本書は約350ページに及ぶページ数でタイトルに沿った内容を解説しており、「手を動かして学ぶ」ためのソースコードがついています。
経済・ファイナンスデータの計量時系列分析
経済・ファイナンスデータの 計量時系列分析 (統計ライブラリー) [ 沖本 竜義 ] 価格:3,960円 |
- 理論的な時系列解析の入門書ならこれ!
- 経済やファイナンスに限らず、様々な分野で応用可能!
理論的な時系列解析を学びたいならこの本がおすすめです。
ARIMAベースの古典的時系列解析を200ページ足らずで解説しています。
特定の職種を対象にしたものではなく、時系列解析の手法自体を解説した本です。
数学的なややレベルは高いですが、直観的な理解が得られるような工夫も見られます。
時系列解析
時系列解析 (統計学One Point 4) [ 柴田 里程 ] 価格:2,420円 |
- 100ページ程度とコンパクトな内容!
- 多変量データの時系列分析についても解説!
この本は100ページ程で時系列解析の基礎をコンパクトに解説しています。
理論的な時系列解析は数学的に非常に高度なのですが、本書は「数学的予備知識を気にしなくて良いように」と前書きにあります。ただ、複素解析と線形代数及び数理統計学基礎の知識はある程度ないと結構厳しい印象です。
理学・工学系出身の人だと簡単すぎず、難しすぎない、ちょうどいいレベルだと思います。
カルマンフェイルタ
カルマンフィルタ Rを使った時系列予測と状態空間モデル (統計学One Point 2) [ 野村 俊一 ] 価格:2,420円 |
- 状態空間モデル・カルマンフィルタの入門書としておすすめ!
- Rを用いて、どのようなモデルになっているのか、理解しやすい!
カルマンフィルタはもともとは工学分野における動的システム制御の手法として提案されたもので、状態空間モデルの推定をコンピュータで高速に与える計算手法です。
この本では、カルマンフィルタを用いた時系列解析の方法論とデータ解析の実践について解説されています。
統計用フリーソフトRを用い、多種多様な時系列への対応を念頭に置いた解析例を紹介しています。
まず事前準備として多変量の確率分布と時系列の基礎知識および代表的な時系列モデルについて解説し、章が進むにつれてモデルがより一般化されていく構成になっています。
確率と統計の基礎を修めた学部生,大学院生,社会人であれば十分読みこなせる内容となっています
カルマンフェイルタの基礎
価格:3,190円 |
- 実践に役立つMATLABのプログラムを掲載!
- 工学向きの内容で実践主義!
カルマンフィルタを全く知らない状態でも式、図が非常にわかりやすく楽しく読み進めることができます。
次元圧縮・高次元データ
現代科学はDNAデータや画像データ、単語頻度データのような非常に次元数が高いデータが見られるようになりました。
このような次元数が高いデータに対して、多変量解析を用いて解析をすること十分なサンプル数を揃えることができず、結果が不安定になったり、計算に時間を要することが問題になっています。
このような問題に対して、新たな手法の研究がされてきました。
今回は「高次元データ分析入門書」を2つ紹介します。
高次元データ分析の方法
高次元データ分析の方法 Rによる統計的モデリングとモデル統合 (統計ライブラリー) [ 安道知寛 ] 価格:3,850円 |
- パラメトリックな解析法を紹介!
- 多変量解析の基礎から丁寧に解説!
この本では、スパース推定や漸近理論などを用いた高次元データの解析について言及しています。
内容としては決して簡単ではないですが、第1章で必要になる多変量解析の準備をしています。
適切な応用例をいくつか紹介することで、読者の理解を助けてくれます。
学部3,4年生から大学院生、そして技術者や研究者を対象に高次元の統計学へといざなう入門書です。
高次元の統計学
高次元の統計学 (統計学One Point 11) [ 青嶋 誠 ] 価格:2,420円 |
- ノンパラメトリックな解析法を紹介!
- データ処理の計算量についても言及!
この本は上記の本とは異なるノンパラメトリックな手法を中心に扱っています。
ノンパラメトリックな手法は、パラメータの推定に時間を使わないため、短時間で解析が終わるという特徴があります。
今までの常識を覆すような奇想天外なやり方が多く、得られる物がたくさんありました。
こちらも学部3,4年生から大学院生、そして技術者や研究者を対象とした入門書になっています。
極値統計学
統計学の分野の一つに極値統計学と呼ばれる分野があります。
極値統計学では最大値や最小値を推定することを目的にした分析を行います。
例えば、人間の寿命や、津波などの最大の高さ、最高・最低気温などをこれまでのデータを用いて推定したりします。
特に、日本は災害が多い国です。津波の最大の高さを推定することができれば、防波堤などの建設で役に立ちますね。
しかしながら、大学などで提供されている標準的な統計学・データサイエンスのコースにおいて極値統計学がほとんど扱われないことに加え,現在,極値統計学を専門とする統計学者が日本に少ないです。
世界的に見ると、極値統計学はポピュラーな分野ではあるのですが、なかなか浸透しないようです。
日本語で書かれた貴重な「極値統計学の入門書」を3冊紹介します。
極値統計学
新品価格 |
- 数少ない極値統計の和書!
- 式変形や式の導出が丁寧でわかりやすい!
数学書のような形式で書かれており、和書で書かれた専門書としてはかなり読みやすいと感じました。
定義から始まり、性質や命題を紹介して、定理などを証明するといった、ルーティン的な流れで話が進められています。
また、極値統計を聞いたことも無いであろ読者でも、興味が湧くようなトピックを複数紹介しており、モチベーションを維持しやすいです。
はじめての極値統計ならこの本がおすすめです。
極値現象の統計分析
新品価格 |
- 2021年出版で最新研究も紹介!
- 様々なケースに対応した網羅的な専門書!
ちょっとお高めですが、極値統計のあらゆる知識が詰め込まれています。
上記の本で載っていないような、よりニッチな事項や最新研究も紹介されています。
実際に、極値現象をターゲットとした研究や実務を行うなら役立つ知識が載っていると思います。
極値統計をより詳しく学びたい人におすすめですね!
Rによる極値統計学
価格:4,400円 |
- 極値統計の実装に関する貴重な本!
- パッケージを使って簡単に解析する方法を紹介!
実際に手を動かして学ぶならこの本が良いでしょう。
欠測データ
実データは常に完璧であることは少なく、値が抜けていたり、異常な値を含んでいるケースが多いです。
欠測(欠損)データはデータのいずれかに抜けがあり、このままでは解析できないようなものを指します。
データ分析の前処理において、この欠測値の補完は非常に重要であり、これをしないと次のステップに進むことができません。
今回は、おすすめの「欠測データ処理入門書」を2冊紹介します。
欠測データ処理: Rによる単一代入法と多重代入法
欠測データ処理: Rによる単一代入法と多重代入法 (統計学One Point) 新品価格 |
- 数式少なめでRによる実装が中心!
- ウェブ上で入手可能な実データで解説!
約6割がRによるコーディングで、実際に手を動かしながら欠測データ処理の方法を学ぶことができます。
欠測データ処理後のデータ解析が主となる人が多いと思うため、理論的な本よりも、すぐに使えるような知識が良いかもしれないですね。
Web上で簡単に手に入るデータを扱っているので、実践も簡単です。
欠測データの統計科学医学と社会科学への応用
欠測データの統計科学医学と社会科学への応用 (調査観察データ解析の実際 第1巻) 新品価格 |
- 理論的に欠測のメカニズムを解説!
- 研究者向けの良書!
理論的に欠測データ処理を学びたいならこちらがおすすめです。
欠測のメカニズムを考え、結果に意味をもたせるような、本質的説明がなされています。
最尤法やベイズ法、EMアルゴリズム、種々の代入法、重み付き推定方程式などの手法を紹介しています。
※楽天では現在販売していないようです。
統計的機械学習
機械学習と統計学は切っても切れない関係で、統計学の知識なしでは機械学習の理解はできないです。
また、一口に機械学習と言っても様々な学習理論の総称なので、一冊の本で全てをカバーすることは難しいです。
今回は要点だけをサクッとまとめた本から、理論的な部分まで細かく書かれた本まで、「統計的機械学習の入門書」を6冊紹介します!
機械学習&ディープラーニングのしくみと技術がこれ1冊でしっかりわかる教科書
図解即戦力 機械学習&ディープラーニングのしくみと技術がこれ1冊でしっかりわかる教科書 [ 株式会社アイデミー 山口達輝 ] 価格:2,178円 |
- 数式やプログラミングNGでも大丈夫!
- アルゴリズムの説明が丁寧で分かった気になれる!
機械学習の入門書の入門書的な立ち位置の本です。
図解が多くわかりやすく、数式やソースコードは出てきません。
多変量解析や機械学習のアルゴリズムをざっくりと理解するのに適しています。
アルゴリズムの概要や用途を知る上では初学者の方におすすめです。
機械学習がわかる統計学入門
価格:2,420円 |
- Excelを使って解説するので、大学レベルの難しい数学は不要!
- 図を豊富に用いた直感的な説明がわかりやすい!
この本はその機械学習の理解に必要な統計学の知識をわかりやすく解説した入門書です。
図を多用し、具体例を重視した内容になっているので、数学があまり得意ではない人も読みやすいです。
また、Excelを使って解説するので、大学レベルの難しい数学の知識のない入門者でも、視覚的にそのしくみを学ぶことができます。
機械学習を目的とした統計学の手法「教師あり学習」や「教師なし学習」を理解したい人に最適です。
パターン認証と機械学習
[yoko2 responsive][cell]
パターン認識と機械学習 ベイズ理論による統計的予測 上/C.M.ビショップ/元田浩/栗田多喜夫 価格:7,150円 |
[cell]
パターン認識と機械学習(下) ベイズ理論による統計的予測 [ クリストファー・M.ビショップ ] 価格:8,580円 |
[/cell]
[/yoko2]
- 機械学習の手法をこの2冊で網羅!
- 数式を交えつつ、様々な分野の知識を満遍なくカバー!
ここで紹介するまでもない名著ですね。まず、これをやっておけば間違いないです。
ともかく機械学習を学ぶなら、あって損することはない1冊です。
最大の特徴は、一つ一つのキャプチャーすべてに力が入っており、満遍なく知識を吸収することができる点ですね。
ある程度の統計学の知識があれば、最初から読まずとも、辞書的な使い方ができるので、分からないことがあったときに役立ちます。
サクッと学べる分量ではないのですが、良書であることは間違いです。
はじめてのパターン認識
価格:3,300円 |
- 要点を押さえてサクッと学びやすい!
- レイアウトが綺麗で数式が見やすい!
2冊目に紹介するこちらの本は、最初に紹介した本をより簡潔にまとめたものと表現できるのではないでしょうか。
数式での記述が多く、統計や数学の知識が必要になることが多いですが、非常にレイアウトがきれいで読みやすいの特徴の一つです。
ボリュームはあまりないですが、基本的な内容に絞っている分、サクッと読めます。
要点を抑えて、スピーディに学習したい方におすすめです。
統計的学習理論
統計的学習理論 (機械学習プロフェッショナルシリーズ) [ 金森 敬文 ] 価格:3,080円 |
- 機械学習の基礎的な理論が学べる!
- 数学書のような流れが好きな人におすすめ!
三度出てきました、金森先生の本です。やはり見やすいです。
どちらかというと、理論的で数学的な補足もされており、かなりおすすめな一冊。
理論的な側面を大切にしたい方におすすめですね!
スパース推定
スパース推定とは、正則化法の一つです。回帰分析を中心にさまざな場面で見かけることが多い方法です。
回帰する時に、”サンプル数 < 次元数“となる場合、推定が不安定になることが多いです。
そのため、回帰する上で重要になる部分だけを残して、それ以外が0であるとして考え推定する方法をスパース推定と呼びます。
スパースというのは、日本語で”疎”という意味です。
係数ベクトルのほとんどが0でスカスカなので、スパース推定という名前が付けられています。
機械学習の本などでもスパース推定については学ぶことが出来ます。
しかし、スパース推定は種類が多く、機械学習の本だけ全てを網羅することは難しいです。
そこで、「スパース推定に特化した入門書」3冊を紹介したいと思います。
スパース推定法による統計モデリング
スパース推定法による統計モデリング (統計学One Point 6) [ 川野 秀一 ] 価格:2,420円 |
- 初歩的な内容から近年の研究成果・トレンドまで丁寧かつコンパクトに説明!
- 他の本で飛ばされるような証明なども載っている!
特にこの本が素晴らしいと思った点は、理論的な説明が非常に丁寧であることです。
単純なアルゴリズムの説明だけではなく、「どうしてこの結果がえられるのか?」「本当に最適解なのか?」など、理論的部分にも言及した本です。
ここまでコンパクトにまとめられた本は、日本中探してもこれしかないです。
是非、一度は読んで欲しいスパース推定の本です。
スパースモデリング
スパースモデリング 基礎から動的システムへの応用 [ 永原正章 ] 価格:3,300円 |
- 言葉による説明で丁寧で、数式を避けながらでも読める!
- 動的システムの説明がわかりやすい!
スパースモデリングの基本的な考え方から最新の研究成果である動的スパースモデリングの計算までカバー!
また、スパースモデリングを実際に試してみるためのMATLABコードを掲載しています。
数学や制御に関して高度な知識がなくても読めるように、数式の定義に関して一つひとつ丁寧な説明を行っており、作者の配慮を感じます。
スパース性に基づく機械学習
スパース性に基づく機械学習 (機械学習プロフェッショナルシリーズ) [ 冨岡 亮太 ] 価格:3,080円 |
- より専門的な内容!
- スパース推定の論文をまとめて、和訳したような良書!
近現代の研究成果がまとまった良書です。
上記2冊の本に比べるとやや専門的な内容で、多変量解析で使われるような行列やベクトルの操作に慣れていないと読みにくいかもしれません。
非常にボリュームがある内容なので、スパース推定を応用したさまざまな手法にも触れており、新たな学びが多い一冊でした。
より専門的かつボリュームを求めるのであればおすすめです!
ITエンジニアのためのスパースモデリング入門
ITエンジニアのためのスパースモデリング入門【電子書籍】[ 染田貴志 ] 価格:1,760円 |
- 2021年に出版で近年の研究成果を掲載!
- 実際のデータを用いたPythonによる分析!
この本ではスパースモデリングについて、なるべく複雑な数式は使わず、原理の説明から、実際のデータに対してどのように適用していくかまでを紹介しています。
実践的ですぐに実装できるような技術が盛り込まれています。
異常検知
では、何が分類問題と異なるのでしょうか?
最大の相違点は”訓練データ(モデルを構築するデータ)に異常な標本が圧倒的に少数、もしくは存在しない“と言うことです。
極端に言うと、正常クラスのサンプルで判別モデルを作ることもあります。
通常の分類問題で使われている手法を使うと、異常クラスの判別が非常に不安定になる可能性が高くなります。
この本では、分布や異常標本の有無に応じて、8種類程度の方法が提案されています。
入門 機械学習による異常検知
新品価格 |
- 様々なケースごとに異なった手法が多数紹介!
- Rによる説明で難しい部分は補足!
この本では、異常検知をするにあたって様々な状況が考えられると思います。
正規データ(正規分布など)のように扱いやすいデータであれば良いのですが、非正規データ(t分布など)のような分布に仮定を置かないような状況でも成立するような方法についても紹介されています。
他にも、異常標本が訓練データに存在しないようなサンプルや時系列データにも対応できるような方法も紹介されており、非常に充実した内容になっています。
また、Rでのコーディングを載せていおり、パッケージのデータを使った結果を載せています。
数式が多く難しい箇所もありますが、具体例を使ってわかりやすくまとめています。
異常検知と変化検知
異常検知と変化検知 (機械学習プロフェッショナルシリーズ) [ 井手 剛 ] 価格:3,080円 |
- 変化点検知を学ぶならこの本しかない!
- 理論的な部分がより詳細である!
前述の本に比べて、少し理論的になっており、難しいかもしれません。
異常検知の部分を井出先生が、変化点検知の部分を杉山先生が執筆しているようです。
そのため、前半の異常検知に関するパートは前述の本と似たような部分が多いです。
一方で、変化点検知に関する本が珍しいため、和書で学ぶならこの本が最適だと思います!
Pythonによる異常検知
価格:3,520円 |
- 2021年に出版されたPythonによる異常検知入門書!
- 深層学習を用いた新しい異常検知を学べる!
深層学習と相性が良いPythonを用いた異常検知の入門書です。
非時系列データにおける異常検知の手順や、時系列データを分析する際の手法と注意点、さらに深層学習を用いた応用例といった内容まで踏み込み、異常検知システムを構築できるような力を付けさせてくれる一冊!
機械学習の各アルゴリズムの説明や例題などには、数式や図ともに、Pythonのコードが付いています。
最新の異常検知手法を知りたいなら、現状この本がおすすめです!
深層学習・ディープラーニング
深層学習やディープラーニングという言葉聞いたことがある人は多いのではないでしょうか?
深層学習とは、ニューラルネットと呼ばれる概念が複数組み合わさって出来た学習方法です。
ニューラルネットとは、脳の構造から始まった数学的概念で、入力されたデータや信号を変換するシステムです。
実は数学的概念でありながら、深層学習はどうしてうまくいっているのかはっきりと分かっていません。(2022年現在)
そのため、ブラックボックスと呼ばれたりもします。
未知な部分も多く、新たな情報が毎日のように更新されます。
データサイエンスの分野でも、常に最新の情報収集を怠らないようにしています。
ここでは、深層学習・ディープラーニングの基本的な仕組みから最新研究を紹介した本を5冊紹介します。
ディープラーニングの数学
最短コースでわかるディープラーニングの数学 綴じ込み!最短コースマップ/赤石雅典【3000円以上送料無料】 価格:3,190円 |
- 高一レベルの数学から復習!
- 最短でディープラーニングの本質を理解するための本!
この本では、ディープラーニングの理解には欠かせない数学を高校1年生レベルから、やさしく解説します。
ディープラーニングの本質を理解するために必要な「数学」を「最短コース」で学べます!
「ディープラーニング」と「数学」の関係性について文系の方でもわかりやすく説明がされています。
また、記述したコードをJupyter Notebook形式で提供しますので実際に動かしながら学ぶことができます。
深層学習
深層学習 改訂第2版 (機械学習プロフェッショナルシリーズ) [ 岡谷 貴之 ] 価格:3,300円 |
- 深層学習のさまざまな課題と、その対策についても詳しく解説!
- たくさんのトピックについて学べる!
深層学習の根幹を俯瞰できるような内容の入門書と言えます。
深層学習の問題点をピックアップして、それらへの対抗策を考えていくというのが本書の流れになっています。
現在の深層学習の広がりを把握できるように、定番となった問題・方法に加えて、重要だと思われる問題については網羅しています。
深層学習が実践的技術であることを踏まえ、実用性を最も重視されています。
深層学習の全体像を眺めるなら、本書がおすすめです。
PyTorch &深層学習プログラミング
最短コースでわかる PyTorch &深層学習プログラミング [ 赤石 雅典 ] 価格:4,070円 |
- 「PyTorch」を網羅的、体系的に理解できる!
- 圧倒的なボリュームとわかり易い構成!
再び、赤石先生の最短シリーズですが、分量がそこそこ多いので、読破にはそれなりの時間が必要です。
この本では、人気のAIフレームワーク「PyTorch」を使ったディープラーニングプログラミングを一から説明しています。
そのため、まだPythonもKeras/TensorFlowも知らない方でも十分理解できる内容となっています。
企業でディープラーニングプログラムを業務で利用している、あるいはこれから利用しようとしているITエンジニアや研究者、理工系の大学・大学院の学生で研究の一環としてディープラーニングのプログラムを開発する必要がある方におすすめです。
ゼロから作るDeep Learning
ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装 [ 斎藤 康毅 ] 価格:3,740円 |
- ライブラリを頼らず作っているため、何が行われているか理解しやすい!
- プログラミング初心者でも楽しく構築できる!
非エンジニアがAIや深層学習の勉強をする場合、CNNとかRNNとかの言葉の暗記や抽象的な例え話で理解し、実際の動作原理の話は棚上げにしがちです。
でも「実際のところ、中身はどういう仕組みになってるの?」という気持ち悪さは残ってしまいます。
この本ではまさにそうした気持ち悪さを解消できます。
外部のライブラリに頼らずに、Python3によってゼロからディープラーニングを作ることで、ディープラーニングの原理を楽しく学びます。
プログラミング初心者でも十分に理解し、使いこなせるようになると思います。
深層学習の原理に迫る
深層学習の原理に迫る: 数学の挑戦 (岩波科学ライブラリー 303) 新品価格 |
- 深層学習の数学的なメカニズムがわかる!
- 縦読みの本で新書感覚で読むことができる!
この本では、数学的な背景をベースに深層学習が誕生した経緯や構造について紹介しています。
関数の概念から始まり、ニューラルネット、そして深層学習へと続く一連の流れが、よく分かると思います。
このような切り口で書かれた本は珍しく、数学の発展がよく分かる内容になっています。
縦読みで数学の話を展開するのは難しいように思われますが、最低限の数式のみで、上手くまとまっています。
焦点が絞られていて、深層学習を理論的に理解したい初学者におすすめです。
数理最適化
数理最適化って統計学の分野なの?と思う方も多いかもしれません。
統計学や機械学習において、パラメーターの推定で最適化を考えることが多いです。
純粋数学と違い統計学では最適解を解析的に求めれるケースの方が少なく、数理的に最適化しなければいけないことがほとんどです。
近年、ディープラーニングのような複雑なモデルのパラメータ推定は、非凸であるため容易に最適化することが難しく、計算時間も莫大です。
そのような背景があり、数理最適化に関する研究が盛んに行われるようになっています。
今回は実務でも使えるような「数理最適化入門書」を4冊紹介します。
しっかり学ぶ数理最適化
しっかり学ぶ数理最適化 モデルからアルゴリズムまで【電子書籍】[ 梅谷俊治 ] 価格:3,300円 |
- 理論的にしっかりと学べる!
- イメージしやすい具体的な例や、理解の定着にかかせない演習問題も充実!
この本では、大学数学の記号や使い方が分かっている前提ではじまります。
ただ、大学1年生で習うような微積分の知識があれば十分です。
数学的な準備を省いている分、さまざまな手法の紹介にページを割いています。
通常の計画問題や制約付きの最適化に加えて、組み合わせ最適化についても詳しく紹介されています。
機械学習のための連続最適化
機械学習のための連続最適化 (機械学習プロフェッショナルシリーズ) [ 金森 敬文 ] 価格:3,520円 |
- 機械学習で使う最適化問題を網羅!
- 厳密さを保ちつつ、イメージは掴みやすく!
またまた登場しました、金森先生の機械学習関連の本です。
この本は、理論的な部分をあまり気にしないで、速習したいならおすすめです。
第1~12章ぐらいまでの内容は、よくある最適化の手法を紹介しているという感じです。
第13章ではEMアルゴリズム、第14章ではSVM(サポートベクターマシン)の主問題と双対問題の関係性、第15章では座標降下法などを使ったスパースモデリング、第16章では多様体上の最適化についてまとめられており、より機械学習っぽい最適化を学ぶことが出来ます。
より応用を考えた最適化を学ぶならおすすめしたい一冊。
Pythonによる数理最適化入門
Pythonによる 数理最適化入門 (実践 Pythonライブラリー) [ 久保 幹雄 ] 価格:3,520円 |
- 連立方程式を使ったイメージしやすい問題からスタート!
- ケーススタディで実践的な力を養う!
本書は、Pythonを用いた数理最適化の入門書です。
この本の特徴は、数理最適化のアルゴリズム自体ではなく、数理最適化を用いた課題解決に重きを置いている点です。
ビジネスなどにおける課題を数理最適化で解く際に現場で発生しうる試行錯誤が多分に盛り込まれており、実務における手順や気をつけるべきポイントを学習することができます。
第1部はチュートリアルで、中学校で習う連立一次方程式や高校で習う線形計画法を題材として、数理最適化の基礎的な考え方とPythonによる初歩的な実装を学びます。
第2部はケーススタディで、実際に社会で起こりうる、さまざまな課題を数理最適化によって解いていきます。
数理最適化の実務応用について知りたい方や情報・経済・経営系などの学部や学科の学生におすすめです。
scikit-learn活用レシピ80+
scikit-learn活用レシピ80+ Python機械学習ライブラリ (impress top gear) [ ジュリアン・アビラ ] 価格:4,290円 |
- scikit-learnのあらゆる知識が詰め込まれている!
- 著者作ったのコードが公開されているので、手間が少ない!
「理論とかどうでもいいから、どうやって最適化をすればいいの?」と思っている方におすすめ!
Pythonのscikit-learnといわれるパッケージを使った最適化を紹介している本です。
scikit-learnは最適化に特化したパッケージで、さまざま手法が関数としてまとめられています。
また、githubにコードが公開されているので、いちいちコーディングする必要もないです。
変分ベイズ学習
変分ベイズ学習 (機械学習プロフェッショナルシリーズ) [ 中島 伸一 ] 価格:3,080円 |
- 「共役性」と「制約の設計指針」に焦点を当てた説明!
- ベイズ推論から丁寧な説明!
まとめ
今回は分野別・統計学入門おすすめ100冊を紹介しました。
それにしてもすごい長い記事なりましたね(^_^;)
Takumaro’s blogでは他にも初学者向けの分かりやすい本を紹介しています。
【データサイエンス入門】データ可視化おすすめの本3選【可視化入門】
【初心者におすすめ】はじめての統計学におすすめの本【統計学入門書】
【数学専攻がおすすめ】数理統計学おすすめの本10選【数理統計学入門】
コメント