こんにちはたくまろです。
今回紹介するおすすめの本は、MLPシリーズ須山敦志 (著)の『ベイズ推論による機械学習入門』です。
ベイズ統計学は、実用性が高く様々な分野で用いられている学習理論の一つです。
機械学習を使う上で、ベイズの考え方は避けては通れません。
「機械学習やベイズ統計学について理論的に学びたい!」
「最新の実用的な機械学習の方法が知りたい!」
そんな方におすすめな内容です。
![]() |
機械学習スタートアップシリーズ ベイズ推論による機械学習入門 新品価格 |
『ベイズ推論による機械学習入門』の概要
頻度主義 v.s. ベイズ主義
メールの分類問題を考えたいと思います。
メールに書かれている言葉を単語に分けてデータ化したものを100通用意して、正常なメールと迷惑メールに分類するとします。
頻度論的な考えだと、この100通を使って分類器を作るのですが、ここで問題が生じます。
例えば、分類したい新たなメールに、100通に含まれていない単語が含まれていた場合、誤った判別を起こす可能性があります。
そこで、分類器を作る際に、事前に100通のメールに含まれていないような単語に対しても、正常メールか迷惑メールになるか主観的な確率を決めておけば、上記なような不足の自体でも対処できるようになるはずです。
このように、100通のメールとは無関係に事前決めた単語の出現確率を指すのが事前確率というものです。
事前確率は、データではなく主観的に決定されたもので、証拠がない確率と呼ばれたりもします。
得られたデータのみで判別をする考え方を頻度主義。
事前確率と得られたデータで判別する考え方をベイズ主義。
このベイズ主義的な考えを定式化したものがベイズの定理です。
事前確率の導入によって、より現実に則した推論ができるようになることが多く、本書でも数式を用いて様々な手法が紹介されています。
本書の構成
第 1 章 機械学習とベイズ学習
1.1 機械学習とは
1.2 機械学習の代表的なタスク
1.3 機械学習の 2 つのアプローチ
1.4 確率の基本計算
1.5 グラフィカルモデル
1.6 ベイズ学習のアプローチ
第 2 章 基本的な確率分布
2.1 期待値
2.2 離散確率分布
2.3 連続確率分布
第 3 章 ベイズ推論による学習と予測
3.1 学習と予測
3.2 離散確率分布の学習と予測
3.3 1 次元ガウス分布の学習と予測
3.4 多次元ガウス分布の学習と予測
3.5 線形回帰の例
第 4 章 混合モデルと近似推論
4.1 混合モデルと事後分布の推論
4.2 確率分布の近似手法
4.3 ポアソン混合モデルにおける推論
4.4 ガウス混合モデルにおける推論
第 5 章 応用モデルの構築と推論
5.1 線形次元削減
5.2 非負値行列因子分解
5.3 隠れマルコフモデル
5.4 トピックモデル
5.5 テンソル分解
5.6 ロジスティック回帰
5.7 ニューラルネットワーク
大学教養レベルの数学が分かっていれば、PRML(パターン認識と機械学習)に比べて、易しいと感じました。
数学的な厳密性は求められていませんが、最適化など難しいところもあります。
ただ100%理解できなくても、結果が何を表すのか?さえ分かればなんとかなると思います。
個人的にキーとなるのは、「尤度と事後確率の違い」「事前分布は正則化と一緒」ここら辺が分かってくると、ベイズが楽しくなると思います。
『ベイズ推論による機械学習入門』おすすめポイント
Point1:式変形が丁寧
PRMLに比べて、易しいと感じた最大の理由は式変形が細かいと感じたからです。
ベイズ推論の最初の方は、分布関数を使った式変形が多いので、微積分を使った複雑な式変形が多いです。
そのため、行間が空いていると、パニックになります(笑)
その点、この本では途中変形で何をしたのか説明を挟んでくれたりするので良心的です。
Point2:事前分布の導入が良い
「共役事前分布の説明が良い」という意見がAmazonのレビューなど見ていて多かったです。
確かに、分かりやすいと思います。
そもそも、事前分布ってどうやって決まるの?と思う人も多かったと思います。
そこで都合が良い事前分布として、共役事前分布が登場しました。
何を変数として、何を定数として議論を進めているのか?そこを意識して読むとさらに理解が深まるのではないでしょうか。
初学者がつまずきやすいポイントがよく分かっているなぁと感じました。
Point3:数学的な補足も参考になる
特によかったと思った部分は、最適化の部分です。
モデルが複雑になればなるほど、解析的に最適解を求めることは困難になります。
そんな時、役立つのが数値的最適化です。
この本では、勾配法を用いており、その説明が付録でされています。
他にも、数学的な補足が付録の部分でされており、数学的議論が蔑ろにされていないので、とてもためになると思います。
まとめ
今回は、おすすめの一冊ということで須山敦志 (著)の『ベイズ推論による機械学習入門』を紹介しました。
Takumaro’s blogでは他にも初学者向けの分かりやすい本を紹介しています。
良かった、ご覧ください!!
【初心者におすすめ】はじめての統計的機械学習におすすめの本10選【機械学習入門】
【初心者におすすめ】はじめての統計学におすすめの本【統計学入門書】