こんにちはたくまろです。
今回紹介するおすすめの一冊は、井出剛著の『入門 機械学習による異常検知』です。
異常検知の最前線で活躍している井出先生の実践的な方法論を紹介しています。
他の機械学習の本で書かれていない、異常検知ならではの手法もたくさん紹介されています!
様々な分野で異常検知は研究されており、機械学習の中でもホットなトピックです。
専門分野:数理統計学、機械学習
統計学やデータサイエンスを中心にブログで発信中!
スクレイピングによるデータ収集が得意です。
相談・質問も待ってます!Twitter >>> @takumaroblog
![]() |
新品価格 |
異常検知とは何か?
ざっくりと言うと、分類問題の一種です。
データが与えられて、正常のクラスと異常のクラスに分けると言うものです。
では、何が分類問題と異なるのでしょうか?
最大の相違点は”訓練データ(モデルを構築するデータ)に異常な標本が圧倒的に少数、もしくは存在しない“と言うことです。
極端に言うと、正常クラスのサンプルで判別モデルを作ることもあります。
通常の分類問題で使われている手法を使うと、異常クラスの判別が非常に不安定になる可能性が高くなります。
この本では、分布や異常標本の有無に応じて、8種類程度の方法が提案されています。
『異常検知』おすすめポイント
Point1:様々なパターンに応じた方法
異常検知をするにあたって様々な状況が考えられると思います。
正規データ(正規分布など)のように扱いやすいデータであれば良いのですが、非正規データ(t分布など)のような分布に仮定を置かないような状況でも成立するような方法についても紹介されています。
他にも、異常標本が訓練データに存在しないようなサンプルや時系列データにも対応できるような方法も紹介されており、非常に充実した内容になっています。
Point2:何に使われているのかイメージしやすい
Point1でも説明しましたが、様々な状況に合わせた異常検知の手法を紹介しているため、それがどのような現場で使われているのか?といった部分も気になりますよね。
この本では各章の初めのイントロでどのようなデータをターゲットにした手法であるのか書かれいるため、イメージがしやすいです。また、Rでのコーディングを載せていおり、パッケージのデータを使った結果を載せています。
数式が多く難しい箇所もありますが、具体例を使ってわかりやすくまとめています。
Point3:実践的な対処法
8章では、『よくある悩みとその対処法』が述べられています。
他の本ではなかなか見られないようなページですよね。
このページでは、実データの解析でよく問題になる、パラメータの更新速度や前処理などについて言及されています。
実際に解析することを視野にいれて書かれているというのが伺えますね。
合わせて読みたい一冊
この本は井出先生と杉山先生の共著によって書かれたMLPシリーズです。
上記の本に比べると、内容がやや難しいと感じました。より理論的に学びたいならこちらがおすすめです。
学生時代にこの本でゼミをしたことがあるのですが、ベクトルや行列の演算、多変量解析の力が身につきました。
ちなみに難易度が高いため、数学的な補足も後ろの方に書かれています。
また、杉山先生の専門分野に関する密度比推定なども上の本より詳しく述べられているので、是非合わせて読んでみると良いですね。
![]() |
新品価格 |
まとめ
今回は、おすすめの一冊ということで井出剛著の『入門 機械学習による異常検知』を紹介しました。
Takumaro’s blogでは他にも初学者向けの分かりやすい本を紹介しています。
良かった、ご覧ください!!
【初心者におすすめ】はじめての統計学におすすめの本【統計学入門書】
【数学専攻がおすすめ】数理統計学おすすめの本10選【数理統計学入門】
【初心者におすすめ】はじめての統計的機械学習におすすめの本10選【機械学習入門】