【おすすめの本】欠損値・欠測データ処理の方法【統計学入門】

こんにちはたくまろです。

今回紹介するおすすめの本は、高橋 将宜 (著), 渡辺 美智子 (著)の『欠測データ処理』です。

実データ解析をする上で、いつでも綺麗なデータばかりとは限りません。

中には、値が抜けていたり、欠損しているケースも珍しくありません。

そんな時、必要となる知識が欠損値・欠測データの処理です。

この本では、どのようにして失われた情報を補完するのか、Rを使って解説されています。

プロフィール

専門分野:数理統計学、機械学習
統計学やデータサイエンスを中心にブログで発信中!
相談・質問も待ってます!Twitter >>> @takumaroblog

欠測データ処理: Rによる単一代入法と多重代入法 (統計学One Point)

新品価格
¥2,420から
(2021/9/18 22:42時点)

Amazon 楽天市場

『欠測データ処理』の概要

一般的に調査・観測データには欠測が生じることが多く、それを補完するのでが欠測データ処理です。
適切な欠測データの処理をしなければ、解析結果に偏りが生じることがあります

有名な処理方法として、多重代入法尤度解析法の2種類があります。
この本では、特に多重代入法を用いた解析方法について紹介しています。

平均値のt検定、重回帰分析、ロジスティック回帰分析、時系列分析、パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して、データに欠測が生じている場合に、多重代入法を用いてどのように欠測データを処理していけばよいかを具体的に解説しています。

また、ウェブ上で入手可能な実データで解説しているので、より実践的な技能が身につくこと間違いなしです!

『欠測データ処理』おすすめポイント

Point1:実践で使える内容が多い

これまで、欠損値や欠測データの処理に関する理論的な本はたくさんあったのですが、実践的な内容のものが乏しかったため、この本をおすすめしました。

約6割がRによるコーディングで実際に手を動かしながら解析を進めることができるため、すぐに実践に応用することができると思います。

実際、欠測データ処理そのものよりも、処理後のデータ解析が主となる人が多いと思うため、理論的な本よりも、すぐに使えるような知識が良いかもしれないですね。

Rのパッケージに関する便利な知識もたくさん勉強になりました。
実践で即活かせる技術満載です!

Point2:欠損のメカニズムが分かりやすい

処理ばかりに目がいってしまい、どうして欠損が起きてしまうのか?という根本的な問題が取りのこされていることがよくあります。

欠損のメカニズムがわかってないと、正しい処理が出来ないケースがあります。

この本では、MCAR, MAR, MNARという3種類の欠損メカニズムについて書かれているのですが、条件付き確率を使った説明がとても分かりやすかったです。

この違いで躓く人も多いので、はじめて欠測データに触れる方は是非読んで欲しい部分です。

Point3:多重代入法を学ぶなら最適

重回帰分析を使って多重代入法を紹介するだけではなく、最適なアルゴリズムの設計といった、コーディングにおいて重要な部分ももれなく解説している良書です。

邦書でここまで詳しく多重代入法を解説している本はこれ以外にないかもしれません。
最新の研究成果についても簡潔にまとまっており、はじめて読む方でも良心的な設計になっています。

理論的に学びたいならこちら

もう少し理論的に学びたいならこちらがおすすめです。
最尤法ベイズ法EMアルゴリズム種々の代入法重み付き推定方程式などの手法を紹介しています。

欠測データの統計科学医学と社会科学への応用 (調査観察データ解析の実際 第1巻)

新品価格
¥3,520から
(2021/9/19 10:01時点)

Amazon

まとめ

今回は、おすすめの一冊ということで高橋 将宜 (著), 渡辺 美智子 (著)の『欠測データ処理』を紹介しました。
Takumaro’s blogでは他にも初学者向けの分かりやすい本を紹介しています。
良かった、ご覧ください!!

【初心者におすすめ】はじめての統計学におすすめの本【統計学入門書】

【数学専攻がおすすめ】数理統計学おすすめの本10選【数理統計学入門】

【初心者におすすめ】はじめての統計的機械学習におすすめの本10選【機械学習入門】

【初心者におすすめ】統計学のための数学おすすめの本5選【統計学入門書】

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です