【おすすめの本】BERTによる自然言語処理入門【機械学習・統計学入門】

こんにちはたくまろです。
今回紹介するおすすめの本は、2021年に出版された近江 崇宏 (著), 金田 健太郎 (著), 森長 誠 (著), 江間見 亜利 (著)の『BERTによる自然言語処理入門』です。BERTはGoogleが2018年末に発表した自然言語処理モデルです。

Amazonでも情報科学分野でランキング1位を獲得したこともあります。
自然言語処理の標準モデルBERTを使いこなしたい方におすすめの本です!

プロフィール

専門分野:数理統計学、機械学習
統計学やデータサイエンスを中心にブログで発信中!
相談・質問も待ってます!Twitter >>> @takumaroblog

BERTによる自然言語処理入門 Transformersを使った実践プログラミング

新品価格
¥2,673から
(2021/9/21 14:21時点)

Amazon 楽天市場

『BERTによる自然言語処理入門』の概要

BERTについて

自然言語は、人間が発する言葉や書く言葉です。
一方、人工言語とはプログラミング言語の様に人間が機械に分かってもらえるように、作られた言葉です。

自然言語処理は、人が日常的に使う言葉を機械でも分かるように変換する処理です。

BERTはGoogleが2018年末に発表した自然言語処理モデルです。
BERTはGLUEと呼ばれる英語の言語理解を評価するテストに置いて、人間を上回る結果を出しました

また少数のデータでも高い性能を示し、応用的な側面でも有意な結果を残しています。
今では、BERTは標準的なモデルとなっており、自然言語処理を学ぶなら避けることはできません

本書の構成

第1章 はじめに
第2章 ニューラルネットワークを用いた自然言語処理
第3章 BERT
第4章 Huggingface Transformers
第5章 文章の穴埋め
第6章 文章分類
第7章 マルチラベル文章分類
第8章 固有表現抽出
第9章 文章校正
第10章 文章ベクトルを用いたデータの可視化と類似文章検索
付録A ニューラルネットワークの学習の基礎
付録B Colaboratoryの使い方

第2章では、前処理トークン化といった自然言語処理では欠かすことのできない操作を紹介するとともに、BERTに至るまでの自然言語モデルの背景を紹介。その後第3章ではBERTについてより詳しく解説がされています。第4~10章では各タスクごとにどのようにして解くのか、Pythonを使って解説されています。

『BERTによる自然言語処理入門』おすすめポイント

Point1:日本語対応の言語処理

自然言語処理に置いて、日本語のデータセットは非常に少ないです。
おそらく、日本語で書かれた本やインターネットの記事でも、扱っているデータセットは英語のものがほとんどだと思います。

しかし、多くの日本人にとっては、日本語で書かれている文章の方が、文脈理解がしやすく、イメージもしやすいのでは無いでしょうか?
その点を考慮して、本書では日本語のデータセットのみをピックアップして扱っています。
また、日本語特有の問題点もあり、その辺にも触れています。

英語があまり得意では無いならおすすめです。

Point2:Colaboratoryを使って簡単実装

本書では、Googleのアプリケーションである、Google Colaboratoryを使ってPythonの実装をしています。
ColaboratoryはJupyterLabやVScodeと違い、環境構築の必要がないので、簡単に実装することができます
環境構築って意外と大変なので、Pythonの実行環境か整ってないならおすすめです。

Point3:目標がはっきりしている

各章に上の方に目標が明記されています
そのために、この章では何が説明されているのかすぐわかります。
これによって、必要な箇所だけ読めるので、あると嬉しい場面があります。
また、4章以降はケーススタディ形式なので、目標のおかげて問題のイメージもしやすいです。

まとめ

今回は、おすすめの一冊ということで近江 崇宏 (著), 金田 健太郎 (著), 森長 誠 (著), 江間見 亜利 (著)の『BERTによる自然言語処理入門』を紹介しました。
Takumaro’s blogでは他にも初学者向けの分かりやすい本を紹介しています。
良かった、ご覧ください!!

【初心者におすすめ】統計学のための数学おすすめの本5選【統計学入門書】

【初心者におすすめ】はじめての統計学におすすめの本【統計学入門書】

【数学専攻がおすすめ】数理統計学おすすめの本10選【数理統計学入門】

【初心者におすすめ】はじめての統計的機械学習におすすめの本10選【機械学習入門】

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です