Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems
Hala Nelson
Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems
本書は、機械学習に関してトピックごとに関連する数学が挿入してあります。数学の理論や証明、プラミングコードは記述してありません。
読者として、数学を専門にするものだけでなく、データサイエンティスト、AI、機械学習エンジニア、技術の倫理的な問題に関わる思索者、AIやデータ分析を業務に組み入れたいと考える管理職、他の領域を専門とするAIに興味のある人々を対象にしてあります。
本書で取り上げているAI・機械学習の主なトピックは以下のようなものです。
- 一般的なトレーニング関数、損失関数、最適化
- 画像認識とCNN
- SVD(主成分分析と次元の縮約)と画像処理、自然言語処理
- 自然言語処理に関する量子化と時系列分析
- 確率的な生成モデル
- グラフモデル
- オペレーション・リサーチ
- 因果関係におけるPearlのdo-calculas
- AIと偏微分方程式
情報処理のシステムとして、ルールをプログラムし、それらの予めプログラムされたルールに基づいて、決定し、結論を得る代わりに、機械学習はデータからルールを推論します。そのため機械学習では、最初にデータが必要になります。
一般的なアルゴリズムの構成法は、問題を識別してモデルを作り、データに関数を適合させます。
ニューラルネットの最適化には確率勾配下降法が用いられますが、これは類書でも多く解説されています。
本書で取り上げているユニークなテーマとして、オペレーション・リサーチや偏微分方程式に独立した章が割り当てられています。
ニューラルネットでは任意の関数を再現できることがわかっています。偏微分方程式の章では、ニューラルネットワークは、任意の関数を無限の次元の空間にマッピングして近似することができ、どのような非線形の連続した関数でも近似することができるということなどが記述されています。
各トピックに沿って、概念の説明に数学が用いられています。
各章のトピックは独立しており、初めの章から順番に進める必要はないので、興味のあるテーマから読める構成になっています。
教養として技術的背景にある数学を知るには良いでしょう。より深く技術を把握しておきたければ、Kindle版は本文中に関連資料へのリンクが貼ってあるので簡単に参照することができます。