グラフィカル・モデルを基にした因果探索

2025/1/21

Rによるベイジアンネットワークを用いた因果探索。 有向グラフ因果モデル(DGCMs)、またはDAGは、因果関係を説明し、データから真の因果の関係を探索するために計算に用いる方法です。 causal-learnやcausalpyというpythonの因果探索ライブラリを評価しました、Rにも同様のライブラリが提供されています。ここでは、CRANに登録されているRのライブラリpcalgとbnlearnに実装されているいくつかの因果探索アルゴリズムを評価します。 2025年の10大リスク  ユーラシア・グループは、 ...

ReadMore

JupyterノートブックでRを使う方法

2025/1/20

Pythonの開発環境としてJupyter notebookがよく使われています。RでもPython同様にJupyter によるコードの編集、実行環境が利用できます。データサイエンスでは、主にJulia, Python, Rという言語が使用されますが、このイニシャルを繋げるとJupyterになります。 Jupyter notebook  R環境設定  JupyterからRを使うには、Rを起動したコマンドプロンプトから以下のコマンドを使います。  使用しているバージョンのR環境にJupyterのカーネルのパ ...

ReadMore

ドル円為替レートと物価上昇の関係:非線形モデル

2024/12/29

【マネーサプライと物価上昇の因果推論】で、線形モデルを適用して因果関係を調べてみました。物価上昇がドル円為替レートと因果関係があり、国内の金融政策には影響を受けていないことを示しました。ここでは、このドル円為替レートと物価上昇の関係に非線形なモデルを適用した例を示します。 USDJPY為替レートと物価上昇  最初に、【マネーサプライと物価上昇の因果推論】で使った同じデータセットを読み込みます。 図1 CPIーUSDJPY為替レートのデータセット  このデータセット(期間2001年12月〜2023年11月の ...

ReadMore

Apple Silicon Mac の R バージョン更新・インストール

2024/12/25

ARM Mac(Apple silicon)用の新しいバージョンの R バイナリパッケージがリリースされていたので(R4.4.2 released on 2024/10/31) 更新します。 CRANから Rバイナリパッケージをインストール 以下のCRANのサイトにアクセスしてダウンロードします。 https://cran.rstudio.com "Download R for macOS" をクリックします。  Linux(Debian, Fedora/Redhat, Ubuntu) またはWindow ...

ReadMore

書評:Essential Math for AI

2024/12/23

Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems Hala Nelson Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems  本書は、機械学習に関してトピックごとに関連する数学が挿入してあります。数学の理論や証明、プラミングコードは記述してありません。  読者として、数 ...

ReadMore

書評:Supremacy

2024/12/20

Supremacy: AI, ChatGPT and the race that will change the world Parmy Olson Supremacy - AI, ChatGPT and the race that will change the world  ジェフリー・ヒントン氏のチームがGPUにCNNを実装したAlexNetを使って画像認識でブレークスルーを起こしたのが2012年です。  5年後の2017年にGoogleのチームがAttentionモデルを使ったTransforme ...

ReadMore

R統合開発環境 RStudioのインストール

2024/12/10

 ARMネイティブなRStudioがリリースされていたのでインストールしました。  AppleSilcon版(ARMコアのMシリーズプロセッサ) Mac用のAnacondaをインストールしたときに、RStudioはバンドルされていませんでした。  Rの統合開発環境(IDE) RStudioは、公益法人RStudioが開発元でしたが、2022年に法人形態が変更され、Positという名称になっています。また、Positは、Rの開発、メンテナンスを行なっているR ファウンデーションとは無関係です。 RStudi ...

ReadMore

書評:Why Machines Learn

2024/11/25

Why Machines Learn: The Elegant Math Behind Modern AI Anil Ananthaswamy Why Machines Learn: The Elegant Math Behind Modern AI  本書は1950年代のローゼンブラットのパーセプトロンから現代の深層機械学習までの物語を記述してあります。  今年、2024年のノーベル物理学賞を授与された、ホップフィールド氏(John Hopfield)とヒントン氏(Geoffey Hinton)の仕事も ...

ReadMore

書評:The Model Thinker

2024/11/18

The Model Thinker: What You Need to Know to Make Data Work for You Scott E. Page The Model Thinker: What You Need to Know to Make Data Work for You  本書のサンプルを目を通してみると、本文がチャーリー・マンガー氏の言葉の引用から始まっています。  ー賢明になるためには、頭の中にモデルを持つことだ。このモデルの格子の中に、直接の経験と、代行による間接的な経験の両 ...

ReadMore

市場創造型のイノベーション 書評:The Prosperity Paradox

2024/12/26

ノーベル物理学賞の対象としての機械学習  今年のストックホルムの物理学賞に、機械学習の分野への貢献に対してジョン・ホップフィールド氏と以前グーグルにも所属していたトロントのジェフリー・ヒントン氏が選出された。  ACM、チューリング賞なら自然なのだが、コンピュータサイエンスの分野から物理学賞として選ばれるのは珍しい。ストックホルムの賞は物理学と化学と生理学の3種類しかないので、物理学的な考えがアルゴリズムに導入されているので物理学という枠組みが適用されるのであろう。それだけ機械学習の社会へのインパクトが大 ...

ReadMore

システム 書評

書評:Probabilistic Machine Learning, Advanced Topics

Probabilistic Machine Learning
Advanced Topics
(Adaptive Computation and Machine Learning series)

Kevin P. Murphy

Probabilistic Machine Learning Advanced Topics

 機械学習について、幅広いトピックが取り上げられています。紙の印刷物で1360項、kindleで2500頁を超えるボリュームです。構成の上で削っていくよりすべてを載せておこうという考えなのでしょう。従来の統計的な機械学習にベイジアンの視点で、多くのセクションが割かれています。

 

 章立ては以下の構成になっています。
1.Fundamentals
2.Inference
3.Prediction
4.Generation
5.Discovery
6.Action

 この本は、全体を通して各章のテーマに沿った事例が示され、機械学習について画像、音声、言語などのデータ処理に関する、多数の要素技術、考え方、数学的背景が紹介されてあります。それぞれの主要な概念が数学でも記述されているので、厳密さを求める方にはわかりやすくなっています。また、トピックの各例にGitへのリンク(ipynb)が貼られ、GitとColab上でJupyter Notebookによるpythonのソースコードが提供されています。本文にはtensorflowやJAXを使ったpythonのソースコードは一切掲載されていませんが、さらに深く知りたい方には、リンクを参照することで550以上のpythonサンプルコードでトピックの要素技術を調べることができるようになっています。Kindle版では、1クリックでサンプルコードが参照できる親切な作りです。

 著者の前著(Probabilistic Machine Learning: An Introduction)と重複している部分は少なく、1章に全体を読み進める上での基礎概念が記述されています。数学的記述からIsingモデル、相転移、ボルツマンマシンなどの物理学から持ってきた概念で潜在変数について解説されてあります。PGMだけでも幅広いトピックが記述されています。

 2章、3章はベイジアンに親しみのある内容になっています。2章はベイジアン推論に関して多くの項で解説されてあります。3章は与えられた入力によって、教師あり学習を使って出力を予測する確率モデルの作り方について書かれています。

 Counterfactualに関する議論では、CausalImpactに触れてあり、これは同じ考えに基づいて、GoogleからCRANに提供されているRのライブラリと対応しています。RライブラリのCausalImpactは状態空間モデルで表現できる時系列データに対して、Counterfactual推論が簡単に実行できるようになっています。

 変分推論は、ひとつのセクションが割り当てられており、自動微分に関しても複数のアルゴリズムが解説されてあります。

 4章の生成AIに関する章では、現在、流行っている大規模言語モデルのシンプルな構造から、オートエンコーダに関して丁寧に解説されてあります。確率モデルが教師なし学習を使って、出力を生成する方法について書かれています。

 こうした生成技術は画像においては、Google の消しゴムサービスなどで使われています。AppleのiOSでも同様ですが、言語モデルのように、AIという名称は使用されていませんが、これらの技術は、現代の携帯端末にも多く採用されています。画像や音声のオートエンコーダは、そうした代表例といえます。

 変分推論でバックプロパゲーションにベイズを使う方法など、ベイジアンの考えを取り込む技術が盛んになっています。これらのベイジアンニューラルネットワークは、多くの計算資源が利用できるようになった恩恵でもあります。各セクションでこれらの要素技術が解説されています。

 5章のDiscoveryは、潜在変数のモデルに関するものです。私たちが関心を向けるデータの探索に関して記述されています。観測データが隠れた潜在変数から生成されたものと仮定して探索します。潜在因子モデル、状態空間モデル、ベイジアンモデルなどが解説してあります。潜在因子はPGMで記述する場合、Graphに表現すれば構造がわかります。相互作用する変数の場合はGraphは有効なツールになります。

 また、自然言語処理におけるBERTの成功は、画像表現にも適用され、Representation Learningは、75%のマスクされた入力から全体をデコードする強力さが示されています。

 6章は、不確実性のもとでの意思決定のモデルとアルゴリズムに関して記されます。市場経済に関わる立場で、社会、経済システムに関してインスパイアされる内容でもあります。
 Reinforcement Learningは、Q-learning、SARSAメソッドについて記述されてあります。

 因果推論Causalityは、Pearlの有名なdo-operatorについて解説されています。PGMを使って因果の関係性を表現し、観測に基づく条件確率とは別にinterventionによる条件確率をdo-operatorで表します。このInterventionの概念は3章のCausalImpactやCounterfactualの概念とも深く関係します。数式でも表現してあるので理解しやすいでしょう。差分の差分法やconfounderの概念についてもこのセクションで解説されてあります。

 確率モデルによる機械学習の要素が網羅されているので、全体の森を見ることができます。この中のトピックからさらに深い領域に進んでいく端緒になる本です。

-システム, 書評
-