グラフィカル・モデルを基にした因果探索

2025/1/21

Rによるベイジアンネットワークを用いた因果探索。 有向グラフ因果モデル(DGCMs)、またはDAGは、因果関係を説明し、データから真の因果の関係を探索するために計算に用いる方法です。 causal-learnやcausalpyというpythonの因果探索ライブラリを評価しました、Rにも同様のライブラリが提供されています。ここでは、CRANに登録されているRのライブラリpcalgとbnlearnに実装されているいくつかの因果探索アルゴリズムを評価します。 2025年の10大リスク  ユーラシア・グループは、 ...

ReadMore

JupyterノートブックでRを使う方法

2025/1/20

Pythonの開発環境としてJupyter notebookがよく使われています。RでもPython同様にJupyter によるコードの編集、実行環境が利用できます。データサイエンスでは、主にJulia, Python, Rという言語が使用されますが、このイニシャルを繋げるとJupyterになります。 Jupyter notebook  R環境設定  JupyterからRを使うには、Rを起動したコマンドプロンプトから以下のコマンドを使います。  使用しているバージョンのR環境にJupyterのカーネルのパ ...

ReadMore

ドル円為替レートと物価上昇の関係:非線形モデル

2024/12/29

【マネーサプライと物価上昇の因果推論】で、線形モデルを適用して因果関係を調べてみました。物価上昇がドル円為替レートと因果関係があり、国内の金融政策には影響を受けていないことを示しました。ここでは、このドル円為替レートと物価上昇の関係に非線形なモデルを適用した例を示します。 USDJPY為替レートと物価上昇  最初に、【マネーサプライと物価上昇の因果推論】で使った同じデータセットを読み込みます。 図1 CPIーUSDJPY為替レートのデータセット  このデータセット(期間2001年12月〜2023年11月の ...

ReadMore

Apple Silicon Mac の R バージョン更新・インストール

2024/12/25

ARM Mac(Apple silicon)用の新しいバージョンの R バイナリパッケージがリリースされていたので(R4.4.2 released on 2024/10/31) 更新します。 CRANから Rバイナリパッケージをインストール 以下のCRANのサイトにアクセスしてダウンロードします。 https://cran.rstudio.com "Download R for macOS" をクリックします。  Linux(Debian, Fedora/Redhat, Ubuntu) またはWindow ...

ReadMore

書評:Essential Math for AI

2024/12/23

Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems Hala Nelson Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems  本書は、機械学習に関してトピックごとに関連する数学が挿入してあります。数学の理論や証明、プラミングコードは記述してありません。  読者として、数 ...

ReadMore

書評:Supremacy

2024/12/20

Supremacy: AI, ChatGPT and the race that will change the world Parmy Olson Supremacy - AI, ChatGPT and the race that will change the world  ジェフリー・ヒントン氏のチームがGPUにCNNを実装したAlexNetを使って画像認識でブレークスルーを起こしたのが2012年です。  5年後の2017年にGoogleのチームがAttentionモデルを使ったTransforme ...

ReadMore

R統合開発環境 RStudioのインストール

2024/12/10

 ARMネイティブなRStudioがリリースされていたのでインストールしました。  AppleSilcon版(ARMコアのMシリーズプロセッサ) Mac用のAnacondaをインストールしたときに、RStudioはバンドルされていませんでした。  Rの統合開発環境(IDE) RStudioは、公益法人RStudioが開発元でしたが、2022年に法人形態が変更され、Positという名称になっています。また、Positは、Rの開発、メンテナンスを行なっているR ファウンデーションとは無関係です。 RStudi ...

ReadMore

書評:Why Machines Learn

2024/11/25

Why Machines Learn: The Elegant Math Behind Modern AI Anil Ananthaswamy Why Machines Learn: The Elegant Math Behind Modern AI  本書は1950年代のローゼンブラットのパーセプトロンから現代の深層機械学習までの物語を記述してあります。  今年、2024年のノーベル物理学賞を授与された、ホップフィールド氏(John Hopfield)とヒントン氏(Geoffey Hinton)の仕事も ...

ReadMore

書評:The Model Thinker

2024/11/18

The Model Thinker: What You Need to Know to Make Data Work for You Scott E. Page The Model Thinker: What You Need to Know to Make Data Work for You  本書のサンプルを目を通してみると、本文がチャーリー・マンガー氏の言葉の引用から始まっています。  ー賢明になるためには、頭の中にモデルを持つことだ。このモデルの格子の中に、直接の経験と、代行による間接的な経験の両 ...

ReadMore

市場創造型のイノベーション 書評:The Prosperity Paradox

2024/12/26

ノーベル物理学賞の対象としての機械学習  今年のストックホルムの物理学賞に、機械学習の分野への貢献に対してジョン・ホップフィールド氏と以前グーグルにも所属していたトロントのジェフリー・ヒントン氏が選出された。  ACM、チューリング賞なら自然なのだが、コンピュータサイエンスの分野から物理学賞として選ばれるのは珍しい。ストックホルムの賞は物理学と化学と生理学の3種類しかないので、物理学的な考えがアルゴリズムに導入されているので物理学という枠組みが適用されるのであろう。それだけ機械学習の社会へのインパクトが大 ...

ReadMore

ファイナンス 書評 経済・産業

書評:May Contain Lies -嘘を含んでいるかもしれない

May Contain Lies: How stories, statistics and studies exploit our biases - and what we can do about it.

Alex Edmans

嘘を含んでいるかもしれない:どのようにストーリー、統計、調査研究が私たちのバイアスにつけ込むか、私たちがそれについてできること。

嘘を含んでいるかもしれない

 著者は、私たちの日々の生活に影響する誤った情報が氾濫している複雑な現代社会において、より賢明に考え、正しい判断を行う上でのノウハウをわかりやすくまとめています。

 心理的なバイアスは人の判断に影響します。

 筆者は以下の短いエッセイで著書の言説を引用しましたが、著者は、”言説は事実ではない”という章を設けて引用自体も問題の一つとなりうることを示しています。

 なぜならそれは不正確かもしれない。引用は文脈の範囲外かもしれない。そのような引用はセンテンスの一部であるか、チャートからバーを切り出したものかもしれない。

 コンテキストから一部を切り出した場合、著者の本意とは異なる内容を示す場合もあります。著者は本書において、そうした錯誤を生じさせる原因をリストにあげて解説しています。

 著者は自らの体験から以下の二つのことを学びます。

  1. 私たちはほとんどどのような意見であっても、たとえそれに欠陥があって、後にその偽りが剥げることがあっても、その意見をサポートするレポートを書くことができます。時事問題への関心は多くの研究を惹きつけるため、あなたはそれらから選ぶことができます。その証明として、”研究結果は〜と示します。研究では…がわかっています。”のようなフレーズを安っぽく使います。
  2. 政府の報告のような私たちが信頼できると考えているソースは、まだ信頼できないかもしれません。政策立案者、コンサルタント、学者によるものあっても、どのような報告も人によって記述され、そして人間はバイアスを持つのです。

 著者は事例を通して、私たちが影響されているバイアスを明らかにします。多くの例は私たちがいかにリサーチから影響を受けているかを示します。私たちは、たとえ学術的な論文を読まないとしても、ブラウザで選択し、SNSで共有されている記事を開くことで、リサーチに関して読んでいます。専門家の意見を聞くときはいつでも、インフレーションがなぜそう高いのか、子供にどのように教えるか、私たちはリサーチに関して尋ねています。

 いくつかのケースで誤った情報は致命的になります。

 コロナパンデミックの時に、USAの大統領だったドナルド・トランプ氏は,hydroxychloroquineが治療になること、薬の歴史的なゲームチェンジャーになるとツィートしました。ある女性は、魚の水槽のクリーナーのラベルに’chrloroquine’の記載があるのに気づきました。彼女と夫は、ウィルスから保護されることを望み、それを飲みました。女性は危篤になった後、助かりましたが、夫は病院で亡くなりました。

 この例のソリューションはシンプルです。事実を確認すること。それを飲む前に薬品が安全なことを確認することは明白でしょう。

 知識を持つだけでは不十分で、それをいつ使うか、どのように使うか知る必要があります。バイアスは、私たちの知識を忘却させる原因になります。

 本書は三つのパートからなっています。バイアス、問題、そのソリューションです。

 まず判断を誤りに導くバイアスに関して解説し、問題のパートで推論の梯子という概念が導入されます。著者は、判断や推論における全体の問題に関して、六つの梯子を設けています。それは、

  • 証明
  • 証拠
  • データ
  • 事実
  • 言説(statement)

という階段を登っていくことです。梯子の各ステップに一つの章を割いて、そのステップで錯誤を導く問題を解説しています。最後のパートでこれらの問題に対するソリューションとして、より賢明に考えるための方策を提示しています。

 バイアスに関しては二つの心理的なバイアス、確証バイアスと白黒思考について記します。情報を誤解させる二つの大きな要因です。著者はいくつかの実証的な事例を挙げて、確証バイアスを明らかにしていきます。

 シリコンバレーバンクのケースを見てましょう。

 預かり金を2019年から2021年の間に3倍に増やした。彼らは余剰資金を、平時では安全資産であるUS T-Bondsにおいた。しかし、彼らの内部モデルでは、金利が上昇すれば、深刻な損失が発生することを予期していた。この警告に留意するより、エグゼクティブたちは、最小のリスクを予期するようにモデルの仮定を変更した。彼らはそれが、彼らの好みでないモデルだとわかると、それを破棄した。SVBは2023年に破綻した。

 著者は簡単な質問をすることでバイアスされた解釈を見つける方法を提示しています。

確証バイアス

  • 確証バイアスは、バイアスされた解釈を導きます。これは二つの状態(forms)から現れます。
    • 未熟な認識:事実確認なし、あるいは他の解説があるか尋ねることなしに、私たちが好むものを信じます。
    • 見方の狭い懐疑論:他の説明を考慮することなし、私たちが好まない要求を拒否します。
  • 確証バイアスを見つけるためには、この状態が真実であることを望んでいるか?と質問してください。
    • イエスであれば、未熟な認識に気を配り、対抗する理論があるか尋ねてください。
    • ノーであれば、盲目的な懐疑論に気を配り、真剣に承認してください。
  • 確証バイアスは私たちの中に組み込まれています。言説は、fight-or-fright 反応を誘発する脳の部位、アミダラ(amygdala)の応答に委ねないこと1
  • 双方の人々が、まだ相違する結論に導くために、同じデータに注目することができます。彼らは、見たいものを見ます。事実をテーブルの上に置くことは、対立意見に導くかもしれません。人々の見方は、対立が少なくなるどころか、さらにいっそう対立的になります。
  • 確証バイアスは、バイアスされた探索もまた導きます。私たちは、認めたくないソースに目を閉じます。そして見つけたいことを見つけます。仮説をサポートする最も良い方法は、それを否定することを試みること、矛盾することを試みることです。
  • 知識は私たちのバイアスをより気づかせるものではありません。代わりに、積極的な推論に従事させることによって、もっと影響を受けやすくさせます。バイアスされた探索によって、問題はより一層悪化します。

 確証バイアスは拡散しますが、私たちが直面する情報の全てのケースに適用されるものではありません。認知がなければ、確証バイアスはありません。そのため、クリアな頭でこれらの問題に取り組むことができます。

 確証バイアスともう一方のバイアス、白黒思考は、私たちが、そのトピックに事前の視点がない時ですら、常に何かをいいか悪いかで見なすことにあります。その思考を検出するためには、:その状態は全ての設定に適用可能と主張できるか尋ねてください。

 二つのバイアスが情報を解釈するとき、私たちは不注意な失敗の原因となることについて議論します。確証バイアスは、私たちに事前の視点があるときに適用し、白黒思考はそれがないときに現れます。これ等のバイアスは相互に補強します。

 2番目の"問題"の章で著者は二つのバイアスから発生する異なる問題を探ります。私たちは、事実のための言説、データのための事実、証拠のためのデータ、証明のための証拠について錯誤します。

 私たちが間違った推論の梯子を上らないことを確認するために、いくつかの簡単な質問を紹介し、Appendixに簡単なチェックリストとして、それ等がまとめてあります。

推論の梯子

 推論の梯子とは、言説( statement )、事実( Fact )、データ、証拠、証明、という階段を登っていくことでした。これらそれぞれの階段を登る際に錯誤を生じさせる原因を事例を交えて解説しています。各章の章末に各ステップにおける錯誤原因とそれを明らかにするための簡単な質問がまとめてあります。

 たとえば、事実からデータの階段を登る際の、バイアスから発生する錯誤の問題に関して、著者がまとめている結果を抜粋すると、

事実はデータではない

事実はデータではない。それは代表していないかもしれない。たとえストーリーやケーススタディ、逸話が本当でも例外事象かもしれないので、一般的な結論を導けない。

  • 間違った物語(narative fallacy)は、それが存在しないのに、因果関係がわかることを意味する。たとえ、同じ事実に他の説明が適合する時であっても、成功のためにストーリーのような理由を受け入れる。
    • 著者は二つのバイアスを利用してそのような最適なストーリーでも作り出すことができる。
    • 人々は、たとえ、それが幸運に基づくものであっても、彼らの成功を証明するための理由を考案する。
  • 以下のステップを要件として因果関係を理解すること
    • 仮説で始める:所与の入力が所与の出力に影響する。
    • それ等の出力と無関係の、入力のケースをテストサンプルの代表に収集する。
    • それ等の出力と無関係の、入力のないケースでコントロールサンプルの代表を収集する。
    • 両方のサンプルの出力の平均を計算し、相違を見つける。
    • 相違が統計的に特徴的かチェックする。相違が幸運に基づくものにならないように、規模とサンプルサイズは十分に大きくする。

ソリューション

 最後の章で問題に対するソリューションを記述しています。

 これらの問題に関するソリューションは、個人レベルから組織レベル、社会レベルへ三つに大別してよりよく考えるように取り組むことを提案しています。

  • 個人として賢明に考えること。
  • もっと賢明に考えるる組織を作ること
  • より賢明に考える社会を作ること

 この中で著者が提案する組織的な努力に関するソリューションのエッセンスを抜粋すると

より賢明に考える組織を作ること

  • より賢明な組織の構築は、順応しようとする集団思考に打ち勝つことを含みます。
  • 集団思考に打ち勝つことは、民主的な多様性だけでなく、それ等の知識の集まりに実際に段階を踏むこと。認識してスタッフを集めるチームづくりを含みます。
  • 形式的な手続きは以下のことを含みます。
    • 問題解決のためのブレーンストーミング:特別な一つに終点を当てる前に、すべての利用可能なオプションを実行する。
    • 問題発見のためにブルースカイ思考、予算または技術的な実現性によって拘束されない。
    • 静寂した開始、議題と論文は、会議の開始時にだけリリースされること。会議が開始すると、最初に年少から話すこと。
    • 重要な決定では、部屋の温度をとるよりむしろ匿名で決をとることなどです。

 Appendixにさらに賢明に考えるためのチェックリストが収録されています。

 このチェックリストは、不注意な失敗を避け、誤った推論を導かないために、簡単な質問を通して誤りを確認できるものなっています。

  1. Thinking fast and slowの反射的な思考です。ダニエル・カーネマン「ファスト&スロー あなたの意思はどのように決まるか?」 ↩︎

-ファイナンス, 書評, 経済・産業
-