グラフィカル・モデルを基にした因果探索

2025/1/21

Rによるベイジアンネットワークを用いた因果探索。 有向グラフ因果モデル(DGCMs)、またはDAGは、因果関係を説明し、データから真の因果の関係を探索するために計算に用いる方法です。 causal-learnやcausalpyというpythonの因果探索ライブラリを評価しました、Rにも同様のライブラリが提供されています。ここでは、CRANに登録されているRのライブラリpcalgとbnlearnに実装されているいくつかの因果探索アルゴリズムを評価します。 2025年の10大リスク  ユーラシア・グループは、 ...

ReadMore

JupyterノートブックでRを使う方法

2025/1/20

Pythonの開発環境としてJupyter notebookがよく使われています。RでもPython同様にJupyter によるコードの編集、実行環境が利用できます。データサイエンスでは、主にJulia, Python, Rという言語が使用されますが、このイニシャルを繋げるとJupyterになります。 Jupyter notebook  R環境設定  JupyterからRを使うには、Rを起動したコマンドプロンプトから以下のコマンドを使います。  使用しているバージョンのR環境にJupyterのカーネルのパ ...

ReadMore

ドル円為替レートと物価上昇の関係:非線形モデル

2024/12/29

【マネーサプライと物価上昇の因果推論】で、線形モデルを適用して因果関係を調べてみました。物価上昇がドル円為替レートと因果関係があり、国内の金融政策には影響を受けていないことを示しました。ここでは、このドル円為替レートと物価上昇の関係に非線形なモデルを適用した例を示します。 USDJPY為替レートと物価上昇  最初に、【マネーサプライと物価上昇の因果推論】で使った同じデータセットを読み込みます。 図1 CPIーUSDJPY為替レートのデータセット  このデータセット(期間2001年12月〜2023年11月の ...

ReadMore

Apple Silicon Mac の R バージョン更新・インストール

2024/12/25

ARM Mac(Apple silicon)用の新しいバージョンの R バイナリパッケージがリリースされていたので(R4.4.2 released on 2024/10/31) 更新します。 CRANから Rバイナリパッケージをインストール 以下のCRANのサイトにアクセスしてダウンロードします。 https://cran.rstudio.com "Download R for macOS" をクリックします。  Linux(Debian, Fedora/Redhat, Ubuntu) またはWindow ...

ReadMore

書評:Essential Math for AI

2024/12/23

Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems Hala Nelson Essential Math for AI:Next-Level Mathematics for Efficient and Successful AI Systems  本書は、機械学習に関してトピックごとに関連する数学が挿入してあります。数学の理論や証明、プラミングコードは記述してありません。  読者として、数 ...

ReadMore

書評:Supremacy

2024/12/20

Supremacy: AI, ChatGPT and the race that will change the world Parmy Olson Supremacy - AI, ChatGPT and the race that will change the world  ジェフリー・ヒントン氏のチームがGPUにCNNを実装したAlexNetを使って画像認識でブレークスルーを起こしたのが2012年です。  5年後の2017年にGoogleのチームがAttentionモデルを使ったTransforme ...

ReadMore

R統合開発環境 RStudioのインストール

2024/12/10

 ARMネイティブなRStudioがリリースされていたのでインストールしました。  AppleSilcon版(ARMコアのMシリーズプロセッサ) Mac用のAnacondaをインストールしたときに、RStudioはバンドルされていませんでした。  Rの統合開発環境(IDE) RStudioは、公益法人RStudioが開発元でしたが、2022年に法人形態が変更され、Positという名称になっています。また、Positは、Rの開発、メンテナンスを行なっているR ファウンデーションとは無関係です。 RStudi ...

ReadMore

書評:Why Machines Learn

2024/11/25

Why Machines Learn: The Elegant Math Behind Modern AI Anil Ananthaswamy Why Machines Learn: The Elegant Math Behind Modern AI  本書は1950年代のローゼンブラットのパーセプトロンから現代の深層機械学習までの物語を記述してあります。  今年、2024年のノーベル物理学賞を授与された、ホップフィールド氏(John Hopfield)とヒントン氏(Geoffey Hinton)の仕事も ...

ReadMore

書評:The Model Thinker

2024/11/18

The Model Thinker: What You Need to Know to Make Data Work for You Scott E. Page The Model Thinker: What You Need to Know to Make Data Work for You  本書のサンプルを目を通してみると、本文がチャーリー・マンガー氏の言葉の引用から始まっています。  ー賢明になるためには、頭の中にモデルを持つことだ。このモデルの格子の中に、直接の経験と、代行による間接的な経験の両 ...

ReadMore

市場創造型のイノベーション 書評:The Prosperity Paradox

2024/12/26

ノーベル物理学賞の対象としての機械学習  今年のストックホルムの物理学賞に、機械学習の分野への貢献に対してジョン・ホップフィールド氏と以前グーグルにも所属していたトロントのジェフリー・ヒントン氏が選出された。  ACM、チューリング賞なら自然なのだが、コンピュータサイエンスの分野から物理学賞として選ばれるのは珍しい。ストックホルムの賞は物理学と化学と生理学の3種類しかないので、物理学的な考えがアルゴリズムに導入されているので物理学という枠組みが適用されるのであろう。それだけ機械学習の社会へのインパクトが大 ...

ReadMore

ファイナンス リスクモデル 経済・産業

ヒューリスティックス:マーコヴィッツ・ポートフォリオ理論 対 不確実性

 合理性の限界について検討を重ねていたハーバート・A・サイモンの時代は、ダニエル・カーネマン氏等の行動ファイナンスは経済学の主要な流れとはなっていませんでした。

 サイモンは複雑系経済学の起源の一つとみなせますが、その時は複雑系という用語もありませんでした。 サイモンは人工的な現象(経済現象を含む)は、環境に従順であるという点で”環境依存性”を持っているとみなしていました。

 サイモンの仕事を継承するような、現在、複雑系や行動心理学の分野で活動している人々は、不確実な状況での認知や予測に関して新しい知見を提供しています。

 市場経済における資産管理では、基本的な統計手法としてシャープレシオ、裁定価格理論(Arbitrage Pricing Theory:APT)や平均・分散アプローチによるモダンポートフォリオ理論(Modern Portfolio Theory: MPT)などの手法が提案されてきました。

 マーコヴィッツのポートフォリオ理論に基づくポートフォリオのパフォーマンスが、ヒューリスティックによる単純な均等な割り当てのポートフォリオにパフォーマンスで劣るケースが発生することがあります(注1)

 なぜでしょうか。

 ヒストリック・ボラティリティーやシャープ・レシオは過去の履歴に基づくため、将来も統計的に同じように振る舞う場合は、過去の履歴に基づく選別は正しいでしょう。自己回帰モデルが適用できるようなケースに相当します。

 実際は、将来は過去の延長ではないため、回帰分析やヒストリカル・ボラティリティーでの将来予測は限定的な推定になります。

 マーコヴィッツのパフォーマンスが必ずしも最適ではないのは不確実性のためです。

 モダンポートフォリオ理論(MPT)を振り返ってみましょう。

モダンポートフォリオ理論

 分散投資(diversification)の概念は、収益率の期待値としての確率分布の平均、リスクとしてのその確率分布の分散を用いることで、リターンとリスクを統計的に客観的に取り扱います。

 ハリー・マーコヴィッツの提案するMPTはポートフォリオを生成するために平均分散アプローチによって、最小のリスクで最大のリターンを生成するように最適化したものです。MPTは与えられるリスクレベルで期待リターンを最大化させるポートフォリオをどのように構築するかを説明しています。

 図1 はNasdaqに上場されているいくつかの銘柄を基にモンテカルロシミュレーションで作った擬似的なランダムポートフォリオの期待リターンとボラティリティーを図示したものです。シャープ・レシオを赤から青のグラデーションの色で識別できるように表示しています。

 濃い赤字を結んだ曲線が効果的フロンティア(efficient frontier)になります。所与のリターンの水準でリスクが最小であるポートフォリオです。

図1 リターンとボラティリティーの分布

 過去の履歴に基づくボラティリティーやシャープレシオは、対象となる資産価格の時系列データの期間の取り方で値が変化します。

 以下の図は、ロンドン証券取引所(LSE)の上場銘柄に関して、ある時期の大小、異なる期間の期待ショートフォールとリターンを図示したものです。縦のY軸がリターンの平均、横のX軸がボラティリティーの代わりに期待ショートフォールを示しています。図2は長期、図3は中期、図4は短期のデータから導出しています。

図2 LSE リターンと期待ショートフォール(長期)

図3 LSE リターンと期待ショートフォール(中期)

図4 LSE リターンと期待ショートフォール(短期)

 高いリターンと低いボラティリティーを示す銘柄は、その時点からの過去に遡る期間のサンプルデータの取り方で変わります。これは、過去の一定期間の結果が、将来の同期間のリターンとボラティリティーの関係を示すことを約束するものではありません。

 図5は図4と同じデータセットですが、円の大きさがその期間の日次の出来高の平均、流動性を示しています。

 青のマーカーで示した銘柄BHPを例にとると、図5の短期のリターンの平均はマイナスになっており、円の上部だけを表示しています。タイムスパンの取り方によって統計データの示す内容は変化します。

図5 LSE リターンと期待ショートフォール、 流動性(短期)

 平均・分散アプローチは、回帰分析同様、将来も統計的に同じように振る舞うという仮定の上で予測に使うことができます。リターンの平均、期待ショートフォールのような過去の履歴に基づくデータは有用です。当該指標を含めて、どのようなリスクモデルや指標を判断材料とするかは意思決定者によります。

 MPTが将来のベストなポートフォリオを示しものではないことは明白です。とはいえ統計的な処理が無意味であるかというと、決してそうではありません。不確実性の度合いの問題です。

 多くの経済学では合理的な判断をする人間を前提に、理論を構築しています。複雑系の概念を基に調査しているジェームズ・ドイン・ ファーマー氏は、合理的な意思決定をする個人の集合体ではなく、不合理に行動する行為者(エージェント)のアンサンブルを用いた経済システムでシミュレーションを行なっています。

 ファーマー氏はカオスの研究者でしたが、システムの初期の揺らぎがその後に大きく影響するというバタフライ効果はよく知られています。これは初期のカオティックな挙動がその後のシステム全体に影響することです。常にこうした挙動が増幅されるのであれば、回帰分析自体が意味のないものになります。

 そうした不確実な状況は、特別なものでなくありふれて発生します。情報伝達においてはエントロピーの逆数が情報量として定義されます。元データに乱雑さが混入することで、伝達先では、元のデータが変化します。

 因果の探索においては、観測データから元の因果の構造を探索します。一部の因果の構造が既知であれば、事前情報として探索アルゴリズムに与えることができます。

 株式市場などの金融市場において、因果の構造が明らかであれば、予測に役立てることができます。

 現代の市場を通じた経済システムは、国際間で統合されて影響を及ぼしあう傾向があります。CPI等で評価されるインフレーションも、FTAの推進と国際間の貿易量の拡大に伴い国際的な統合が進展している面があります。先進国ではインフレーションや市場価格は伝播するため、エネルギーなどの一次産品の国際取引を通じた国外依存度の高い国では、一国の経済政策だけで完全に制御できるものではなくなっています。

 原因が自国に依存していない場合、つまり外因によるインフレーションに関しては、自国の経済政策で対症的な対応は可能ですが、直接その契機となった原因を取り除くことは外部への働きかけと影響力の行使が必要になり、必ずしも自国の都合で取り扱える範囲にはありません。これは他国に伝播していれば、その影響がさらに相乗的に影響してくる程、先進国では貿易の仕組みや金融システムを通じて経済システムが統合されていれます。

 平均分散アプローチによるMPTを基にしたポートフォリオも不確実性の度合いによっては、最小のリスクと最大のリターンの組み合わせとなりません。これは過去のデータへの適合が将来の予測の精度につながらない状況です。

 リスク(知られているリスク)と不確実性(知られていないリスク)を取り扱う手法として、期待ショートフォール他、たくさんの統計的なリスクモデルがあります。その多くは、過去の履歴を基にしたものです。過去の履歴だけでは軍事侵攻から発生する影響は予測できません。このような突発的な出来事に対するリスク管理の手法もあります。

図6 VaR に対して、Fat Tailなリターンの分布に対応した期待ショートフォール

 地政学的な出来事が発生するような状況では、市場の振る舞いは過去の履歴から乖離します。

 ファーマー氏は、モデルの評価に際しては、過去のデータに適合することよりむしろ、その将来の予測に注目することであると主張しています。

 機械学習の分野では過去のデータに適合させてモデルを作成し、モデルの精度を測りますが、予測に対しては、過去のデータに過度に適合することで、将来の予測の精度が低下することは、過学習(over fit)としてよく知られています。

 データからモデルをバックテストする場合、ブートストラップやクロス・バリデーションの手法が取られます。

 ブートストラップは、パラメータを推定する際に限定されたデータからサンプリングデータをシミュレーションして、テストする手法で元データに依存したデータが生成されます。

 クロス・バリデーションは、モデルを検証するための再サンプリングの手法です。元データをあらかじめ学習用とテスト用のデータセットに分離し、学習用データでテストしたモデルの精度をテストデータで検証します。

 どちらの手法も生成されるモデルの性質は、元データに依存します。

 既知の情報の上でシミュレートされたポートフォリオ、不確実性の上で成立する生成ポートフォリオと未知の結果は常に異なります。

エコロジカル(生態学的)合理性

 不確実性下での判断は、ヒューリスティックスがより正確な予測をする場合があります。

 従来のヒューリスティックスの考え(注2)では、ヒューリスティックな意思決定は、統計的なモデルや論理に従う合理的な判断より、大きな誤りを招くと見られていました。

 心理学者のGerd Gigerenzer氏等は、単純なヒューリスティックスが、より情報量の多い統計的な手法よりもっと正確なケースがあることを見つけています。これ等の結果は’less-is-more effects’として知られています(注3)。彼らは 正確さと情報、計算、時間の量との間に逆U型(inverse-U-shaped)の関係があると主張しています。

 こうしたヒューリスティックな判断が、より洗練された統計的な手法より、高い予測精度を上げる理由は、以上、述べたようにサンプルデータへの依存度と不確実性です。モデル化に際しては予測のベースになるデータの性質について、正しく把握しておく必要があります。

 ブートストラップやクロスバリデーションのような統計的な手法もサンプリングされた状況や条件に元データの性質に左右されます。心理学の"less-is-more effects"や機械学習におけるover fitのために、現実の世界で予測モデルよりヒューリスティックな判断の方が良い結果となる状況は起こります。それにもかかわらずデータサイエンスが有効であるのは、客観性のある尺度を提供できることにあります。

 Gigerenzer氏らは、ヒューリスティックスに関してシステマティックな理論の構築を試み、異なる状況に対応した問題解決のためのツールボックスを提案しています。

 なぜヒューリスティクスが有効であるか、Gigerenzer氏は二つの回答を用意しています。精度に対する労力のトレードオフと、ヒューリスティクスの生態学的合理性(ecological rationality)(注4)です。

 生態学的合理性とは、ヒューリスティックスは、環境の構造に適応する度合いへの生態学的な合理性であるとする、新しいフレームワークです。ヒューリスティックスは良い、悪い、または合理的、不合理でなく、その精度が環境の構造に依存するという考え方になります。

 この考えは、ハーバート・A・サイモンの'Bounded Rationality'の流れを受けたものです。’サイモンのハサミ’のアナロジー(注5)の新しい取り組みとみなせます。これは、人間の合理的な行動は、ハサミの形を持っており、その二つの刃は、タスク環境の構造と、行為者の計算能力であるというものです。片方の刃だけを見ていると、認知について、あるものは、なぜ、いつ失敗、あるいは成功するか理解できません。

 合理性は内部の基準に依存するだけでなく、環境の構造にも依存します。

 環境の構造とは、(Todd 2011)以下の項目を含んで識別されます。

  • 不確実性
  • 冗長性:刺激(cue)間の相関
  • サンプルサイズ:観測値に関する
  • 変数の重み:刺激の重みの分布

 これはコンピュータサイエンスで、より洗練された学習アルゴリズムとしてreinforcement learning に通じます。ニューラルネットワークの変数は各ニューロンの重みづけなので、外部刺激の入力で学習が進みます。心理学と機械学習という別の分野からの取り組みですが、手法が同じアプローチになっています。生態学的合理性(ecological rationality)は、reinforcement learningと共通点の多い概念です。

 生態学的合理性において鍵となる問題は、複雑な環境に組織を適応させることです。単純なタスクを例にとると、階段を上るタスクでは、重要なのは階段を上ることを管理することで、階段の登り方がわかることではありません。これはニューラルネトワークを使った機械学習と同じ考え方です。

 Brunswik氏やGigarenzer氏らは、これは経済にとっても極めて重要であるとみなしています。タスクをアーカイブするためには複数の多重の方法があることが明らかになっています。Gigarenzer氏らは、重要なストラテジーとして、それにヒューリスティックを使うことを試みています。

 

注:参考資料

  1. Alain Samson. “The Behavioral Economics Guide 2015”
  2. Tversky & Kahneman "Judgment under uncertainty: heuristics and biases." 1974
  3. Gerd Gigerenzer, Wolfgang Gaissmaier "Heuristic Decision Making", 2011 by Annual Review of Psychology
  4. Gerd Gigerenzer, "Ecological rationality: Intelligence in the world."
  5. Herbert A. Simon “Invariants of Human Behavior” 1990 Annual Review of Psychology

-ファイナンス, リスクモデル, 経済・産業
-, , , , ,