un — 幾何学的シミュレーション II: モデル妥当性と幾何学的フィッティング

un

ゲスト

1 / ?

レッスン一覧に戻る

モデルフィッティングが実際に意味すること

シミュレーションモデルは数学的な主張をする: 実システムの出力は観測空間の特定の曲面M上に（またはその近くに）存在する。

実システムが観測値y₁, y₂, ..., yₙを生成する。モデルは値ŷ₁, ŷ₂, ..., ŷₙを予測する。

残差を距離として: rᵢ = yᵢ - ŷᵢ. 各残差は観測値とその対応するモデル予測の間の距離を測定する。n次元観測空間では、残差はベクトルr = y - ŷを形成する。

最小二乗フィッティング: ||r||² = Σrᵢ²を最小化するためにモデルパラメータを選択する。幾何学的には、ユークリッド距離で観測ベクトルyに最も近いモデル曲面M上の点ŷを見つける。

残差が誤解を招くとき

小さい||r||²は有効なモデルを保証しない。2つのシステマティックな失敗モード:

1. システマティックバイアス: 残差rᵢは小さいがすべてポジティブ（またはすべてネガティブ）である。モデルは一貫して過小予測または過大予測する。幾何学的に: ŷは真のデータ多様体への平行オフセット曲面上にある — 距離は近いが構造は間違っている。

2. 間違った多様体: 残差が小さいのは、モデルが訓練データに正確にフィットするのに十分な自由パラメータを持っているから（過学習）である。モデル曲面はデータ点を通り抜けるが、その間で大きく曲がる。新しいデータに対する予測は不良である。

残差、バイアス、& 多様体フィッティング

システマティックバイアスの検出

ゼロ平均残差を持つモデルでも、入力変数によって異なるシステマティックバイアスを持つ可能性がある。

例: 夏の気温を2°C低く、冬の気温を2°C高く推定する天気シミュレーションは、1年全体にわたって平均残差≈ 0を持つが、明らかな季節バイアスがある。

残差診断: 各入力変数に対してrᵢをプロットする。フラットなパターン（トレンドなし）は、その変数からのシステマティックなバイアスがないことを示唆する。トレンドパターンはモデルの欠落した次元を明らかにする。

ハミングの検証質問 — 「小さいが重要な効果が欠落している可能性があるか？」 — 幾何学的に翻訳される: 残差ベクトルはモデルのパラメータ空間によってスパンされない方向に成分を持つか?

回帰モデルy = ax + bは4つのデータ点に当てはめられる: (1, 3), (2, 5), (3, 8), (4, 9)。フィットした直線はa = 2, b = 1を持ち、予測ŷ = (3, 5, 7, 9)を与える。残差を計算する。次に: 残差はシステマティック（パターンを示すか）か、またはランダムに見えるか? 残差パターンに基づいてモデルのどの幾何学的特性を修正するか?

システマティックオフセット vs ランダムノイズ

ホーソーン効果: 研究の被験者は観察されていることを知っているため行動を変える。実験的処置のためではなく。

幾何学的解釈

真のデータ多様体Mを変数(x₁, x₂, ..., xₖ, observation_context)によってスパンされた空間に存在するとする。

モデルはobservation_contextを無視する。(x₁, ..., xₖ)の観測だけに曲面をフィットする。

observation_context = '研究中'のとき、実データ点はobservation_contextの軸に沿ってシフトする。モデル曲面 — (x₁, ..., xₖ)空間で固定 — は現在変位したデータにフィットする。残差は小さく見える（曲面は研究文脈内でもよくフィットする）が、観察されていない文脈での予測はシステマティックに間違っている。

幾何学: モデル曲面は研究文脈データ多様体に近いが、現実多様体から遠い。それらの間の距離: observation_context軸に沿ったホーソーンオフセット。

ハミングの二重盲検要件: observation_contextが処置と相関するのを防ぐ。これにより現実多様体と研究文脈多様体を一致させる — 幾何学的オフセットを排除する。

その他の隠れた次元効果

システムに影響するがモデルから除外されているあらゆる変数は同じ幾何構造を作成する:

- 経済モデルから省略された季節効果

- 製造シミュレーションから除外されたオペレータ行動

- パフォーマンスモデルから欠落したソフトウェアバージョン状態

モデルは、高次元多様体上に存在するデータに低次元曲面をフィットする。残差はモデルが測定する方向で小さく、測定されない方向で大きい。

幾何学的整列としての検証

ハミングの検証チェックリスト、幾何学として再構成:

背景理論は仮定された法則をサポートするか？ モデルのパラメータ空間の次元は真のデータ多様体をスパンするか? 重要な変数が欠落している場合（除外される次元）、モデル曲面は現実と整列できない。

内部チェックは利用可能か？ 保存則は幾何制約である: データは質量保存、エネルギー保存などで定義された特定の部分多様体上に存在しなければならない。シミュレーションがこれらに違反する場合、その軌跡は有効な部分多様体から離れている。

既知の過去の経験に対する相互チェック: モデル曲面は履歴検証ポイントを通過しなければならない — 訓練データに単にフィットするのではなく、サンプル外観測に一般化する。

シミュレーションは安定しているか？ 安定したシミュレーションは小さな摂動にもかかわらず真の解多様体の近くに留まる。不安定なシミュレーションは多様体の近傍から離れ、有効なモデルと呼ぶことはできない。

ハミングは、ビジネスシミュレーションと戦争ゲームの参加者がシミュレーション中であることを知ると行動を変え、シミュレーションを実際の行動の信頼できるモデルにしないと指摘した。この場合にシミュレーションが失敗する幾何学的特性を特定する（「ホーソーン効果」というだけではなく — 幾何学的構造を説明する）。次に、二重盲検条件を必要としないシミュレーション現実ギャップを検出する検証テストを提案する。

予測が投影になるとき

ハミングは予測が不可能なドメインのシナリオ方法を支持した: 「システムはXを行う」と主張する代わりに、異なる仮定セットの下での可能な軌跡のセットを提示する。

幾何学的解釈

モデル曲面M(θ)はパラメータθ（法則、定数、境界条件についての仮定）に依存する。異なる仮定セットθ₁, θ₂, ..., θₖは異なる曲面M(θ₁), ..., M(θₖ)を定義する。

シナリオ包絡はこれらの曲面の和集合である: シナリオモデルのいずれかが生成できる出力空間の領域。

単一の予測は主張する: 真の結果は最良の推定θに対するM(θ)の近くにある。シナリオ方法は主張する: 真の結果は包絡の内側のどこかにある。

包絡が有用なとき

包絡が狭い場合 — すべてのシナリオは異なる仮定にもかかわらず出力に同意する — 予測への信頼度は高い。包絡が広い場合 — 異なる仮定は非常に異なる出力を生成する — モデルは仮定に対して高度に敏感である。その感度は出力であり、失敗モードではない。

ハミング自身の予測についての主張: 彼はシナリオを与えていた、ポイント予測ではなく。彼が説明した未来は「私の意見では起こりそうなことは何か」であり、正確な予測ではなかった。

現実との重複

シナリオモデルは現実が包絡の内側に落ちるとき検証される。これはポイント予測よりも弱いテストだが、モデルが主張できることについてより正直である。

まとめる: 有効なモデル & その幾何学

有効なシミュレーションの幾何学は3つの整列に帰着する:

1. パラメータ空間が真の多様体をカバーする: モデルの次元はシステムを駆動するすべての変数を含む。隠れた次元ギャップはシステマティックなオフセットを生成する。

2. 安定性は軌跡を真の多様体の近くに保つ: 収束する方向場はエラーが縮小することを意味する。発散する場はシミュレーションが有効な領域から離れることを意味する。

3. 残差は小さく && 非構造化: ランダム、無相関の残差はモデルが真の多様体をキャプチャすることを示唆する。構造化された残差（トレンド、パターン）は隠れた次元を示唆する。

ハミングの「なぜ誰もシミュレーションを信じるべきか？」は幾何学的に翻訳される: モデル曲面は現実多様体にどのくらい近いか、何次元で、どの程度の安定性で、何個のサンプル外ポイントで検証されたか?

橋梁建設プロジェクトが予定通り完了するかどうかを予測するモデルを構築している。モデルは: 計画期間（週）、チームサイズ（人）、予算比率（実績/計画）を使用する。同僚は重要な変数が欠落していると主張している。このレッスンの幾何学的枠組みを使用して、2つのタイプの欠落変数を説明する: 予測に体系的なバイアスを作成するもの1つ、およびバイアスなしに予測分散を増加させるもの1つ。これら2つの効果の幾何学的差異を説明する。