価値空間対測定空間
世界を2つの空間としてモデル化してください:
価値空間 V:あなたが実際に気にかけることに関して、世界の状態の集合。V の点は、真の基礎的な量(学生の学習、軍事的進歩、経済的幸福)の異なるレベルを表します。
測定空間 M:メトリックが取ることのできる値の集合。メトリックは関数 f: V → M です。価値空間から測定空間への写像です。
有効なメトリックは、f が関連する領域で等距変換に近い場合です。M での等しい変化は V での等しい変化に対応します。M での近い点は V での近い点に対応します。
歪んだメトリックは、f が非等距変換である場合です。メトリックは V のいくつかの領域を圧縮し(大きな変化を見えなくする)、他を拡大します(小さな変化を大きく見せる)。IQ キャリブレーションは意図された歪みです。V での真の知能分布に関係なく、生のスコア分布を M のガウス分布にマップします。
マッピング用語でのグッドハートの法則:M が目標になると、エージェントは M で勾配上昇を適用します。f は歪みであるため、M での勾配上昇は V での勾配上昇に対応しません。エージェントは M で移動しますが、V では移動しません(または後方に移動します)。
メトリック妥当性のテスト
ある企業は従業員のパフォーマンスを1~5つ星スケールで評価しています。スケールは、従業員の80%が3以上を受け取るように調整されています。パフォーマンスレビュー システムは、報酬決定(ランク順序が重要)と改善計画(絶対レベルが重要)の両方に使用されます。
誤った空間での勾配上昇
最適化問題を幾何学的にモデル化してください。V = 価値空間(真の学生の学習、軍事的進歩など)とし、M = メトリック空間(テストスコア、死傷者数など)とします。
真の価値の勾配:∇_V(value) は、あなたが気にかけている基礎的な量を増やす V の方向を指します。
メトリックの勾配:∇_M(metric) は、メトリックを増やす M の方向を指します。
f: V → M は等距変換ではないため、価値空間のメトリック勾配(f(∇_M))は ∇_V と整列していません。それらの間の角度θ = arccos(∇_V · f(∇_M) / (|∇_V| |f*(∇_M)|)) は、グッドハート障害の重大度を測定します。
θ = 0 の場合:メトリック勾配と価値勾配は同じ方向を指します。メトリックを最適化すると、価値が最適化されます。グッドハート腐敗はありません。
θ = 90° の場合:メトリック勾配は価値に直交しています。メトリックを最適化すると、V で移動することなく M で移動します。
θ = 180° の場合:メトリック勾配は価値の反対を指します。メトリックを最適化すると、値を積極的に低下させます。
メトリックがターゲットになり、エージェントがメトリックに対して勾配上昇を適用すると、∇_V ではなく f*(∇_M) に従います。勾配上昇の乖離角 θ は、メトリックが操作されるにつれて時間とともに増加します。∇_M と ∇_V が最も分岐する領域がゲーム化の最も効率的なパスであるため、エージェントがそれらを見つけるにつれて、写像 f はより等距ではなくなります。
乖離を測定する
スキル = 学生の実際の理解、コンプライアンス = テスト受験手順に従う学生の能力の簡単な2次元価値空間 V = (スキル、コンプライアンス) を考えてください。
テストメトリック M = 0.3 × スキル + 0.7 × コンプライアンス(特定の線形結合。コンプライアンスの重みは70%)。
グッドハートに対する防御としてのマルチ目的最適化
ハミング の防御:複数のメトリックを同時に使用します。幾何学的解釈:単一の目的関数 f(x) を最大化する代わりに、目的のベクトル F(x) = (f₁(x), f₂(x), ..., fₖ(x)) を最適化します。
ベクトル目的の場合、解の概念はパレート境界です。目的を改善することが別の目的を悪化させることなくできない解のセット。パレート境界は単一の最適値を置き換えます。
これがグッドハートに対する防御である理由:メトリックを操作するために、合理的なエージェントは、すべての fᵢ を同時に増やす(または、少なくとも判断されているメトリックを増やす)価値空間の方向を見つける必要があります。メトリックが十分に独立している場合、つまり勾配方向が十分に非平行である場合、そのような方向はありません。1つのメトリックを操作すると、別のメトリックが低下します。
防御の程度:k メトリック勾配が k 次元空間をまたがる場合(線形独立)、メトリックの適切な部分集合を最適化すると、少なくとも1つの除外されたメトリックが低下します。完全なパレート防御には、すべてのメトリックを改善するゲーム化方向が存在しないことが必要です。
測定不変性:メトリック M がメトリックが無関係な属性 α に関して不変である場合、M(x + δα) = M(x)。IQ メトリックは、テスト受験練習に関して不変ではありません。学生が主要な構成要素での真正な利益なしにテストを練習すると、IQ が変わります。
パレート防御されたメトリック システムを設計する
研究科学者を2メトリック システムで評価することを考えてください。M₁ = 1年あたりの出版物数、M₂ = 論文当たりの被引用率(論文あたりの引用)。