Không Gian Giá Trị so với Không Gian Đo Lường
Mô hình hóa thế giới thành hai không gian:
Không gian giá trị V: tập hợp các trạng thái của thế giới liên quan đến những gì bạn thực sự quan tâm. Các điểm trong V đại diện cho các mức độ khác nhau của đại lượng cơ bản thực sự (học tập của học sinh, tiến trình quân sự, phúc lợi kinh tế).
Không gian đo lường M: tập hợp các giá trị mà số liệu có thể lấy. Một số liệu là một hàm f: V → M — một ánh xạ từ không gian giá trị đến không gian đo lường.
Một số liệu hợp lệ là số liệu trong đó f gần với một phép đẳng cự trong vùng liên quan: những thay đổi bằng nhau trong M tương ứng với những thay đổi bằng nhau trong V. Các điểm gần nhau trong M tương ứng với các điểm gần nhau trong V.
Một số liệu biến dạng là số liệu trong đó f không phải là phép đẳng cự: số liệu nén một số vùng của V (làm cho những thay đổi lớn vô hình) và mở rộng những vùng khác (làm cho những thay đổi nhỏ có vẻ lớn). Hiệu chỉnh IQ là một sự biến dạng được thiết kế: nó ánh xạ phân phối điểm thô đến một phân phối Gaussian trong M, bất kể phân phối trí thông minh thực sự trong V.
Luật Goodhart theo các thuật ngữ ánh xạ: khi M trở thành mục tiêu, các tác nhân áp dụng tăng dốc trong M. Vì f là một sự biến dạng, tăng dốc trong M không tương ứng với tăng dốc trong V. Tác nhân di chuyển trong M mà không di chuyển (hoặc di chuyển lùi) trong V.
Kiểm Thử Tính Hợp Lệ Của Số Liệu
Một công ty đánh giá hiệu suất của nhân viên trên thang đánh giá 1-5 sao. Thang được hiệu chỉnh sao cho 80% nhân viên nhận được 3 hoặc cao hơn. Hệ thống đánh giá hiệu suất được sử dụng cho cả quyết định tiền lương (nơi thứ tự xếp hạng quan trọng) và kế hoạch cải thiện (nơi mức độ tuyệt đối quan trọng).
Tăng Dốc ở Không Gian Sai
Mô hình hóa bài toán tối ưu hóa theo hình học. Gọi V = không gian giá trị (học tập thực sự của học sinh, tiến trình quân sự, v.v.) & M = không gian số liệu (điểm thi, số vụ, v.v.).
Gradient của giá trị thực: ∇_V(value) chỉ theo hướng trong V tăng đại lượng cơ bản bạn quan tâm.
Gradient của số liệu: ∇_M(metric) chỉ theo hướng trong M tăng số liệu.
Vì f: V → M không phải là phép đẳng cự, gradient của số liệu trong không gian giá trị (f(∇_M)) không thẳng hàng với ∇_V. Góc giữa chúng, θ = arccos(∇_V · f(∇_M) / (|∇_V| |f*(∇_M)|)), đo mức độ nghiêm trọng của thất bại Goodhart.
Nếu θ = 0: gradient số liệu & gradient giá trị chỉ cùng một hướng. Tối ưu hóa số liệu tối ưu hóa giá trị. Không có sự hỏng hóc Goodhart.
Nếu θ = 90°: gradient số liệu vuông góc với giá trị. Tối ưu hóa số liệu di chuyển trong M mà không di chuyển trong V.
Nếu θ = 180°: gradient số liệu chỉ ngược lại với giá trị. Tối ưu hóa số liệu chủ động làm xấu đi giá trị.
Khi số liệu trở thành mục tiêu & các tác nhân áp dụng tăng dốc trên số liệu, họ theo f*(∇_M), không phải ∇_V. Góc phân kỳ θ tăng theo thời gian khi số liệu bị chơi trò chơi — ánh xạ f trở thành ít đẳng cự hơn khi các tác nhân tìm thấy các vùng nơi ∇_M & ∇_V phân kỳ nhiều nhất, vì đó là những con đường hiệu quả nhất để chơi trò chơi.
Đo Lường Sự Phân Kỳ
Hãy xem xét một không gian giá trị hai chiều đơn giản V = (skill, compliance) trong đó skill = hiểu biết thực sự của học sinh, compliance = khả năng của học sinh tuân theo thủ tục làm bài thi.
Một số liệu bài thi M = 0.3 × skill + 0.7 × compliance (một kết hợp tuyến tính cụ thể, trong đó compliance có trọng số 70%).
Tối Ưu Hóa Đa Mục Tiêu như Phòng Vệ chống lại Goodhart
Phòng vệ của Hamming: sử dụng nhiều số liệu cùng một lúc. Cách giải thích hình học: thay vì tối ưu hóa một hàm mục tiêu duy nhất f(x), hãy tối ưu hóa trên vector mục tiêu F(x) = (f₁(x), f₂(x), ..., fₖ(x)).
Đối với mục tiêu vector, khái niệm giải pháp là biên Pareto: tập hợp các giải pháp trong đó không có mục tiêu nào có thể được cải thiện mà không làm xấu đi mục tiêu khác. Biên Pareto thay thế tối ưu duy nhất.
Tại sao phòng vệ này chống lại Goodhart: để chơi trò chơi số liệu, một tác nhân hợp lý phải tìm hướng ở không gian giá trị tăng tất cả fᵢ cùng một lúc (hoặc ít nhất là các số liệu mà họ đang được đánh giá). Nếu các số liệu đủ độc lập — hướng gradient của chúng đủ không song song — không có hướng như vậy. Chơi trò chơi một số liệu làm xấu đi số liệu khác.
Mức độ phòng vệ: nếu k gradient số liệu kéo dài không gian k chiều (độc lập tuyến tính), thì tối ưu hóa bất kỳ tập con thích hợp nào của các số liệu làm xấu đi ít nhất một số liệu bị loại trừ. Phòng vệ Pareto đầy đủ yêu cầu không có hướng chơi trò chơi tồn tại tăng tất cả các số liệu.
Bất biến đo lường: một số liệu M không biến đối với thuộc tính không liên quan α nếu M(x + δα) = M(x) đối với những thay đổi δ ở α. Số liệu IQ không bất biến đối với luyện tập làm bài thi: IQ thay đổi khi học sinh luyện tập bài thi mà không có lợi ích thực sự ở khái niệm cơ bản.
Thiết Kế Một Hệ Thống Số Liệu Được Bảo Vệ Pareto
Hãy xem xét đánh giá một nhà khoa học nghiên cứu trên một hệ thống hai số liệu: M₁ = bài báo mỗi năm, M₂ = tỉ lệ trích dẫn mỗi bài báo (trích dẫn trên mỗi bài báo).