un

guest
1 / ?
back to lessons

什么模型拟合实际上意味着

一个模拟模型提出一个数学断言: 真实系统的输出位于(或接近)特定表面 M 在观察空间中的位置。

让真实系统产生观察值 y₁, y₂, ..., yₙ。模型预测值 ŷ₁, ŷ₂, ..., ŷₙ。

残差作为距离: rᵢ = yᵢ - ŷᵢ。每个残差测量一个观察值与其对应模型预测值之间的距离。在 n 维观察空间中, 残差形成一个向量 r = y - ŷ。

最小二乘拟合: 选择模型参数以最小化 ||r||² = Σrᵢ²。几何上, 找到模型表面 M 上离观察向量 y 最近的点 ŷ 在欧几里得距离上。

当残差误导

小的 ||r||² 不保证有效模型。有两种系统性失败模式:

1. 系统偏差: 残差 rᵢ 都是正的(或都是负的)且很小。模型一致低估或高估。几何上: ŷ 位于真实数据流形的平行偏移表面上 —— 距离很近, 结构却错了。

2. 错误流形: 残差很小因为模型有足够的自由参数可以精确地拟合训练数据(过拟合)。模型表面穿过数据点, 但在它们之间弯曲。对新数据的预测效果不佳。

Residuals, Bias, & Manifold Fitting

检测系统偏差

平均残差为零的模型可能仍然存在与输入变量相关的系统偏差。

示例: 一个低估夏天温度2°C, 高估冬天2°C的气象模拟, 在全年范围内, 残差的平均值约为0, 但有明显的季节性偏差。

残差诊断: 将 rᵢ 与每个输入变量进行绘图。没有趋势的平坦模式表明没有由该变量引起的系统偏差。趋势模式揭示了模型中缺少的维度。

汉明的验证问题——'一个小但关键的效应是否被忽略了?'——在几何上可以表述为:残差向量是否具有在模型参数空间中未被展开的方向分量?

一个回归模型 y = ax + b 对 4 个数据点进行拟合:(1, 3), (2, 5), (3, 8), (4, 9)。拟合直线有 a = 2, b = 1, 给出预测值 ŷ = (3, 5, 7, 9)。计算残差。然后:残差是否系统性(是否显示出模式), 还是看起来随机? 基于残差模式, 您会根据哪个几何性质进行修正?

系统偏差与随机噪声

哈沃斯效应:在研究中,受试者因为知道他们正在被观察而改变行为,而不是因为实验处理。

几何解释

让真实数据流形 M 在由变量 (x₁, x₂, ..., xₖ, 观察上下文) 组成的空间中。

模型忽略了观察上下文。它根据 (x₁, ..., xₖ) 的观察值拟合一个表面。

当观察上下文为 '正在研究' 时,实际数据点沿观察上下文轴线发生移动。模型的表面——在 (x₁, ..., xₖ) 空间中固定——现在适合移动的数据。当未观察到的上下文中进行预测时,残差看起来很小(表面在研究上下文中仍然很好地适合),但预测在未观察到的上下文中是系统错误的。

几何:模型表面接近研究上下文的数据流形,但远离现实流形。它们之间的距离:哈沃斯偏移沿观察上下文轴。

汉明的双盲要求:防止观察上下文与治疗相互关联。这使现实流形和研究上下文流形重合——消除几何偏移。

其他隐藏维度效应

任何影响系统但被排除在模型外的变量会创建相同的几何结构:

- 从经济模型中省略的季节效应

- 从制造模拟中排除的操作者行为

- 在性能模型中缺少的软件版本状态

模型会将生活在更高维子空间的数据拟合到一个低维表面上。残差在模型测量的方向上会很小,在未测量的方向上会很大。

验证作为几何对齐

Hamming的验证清单,用几何重新表述

支持假设的背景理论吗? 模型参数空间的维度是否覆盖了真实数据子空间?如果关键变量被排除(被排除的维度),模型表面就无法与现实保持一致。

内部检查可用吗? 保存定律是几何约束:数据必须位于由质量守恒、能量守恒等定义的特定子空间。如果模拟违反这些约束,其轨迹已经离开了有效子空间。

与已知过去经历进行交叉检查: 模型表面必须通过历史验证点——不仅仅是拟合训练数据,还要推广到出样本观察。

模拟是否稳定? 稳定的模拟在小扰动下仍然接近真实解子空间。不可靠的模拟离开子空间,无法称为有效模型。

Hamming指出,在商业模拟和战争游戏中,知道自己在模拟中的参与者会改变他们的行为——这使得模拟成为不靠谱的真实行为模型。请在这个情况下,描述模拟失败的几何特性(不仅仅是‘哈韦尔效应’),然后提出一个检测模拟与现实之间差距的验证测试,不需要双盲条件。

预测变成了投影

汉明赞同使用场景方法在预测不可能的领域:而不是断言“系统会做X”,提出在不同假设集下的可能轨迹集合。

几何解释

模型表面M(θ)取决于参数θ(对法律、常数、边界条件的假设)。不同假设集θ₁,θ₂,..., θₖ定义了不同的表面M(θ₁),..., M(θₖ)。

场景包围体是这些表面之和:输出空间中任何场景模型都可能产生的区域。

单个预测断言:真实结果位于最佳估计θ对应的表面M(θ)附近。场景方法断言:真实结果位于包围体内部。

当包围体有用

如果包围体狭窄——不同假设下的输出一致——对预测的信心较高。如果包围体宽——不同假设下产生的输出差异很大——模型对假设的敏感性较高。这种敏感性是输出,而不是一个故障模式。

汉明关于他自己的预测的断言:他在给出场景,而不是单点预测。他描述的未来是“在我看来,很可能发生的”,而不是精确的预测。

与现实的重叠

当现实落入包围体时,场景模型得到验证。这比单点预测的验证要求更低,但对模型能声称的内容更诚实。

把它们放在一起:有效模型及其几何

有效模拟的几何归结为三个对齐:

1. 参数空间覆盖真实多维空间:模型的维度包括所有驱动系统的变量。隐藏维度的差距产生系统偏差。

2. 稳定性使轨迹接近真实多维空间:收敛方向场意味着误差减小。分散的场意味着模拟离开有效区域。

3. 残差小且无结构:随机、无相关性残差表明模型捕捉到了真实多维空间。具有结构的残差(趋势、模式)表明缺少维度。

Hamming的'任何人为什么相信模拟?'在几何上翻译为:模型表面与现实多维空间的距离有多近,具有多个维度,具有多大的稳定性,基于多少个外样本点进行验证?

您正在构建一个模型,预测桥梁建设项目是否按时完成。您的模型使用:计划工期(周)、团队规模(人)、预算比(实际/计划)。一个同事认为您忽略了关键变量。根据本课堂的几何框架,描述两种类型的丢失变量:一种会在预测中产生系统偏差,另一种会增加预测方差但不产生偏差。解释这两种效果之间的几何差异。