拟合优度测量

Explore discuss data innovations to drive business efficiency forward.
Post Reply
asimd23
Posts: 472
Joined: Mon Dec 23, 2024 3:51 am

拟合优度测量

Post by asimd23 »

一旦选择了参数化的函数类,执行回归之前的最后一步是确定适当的距离度量,以测量最佳拟合曲线预测的值与训练该曲线的数据之间的误差。如果我们选择线性函数和直线与样本点之间的垂直差的平方,我们就会得到普遍使用的最小二乘线性回归技术。其他函数类(多项式、逻辑、正弦、指数)在某些情况下可能适用,就像其他距离度量(例如绝对值而不是平方值)可能在某些应用中给出更合适的结果一样。

一旦选择了回归问题的超参数(因变量的选择、函数类和距 阿塞拜疆电话号码数据 离度量),就可以通过人工分析和计算机计算相结合的方式求解最佳参数值。根据所选的距离度量,这些最佳参数确定了属于参数化类的特定函数,该函数比该类中的任何其他函数更接近可用数据点。 (例如相关系数和卡方系数)不仅可以帮助我们回答我们的曲线与训练数据的匹配程度,还可以帮助我们回答我们是否“过度拟合”了该数据,即我们是否应该期望有更简单的曲线提供与所考虑的曲线几乎一样好的拟合度。

通常,我们关心的因变量不会在连续的数值范围内变化。例如,我们可能只关心我们是否应该预期某个新数据点会或不会具有某些特征。在其他情况下,我们可能希望使用我们期望从一些相对较小的固定标签集中获得的准确标签来标记新数据点。例如,我们可能希望根据我们对客户需求的预期,将客户分配到多个处理队列之一。
Post Reply