学习曲线可视化
探索训练集大小如何影响训练误差与交叉验证误差 -- 切换高偏差/高方差场景对比诊断
阴影区域 = 训练误差与交叉验证误差的间隔(方差指标)
关键洞察
- 高偏差 (欠拟合): 两条曲线很快收敛到一起,但误差值都偏高;增加数据无法显著改善
- 高方差 (过拟合): 两条曲线间距大,训练误差远低于交叉验证误差;增加数据能有效改善
- 均衡模型: 间距适中,随数据增加两条曲线都趋于较低且接近的误差
- 垂直虚线标记当前训练集大小,阴影区域的宽度直观反映方差大小
- 切换场景预设可快速对比不同模型复杂度下的典型学习曲线形态