调整线性组合 z = w·x + b,观察概率输出 \(\sigma(z)\) 如何变化,并理解为什么逻辑回归在 z=0 附近最敏感。
观察:当 |z| 很大时,σ(z) 接近 0 或 1,梯度变小,学习变慢;当 z 接近 0 时,模型最“犹豫”,但可学习性最强。