文章目录 梯度下降小批量梯度下降多轮训练 数据归一化归一化原因损失函数等高线归一化 梯度下降 当前参数-损失函数关于参数的导数=新参数,新参数会往损失函数减少的方向变化 小批量梯度下降 小批量梯度下降:每次选择部分数据计算损失率进行梯度下降 随机梯度下降:随机选择数据计算损失率进行梯度下降 多轮训练 每轮分别使用各个批次的数据进行梯度下降,然后反复多轮 数据归一化 归一化原因 损失函数等高线 归一化