问答详情
源自:2-4 梯度下降

梯度下降的公式的解释

请问老师,梯度下降公式中学习速率乘上损失函数的偏倒的意义仍然不理解,什么叫对每次损失函数减小的维度进行不近似的参数递减?最小二乘法的公式是通过矩阵求导得到的吗?是否也可以用线性代数的知识解释呢?

提问者:慕婉清4872412 2018-07-09 10:37

个回答

  • Tsuki_suki
    2018-07-13 15:55:13

    损失函数的偏导就是一个导数,就是theta的斜率,调节学习率是为了斜率变化不大,这样多次迭代就能达到最低值