问答详情
源自:2-4 梯度下降

直接计算这里为什么要考虑这两个问题?

直接计算这里为什么要考虑这两个问题?

提问者:ABC123CBA 2018-11-25 13:39

个回答

  • Beb
    2018-11-27 20:55:47
    已采纳

    个人认为讲师说得有一点问题,不瞒秩或者不正定的时候,存在多个解,并不是没有解,即解不唯一。此时选择哪一个解作为最后模型的参数呢?

    一是通过既定的选择便好来决定;

    二是采用梯度下降来近似。

    我觉得性能问题倒不是主要原因,主要原因是因为存在多个解(至于为什么你可以查查矩阵相关的资料)。