损失函数面是在调整w,b的过程中一步一步趋向完整的嘛?那么又怎么根据梯度下降确定哪个y是最优的,希望看明白了的同学讲解一下,不胜感激
可以根据y来进行反向传递来调整,我也不是看得很明白。多看几遍啦 。。。