6.4 梯度下降算法的变形