7.5 奖励函数与值函数计算