10.1.2 InstructGPT和ChatGPT的训练过程