12.2.3 第三步:完整的BERT模型训练