AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 AIGC的主要技术

AIGC的发展源于早期基于概率模型和规则系统的方法,但受规则的限制。随着深度学习的兴起,深度神经网络和变分自编码器等模型取得重要突破。然后,生成对抗网络(Generative Adversarial Network, GAN)引入对抗训练机制,实现了更逼真的生成样本。Transformer模型通过自注意力机制改进了序列数据建模,开创了新思路。接着,生成式预训练Transformer(Generative Pre-trained Transformer, GPT)基于Transformer模型,通过预训练和微调解决了自然语言处理(Natural Language Processing, NLP)任务,ChatGPT扩展了GPT。最后,ChatGPT和稳定扩散(Stable Diffusion)等模型进一步推动了AIGC的发展,取得了新突破。总体而言,AIGC在各个领域都取得了显著进展,并展现了巨大的潜力。AIGC相关技术的发展历程如图1-1所示。

图1-1 AIGC相关技术的发展历程