AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3.1 生成模型的框架

假设有一组观察数据x={x1,x2,…,xn},这组观察数据通过一个规则来生成,这个规则不妨称为pdata,图1-5左边为数据分布样本点,图1-5右边为由随机采样得到的分布曲线。

图1-5 生成模型的框架示意

一般情况下,生成观察数据的规则(即分布函数pdata)是未知的,我们只能看到一组观察数据,如一组样本,这些样本可以是一组样本点或一组图像等。

接下来我们的目标就是通过观察数据x构建一个模型pmodel,用模型pmodel去模仿或逼近pdata。如果实现了这个目标,我们就可以从模型pmodel采样生成观察数据,且生成的观察数据好像是从pdata提取的。

构建模型pmodel后,如何衡量模型pmodel的优劣呢?如果满足以下两个条件说明pmodel建模成功。

1)从模型pmodel生成的采样与输入数据很逼真,或就像是从pdata生成的结果。

2)由模型pmodel生成的点,除模仿功能外,还应该有创新功能,即可以生成一些观察数据中没有但与观察数据有几分相似的新数据。

如何基于观察数据x来构建满足以上要求的模型pmodel呢?接下来我们从底层逻辑进行说明。