智能语音处理
上QQ阅读APP看书,第一时间看更新

2.3.1 基本概念

在正交变换中,信号可以采用正交基表示。这些正交基实际上是一些标准信号形式,可以认为它们形成了一个能够准确表示信号空间中所有信号的字典。就像通过字典可以找到所有词汇一样,也可以通过“信号字典”来查明任意信号。

稀疏表示中引入了字典这个概念。假设信号y∈ℝN具有表示y=Dx,其中D∈ℝN×Nx∈ℝN是稀疏的,则可称D是表示字典(简称“字典”),x是在字典D中信号y的表示系数。D中的元素di=(d1i,…,dNiT称为原子。

从数学的角度看,一个原子就是一个表示矢量,字典是由这样的多个矢量构成的矩阵。若这NN维原子相互正交,能够组合生成N维空间,则通常称为完备字典,也就是说这个字典中的原子都相互独立,无法再增加新的原子了。FFT矩阵、DCT矩阵都可以认为属于这类完备字典。这种字典的原子实际上都是变换空间中的正交基。

在信号的稀疏建模(稀疏表示)中,除了这种完备字典外,还可以构造其他类型的字典。比如,可以设计一个字典D∈ℝN×MM>N,此时有y=Dxx∈ℝM是稀疏的。D的行数小于列数,即原子的维数低于字典中原子的个数。这种字典称为冗余字典,因为这种字典中包含了过多的列来表示信号,存在冗余。如果冗余字典中的各原子能够保证生成N维空间,该字典就是一个过完备字典。

图2-5所示是一个N=2的例子。对于同一个信号,在两个不同的字典D1D2下可以有不同的表示方法。其中,D1是Hadamard矩阵,这是一个二维正交完备字典,D2是冗余字典(具有扁平的形状特点,有时也称为“扁胖”矩阵)。可以看出,针对同一个信号y=[3 2]T,在字典D2中可以得到稀疏表示x=[5 0 0 -2]T

图2-5 二维信号表示的示例