Python快乐编程:人工智能深度学习基础
上QQ阅读APP看书,第一时间看更新

3.3.2 矩阵范数

除了衡量向量的大小很多时候也需要衡量矩阵的大小,前面所讲到的有关向量范数的知识同样可以应用于矩阵。满足下列所有性质的任意函数f称为矩阵范数。

(1)正定性:‖A‖≥0,且当‖A‖=0时,必有A=0成立;

(2)正齐次性:∀ARm×n,‖αA‖=|α|×‖A‖;

(3)三角不等次性:‖A‖+‖B‖≥‖A+B‖;

(4)矩阵乘法的相容性:对于任意两个矩阵ARk×m和矩阵BRn×k,若A可以与B相乘,则满足‖A‖×‖B‖≥‖A×B‖。

本书采用与向量范数相似的表达式‖Ap来表示矩阵的p范数,矩阵通常采用的是诱导范数,诱导范数的定义如下:

(1)假设‖xm是向量x的范数,‖An是矩阵A的范数对于任意满足‖xm×‖An≥‖x×Am的向量x和矩阵A,有矩阵范数‖An与向量范数‖xm相容。

(2)假设‖xp是向量xp范数,定义:,则‖Ap是一个矩阵范数,并且称该矩阵范数是由向量范数‖xp所诱导的诱导范数。

由向量的p范数诱导可得矩阵p范数。

1.矩阵L2范数

矩阵L2范数也被称为谱范数,写作‖A2,是由向量L2范数诱导的矩阵范数,其表达式如下所示:

其中λjATA)表示矩阵ATA的第j个特征值。

2.矩阵L1范数

矩阵L1范数也被称为列和范数,写作‖A1,是由向量L1范数诱导的矩阵范数,其表达式如下所示:

p的值趋于∞时,矩阵L范数也被称为行和范数,写作‖A,是由向量L1范数诱导的矩阵范数,其表达式如下所示:

在深度学习中,最常见的做法是使用F范数(Frobenius norm,简称F范数),其表达式如下所示:

其类似于向量L2范数。在后续章节中处理模型最优化问题时将很多问题转化为F范数的最优化问题。