昌旭的博客


机器学习、编程和数学


矩阵论——范数理论

不加证明地简述向量范数和矩阵范数的概念与部分定理。

R内容摘录自《矩阵论简明教程》(科学出版社)

向量范数

向量范数三公理

定义   若对任意$\boldsymbol{x} \in \mathbf{C}$都有一个实数$\Vert\boldsymbol{x}\Vert$与之对应,且满足:

  1. 非负性:当$\boldsymbol{x} \neq 0$时,$\Vert \boldsymbol{x} \Vert \gt 0$,当$\boldsymbol{x} = 0$时,$\Vert \boldsymbol{x} \Vert = 0$,
  2. 齐次性:对任何$\lambda \in \mathbf{C}$,$\Vert\lambda \boldsymbol{x}\Vert = \vert\lambda\vert \Vert\boldsymbol{x}\Vert$,
  3. 三角不等式:对任意$\boldsymbol{x}, \boldsymbol{y} \in \mathbf{C}^n$,都有$\Vert \boldsymbol{x} + \boldsymbol{y} \Vert \leq \Vert \boldsymbol{x} \Vert + \Vert \boldsymbol{y} \Vert$,

则称$\Vert \boldsymbol{x} \Vert$为$\mathbf{C}^n$上向量$\Vert \boldsymbol{x} \Vert$的范数,简称向量范数

常用向量范数

定义

设向量$\boldsymbol{x} = (\xi_1, \xi_2, \cdots, \xi_n)^T \in \mathbf{C}^n$

  • 向量1范数

$$ \Vert \boldsymbol{x} \Vert1 = \sum{k=1}^{n}{\vert \xi_k \vert} $$

  • 向量p范数

$$ \Vert \boldsymbol{x} \Vertp = ( \sum{k=1}^{n}{\vert \xi_k \vert^p} )^{\frac{1}{p}} \quad (1 \leq p \lt +\infty) $$

  • 向量$\infty$范数

$$ \Vert \boldsymbol{x} \Vert\infty = \max{k}\vert \xi_k \vert $$

  • 向量加权范数椭圆范数

$$ \Vert\boldsymbol{x}\Vert_\boldsymbol{A} = \sqrt{\boldsymbol{x}^H\boldsymbol{A}\boldsymbol{x}},\boldsymbol{A}是n阶Hermite正定矩阵 $$

性质

  1. 常见的1范数和2范数(欧氏距离)是都是特殊的p范数
  2. $$ \lim_{p \rightarrow +\infty} \Vert\boldsymbol{x}\Vertp = \Vert\boldsymbol{x}\Vert\infty $$
  3. 2范数具有酉不变性

向量范数等价性

定义   设 $\Vert \bullet \Vert_a$$ 和 $$\Vert \bullet \Vert_b$ 是 $\mathbf{C}^n$上的两种向量范数,如果存在正数 $\alpha$ 和 $\beta$,使对任意 $\boldsymbol{x} \in \mathbf{C}^n$ 都有

$$ \alpha\Vert\boldsymbol{x}\Vert_a \leq \Vert\boldsymbol{x}\Vert_a \leq \beta\Vert\boldsymbol{x}\Vert_b $$

则称向量范数 $\Vert \bullet \Vert_a$ 和 $\Vert \bullet \Vert_b$ 等价

定理   $\mathbf{C}^n$上所有向量范数等价

$\boldsymbol{H\ddot{o}lder}不等式$

对任意 $\xi_k, \eta_k \in \mathbf{C}(k=1,2,\cdots,n)$,有:

$$ \sum_{k=1}^{n}{\vert \xi_k \vert \vert \etak \vert} \leq
( \sum
{k=1}^{n}{\vert \xik \vert^p} )^{\frac{1}{p}}
( \sum
{k=1}^{n}{\vert \eta_k \vert^q} )^{\frac{1}{q}} $$

其中 $p \gt 1, q \gt 1, \frac{1}{p} + \frac{1}{q} = 1$

当 $p = q = 2$ 时,即得到Cauchy-Schwarz不等式

矩阵范数

矩阵范数四公理

定义   若对任意 $\boldsymbol{A} \in \mathbf{C}^{m \times n}$ 都有一个实数 $\Vert\boldsymbol{A}\Vert$ 与之对应,且满足

  1. 非负性:当 $\boldsymbol{A} \neq \boldsymbol{O}$ 时,$\Vert\boldsymbol{A}\Vert \gt 0$,当 $\boldsymbol{A} = \boldsymbol{O}$ 时,$\Vert\boldsymbol{A}\Vert = 0$,
  2. 齐次性:对任意 $\lambda \in \mathbf{C}, \Vert\lambda \boldsymbol{A}\Vert = \vert\lambda \vert \Vert \boldsymbol{A} \Vert$,
  3. 三角不等式:对任意 $\boldsymbol{A,B} \in \mathbf{C}^{n \times n}$,都有 $\Vert\boldsymbol{A} + \boldsymbol{B}\Vert \leq \Vert\boldsymbol{A}\Vert + \Vert\boldsymbol{B}\Vert$,
  4. 相容性:对任意 $\boldsymbol{A} \in \mathbf{C}^{m \times n}, \boldsymbol{B} \in \mathbf{C}^{n \times l}$,都有 $\Vert\boldsymbol{A}\boldsymbol{B}\Vert \leq \Vert\boldsymbol{A}\Vert \Vert\boldsymbol{B}\Vert$,

则称 $\Vert \boldsymbol{A} \Vert$ 为 $\mathbf{C}^{m \times n}$上矩阵 $\boldsymbol{A}$ 的范数,简称矩阵范数

与向量范数的相容性

定义   设 $\Vert \bullet \Vert_m$ 是 $\mathbf{C}^{n \times n}$ 上的矩阵范数,$\Vert \bullet \Vert_v$ 是 $\mathbf{C}^n$ 上的向量范数,如果对任意 $\boldsymbol{A} \in \mathbf{C}^{n \times n}$ 和 $\boldsymbol{x} \in \mathbf{C}^m$ 都有

$$ \Vert\boldsymbol{A}\boldsymbol{x}\Vert_v \leq \Vert\boldsymbol{A}\Vert_m \Vert\boldsymbol{x}\Vert_v $$

则称矩阵范数 $\Vert \bullet \Vert_m$ 与向量范数 $\Vert \bullet \Vert_v$ 是相容的。

从属范数(又名:导出范数)

我们知道,单位矩阵在矩阵乘法中的作用类似于1在数的乘法的作用,但是对于矩阵的$m_1$、F和M范数,有

$$ \Vert\boldsymbol{I}n\Vert{m_1} = n, \quad \Vert\boldsymbol{I}_n\Vert_F = \sqrt{n}, \quad \Vert\boldsymbol{I}_n\Vert_M = n $$

这对于一些理论分析带来不便,因此下面定理告诉我们如何构造出使$\Vert \boldsymbol{I}_n \Vert \equiv 1$的矩阵范数。

定理   已知 $\mathbf{C}^n$ 上的向量范数 $\Vert \bullet \Vert_v$,对任意 $\boldsymbol{A} \in \mathbf{C}^{m \times n}$,规定

$$ \Vert \boldsymbol{A} \Vert = \max_{x \neq 0}{\frac{\Vert\boldsymbol{A} \boldsymbol{x}\Vert_v}{\Vert \boldsymbol{x} \Vertv}} = \max{\Vert \boldsymbol{X} \Vert_v = 1}{\Vert \boldsymbol{A} \boldsymbol{x} \Vert_v} $$

则 $\Vert \bullet \Vert$ 是 $\mathbf{C}^{m \times n}$上与向量范数 $\Vert \bullet \Vert_v$ 相容的矩阵范数,称之为由向量范数 $\Vert \bullet \Vert_v$ 导出的矩阵范数从属于向量范数 $\Vert \bullet \Vert_v$ 的矩阵范数,简称导出范数从属范数

常用矩阵范数

设 $\boldsymbol{A} = (a{ij}){m \times n} \in \mathbf{C}^{m \times n}$

  • 矩阵$\boldsymbol{m_1}$范数

$$ \Vert \boldsymbol{A} \Vert_{m1} = \sum{i=1}^{m}{\sum{j=1}^{n}{\vert a{ij} \vert}} $$

  • 矩阵Frobeniuse范数F范数

$$ \Vert \boldsymbol{A} \VertF = \sqrt{ \sum{i=1}^{m}{\sum{j=1}^{n}{\vert a{ij} \vert^2 }} } = \sqrt{tr(\boldsymbol{A}^H \boldsymbol{A})}$$

  • 矩阵M范数最大范数

$$ \Vert \boldsymbol{A} \VertM = max{m,n} \max{i,j}{\vert a_{ij} \vert} $$

  • 矩阵G范数几何平均范数

$$ \Vert \boldsymbol{A} \VertG = \sqrt{mn} \max{i,j}{\vert a_{ij} \vert} $$

  • 矩阵1范数列和范数

$$ \Vert \boldsymbol{A} \Vert1 = \max{j}{\sum{i=1}^{m}{\vert a{ij} \vert}} $$

  • 矩阵2范数谱范数

$$ \Vert \boldsymbol{A} \Vert_2 = \sqrt{\boldsymbol{A}^H \boldsymbol{A} 的最大特征值} $$

  • 矩阵$\boldsymbol{\infty}$范数行和范数

$$ \maxi{\sum{j=1}^{n}{\vert a_{ij} \vert}} $$

性质

  1. F范数2范数具有酉不变性
  2. 相容性:
    • 矩阵$m_1$范数向量1范数相容
    • 矩阵F范数、G范数向量2范数相容
    • 矩阵M范数分别与向量1、2、$\boldsymbol{\infty}$范数相容
    • 矩阵1、2、$\boldsymbol{\infty}$范数分别与向量1、2、$\boldsymbol{\infty}$范数相容
  3. 矩阵1、2、$\boldsymbol{\infty}$范数分别由向量1、2、$\boldsymbol{\infty}$范数导出,从而与相应的向量范数相容

计算范数的Matlab命令 —— norm

在Matlab中使用doc norm可查看其文档,在此不再赘述

范数的两种常见应用

谱半径

定义   设 $\boldsymbol{A} \in \mathbf{C}^{n \times n}, \lambda_1, \lambda_2, \cdots, \lambda_n$为$\boldsymbol{A}$的$n$个特征值,称

$$ \rho(\boldsymbol{A}) = \max_{j}{\vert \lambda_j \vert} $$

为$\boldsymbol{A}$的谱半径

定理   设 $\boldsymbol{A} \in \mathbf{C}^{n \times n}$,则

  1. $\rho(\boldsymbol{A}^k) = (\rho(\boldsymbol{A}))^k$
  2. $\rho(\boldsymbol{A}^H \boldsymbol{A}) = \rho(\boldsymbol{A} \boldsymbol{A}^H) = \Vert \boldsymbol{A} \Vert_2^2$
  3. 当 $\boldsymbol{A}$ 是正规矩阵时,$\rho(\boldsymbol{A}) = \Vert A \Vert_2$

定理   设 $\boldsymbol{A} \in \mathbf{C}^{n \times n}$,则对$\mathbf{C}^{n \times n}$上的任一矩阵范数$\Vert \bullet \Vert$,都有

$$ \rho(\boldsymbol{A}) \leq \Vert \boldsymbol{A} \Vert $$

条件数

定理   设 $\boldsymbol{A} \in \mathbf{C}_n^{n \times n}$, $\Vert \bullet \Vert$是$\mathbf{C}^{n \times n}$上的矩阵范数,称

$$ cond(\boldsymbol{A}) = \Vert \boldsymbol{A} \Vert \Vert \boldsymbol{A}^{-1} \Vert $$

为矩阵 $\boldsymbol{A}$(关于求逆或求解线性方程组)的条件数

一般地,如果矩阵 $\boldsymbol{A}$ 的条件数大就称 $\boldsymbol{A}$ 对于求逆矩阵或求解线性方程组是病态的,或坏条件的;否则,称为良态好条件的