本学期选修了学校自动化学院的张绍武教授《模式识别》课程。此为期末总结时候的复习总结。此篇主要包含了一些数学常识与基础。
Chapter 0 数学基础
0.1 行列式与线性方程组
解行列式:
- 按行 (列) 展开计算
- 化为三角行列式计算
解线性方程组:
⎩⎪⎪⎨⎪⎪⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2………………………an1x1+an2x2+⋯+annxn=bn
-
若系数行列式 D=∣aij∣=0, 则方程组存在唯一解
x1=DD1,x2=DD2,⋯,xn=DDn
-
若为齐次方程组 (b=0), 有非零解的充要条件是 D=∣aij∣=0
0.2 矩阵
Am×n=[aij]m×n
方阵:
m=n
对角阵:
∧=diag(a11,a22,…,ann)
单位阵:
E=diag(1,1,…,1)
| eye (n) ```上三角与下三角阵: (TODO)```matlab triu (A) tril (A)
|
0.3 矩阵运算
矩阵乘法 C=AB:
cij=k∑aikbkj
矩阵的转置:
A=(aij),A′=AT=(aji)
对称方阵:
A′=A,即aij=aji
方阵的行列式性质:
- 如果 ∣A∣=0, A 称为非奇异阵,否则为奇异阵.
- ∣A′∣=∣A∣,∣AB∣=∣A∣∣B∣
逆矩阵:
如果 AB=BA=E, 则称 A 可逆,B 为 A 的逆.
方阵 A 可逆的充要条件为
∣A∣=0
0.4 分块矩阵及其运算
用横线和竖线把矩阵分成若干小块,每个小块为一个矩阵,它可以作为一个元素参加运算。
⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡10⋯0001⋯00⋮⋮⋮⋮⋮10⋯1201⋯21⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤=[E2OE2B22]
分块对角阵 (TODO):
∣A∣=∣A11∣∣A22∣…∣Arr∣
| A = blkdiag (A11, A22, ..., Arr) A11 = A (1:m, 1:n)
|
0.5 向量
n 维向量:
x=(x1,x2,…,xn)T
线性相关与线性无关:
设有 n 维向量组: x1,x2,…,xm, 如果只有当 k1=k2=…=km=0 时,才能使得下式成立,则称该向量组线性无关,否则则称线性相关.
k1x1+k2x2+⋯+kmxm=0
m 个 n 维的向量的矩阵表示:
A=(a1,a2,…,am)
n 个 n 维向量: ai=(ai1,ai2,…,ain)T 线性无关的充要条件是
∣A∣=0
0.6 向量 (二)
若满足下式,则称 A 可以由向量组 B 线性表示:
A=(a1,a2,…,am)=(b1,b2,…,bm)C=BC
向量组的秩:(TODO)
rank(A)=nor(A的最大线性无关组)
- 向量组 α1,α2...αs 线性无关等价于 rank(α1,α2...αs)=s
- 等价的向量组具有相同的秩
- 任意 n+1 个 n 维向量线性相关
向量的内积:
(x,y)=i=1∑nxiyi=xTy
向量的模 (范数 / 长度):
∣x∣=xTx
两点的距离:
d(x1,x2)=∣x2−x1∣=(x2−x1)T(x2−x1)
两个向量的夹角:
θ=<x1,x2>=arccos∣x1∣∣x2∣x1Tx2
0.7 向量 (三)
两个向量正交:
(x,y)=0,cos(θ)=0
若非零的 n 维向量 x1,x2,…,xm 两两正交,则称为 正交向量组. 正交向量组队的性质:
-
正交向量组线性无关
-
若 n 维向量 y 可以由正交向量组 x1,x2,…,xm 线性表示,则
y=x1Tx1yTx1x1+x2Tx2yTx2x2+⋯+xmTxmyTXmxm
0.8 向量 (四)
向量空间:
对加法和乘法运算均封闭的非空向量集合称为一个向量空间.
向量空间 V 的基:向量空间的任一向量都可以由线性无关的向量组 a1,a2,…,ar 线性表示,则称向量组 a1,a2,…,ar 为 V 的基,dimV=r
向量空间 V 中的任意一个向量 z 可由它的基唯一线性表示,有序组 (x1,x2,…,xr) 称为向量 z 在该基下的坐标.
z=x1a1+x2a2+…+xrar
基变换与坐标变换:
(β1β2…βr)=(α1α2…ar)C
0.9 矩阵的特征值与特征向量
方阵 A 的特征值 λ 与特征向量 α:
Aα=λα
- 设 α 是方阵 A 的属于特征值 λ 的特征向量,则 kα 也是 A 的属于特征值 λ 的特征向量.
- 方阵 A 的两个不同特征值所对应的特征向量是线性无关的
方阵 A 的特征矩阵 A−λE 和特征多项式 ∣A−λE∣ 和特征多项式 ∣A−λE∣.
仿真 A 的特征方程:
∣A−λE∣=0
特征方程 ∣A−λE∣=0 的解 λ 为方阵 A 的特征值,方程 (A−λE)x=0 的非零解向量就是方阵 A 的属于特征值 λ 的特征向量.
0.10 相似矩阵
如果存在可逆方阵 P, 使 P−1AP=B, 则称 A 与 B 相似,记作 A∼B
- 相似关系具有反身,对称,传递性.
- 相似矩阵有相同的行列式,即 ∣A∣=∣B∣
- 相似矩阵有相同的特征多项式及特征值
n 阶方阵 A 与对角矩阵 ∧ 相似的充要条件是 A 有 n 个线性无关的特征向量.
如果 A∼∧, 即有
P−1AP=∧=diag(d1,d2,…,dn)
, 则 d1,d2,…,dn 是 A 的 n 个特征值.
实对称矩阵:(TODO)
如果有 n 阶矩阵 A, 其矩阵的元素都为实数,且矩阵 A 的转置等于其本身 (aij=aji)(i,j 为元素的脚标), 则称 A 为实对称矩阵
- 特征值为实数,特征向量为实向量
- 两个相异的特征值对应的特征向量正交
- n 阶实对称方阵 A 有 n 个线性无关的特征向量
- n 阶实对称方阵 A 与对角矩阵相似,即 n 阶实对称矩阵 A 必可对角化,且相似对角阵上的元素即为矩阵本身特征值
0.11 正交矩阵
正交矩阵 A, 有 AA′=E, 即 A−1=A′
- 正交矩阵 A,B 的乘积 AB 仍为正交矩阵
- 正交矩阵 A 的行列式 ∣A∣=1
正交矩阵 A 的行 (列) 向量组为正交单位向量组,即:
⎝⎜⎜⎜⎛a1a2⋮an⎠⎟⎟⎟⎞(a1′,a2′,⋯,an′)=E
aiajT=δij
若 A 为实对称矩阵,则一定存在 正交矩阵 P, 使得 P−1AP=∧, ∧ 是以 A 的特征值为对角元素的对角矩阵.
0.12 二次型
二次齐次函数:
f(x1,x2,⋯,xn)=i=1∑naijxixj,aij=aji
记 x=(x1,x2,…xn)⊤, A=(aij)n∗n, 则有
f(x1,x2,⋯,xn)=x′Ax
二次型 f 与对称矩阵 A 存在一一对应: A 为二次型 f 的矩阵,f 为矩阵 A 的二次型.
A=∧ 时为标准二次型 (只含平方项)
对于任何二次型,总可以找到正交变换将 f 化为标准型
f(x1,x2,⋯,xn)=x′Ax
x=Cy
∧=C′AC
f=y′∧y=λ1y12+λ2y22+⋯λnyn2
0.13 正定二次型和正定矩阵
二次型 f(x1,x2,…,xn), 如果对于任何 x12+x22+…+xn2=0, 都有 f>0, 则称 f 为正定二次型。其矩阵 A 为正定矩阵 (A>0).
n 阶方阵 A 正定的充要条件是: A 的 n 个特征值全为正数.
n 阶方阵 A, 若存在可逆矩阵 B, 使得 A=B′B, 则 A 为正定矩阵.
意义 (TODO)
0.14 多元随机变量的统计特征
n维随机变量:
x=[x1,x2,…,xn]T
n 维随机变量的 (总体) 均值:
μ=E(x)=∫xxp(x)dx
n 维随机变量的 (样本) 均值:
μ^=N1i=1∑Nxi
n 维随机变量的 (总体) 相关函数矩阵:(TODO)
R(x)=[rij]=[E{xixj}]=E{xxT}
n 维随机变量的 (样本) 相关函数矩阵:
R^(x)=N1i=1∑NxixiT
n 维随机变量的 (总体) 协方差矩阵:
C(x)=[cij]=[E{(xi−μi)(xj−μj)}]=E{(x−μ)(x−μ)T}
n 维随机变量的 (样本) 协方差矩阵:
C^(x)=N1i=1∑N(xi−μi)(xi−μi)T
0.15 n 维随机变量协方差矩阵的性质
n维随机变量的协方差矩阵 C 是实对称矩阵
-
协方差矩阵 C 的特征值为实数
-
C 有 n 个线性无关的特征向量
-
存在正交矩阵 U, 使得 U−1CU=UTCU=∧, ∧ 是以 C 的特征值为对角元素的对角矩阵,$$
\mathrm {U}=\left [\mathbf {u}{1}, \mathbf {u}{2}, \ldots, \mathbf {u}{\mathrm {n}}\right], \quad \mathrm {C} \mathbf {u}{\mathrm {i}}=\lambda_{\mathrm {i}} \mathbf {u}_{\mathrm {i}}
准则函数: J(a)
最优化问题: a∗=aargminJ(a)
求解方法: a∗ 应满足方程:
∇J(a)=[∂a1∂J∂a2∂J⋯∂an∂J]T=0
沿梯度的负方向改变 a, 函数会很快达到极小点,梯度趋于 0. 故迭代算法为:
ak+1=ak−η∇J(a)
流程图:
graph TB;
A ("选择初始点 a_0, 给定容许误差 ε, 设定学习率 η. 设 k=0")-->B ["计算梯度▽J (a_k)"];
B-->C ["修改 a_k: a_k+1 = a_k - η▽J (a_k)"];
C-->D {"计算 J (a_k+1), 并检验 | J (a_k+1)-J (a_k)|<ε"};
D--No-->E>"k=k+1"];
E-->B;
D--Yes-->F ["输出结果"]
F-->G ("结束")
Reference: 西北工业大学自动化学院张绍武教授《模式识别》课程 PPT