线性代数笔记 · Aiur · Zellux 的博客

线性代数学习笔记，主要参考了同济大学的《线性代数》和《Deep Learning》的第二章。

行列式

行列式 (determinant) 与它的转置行列式相等。 $D^{T} = D$
余子式 (minor)：在 n 阶行列式中，把 $(i, j)$ 元 $a_{i j}$ 所在的第 $i$ 行和第 $j$ 列划去后留下的 $n - 1$ 阶行列式叫做 $(i, j)$ 元 $a_{i j}$ 的余子式，记作 $M_{i j}$
代数余子式 (cofactor) $A_{i j} = (- 1)^{i + j} M_{i j}$
行列式按行展开： $D = a_{i 1} A_{i 1} + a_{i 2} A_{i 2} + \dots + a_{i n} A_{i n}$
行列式按列展开： $D = a_{1 j} A_{1 j} + a_{2 j} A_{2 j} + \dots + a_{n j} A_{n j}$
克拉默法则 (Cramer’s rule)：如果线性方程组的系数行列式不等于零，那么方程组有唯一解 $x_{1} = \frac{D_{1}}{D}, x_{2} = \frac{D_{2}}{D}, \dots, x_{n} = \frac{D_{n}}{D}$ ，其中 $D_{j}$ 是把系数行列式 D 中第 j 列的元素用方程组右端的常数项代替后得到的 n 阶行列式。

伴随矩阵 (adjugate matrix) $a d j (A) = [\begin{matrix} A_{11} & A_{21} & \dots & A_{n 1} \\ A_{12} & A_{22} & \dots & A_{n 2} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ A_{1 n} & A_{2 n} & \dots & A_{n n} \end{matrix}]$

其中 $A_{i j}$ 为代数余子式

线性组合 (linear combination)：对于一个向量集 $v^{(1)}, v^{(2)}, \dots, v^{(n)}$ ， $\sum_{i} c_{i} v^{(i)}$ 为它的一个线性组合。一组向量的生成子空间 (span) 是指原是向量线性组合后所能抵达的点的集合。
判断 $A x = b$ 是否有解相当于确定向量 b 是否在 A 列向量的生成子空间中。这个特殊的生成子空间被称为 A 的列空间 (column space) 或者 A 的值域 (range)。
线性无关 (linear independene)：如果一组向量中的任意一个向量都不能表示称其他向量的线性组合，那么这组向量被称为线性无关。
奇异矩阵 (singular matrix)：列向量线性相关的方阵。

范数 (norm) 用来衡量向量大小， $L^{p}$ 范数定义为 $‖ x ‖_{p} = (\sum_{i}^{} | x_{i} |^{p})^{\frac{1}{p}}$
欧几里得范数 (Euclidean norm)： $L^{2}$ 范数
最大范数 (max norm)： $L^{\infty}$ 范数
Frobenius 范数可以用来衡量矩阵大小： $‖ A ‖_{F} = \sqrt{\sum_{i, j} A_{i, j}^{2}}$
向量点积也可以用范数表示，即 $x^{T} y = ‖ X ‖_{2} ‖ Y ‖_{2} \cos θ$ ，其中 $θ$ 为 x 和 y 的夹角。

推荐阅读 Eigenvectors and Eigenvalues
特征向量 $v$ (eigenvector) 满足 $A v = λ v$ 。其中标量 $λ$ 为这个特征向量对应的特征值 (eigenvalue)。
如果矩阵 A 有 n 个线性无关的特征向量 ${v^{(1)}, \dots, v^{(n)}}$ ，对应特征值 ${λ_{1}, \dots, λ_{n}}$ 。A 的特征分解为 $A = V diag (λ) V^{- 1}$
每个实对称矩阵可以分解成实特征向量和实特征值： $A = Q Λ Q^{T}$ 。其中 Q 是 A 的特征向量组成的正交矩阵。
正定矩阵 (positive definite)：所有特征值都是正数的矩阵。
半正定矩阵 (positive semidefinite)：所有特征值都是非负数。半正定矩阵 A 满足 $\forall x, x^{T} A x \geq 0$
类似的还有负定 (negative definite) 和半负定 (negative semidefinite)。
奇异值分解 (singular value decomposition) 把矩阵 A 分解成三个矩阵的乘积 $A = U D V^{T}$ 。推荐阅读 Andrew Gibiansky 的博客。
Moore-Penrose 逆伪 (psedoinverse)： $A^{+} = V D^{+} U^{T}$ 。其中 U, D, V 是矩阵 A 在 SVD 后的结果。 $x = A^{+} y$ 是所有可行解中 $‖ x ‖_{2}$ 最小的一个。当没有解存在时，伪逆可以使 $‖ A x - y ‖_{2}$ 最小。

迹 (trace) 定义为矩阵对焦元素之和： $Tr (A) = \sum_{i} A_{i, i}$
迹的一些特性：
- $Tr (A) = Tr (A^{T})$
- $Tr (A B C) = Tr (C A B) = Tr (B C A)$
- $Tr (A B) = Tr (B A)$ （如果乘法可行）