核心问题:如何用线性结构来表示、变换与压缩信息?
线性代数并不是关于"算矩阵",而是关于:
- 如何表示世界(Representation)
- 如何改变视角(Transformation)
- 如何在信息不丢失或最优丢失的前提下进行简化(Optimization & Compression)
线性代数的三大核心问题
├── 表示(Representation)
│ ├── 向量
│ ├── 向量空间 / 子空间
│ ├── 基、维度、秩
│
├── 变换(Transformation)
│ ├── 线性映射
│ ├── 矩阵(映射的坐标表示)
│ ├── 核空间 / 像空间
│
└── 优化与压缩(Optimization & Compression)
├── 投影
├── 最小二乘
├── PCA
├── SVD
稳定认知:所有后续方法,都是在这三类问题中反复出现的不同形式。
向量不是“数组”,而是可以进行线性组合的抽象对象。
向量的核心价值在于:
这使得向量成为:
数学上,一个向量是一组有序标量: [ \mathbf{x} = (x_1, x_2, \dots, x_n) ]
向量空间 = 允许线性运算的世界。
设标量域为 (F),若集合 (V\subseteq F^n) 满足:
则称 (V) 是 (F) 上的向量空间。
第一性原理解释:
子空间不是子集,而是保留线性结构的子集。
若 (U \subseteq V),且 (U) 本身仍是向量空间,则 (U) 为 (V) 的子空间。
子空间的意义在于:
向量本身只是代数对象, 一旦引入距离或内积,就获得了几何意义。
距离的选择,本质是对“世界几何形态”的假设。
内积定义了:
[ \cos(\theta) = \frac{\langle x, y \rangle}{|x||y|} ]
这是后续投影、最优化、PCA的基础。
一组向量 ({v_1, \dots, v_n}) 若满足: [ a_1v_1 + \cdots + a_nv_n = 0 \Rightarrow a_1=\cdots=a_n=0 ]
则称其线性无关。
本质:没有向量是“多余的”。
基 = 最小生成集 + 唯一坐标表示。
任意向量空间都存在基,且:
这个数量称为:维度。
矩阵的秩 =
秩衡量的是: 一个线性系统最多能表达多少独立信息。
线性映射描述的是: 结构保持的变化。
映射 (f: V \to W) 若满足:
则称为线性映射。
矩阵不是数表,而是映射在某组基下的表示。
一旦选定基:
它们揭示了:
向量空间关心方向,仿射空间关心位置。
仿射空间 = 向量空间 + 平移
[ L = x_0 + U ]
这是:
的统一抽象。
高斯消元的意义不在“算解”,而在:
最小二乘的本质: 把观测投影到可解释的子空间上。
这引出了:
PCA 的问题不是“怎么降维”,而是: 在哪个坐标系下,信息最集中?
PCA 做的事情:
SVD 揭示了任意矩阵的本质结构。
[ A = U \Sigma V^T ]
它统一了:
| 维度 | PCA | SVD |
|---|---|---|
| 出发点 | 协方差 | 原矩阵 |
| 本质 | 正交投影 | 最优低秩分解 |
| 目标 | 信息集中 | 结构分离 |
二者本质上都是: 在所有子空间中寻找最优表示。
线性代数不是工具箱,而是:
一旦理解其抽象结构, 具体算法只是自然推论。
结束语:
学线性代数,不是为了记住公式, 而是为了获得一种线性看世界的能力。