向量空间入门 (三)

向量空间入门 (三)

向量空间入门 (三)

rfsfreffr

·

2024-10-30 22:34:59

·

个人记录

我们将着手引入行列式,以及其他的共轭不变量.

参考书是lww代数学讲义的第五章,本博客只做个人记录只用,而书本身已经写的几乎足够详尽,强推读者前去阅读.

6.10 交错形式

定义 6.10.1: 设 V 为 F 向量空间,则对于所有 m \in \Z_{\ge 1}, 记:

D_{V,m} := \{D : V^m \to F , 满足以下性质 D.1 \ D.2 \}

$$D(...,v_i + v_i' ,...) = D(...,v_i ,...) + D(...,v_i' ,...)$$

$$D(...,tv_i ,...) = tD(...,v_i ,...)$$

省略号表示其余变量均不变动.

$D.2$ : 如果存在 $1 \le i < j \le m$ 使得 $v_i = v_j$. 则 :

$$D(v_1,...,v_m) =0$$

属于 $D_{V,m}$ 的映射也被称为 $V$ 上的 $m$ 元**交错形式**.

特别的,对于有限维向量空间 $V$ , 记 $n : = \dim V$ , 定义 :

$$D_V = \begin{cases} D_{V,n} & n \ge 1 \\ F & n=0\end{cases}$$

注意到 D_{V,m} 也可以成为 F-向量空间,只需逐点的定义运算 .

从广义上来说,交错形式无非是一种满足一些线性关系的映射,至于交错之名来源于性质 D.2 带来的在计算上和交错群的紧密联系.

Remark 6.10.2: m=1 时我们有 D_{V,m} = \text{Hom}(V,F) = V^\vee

我们将一步一步刻画交错形式的性质.

引理 6.10.3: 对于任意 1 \le i < j \le m, D \in D_{V,m}, 对于 (v_1,...,v_m) \in F^m 有 :

D(...,v_i,...,v_j,...) + D(...,v_j ,...,v_i ...) =0

证明 ;

考虑 :

0 = D(...,v_i + v_j ,...,v_j + v_i ,...)

=D(...,v_i,...,v_j,...) + D(...,v_j ,...,v_i, ...) + 0

用到了性质 D.1 和 D.2

推论 6.10.4: 设 m \in \Z_{\ge 1}, D \in D_{V,m}, 对于 \sigma \in \mathfrak S_m , 则 :

\forall (v_1,...,v_m) \in V^m , D(v_{\sigma^{-1}(1)} , ..., v_{\sigma^{-1}(m)}) = \text{sgn}(\sigma) D(v_1, ...,v_m)

这是根据 6.10.3 和交错群性质的直接推论 .

命题 6.10.5: 对于 D \in D_{V,m} 若 (v_1,...,v_m) \in V^m 线性相关,则:

D(v_1,...,v_m) =0

故而只要线性无关集合对应的值才非零,且作为推论,设有限维线性空间 V 的维数为 n . 则对于 m>n 的情形, D_{V,m} 中只有一个零映射.

进一步的,对于 D \in D_V : = D_{V,n}, 只有对于作为基的向量组的取值才不是零.

证明:

只需注意到, 对于任意 c \in F, 1 \le i < j \le m 有 :

D(..,v_i ,..., v_j ,..) = D(... v_i + cv_j ,...,v_j ,...)

采用交错形式的线性性 D.1 , 再配合 D.2 即可证明.

不是一般的,如果 v_1,...,v_m 线性相关,故而存在不全为零的 c_1,...,c_m \in F 使得 \sum_{i=1}^m v_i c_i =0, 故而 :

D(v_1,...,v_m) = D(-\sum_{i=2}^n v_i c_i ,v_2,...,v_m)

= \sum_{i=2}^n c_i (v_i,v_2,...,v_m) =0

我们现在聚焦讨论 D_{V} := D_{V,n} 的结构.

定理 6.10.6: 对于 D \in D_{V} ,我们选定基 \bm e = (e_1,...,e_n) , 对于 (v_1,...,v_n) \in V^n , 对基进行分解有 :

v_i = \sum_{j=1}^n a_{ij}e_j , \ \ i=1,2,...,n

则有 :

D(v_1,...,v_n) = \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma(i)} D (e_1,...,e_n)

证明:

直接采用性质 D.1 进行计算 :

D(v_1,...,v_n)= \sum_{j_1 =1}^n a_{1j_1} D(e_{j_1} ,v_2 ,..., v_n)

= \sum_{j_1=1}^n \sum_{j_2 =1}^n a_{1j_1} a_{2,j_2} D (e_{j_1} , e_{j_2}, v_3,...,v_n)

= \sum_{j_1=1}^n ... \sum_{j_n =1}^n \prod_{i=1}^n a_{i,j_i} D(e_{j_1},e_{j_2},...,e_{j_n})

由性质 D.2 可知,当且仅当 (j_1,...,j_n) 是 (1,2,...,n) 的一个置换时, D(e_{j_1} , ... , e_{j_n}) 非零,故而 :

= \sum_{\sigma \in \mathfrak S_n} \prod_{i=1}^n a_{i,\sigma(i)} D(e_{\sigma (1)}, ..., e_{\sigma (n)})

由推论 6.10.4 以及 \text{sgn}(\sigma) = \text{sgn}(\sigma^{-1}) 可知 :

= \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma(i)} D (e_1,...,e_n)

即证毕.

有以上推理可知,D \in D_{V} 可以被某个基的取值完全确定 (identify),即只要在某个基上的值相同,则整个映射相同。 故而自然的引出一下命题 :

定理 6.10.7 : 设 V 为有限维向量空间,则 \dim D_V = 1. 对于某一组基 \bm e =(e_1,...,e_n), 则存在唯一的 D_{\bm e} \in D_V 满足 D_{\bm e} (e_1,...,e_n) =1.

证明: 由命题 6.10.6 可知,我们选定基 (e_1,...,e_n) ,则映射 :

D_V \to F

D \to D(e_1,...,e_n)

是单射,故而 \dim D_V \le \dim F =1. 只需再构造 D \in D_V \setminus \{ 0 \} 说明其存在性即可.

我们选定基 \bm e = (e_1,...,e_n), 构造 D_{\bm e} : V^n \to F:

D_{\bm e} (v_1,...,v_n) = \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma(i)}

注意,引理 6.10.6 只是说明任何 D_{V} 中的元素具有那种形式,不代表这个很“相似”的一定也是 D_{V} 中的元素(毕竟可能在 D_{V} 中没有元素可以给我们用),故而我们需要做的只是说明 D_{\bm e} \in D_V.

首先验证 D.1, 只需考虑 v_k' = \sum_{j=1}^n a_{kj}'e_j , 则有 :

D_{\bm e}(...,v_i + v_i' ,...) = \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) (a_{k,\sigma(k)} + a_{k,\sigma(k)}') \prod_{i=1, i \neq k}^n a_{i,\sigma(i)}

= \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma(i)} + \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) a_{i,\sigma(i)}' \prod_{i=1, i \neq k}^n a_{i,\sigma(i)}

= D_{\bm e}(...,v_i,...) + D_{\bm e}(...,v_i',...)

而 D.1 的另一条,无非就是考虑 tv_k = t\sum_{j=1}^n a_{kj}e_j,其验证是显然的.

我们再来考虑 D.2, 对于 1 \le k < l \le n , 设 v_k = v_l.

考虑对换 \tau = (kl) \in \mathfrak S_n, 注意到有一一配对:

\mathfrak S_n \to \mathfrak S_n

\sigma \to \sigma \tau

若存在 \sigma_1 \neq \sigma_2 满足 \sigma_1 \tau = \sigma_2 \tau, 再左乘 \tau, 由 \tau^2 =\text{id} 则可推出矛盾 .

由于:

\text{sgn}(\sigma \tau) + \text{sgn}(\sigma) =0, \ \ \ \forall \sigma \in \mathfrak S_n

a_{kr} = a_{lr} , \ \ \ \forall 1 \le r \le n

我们有 :

D_{\bm e} (...,v_i,...,v_j,...)= \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma(i)}

= \frac{1}{2} \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma (i)} + \text{sgn}(\sigma \tau) \prod_{i=1}^n a_{i, \sigma \tau (i)}

=\frac{1}{2} \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma (i)} + \text{sgn}(\sigma \tau)a_{k,\sigma (l)}a_{l, \sigma (k)} \prod_{i=1, i\neq k, i\neq l}^n a_{i, \sigma(i)}

=\frac{1}{2} \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma (i)} + \text{sgn}(\sigma \tau)a_{l,\sigma (l)}a_{k, \sigma (k)} \prod_{i=1, i\neq k, i\neq l}^n a_{i, \sigma(i)}

=0

证毕. 至于唯一性,应该是显然的.

6.11 行列式

对于交错形式,我们亦有诱导映射 :

Denote 6.11.1: 对于线性映射 T: V \to W , 有诱导映射:

T^* : D_{W, m} \to D_{V, m}

D \to [T^* D : (v_1,...,v_m) \to D(Tv_1,...,Tv_m)]

仍然和 T 的方向相反,将交错形式从 W^m 拉回到 V^m.

显然 T^* 也是线性映射. 如果考虑取 V=W, n=m = \dim V, 则 T^* 是一维的线性空间 D_V 到其自身的映射,故而其只可能是伸缩 D \to cD. 我们由此引出行列式的初步概念 .

定义 6.11.2: 设 V 是 n 维向量空间,对于任意 T \in \text{End}(V), 定义 \text{det} (T) \in F 是使得一下等式成立的唯一常数 :

T^* (D) = \text{det} (T) \cdot D , D \in D_V

从局部来看,这等价于,对于每个 D \in D_V, (v_1,...,v_n) \in V^n 使得一下等式成立的为异常数 :

D(Tv_1,...,Tv_m ) = \text{det} T \cdot D(v_1,...,v_m)

对于零空间的情形,我们特别的对 T = \text{id}_V 定义 \det T.

引理 6.11.3: 设 T : V \simeq W 是有限维向量空间的同构,则基被映射为基, 特别的,基与基之间的映射是一一对应的.

证明: 设 \bm e = (e_1,...,e_m), 对于任意 v \in V 有分解 v= \sum_{i=1}^n a_i e_i.

则有 :

T v = \sum_{i=1}^n a_iT(e_i)

故而 T \bm e = (T(e_1),T(e_2),...,T(e_n)) 是 \text{im}(T) 的生成系,由 T 是同构,则有 \text{im}(T)=W.

再说明其线性无关 : 若存在非全为零的解 (c_1,...,c_n)

\sum_{i=1}^n c_i T(e_i) =0

则在 T^{-1} : W \simeq V 下有 :

\sum_{i=1}^n c_i e_i =0

这与 \bm e 是基矛盾,故而其线性无关,故而其是基.

至于最后一个断言,若两个基在同构下被打到同一组基,则可以由同构是单说明两个基实则相等,反过来也是易于说明的.

定理 6.11.4: \det T \neq 0, 当且仅当 T \in \text{Aut}(V) ,即其是 V 的自同构.

证明:若 T \in \text{Aut}(V) , 由于 \det T 的唯一性已经在 6.11.1 中说明,只需说明存在 \dfrac{D(Tv_1,...,Tv_m )}{D(v_1,...,v_m)} 有定义且不为零,这由引理 6.11.3 可得.

反过来,如果 \det T \neq 0, 我们选定一组基 e_1,...,e_n, D \in D_V \setminus \{ 0 \}

则 D(e_1,...,e_m) \neq 0 时有 D(Te_1,...,Te_m) \neq 0,故而俩者都是基.

则对于任意 v,w \in V, 取分解 v= \sum_{i=1}^n a_i e_i,w = \sum_{i=1}^n b_ie_i,我们有 :

Tv = \sum_{i=1}^n a_i T(e_i)

Tw = \sum_{i=1}^n b_i T(e_i)

显然, Tv=Tw 当且仅当 \forall 1 \le i \le n 有 a_i =b_i, 即 v = w, 故而可知 T 是单射,再由推论 6.6.5 可知 T 是同构 .

定理 6.11.5(行列式的乘性): 行列式具有以下基本性质 :

(1).$ $\det(\text{id}_V)=1

(2).$ 设 $S,T \in \text{End}(V)$ , $\det(ST) = \det (S) \det (T)

(3).$ 当 $T$ 可逆时,有 $\det (T^{-1}) = \det (T)^{-1}

证明:对于 (1). 由定义直接可得 . 对于 (2), 按定义即有 :

\det (ST) D(v_1,...,v_n) = D(STv_1,...,STv_n) = \det (S) D(Tv_1,...,Tv_n)

= \det (S) \det (T) D(v_1,...,v_n)

故而可得 \det(ST) = \det (S) \det (T)

对于 (3) , 取 S = T^{-1} 即可得 :

\det (T) \det (T^{-1}) = \det (\text{id})= 1

命题 6.11.6(行列式的共轭不变) : 设 T \in \text{End}(V), 而 S : V \simeq W 是有限维向量空间之间的同构,则 \det(T) = \det (STS^{-1}) .

证明 :首先易见 STS^{-1} \in \text{End}(W).

若 \det (T) =0 , 即其不是自同构,则 \text{Im} (STS^{-1}) \neq W, 即也不是自同构,故有 \det (STS^{-1})=0

现在假设 \det (T) \neq 0 则不难论证 \det (STS^{-1} ) \neq 0.

设 n : = \dim V = \dim W , 我们设 \bm v = (v_1,...,v_n) 和 \bm w = (w_1,...,w_n) .

由 S 可得一个线性映射 :

D_W \to D_V

D' \to [D : (v_1,...,v_n) \to D'(Sv_1,...,Sv_n)]

即考察 :

\det (STS^{-1}) D'(w_1,...,w_n)= D'(STS^{-1}w_1,...,STS^{-1}w_n)

可以简化为 :

\det (STS^{-1}) D(v_1,...,v_n) = D(Tv_1,...,Tv_n)

由于 S 是同构,故而实则可以取遍所有的 D \in D_V. 由定义可知 :

\det (STS^{-1}) = \det (T)

证毕

由于 \det T 在定义中的唯一性,在实际计算中,我们可以选取一个特殊的 D \in D_V 与一组 (v_1,...,v_n) 来方便我们的计算。

命题 6.11.7: 取定 n 维的有限维向量空间 V ,选取有序基 \bm e = (e_1,...,e_n), 取定理 6.10.7 给出的 D_{\bm e} , 则对于 T \in \text{End}(V) 我们有 :

\det T = D_{\bm e} (Te_1,...,Te_m)

证明:按定义有 \det T = \dfrac{D_{\bm e}(Te_1,...,Te_n)}{D_{\bm e} (e_1,...,e_n)},再由 D_{\bm e}(e_1,...,e_n) =1 可得.

而一旦取定基,线性变换的行列式便可化为具体的矩阵情形

定义-命题 6.11.8: 选定向量空间 F^n 的标准有序基 \bm e (最标准的哪个,意会一下!) , 则 \bm A \in M_{n \times n}(F) 可以视为 \text{End}(F^n) 的元素 .我们定义矩阵 \bm A 的行列式为:

\begin{vmatrix}

a_{11} & \cdots & a_{1n} \\

\vdots & \ddots & \vdots \\

a_{n1} & \cdots & a_{nn}

\end{vmatrix}

:= \det \bm A = D_{\bm e}(\bm Ae_1,...,\bm Ae_n)

= \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{\sigma (i),i}

= \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^m a_{i,\sigma(i)}

证明: 第一个等号是对定理 6.10.6 的应用,只不过这里有 \bm Ae_j = \sum_{i=1}^n a_{ij}e_i ,在形式上略有不同 .

至于第二个等式,需要注意到 :

\prod_{i=1}^n a_{\sigma(i),i} = \prod_{i=1}^n a_{i,\sigma^{-1}(i)}

而 \sigma \to \sigma^{-1} 是 \mathfrak S_n 到自身的双射,而且有 \text{sgn}(\sigma^{-1}) = \text{sgn}(\sigma) 故而有 :

\sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{\sigma (i),i}

=\sum_{\sigma^{-1} \in \mathfrak S_n} \text{sgn}(\sigma^{-1}) \prod_{i=1}^n a_{i,(\sigma^{-1})^{-1}(i)}

=\sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma(i)}

定义 6.11.9: 对于矩阵 \bm A \in M_{n \times n}(F),定义第 (i,j) 的余子式为将 \bm A 的第 i 行第 j 列去掉剩下的矩阵(记为 \mathcal M_{ij})的行列式,记为 M_{ij} : = \det \mathcal M_{ij}.

由于行列式本身有交错形式引入,其亦有很多值得称道的线性性质 .

定理 6.11.10: 行列式具有以下性质 :

(1).$ $\det(\bm 1_{n \times n}) =1

(2).$ 转置不变性: $\det (\bm A) = \det(\bm A^t)

$(4).$ 对每一行和每一列都有线性(对应 $D.1$)

$(5).$ 只有可逆矩阵的行列式非零(来源于定理 $6.11.4$).

$(6).$ 余子式展开: 对于任意 $1 \le i ,j \le n$, 任意 $\bm A \in M_{n \times n}(F)$ 的行列式可以按列展开:

按第 $i$ 行展开 :

$$\det A = \sum_{k=1}^n (-1)^{i+k} a_{ik} M_{ik}$$

或者按第 $j$ 列展开 :

$$\det A = \sum_{k=1}^n (-1)^{k+j} a_{kj} M_{kj}$$

证明:我们只对不是很平凡的 (6) 做证明 .

我们先证明对第 1 行展开的情形,由 6.11.8,有:

\det \bm A = D_{\bm e} (\bm A e_1,...,\bm A e_n)

=\sum_{i=1}^n a_{i1} D_{\bm e}(e_i,\bm A e_2,...,\bm A e_n)

由于 e_i 的存在,后面的展开中含有 e_i 的项会变成 0. 故而:

= \sum_{i=1}^n a_{i1} D_{\bm e}(e_i, \bm Ae_2 -a_{i2} e_i ,...,\bm A e_n -a_{in} e_i)

注意到后面的项所在的子空间实则由 (e_1,...,e_{i-1},e_{i+1},...,e_n) 为基生成, 记这个空间为 V_i. 我们考虑 D_{\bm e} 限制在 V_i 上的交错形式 :

D_i : V_i ^{n-1} \to F

(v_1,...,v_{n-1}) \to D_{\bm e}(e_i,v_1,...,v_{n-1})

可以验证其满足 D.1, D.2 , 故而 D_i \in D_{V_i}, 我们选定基 \bm e_i = (e_1,...,e_{i-1},e_{i+1}, ...,e_n). 则:

D_i (\bm e_i) = D_{\bm e} (e_i,e_1,...,e_{i-1},e_{i+1},...,e_n) = (-1)^{i+1}D_{\bm e}(e_1,..,e_n) = (-1)^{i+1}

故而 :

= \sum_{i=1}^n a_{i1} D_i (\bm Ae_2 -a_{i2},...,\bm A e_n - a_{in} e_i)

= \sum_{i=1}^n a_{i1} (-1)^{i+1} \det M_{i1}

对第 k 行的处理是类似的,之所以是 i+1 是因为防止出现负次幂,方便处理.

再来证明对第 j 列展开的情形.

推论 6.11.11: 对于任意 1 \le i \neq j \le n 和 \bm A = (a_{ij})_{i,j}\in M_{n \times n}(F) 皆有 :

\sum_{k=1}^n (-1)^{k+j} a_{ik} M_{jk} =0

\sum_{k=1}^n (-1)^{k+j} a_{ki} M_{kj} =0

6.12 Cramer 法则

本节讨论线性方程组的解的判定以及矩阵求逆的具体公式.

定义 6.12.1: 设 n \in \Z_{\ge 1}, 对于 \bm A=(a_{ij})_{i,j} \in M_{n \times n}(F), 定义其经典伴随矩阵为 .

A^\vee = (A_{ji})_{j,i} \in M_{n \times n}(F)

其中

A_{ij} := (-1)^{i+j} M_{ij}

其中 M_{ij} 是余子式.

$$\begin{pmatrix}

a & b \\ c & d

\end{pmatrix}^\vee = \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}$$

我们实际上有一下断言:伴随矩阵和逆矩阵只差一个常数 .

> **定理 6.12.2:** 对于任意 $\bm A \in M_{n \times n}(F)$, 有 :

>

> $$\bm A \bm A^\vee = \det \bm A \cdot \bm 1_{n \times n} = \bm A^\vee \bm A$$

>

> 特别的,在 $\bm A$ 可逆时,我们有 $\det \bm A \neq 0$, 即有 $\bm A^{-1} = \det A^{-1} \bm A^{\vee}$ .

故而除了从余子式来看伴随矩阵,也可以从其和逆矩阵只差一个倍数来看.

证明:实际上,可以视为这一构造的来源于定理 $6.11.10$ 和推论 $6.11.11$.

根据矩阵乘法定义展开即可:

> **推论 6.12.3(Cramer 法则):** 考虑域 $F$ 上的 $n$ 元线性方程组 :

>

> $$\begin{cases}a_{11}X_1 + a_{12}X_2 +...+ a_{1n} X_n =b_1 \\ ... \\ a_{n1}X_1 + a_{n2}X_2 + ... + a_{nn}X_n = b_n \end{cases} $$

>

> 将系数矩阵 $\bm A = (a_{ij})_{i,j} \in M_{n \times n}(F)$ 视为 $F^n$ 到自身的同态映射.

>

> $(1).$ 如果 $b_1=b_2=...=b_n =0 $, 则其解集为 $\ker \bm A$ . 特别的,此时方程组有不全为零的解当且仅当 $\det \bm A = 0$ ($\det \bm A \neq 0$ 时 $\bm A$ 为同构,则 $\ker \bm A =0$).

>

> $(2).$ 若 $\det A \neq 0$, 则对于任意 $(b_1,...,b_n) \in F^n$, 方程组都有唯一解 $(x_1,...,x_n)$, 其中 :

>

>$$x_j = \frac{\begin{vmatrix}

>a_{11} & \cdots & b_1 & \cdots & a_{1n}\\

>\vdots & & \vdots & & \vdots\\

>a_{n1} & \cdots & b_n & \cdots & a_{nn}

>\end{vmatrix}}{\begin{vmatrix}

>a_{11} & \cdots& a_{1n}\\

>\vdots & & \vdots\\

>a_{n1} & \cdots & a_{nn}

>\end{vmatrix}} , \quad j =1,2,...,n$$

>

>其中 $b_1,...,b_n$ 在第 $j$ 列.

>

> $(3).$ 若 $\det A =0$, 对于 $(b_1,...,b_n) \in F^n$, 方程组或无解,或解集为:

>

> $$\ker \bm A + (x_1,...,x_n)$$

>

> 其中 $(x_1,...,x_n)$ 是任一一组解.

## 6.13 特征多项式的初步引入

> **Remark 6.13.1:** 设 $V$ 是 $n$ 维有限维向量空间,对于 $T \in \text{End}(V)$, 可以唯一的定义 $T^2,T^3,...,T^k$, 由于 $\text{End}(V)$ 是 $n^2$ 维向量空间,故而 $(T^0:=\text{id} , T,T^2,...,T^{n^2})$ 一定线性相关,故而存在一组非全为零的系数 $(c_0,...,c_{n^2}) \in F^{n^2+1}$ 使得 :

>

> $$\sum_{k=0}^{n^2} c_{k} T^k =0$$

>

>可以简单视为,存在次数小于等于 $n^2$ 的多项式 $f \in F[X]$ 使得 $f (T) =0$.

>

> 进一步的,若 $T$ 可逆,即是自同构,则存在多项式 $g \in F[X]$ 满足 $c_0 \neq 0$, 具体构造方式为:按上面的讨论得到 $c_0$ 可能等于 $0$ 的多项式 $f$.

>

> 若 $c_0 \neq 0$ 则取 $g =f$, 否则有 $T(\sum_{k=1}^{n^2} c_k T^k) =0$, 两边同时成 $T^{-1}$ 即可降次,直到取到 $c_0 \neq 0$ 时停止 .

> **命题 6.13.2:** 如果 $T$ 可逆,则存在多项式 $g \in F[X]$, 使得 $g(T) T =\text{id}$, 或者说 $g(T) = T^{-1}$.

证明:按 $6.13.1$ 中构造的满足 $c_0 \neq 0$ 的多项式 $g_0 \in F[X]$, 选取;

$$g = (-c_0^{-1})(\sum_{k=1}^{n^2}) c_kX^{k-1} \in F[X]$$

即可.

值得注意的是 $6.13.1$ 只是断言了多项式的存在性,而如何给出一个使得我们选定的矩阵是根的多项式是另一个问题,我们需要引入特征多项式的概念,并说明其的“特征”性.

> **定义 6.13.3:** 设 $\bm A \in M_{n \times n} (F)$, 将 $F$ 嵌入有理函数域 $F(X)$, 构造矩阵 $X \cdot 1_{n \times n} - \bm A \in M_{n \times n} (F(X))$定义特征多项式为 :

>

> $$\text{Char}_{\bm A} := \det (X \cdot 1_{n \times n} -\bm A) \in F(X)$$

> **Denote 6.13.4:** 引入 $\text{Kronecker}$ 记号 :

>

> $$\delta_{ij} = \begin{cases} 1 , & i=j \\ 0 , & i \neq j\end{cases}$$

>

故而根据行列式的计算公式可得 :

$$\text{Char}_{\bm A} = \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n (\delta_{i,\sigma(i)} \cdot X - a_{i,\sigma(i)})$$

可以观察到,最高次得贡献来自于 $\sigma = \text{id}$, 可知 $\deg \text{Char}_{\bm A} = n$.

易得 :

$$\text{Char}_{\bm A} (0) = \det(-\bm A) = (-1)^n \det (\bm A) =c_0$$

其中 $c_0$ 代指多项式 $\text{Char}_{\bm A}$ 的常数项. 我们之后将其表示为 :

$$\text{Char}_{\bm A} = X^n + c_{n-1} X^{n-1} +... + c_1 X + c_0$$

故而,之所以选取的是有理函数域,是因为一般多项式环(不取模)不是域.

实际上,$\text{Char}_{\bm A}$ 也是共轭不变量,进而其的每一项系数其实都是共轭不变量。

> **命题 6.13.5:** 设 $\bm A \in M_{n \times n}(F)$, 则对于可逆矩阵 $\bm P \in M_{n \times n}(F)$, 有 :

>

> $$\text{Char}_{\bm A} = \text{Char}_{\bm P \bm A \bm P^{-1}}$$

证明:

由 :

$$\bm X \cdot \bm 1_{n \times n} - \bm P \bm A \bm P^{-1} =\bm P^{-1} (\bm X \cdot \bm 1_{n \times n} - \bm A) \bm P $$

再由行列式的乘性即可证明.

故而,我们对于线性映射 $T$ 也可以定义不依赖于基选取的特征多项式.

> **命题 6.13.6:** 对任意 $\bm A \in M_{m \times n}(F) , \bm B \in M_{n \times m} (F)$, 都有 $F[X]$ 中的等式 :

>

> $$X^n\text{Char}_{\bm A \bm B} = X^m \text{Char}_{\bm B \bm A}$$

>

> 特别的,在 $m=n$ 时,我们有 $\text{Char}_{\bm A \bm B} = \text{Char}_{\bm B \bm A}

证明:

以下定理将揭示伴随矩阵和特征多项式的联系.

定理 6.13.7: 设 \bm A \in M_{n \times n}(F), 设其特征多项式为 :

\text{Char}_{\bm A} = \det (X \cdot \bm 1_{n \times n}- \bm A) = X^n +c_{n-1} X^{n-1}+...+c_0

则 :

(-1)^{n-1} \bm A^\vee = \bm A^{n-1} + c_{n-1} \bm A^{n-2} + ... +c_1 \cdot \bm 1_{n \times n}

证明: 很神奇的证明, motivate 不明.

我们考虑伴随矩阵 (X \cdot \bm 1_{n \times n} -A)^\vee \in M_{n \times n}(F(X)), 根据定义可知其每一个位置上最高为 n-1 次,我们可以考虑分到每个次数上进行考虑 :

(X \cdot \bm 1_{n \times n} - \bm A)^\vee = \sum_{k=0}^{n-1} X^k \bm D_k , \ \ \bm D_k \in M_{n \times n}(F)

注意到 \text{Char}_{\bm A} = \det (X \cdot \bm 1_{n \times n} - \bm A), 根据定理 6.12.2 :

(X \cdot \bm 1_{n \times n} - \bm A)^\vee (X \cdot \bm 1_{n \times n} - \bm A) = \text{Char}_A \cdot \bm 1_{n \times n}

我们对右边同样考虑分次数考虑,和右边进行对应有 :

\bm D_{n-1} = \bm 1_{n \times n}

-\bm A \bm D_{n-1}+ \bm D_{n-2} = c_{n-1} \cdot \bm 1_{n \times n}

-\bm A \bm D_{n-2} + \bm D_{n-3} = c_{n-2} \cdot \bm 1_{n \times n}

\cdots

-\bm A \bm D_1 + \bm D_0 = c_1 \cdot \bm 1_{n \times n}

-\bm A \bm D_{0} = c_0 \cdot \bm 1_{n \times n}

而比较有意思的是,对于零次项考虑我们有 :

\bm D_0 = (-\bm A)^\vee = (-1)^{n-1}\bm A^\vee

故而我们考虑对左边进行一些变换消项:

\bm A^{n-1} \bm D_{n-1} + (- \bm A^{n-1} \bm D_{n-1} + \bm A^{n-2} \bm D_{n-2} )

+(-\bm A^{n-1} \bm D_{n-2} +\bm A^{n-3} \bm D_{n-3})

\cdots

+(-\bm A \bm D_1 +\bm D_0 )

=\bm D_0 = c_0 \cdot \bm 1_{n \times n} + \cdots +c_{n-1} \cdot \bm A^{n-2} + c_n \cdot \bm A^{n-1}

故而我们就得到 :

(-1)^{n-1} \bm A^\vee = \bm A^{n-1} + c_{n-1} \bm A^{n-2} + ... +c_1 \cdot \bm 1_{n \times n}

根据以上定理,最直接的应用是得出特征多项式的一个重要的性质 :

定理 6.13.8(Cayley–Hamilton 定理): 对于任意矩阵 \bm A \in M_{n \times n}(F) 皆有 \text{Char}_{\bm A}(\bm A) =\bm 0_{n \times n}. 类似的,对于任意向量空间 V, 其自同态 T \in \text{End}(T), 皆有 \text{Char}_T (T) =0_V.

证明:在这里我们只处理矩阵的情形.

在先前的观察中我们有 :

\text{Char}_{\bm A} (0) = c_0 = (-1)^n \det (\bm A)

证明是惊人的,只需应用定理 6.13.7:

\bm A^n + c_{n-1}\bm A^{n-1} + c_{n-2} \bm A^{n-2} + ... + c_1 \bm A + c_0 \cdot \bm 1_{n \times n}

=(-1)^{n-1}\bm A \bm A^\vee + (-1)^n \det \bm A \cdot \bm 1_{n \times n}

=(-1)^{n-1} (\bm A \bm A^\vee - \det \bm A \cdot \bm 1_{n \times n})=0

最后一个等号用到的是伴随矩阵的性质.

推论 6.13.9: 设矩阵 \bm A \in M_{n \times n}(F) ,则对于任意可逆矩阵 \bm P \in M_{n \times n}(F), 有 : \bm P^{-1} \bm A^\vee \bm P = ( \bm P^{-1} \bm A \bm P)^\vee

证明 : 关键在于特征多项式的共轭不变性 :

推论 6.13.10: 设 \bm A 是可逆矩阵 , \text{Char}_{\bm A} = x^n + c_{n-1} X^{n-1} +... + c_1 X + c_0. 则 :

\text{Char}_{\bm A^{-1}}= X^n + \frac{c_1}{c_0} X^{n-1} +...+\frac{c_{n-1}}{c_0} X + \frac{1}{c_0}

证明:

我们顺便先介绍线性映射的迹.

引理 6.13.11: 设矩阵 \bm A \in M_{n \times n}(F), 设其特征多项式为 \text{Char}_{\bm A} = X^n + c_{n-1} X^{n-1} + ... + c_1 X + c_0, 则 :

-c_{n-1} = \sum_{i=1}^n a_{ii}

证明:只需考虑对 X^{n-1} 的贡献 .

观察特征多项式的公式 :

\text{Char}_{\bm A} = \sum_{\sigma \in \mathfrak S_n} \text{sgn}(\sigma) \prod_{i=1}^n (\delta_{i,\sigma(i)} \cdot X - a_{i,\sigma(i)})

由于 \sigma \in \mathfrak S_n 至少有 n-1 个不动点,才可逆贡献出 X^{n-1}, 符合这一条件的 \sigma 只有 \sigma =\text{id}, 故而此引理容证.

定义 6.13.12: 对于矩阵 \bm A \in M_{n \times n}(F), 定义其迹为 :

\text{Tr} : M_{n \times n}(F) \to F

\text{Tr}(\bm A) = \sum_{i=1}^n a_{ii } = -c_{n-1}

容易验证其有以下一些性质 :

线性 :

\text{Tr}(\bm A + \bm B) = \text{Tr} (\bm A) + \text{Tr}(\bm B), t \text{Tr}(\bm A) = \text{Tr}(t\bm A) , t\in F

对称性(可以推至轮换不变)

\text{Tr}(\bm A \bm B) = \text{Tr} (\bm B \bm A)

共轭不变性(来源自特征多项式的共轭不变)

\text{Tr}(\bm P^{-1} \bm A \bm P) = \text{Tr} (\bm A)

对于任意线性映射 T, 只需考取特征多项式的系数即可. (或者取基也行,反正共轭不变).

接下来,我们将进一步的刻画特征多项式的系数.

定义 6.13.13(子式): 考虑非空子集 I \subseteq \{1,2,...,m \} 和 J \subseteq \{ 1,2,...,n \}, 具体写成 I = \{ i_1,...,i_r \}, J = \{ j_1 ,..., j_s \}, 其中 1 \le i_1 < i_2 < ... < i_r \le m , 1 \le j_1 < j_2 < ... < j_s \le n, 对于矩阵 \bm A \in M_{m \times n}(F) , 定义其子矩阵为 :

\bm A \begin{pmatrix} I \\ J \end{pmatrix} = (a_{i_p,j_q})_{1 \le p \le r , 1 \le q \le s} \in M_{r \times s}(F)

即取出一些列,一些行的子矩阵 .

对于 |I| = |J|, 定义子式为 \det \bm A\begin{pmatrix} I \\ J \end{pmatrix} , 定义主子式为 \det \bm A \begin{pmatrix} I \\ I \end{pmatrix}, 也称为由 I 决定的子式.

引理 6.13.14: 设 \bm C \in M_{n \times n}(F) , 则 \det (X \cdot \bm 1_{n \times n} + \bm C) \in F[X] 中的 X^{n-k} 的系数为 \sum_{I \subseteq \{1,...,n\}, |I| =k} \det \bm C \begin{pmatrix} I \\ I \end{pmatrix}.

只需将 \bm C 换成 -\bm A 我们实际上就得到了对特征多项式系数的刻画.

证明:设 X^{n-k} 系数为 c_{n-k}, 记 \mathfrak S_{n,I} 是使得某个子集不动的置换集合,简单推导:

c_{n-k} = \sum_{ \sigma \in \mathfrak S_n} \text{sgn}(\sigma)\sum_{|I'|= k , I' \subseteq \{1,...,n\}, \forall i\in I', \sigma(i)=i} \prod_{i \notin I'} c_{i,\sigma(i)}

=\sum_{|I|=k ,I \subseteq \{ 1,...,n \}} \sum_{\sigma \in \mathfrak S_{n,I}} \text{sgn}(\sigma) \prod_{i \in I} c_{i,\sigma(i)}

=\sum_{I \subseteq \{1,...,n\} ,|I|=k} \det \bm C \begin{pmatrix} I \\ I \end{pmatrix}

定理 6.13.15(Cauchy–Binet 公式):

应用 6.13.16(矩阵-树定理):

相关推荐

皮肤的附属器官有哪些
365bet国内

皮肤的附属器官有哪些

⌛ 09-04 👁️ 7559
什么是标识符、关键字和预定义标识符?三者有何区别?
365体育投注一直进不去

什么是标识符、关键字和预定义标识符?三者有何区别?

⌛ 09-20 👁️ 4550
欧那教育西班牙语培训学校怎么样
365体育投注一直进不去

欧那教育西班牙语培训学校怎么样

⌛ 10-23 👁️ 6968