Định lý về hạng

Mô tả liên hệ giữa hạng và số chiều của hạt nhân

Định lý về hạng (còn gọi là định lý về hạng và số vô hiệu, định lý về số chiều) là một trong những định lý cơ bản của đại số tuyến tính. Định lý phát biểu rằng, đối với một ánh xạ tuyến tính thì tổng của hạng (số chiều của ảnh) và số vô hiệu (số chiều của hạt nhân) bằng số chiều của miền xác định của nó.[1][2][3][4]

Phát biểu định lý

Cho V {\displaystyle V} , W {\displaystyle W} là các không gian vectơ, trong đó V {\displaystyle V} hữu hạn chiều. Cho T : V W {\displaystyle T\colon V\to W} là một biến đổi tuyến tính. Ta có

Rank ( T ) + Nullity ( T ) = dim V {\displaystyle \operatorname {Rank} (T)+\operatorname {Nullity} (T)=\dim V} ,

trong đó Rank là hạng của phép biến đổi, còn Nullity là số vô hiệu tức là số chiều của hạt nhân của phép biến đổi.

Rank ( T ) := dim ( Im ( T ) ) {\displaystyle \operatorname {Rank} (T):=\dim(\operatorname {Im} (T))} Nullity ( T ) := dim ( Ker ( T ) ) . {\displaystyle \operatorname {Nullity} (T):=\dim(\operatorname {Ker} (T)).}

Dựa vào bổ đề tách, ta có thể phát biểu định lý này dưới dạng một mệnh đề về sự đẳng cấu giữa các không gian, chứ không chỉ riêng về số chiều của chúng. Một cách rõ ràng, vì ánh xạ T tạo ra một đẳng cấu từ không gian thương V / Ker ( T ) {\displaystyle V/\operatorname {Ker} (T)} vào không gian Im ( T ) {\displaystyle \operatorname {Im} (T)} nên từ sự tồn tại một cơ sở của V có thể suy ra từ bổ đề tách rằng Image ( T ) Ker ( T ) V {\displaystyle \operatorname {Image} (T)\oplus \operatorname {Ker} (T)\cong V} . Chuyển sang số chiều, ta có định lý về hạng.

Ma trận

Mat m × n ( F ) Hom ( F n , F m ) {\displaystyle \operatorname {Mat} _{m\times n}(\mathbb {F} )\cong \operatorname {Hom} (\mathbb {F} ^{n},\mathbb {F} ^{m})} [5] nên ta nghĩ ngay đến ma trận khi nói về ánh xạ tuyến tính. Với trường hợp một ma trận m × n {\displaystyle m\times n} , số chiều của miền xác định là n {\displaystyle n} , cũng là số cột của ma trận. Vì thế đẳng thức của định lý về hạng đối với một ma trận M Mat m × n ( F ) {\displaystyle M\in \operatorname {Mat} _{m\times n}(\mathbb {F} )} cho trước trở thành

Rank ( M ) + Nullity ( M ) = n {\displaystyle \operatorname {Rank} (M)+\operatorname {Nullity} (M)=n} .

Chứng minh

Ở đây trình bày hai chứng minh. Chứng minh đầu tiên[2] là đối với trường hợp tổng quát, sử dụng ánh xạ tuyến tính. Chứng minh thứ hai[6] xét hệ tuyến tính đồng nhất A x = 0 {\displaystyle \mathbf {Ax} =\mathbf {0} } trong đó ma trận A Mat m × n ( F ) {\displaystyle \mathbf {A} \in \operatorname {Mat} _{m\times n}(\mathbb {F} )} có hạng r {\displaystyle r} và chứng tỏ tồn tại một tập hợp gồm đúng n r {\displaystyle n-r} các nghiệm độc lập tuyến tính và span hạt nhân của A {\displaystyle \mathbf {A} } .

Trong khi định lý yêu cầu miền xác định của ánh xạ tuyến tính phải là hữu hạn chiều, đối với miền giá trị lại không có yêu cầu như vậy. Điều này có nghĩa là có những ánh xạ tuyến tính thỏa mãn định lý nhưng không được cho bởi các ma trận. Tuy nhiên, chứng minh thứ nhất thực ra không tổng quát hơn chứng minh thứ hai: bởi vì ảnh của ánh xạ tuyến tính là hữu hạn chiều, chúng ta có thể biểu diễn được ánh xạ đó từ miền xác định vào ảnh bằng một ma trận, sau đó chứng minh định lý đối với ma trận đó, cuối cùng đưa ảnh vào tập đích đầy đủ.

Chứng minh thứ nhất

Cho V , W {\displaystyle V,W} là các không gian vectơ trên một trường F {\displaystyle \mathbb {F} } và biến đổi T {\displaystyle T} được định nghĩa như phát biểu của định lý với dim V = n {\displaystyle \dim V=n} .

Ker T V {\displaystyle \operatorname {Ker} T\subset V} là một không gian con của V {\displaystyle V} nên tồn tại một cơ sở. Giả sử dim Ker T = k {\displaystyle \dim \operatorname {Ker} T=k} và gọi

K := { v 1 , , v k } Ker ( T ) {\displaystyle {\mathcal {K}}:=\{v_{1},\ldots ,v_{k}\}\subset \operatorname {Ker} (T)}

là cơ sở của nó. Bây giờ theo bổ đề trao đổi Steinitz ta có thể mở rộng cơ sở K {\displaystyle {\mathcal {K}}} bằng cách bổ sung thêm vào n k {\displaystyle n-k} vectơ độc lập tuyến tính w 1 , , w n k {\displaystyle w_{1},\ldots ,w_{n-k}} để có một cơ sở đầy đủ của V {\displaystyle V} . Đặt

S := { w 1 , , w n k } V Ker ( T ) {\displaystyle {\mathcal {S}}:=\{w_{1},\ldots ,w_{n-k}\}\subset V\setminus \operatorname {Ker} (T)}

sao cho

B := K S = { v 1 , , v k , w 1 , , w n k } V {\displaystyle {\mathcal {B}}:={\mathcal {K}}\cup {\mathcal {S}}=\{v_{1},\ldots ,v_{k},w_{1},\ldots ,w_{n-k}\}\subset V}

là một cơ sở của V {\displaystyle V} . Từ đây, ta có

Im T = Span T ( B ) = Span { T ( v 1 ) , , T ( v k ) , T ( w 1 ) , , T ( w n k ) } = Span { T ( w 1 ) , , T ( w n k ) } = Span T ( S ) {\displaystyle \operatorname {Im} T=\operatorname {Span} T({\mathcal {B}})=\operatorname {Span} \{T(v_{1}),\ldots ,T(v_{k}),T(w_{1}),\ldots ,T(w_{n-k})\}=\operatorname {Span} \{T(w_{1}),\ldots ,T(w_{n-k})\}=\operatorname {Span} T({\mathcal {S}})} .

Ta chứng minh rằng hệ T ( S ) {\displaystyle T({\mathcal {S}})} là một cơ sở của Im T {\displaystyle \operatorname {Im} T} . Từ đẳng thức trên ta có T ( S ) {\displaystyle T({\mathcal {S}})} là hệ sinh của Im T {\displaystyle \operatorname {Im} T} ; việc còn lại là chứng tỏ hệ vectơ trên là độc lập tuyến tính để kết luận rằng nó là cơ sở.

Giả sử hệ T ( S ) {\displaystyle T({\mathcal {S}})} không độc lập tuyến tính, và cho rằng

j = 1 n k α j T ( w j ) = 0 W {\displaystyle \sum _{j=1}^{n-k}\alpha _{j}T(w_{j})=0_{W}}
với các α j F {\displaystyle \alpha _{j}\in \mathbb {F} } nào đó.

Do đó, nhờ tính tuyến tính của T {\displaystyle T} , từ đây suy ra rằng

T ( j = 1 n k α j w j ) = 0 W ( j = 1 n k α j w j ) Ker T = Span K V {\displaystyle T\left(\sum _{j=1}^{n-k}\alpha _{j}w_{j}\right)=0_{W}\implies \left(\sum _{j=1}^{n-k}\alpha _{j}w_{j}\right)\in \operatorname {Ker} T=\operatorname {Span} {\mathcal {K}}\subset V} .

Điều này mâu thuẫn với B {\displaystyle {\mathcal {B}}} là một cơ sở, trừ khi tất cả các hệ số α j {\displaystyle \alpha _{j}} đều bằng 0. Ta suy ra hệ T ( S ) {\displaystyle T({\mathcal {S}})} phải là độc lập tuyến tính, và hơn nữa hệ này là cơ sở của Im T {\displaystyle \operatorname {Im} T} .

Nói tóm lại, ta có hệ K {\displaystyle {\mathcal {K}}} là cơ sở của Ker T {\displaystyle \operatorname {Ker} T} , và hệ T ( S ) {\displaystyle T({\mathcal {S}})} là cơ sở của Im T {\displaystyle \operatorname {Im} T} .

Cuối cùng ta có thể khẳng định rằng

Rank ( T ) + Nullity ( T ) = dim Im T + dim Ker T = | T ( S ) | + | K | = ( n k ) + k = n = dim V {\displaystyle \operatorname {Rank} (T)+\operatorname {Nullity} (T)=\dim \operatorname {Im} T+\dim \operatorname {Ker} T=|T({\mathcal {S}})|+|{\mathcal {K}}|=(n-k)+k=n=\dim V} .

Ta có điều phải chứng minh.

Chứng minh thứ hai

Cho ma trận A Mat m × n ( F ) {\displaystyle \mathbf {A} \in \operatorname {Mat} _{m\times n}(\mathbb {F} )} với r {\displaystyle r} cột độc lập tuyến tính (nói cách khác Rank ( A ) = r {\displaystyle \operatorname {Rank} (\mathbf {A} )=r} ). Để có định lý ta sẽ chứng tỏ rằng:

  1. Tồn tại một tập gồm n r {\displaystyle n-r} nghiệm độc lập tuyến tính của hệ tuyến tính đồng nhất A x = 0 {\displaystyle \mathbf {Ax} =\mathbf {0} } .
  2. Mọi nghiệm khác đều là một tổ hợp tuyến tính của n r {\displaystyle n-r} nghiệm nói trên.

Để bắt đầu ta sẽ xây dựng một ma trận X Mat n × ( n r ) ( F ) {\displaystyle \mathbf {X} \in \operatorname {Mat} _{n\times (n-r)}(\mathbb {F} )} với các cột tạo thành một cơ sở cho không gian hạt nhân của A {\displaystyle \mathbf {A} } .

Không mất tính tổng quát, giả thiết rằng r {\displaystyle r} cột đầu tiên của A {\displaystyle \mathbf {A} } là độc lập tuyến tính. Vì vậy ta có thể biểu diễn

A = ( A 1 A 2 ) {\displaystyle \mathbf {A} ={\begin{pmatrix}\mathbf {A} _{1}&\mathbf {A} _{2}\end{pmatrix}}} ,

trong đó

A 1 Mat m × r ( F ) {\displaystyle \mathbf {A} _{1}\in \operatorname {Mat} _{m\times r}(\mathbb {F} )} gồm r {\displaystyle r} vectơ độc lập tuyến tính, và
A 2 Mat m × ( n r ) ( F ) {\displaystyle \mathbf {A} _{2}\in \operatorname {Mat} _{m\times (n-r)}(\mathbb {F} )} mỗi cột trong số n r {\displaystyle n-r} cột của nó là tổ hợp tuyến tính của các cột trong A 1 {\displaystyle \mathbf {A} _{1}} .

Điều này có nghĩa là A 2 = A 1 B {\displaystyle \mathbf {A} _{2}=\mathbf {A} _{1}\mathbf {B} } với một ma trận B Mat r × ( n r ) {\displaystyle \mathbf {B} \in \operatorname {Mat} _{r\times (n-r)}} (xem bài phân tích hạng) và vì thế,

A = ( A 1 A 1 B ) {\displaystyle \mathbf {A} ={\begin{pmatrix}\mathbf {A} _{1}&\mathbf {A} _{1}\mathbf {B} \end{pmatrix}}} .

Đặt

X = ( B I n r ) {\displaystyle \mathbf {X} ={\begin{pmatrix}-\mathbf {B} \\\mathbf {I} _{n-r}\end{pmatrix}}} ,

trong đó I n r {\displaystyle \mathbf {I} _{n-r}} ma trận đơn vị ( n r ) × ( n r ) {\displaystyle (n-r)\times (n-r)} . Lưu ý rằng X Mat n × ( n r ) ( F ) {\displaystyle \mathbf {X} \in \operatorname {Mat} _{n\times (n-r)}(\mathbb {F} )} thỏa mãn

A X = ( A 1 A 1 B ) ( B I n r ) = A 1 B + A 1 B = 0 m × ( n r ) . {\displaystyle \mathbf {A} \mathbf {X} ={\begin{pmatrix}\mathbf {A} _{1}&\mathbf {A} _{1}\mathbf {B} \end{pmatrix}}{\begin{pmatrix}-\mathbf {B} \\\mathbf {I} _{n-r}\end{pmatrix}}=-\mathbf {A} _{1}\mathbf {B} +\mathbf {A} _{1}\mathbf {B} =\mathbf {0} _{m\times (n-r)}.}

Vì vậy, mỗi cột trong số n r {\displaystyle n-r} cột của X {\displaystyle \mathbf {X} } là các nghiệm của hệ A x = 0 F m {\displaystyle \mathbf {Ax} =\mathbf {0} _{\mathbb {F} ^{m}}} .

Hơn nữa, n r {\displaystyle n-r} cột của X {\displaystyle \mathbf {X} } là độc lập tuyến tính bởi vì X u = 0 F n {\displaystyle \mathbf {Xu} =\mathbf {0} _{\mathbb {F} ^{n}}} suy ra u = 0 F n r {\displaystyle \mathbf {u} =\mathbf {0} _{\mathbb {F} ^{n-r}}} với vectơ u F n r {\displaystyle \mathbf {u} \in \mathbb {F} ^{n-r}} gồm các hệ số:

X u = 0 F n ( B I n r ) u = 0 F n ( B u u ) = ( 0 F r 0 F n r ) u = 0 F n r . {\displaystyle \mathbf {X} \mathbf {u} =\mathbf {0} _{\mathbb {F} ^{n}}\implies {\begin{pmatrix}-\mathbf {B} \\\mathbf {I} _{n-r}\end{pmatrix}}\mathbf {u} =\mathbf {0} _{\mathbb {F} ^{n}}\implies {\begin{pmatrix}-\mathbf {B} \mathbf {u} \\\mathbf {u} \end{pmatrix}}={\begin{pmatrix}\mathbf {0} _{\mathbb {F} ^{r}}\\\mathbf {0} _{\mathbb {F} ^{n-r}}\end{pmatrix}}\implies \mathbf {u} =\mathbf {0} _{\mathbb {F} ^{n-r}}.}

Vì vậy, các vectơ cột của X {\displaystyle \mathbf {X} } tạo thành một tập hợp gồm n r {\displaystyle n-r} nghiệm độc lập tuyến tính của hệ A x = 0 F m {\displaystyle \mathbf {Ax} =\mathbf {0} _{\mathbb {F} ^{m}}} .

Tiếp theo, ta sẽ chứng minh một nghiệm bất kỳ của hệ A x = 0 F m {\displaystyle \mathbf {Ax} =\mathbf {0} _{\mathbb {F} ^{m}}} phải là một tổ hợp tuyến tính của các cột trong X {\displaystyle \mathbf {X} } .

Để có điều này, cho

u = ( u 1 u 2 ) F n {\displaystyle \mathbf {u} ={\begin{pmatrix}\mathbf {u} _{1}\\\mathbf {u} _{2}\end{pmatrix}}\in \mathbb {F} ^{n}}

là một vectơ bất kỳ sao cho A u = 0 F m {\displaystyle \mathbf {Au} =\mathbf {0} _{\mathbb {F} ^{m}}} . Lưu ý rằng bởi vì các cột của A 1 {\displaystyle \mathbf {A} _{1}} là độc lập tuyến tính nên A 1 x = 0 F m {\displaystyle \mathbf {A} _{1}\mathbf {x} =\mathbf {0} _{\mathbb {F} ^{m}}} dẫn đến x = 0 F r {\displaystyle \mathbf {x} =\mathbf {0} _{\mathbb {F} ^{r}}} .

Vì vậy,

A u = 0 F m ( A 1 A 1 B ) ( u 1 u 2 ) = A 1 u 1 + A 1 B u 2 = A 1 ( u 1 + B u 2 ) = 0 F m u 1 + B u 2 = 0 F r u 1 = B u 2 {\displaystyle {\begin{array}{rcl}\mathbf {A} \mathbf {u} &=&\mathbf {0} _{\mathbb {F} ^{m}}\\\implies {\begin{pmatrix}\mathbf {A} _{1}&\mathbf {A} _{1}\mathbf {B} \end{pmatrix}}{\begin{pmatrix}\mathbf {u} _{1}\\\mathbf {u} _{2}\end{pmatrix}}&=&\mathbf {A} _{1}\mathbf {u} _{1}+\mathbf {A} _{1}\mathbf {B} \mathbf {u} _{2}&=&\mathbf {A} _{1}(\mathbf {u} _{1}+\mathbf {B} \mathbf {u} _{2})&=&\mathbf {0} _{\mathbb {F} ^{m}}\\\implies \mathbf {u} _{1}+\mathbf {B} \mathbf {u} _{2}&=&\mathbf {0} _{\mathbb {F} ^{r}}\\\implies \mathbf {u} _{1}&=&-\mathbf {B} \mathbf {u} _{2}\end{array}}}
u = ( u 1 u 2 ) = ( B I n r ) u 2 = X u 2 . {\displaystyle \implies \mathbf {u} ={\begin{pmatrix}\mathbf {u} _{1}\\\mathbf {u} _{2}\end{pmatrix}}={\begin{pmatrix}-\mathbf {B} \\\mathbf {I} _{n-r}\end{pmatrix}}\mathbf {u} _{2}=\mathbf {X} \mathbf {u} _{2}.}

Điều này cho thấy một vectơ u {\displaystyle \mathbf {u} } là nghiệm của A x = 0 {\displaystyle \mathbf {Ax} =\mathbf {0} } cũng phải là một tổ hợp tuyến tính của n r {\displaystyle n-r} các nghiệm đặc biệt cho bởi các cột của X {\displaystyle \mathbf {X} } . Mà ta đã chứng minh rằng các cột của X {\displaystyle \mathbf {X} } là độc lập tuyến tính. Vì thế các cột của X {\displaystyle \mathbf {X} } tạo ra một cơ sở cho không gian hạt nhân của ma trận A {\displaystyle \mathbf {A} } . Vậy số chiều hạt nhân, hay số vô hiệu của A {\displaystyle \mathbf {A} } n r {\displaystyle n-r} . Vì r {\displaystyle r} bằng hạng của A {\displaystyle \mathbf {A} } , ta suy ra Rank ( A ) + Nullity ( A ) = n {\displaystyle \operatorname {Rank} (\mathbf {A} )+\operatorname {Nullity} (\mathbf {A} )=n} . Đến đây ta kết thúc chứng minh.

Trích dẫn

  1. ^ Axler (2015) p. 63, §3.22
  2. ^ a b Friedberg, Insel & Spence (2014) p. 70, §2.1, Theorem 2.3
  3. ^ Valenza (1993) p. 71, §4.3
  4. ^ Katznelson & Katznelson (2008) p. 52, §2.5.1
  5. ^ Friedberg, Insel & Spence (2014) pp. 103-104, §2.4, Theorem 2.20
  6. ^ Banerjee, Sudipto; Roy, Anindya (2014), Linear Algebra and Matrix Analysis for Statistics, Texts in Statistical Science (ấn bản 1), Chapman and Hall/CRC, ISBN 978-1420095388

Tham khảo sách

  • Axler, Sheldon (2015). Linear Algebra Done Right. Undergraduate Texts in Mathematics (ấn bản 3). Springer. ISBN 978-3-319-11079-0.
  • Linear Algebra and Matrix Analysis for Statistics, ISBN 978-1420095388
  • Friedberg, Stephen H.; Insel, Arnold J.; Spence, Lawrence E. (2014). Linear Algebra (ấn bản 4). Pearson Education. ISBN 978-0130084514.
  • Matrix Analysis and Applied Linear Algebra, 2000, ISBN 978-0-89871-454-8.
  • Katznelson, Yitzhak; Katznelson, Yonatan R. (2008). A (Terse) Introduction to Linear Algebra. American Mathematical Society. ISBN 978-0-8218-4419-9.
  • Valenza, Robert J. (1993) [1951]. Linear Algebra: An Introduction to Abstract Mathematics. Undergraduate Texts in Mathematics (ấn bản 3). Springer. ISBN 3-540-94099-5.