$n$次正方行列$A$に対して$AB=BA=I$を満たす正方行列$B$が存在するとき
- $A$を正則行列
- $B$を$A$の逆行列
といい,$B=A^{-1}$と表すのでした($I$は単位行列).
このように正則行列であることの定義式は$AB=BA=I$ですが,実は$AB=I$か$BA=I$の少なくとも一方が成り立てば正則行列となることが証明できます.
このことを証明するためには基本変形が行列の掛け算で表せることを理解しておきたいところです.
この記事では,正方行列$A$が正則であるためには$AB=I$か$BA=I$を満たす正方行列$B$が存在すれば良いことの証明を目標として
- 行基本変形の確認
- 基本変形を引き起こす行列
- 正則性の条件
を順に説明します.
なお,この記事では特に断らない限り実行列・実ベクトルを扱うことにしますが,複素行列など一般の体を成分とする行列・ベクトルに対しても同様です.
「線形代数学の基本」の一連の記事
- 行列と列ベクトル
- 行列式
- $\R^n$の部分空間と基底
行基本変形の確認
まずは行基本変形がどういうものだったか確認しておきましょう.
連立1次方程式$\begin{cases}2x+3y=8\\x+2y=5\end{cases}$は以下のように加減法により解くことができます:
\begin{align*}\left\{\begin{matrix}2x&+&3y&=&8\\x&+&2y&=&5\end{matrix}\right.
&\iff\left\{\begin{matrix}x&+&2y&=&5\\2x&+&3y&=&8\end{matrix}\right.
\\&\iff\left\{\begin{matrix}x&+&2y&=&5\\&-&y&=&-2\end{matrix}\right.
\\&\iff\left\{\begin{matrix}x&&&=&1\\&-&y&=&-2\end{matrix}\right.
\\&\iff\left\{\begin{matrix}x&&&=&1\\&&y&=&2\end{matrix}\right.\end{align*}
連立1次方程式の加減法は係数と定数をいじっているだけなので,以下のように拡大係数行列$\bmat{2&3&8\\1&2&5}$の変形と対応しますね.
\begin{align*}&\left\{\begin{matrix}2x&+&3y&=&8\\x&+&2y&=&5\end{matrix}\right.&\leftrightarrow&&\bmat{2&3&8\\1&2&5}
\\&\iff\left\{\begin{matrix}x&+&2y&=&5\\2x&+&3y&=&8\end{matrix}\right.&\leftrightarrow&&\bmat{1&2&5\\2&3&8}
\\&\iff\left\{\begin{matrix}x&+&2y&=&5\\&-&y&=&-2\end{matrix}\right.&\leftrightarrow&&\bmat{1&2&5\\0&-1&-2}
\\&\iff\left\{\begin{matrix}x&&&=&1\\&-&y&=&-2\end{matrix}\right.&\leftrightarrow&&\bmat{1&0&1\\0&-1&-2}
\\&\iff\left\{\begin{matrix}x&&&=&1\\&&y&=&2\end{matrix}\right.&\leftrightarrow&&\bmat{1&0&1\\0&1&2}\end{align*}
この連立1次方程式の加減法に対応する行列の変形を行基本変形というのでした.
行列について
- 2つの行を入れ替える
- 1つの行を$k$倍する($k\neq0$)
- 1つの行の$k$倍を別の1つの行に加える
という3つの変形を併せて行基本変形という.
基本変形を引き起こす行列
連立1次方程式の加減法をもとに定義された行基本変形ですが,実は行列の掛け算をかけることで基本変形を引き起こすことができます.
基本変形
いま行基本変形の定義を述べましたが,行列の列に関しての同様の変形を列基本変形といいます.
行列について
- ある列と別の列を入れ替える
- ある列を$k$倍する($k\neq0$)
- ある列の$k$倍を別の列に加える
という3つの変形を併せて列基本変形という.
列基本変形の定義は,行基本変形の定義で「行」を「列」に読み替えただけですね.
列基本変形と行基本変形を併せて基本変形という.
基本変形を引き起こす行列
行列$A:=\bmat{1&2&3\\4&5&6\\7&8&9\\10&11&12}$と,以下の行列を考えます.
\begin{align*}P_{34}:=\bmat{1&0&0&0\\0&1&0&0\\0&0&0&1\\0&0&1&0},\quad
Q_{2}^{(3)}:=\bmat{1&0&0&0\\0&3&0&0\\0&0&1&0\\0&0&0&1},\quad
R_{14}^{(2)}:=\bmat{1&0&0&2\\0&1&0&0\\0&0&1&0\\0&0&0&1}\end{align*}
このとき,定義通り計算すると
\begin{align*}P_{34}A=\bmat{1&2&3\\4&5&6\\10&11&12\\7&8&9},\quad
Q_{2}^{(3)}A=\bmat{1&2&3\\12&15&18\\7&8&9\\10&11&12},\quad
R_{14}^{(2)}A=\bmat{21&24&27\\4&5&6\\7&8&9\\10&11&12}\end{align*}
となります.この結果ともとの$A$を見比べてみると
- $P_{34}A$は第3行と第4行の入れ替え
- $Q_{2}^{(3)}A$は第2行の3倍
- $R_{14}^{(2)}A$は第1行に第4行の2倍の付け加え
という基本変形が起こっていることが分かります.
一般の基本変形もいま見た例のような正方行列$P_{ij}$, $Q_{i}^{(k)}$, $R_{ij}^{(k)}$をかけることによって引き起こすことができます.
$k\in\R$,$A$を$n$行の行列,$I$を$n$次単位行列とする.また
- $P_{ij}$を$I$の第$i$列と第$j$列を入れ替えた行列
- $Q_{i}^{(k)}$を$I$の第$(i,i)$列を$k$とした行列 ($k\neq0$)
- $R_{ij}^{(k)}$を$I$の第$i$列に第$j$列の$k\in\R$倍を加えた行列
とする.このとき,これらを行列に左からかけることで次のように行基本変形が引き起こされる:
- $P_{ij}A$は$A$の第$i$行と第$j$行を入れ替えてできる行列
- $Q_{i}^{(k)}A$は$A$の第$i$行を$k$倍してできる行列 ($k\neq0$)
- $R_{ij}^{(k)}A$は$A$の第$i$行に$A$の第$j$行の$k$倍を加えてできる行列
また,$P_{ij}$, $Q_{i}^{(k)}$, $R_{ij}^{(k)}$を$A$に右からかけると,同様の列基本変形が引き起こされる.
実際に計算することにより,この命題は容易に証明することができます.
この命題から次の系が成り立つことも分かります.
$P_{ij}$, $Q_{i}^{(k)}$, $R_{ij}^{(k)}$はいずれも正則で,それぞれ$P_{ij}$, $Q_{i}^{(1/k)}$, $R_{ij}^{(-k)}$が逆行列である.
正則性の条件
この記事の本題です.念のため正則行列の定義を確認しておきましょう.
$n$次正方行列$A$が正則(regular)であるとは
\begin{align*}AB=BA=I_n\end{align*}
をみたす$n$次正方行列$B$が存在することをいう.このとき,$B$は$A$の逆行列(inverse matrix)であるといい,$B$を$A^{-1}$と表す.
定義は以上の通りですが,実は$AB=I$と$BA=I$のいずれかが成り立てば$A$が正則であることが証明できます.
すなわち,以下が成り立ちます.
正方行列$A$に対して,$AB=I$または$BA=I$をみたす正方行列$B$が存在すれば,$A$は正則で$A^{-1}=B$である.
行列をかけることで基本変形が引き起こされることを用いて証明します.
$BA=I_n$が成り立つとする.$B$の簡約化を$C$とすると,ある$n$次基本行列$T_1,T_2,\dots,T_r$が存在して,
\begin{align*}T_1T_2\dots T_rB=C\end{align*}
が成り立つ.$BA=I$の両辺に左から$T_1T_2\dots T_r$をかけて
\begin{align*}CA=T_1T_2\dots T_r\end{align*}
となる.ここで,もし$C$の第$n$行の全ての成分が0なら,左辺$CA$も第$n$行の全ての成分が0となり正則でないが,右辺$T_1T_2\dots T_r$は正則行列の積なので正則だから矛盾する.よって,$C$の第$n$行には0でない成分が存在する.
$C$が簡約行列かつ正方行列であることと併せると$C=I_n$と分かるから$T_1T_2\dots T_rB=I_n$が成り立ち,この両辺に左から$T_r^{-1}\dots T_2^{-1}T_1^{-1}$をかければ
\begin{align*}B=T_r^{-1}\dots T_2^{-1}T_1^{-1}\end{align*}
を得る.また,
\begin{align*}A=T_1T_2\dots T_r\end{align*}
が成り立つから,
\begin{align*}AB=T_1T_2\dots T_rT_r^{-1}\dots T_2^{-1}T_1^{-1}=I_n\end{align*}
が従う.一方,$AB=I_n$が成り立つときも同様に$BA=I_n$が従う.
コメント