線形代数の初学者のための道案内|線形代数のイメージを知る

「線形代数学」は大学以降の数学の基盤になる基礎的な分野で,多くの理系大学生が1年生で習うことになります.

線形代数学は他のほとんどの数学の分野で使われると言ってもいいほど大切な分野なので,とくに理論系の学科の人はここでコケてしまうと2年生以降がかなり厳しくなってしまいます.

定義や定理を覚えることは大切ですが,理論の大枠のイメージを持っていれば丸覚えすることなく自然に理解して覚えることができます.

数学では定義や定理は抽象的に表されることが多いですが,その裏には「やりたいこと」があります.

この「やりたいこと」のイメージを理解しておかないと,一体何をやっているのか分らなくなってしまいます.数学は数式が先にあるのではなく,やりたいことが最初にありそれを表現するために数式を用いるだけです.

大学の学部の線形代数学は,理論系ならばJordan標準形あたりまでを学ぶことが多いです.

この記事では線形代数学の初学者のために,Jordan標準形あたりまでの線形代数学の全体像を見ていきます.

行列とベクトル

線形代数は行列とベクトルを用いて話が進められます.

多変数の「比例」

実数$a$に対して$y=ax$が成り立つとき,「$y$は$x$に比例する」といい,$a$を比例係数というのでした.

様々にある関数の中でも,$f(x)=ax$で定まる比例の関数$f$は非常に分かりやすい関数のため,他の関数よりも比較的容易に理解することができます.

この意味で,中学数学でも最初に習う関数が比例の関数であることは妥当でしょう.

さて,「比例」を少し拡張してみましょう.

たとえば,2つの等式

\begin{align*} \begin{cases} y_1=x_1+2x_2+3x_3\\ y_2=4x_1+5x_2+6x_3 \end{cases} \end{align*}

を考えます.比例の世界では$x$と$y$が1つずつでしたが,

  • $x$が$x_1$, $x_2$, $x_3$の3つになり,
  • $y$が$y_1$と$y_2$の2つになりました.

比例の世界では$x$に値を代入すれば$y$の値が分かったように,$x_1$, $x_2$, $x_3$に値を代入すれば$y_1$, $y_2$の値が分かるという状況です.

線形代数の世界では,これを

\begin{align*} \bmat{y_1\\y_2} =\bmat{1&2&3\\4&5&6}\bmat{x_1\\x_2\\x_3} \end{align*}

のように表します.

  • 左辺を$\m{y}:=\bmat{y_1\\y_2}$
  • 右辺の係数部分を$A:=\bmat{1&2&3\\4&5&6}$
  • 右辺の変数部分を$\m{x}:=\bmat{x_1\\x_2\\x_3}$

とおくと,上の等式は$\m{y}=A\m{x}$と表すことができ,あたかも$A$を「比例定数」とし$\m{y}$は$\m{x}$に「比例」していると捉えることができます.

$A$のように数を長方形に並べたものを行列といい,$\m{x}$, $\m{y}$のように数を縦に並べたものを(列)ベクトルといいます.

縦$m$行,横$n$列の実数成分からなる行列を$m\times n$次行列といい,この集合を$\Mat_{m,n}(\R)$などと表します(「実数の集合」は$\R$と表します).$m=n$のときには$n$次正方行列といい,この集合を$\Mat_n(\R)$などと表します.

また,行列の第$i$行,第$j$列の成分を第$(i,j)$成分といいます.

$n$個の実数成分からなる列ベクトルの集合を$\R^n$と表します.ここでは

  • $\R^2$は$xy$平面
  • $\R^3$は$xyz$空間

くらいの認識で十分で,$\R^n$は軸が$n$本ある直交座標空間というイメージで十分です.

$x$から$y$への1変数関数の中で比例の関数$f(x)=ax$が最も基本的な関数であったように,多変数$\m{x}$の値から多変数$\m{y}$の値を出す関数の中で関数$f(\m{x})=A\m{x}$が最も基本的な関数なので,この関数を考えようというのは自然な発想ですね.

この行列とベクトルについて考えるのが線形代数学で,言い換えれば線形代数学は多変数での「比例」に相当する$\m{y}=A\m{x}$について考える分野ということになります.

行列の積

上で見たように,行列とベクトルの積については,$B\in\Mat_{mn}(\R)$と$\m{x}\in\R^n$に対して,$B\m{x}\in\R^m$となります.

よって,$B\m{x}$にさらに左から$A\in\Mat_{m\ell}(\R)$をかけると$A(B\m{x})\in\R^{\ell}$となります.

\begin{align*} \begin{matrix} \R^n & \to & \R^m & \to & \R^\ell \\ \rotatebox[origin=c]{90}{$\in$} &  & \rotatebox[origin=c]{90}{$\in$} &  & \rotatebox[origin=c]{90}{$\in$} \\ \m{x} & \mapsto & B\m{x} & \mapsto & A(B\m{x}) \end{matrix} \end{align*}

さて,ここで行列$A$と$B$の積$AB$をするとき,結合法則$A(B\m{x})=(AB)\m{x}$が成り立っていて欲しいと思うのは自然なことですね.

たとえば,$A=\bmat{2&2\\-3&1}$, $B=\bmat{-2&0\\3&1}$, $\m{x}=\bmat{x\\y}$の場合を考えると,

\begin{align*} A(B\m{x}) =&A\bra{\bmat{-2&0\\3&1}\bmat{x\\y}} =A\bmat{-2x\\3x+y} \\=&\bmat{2&2\\-3&1}\bmat{-2x\\3x+y} =\bmat{2(-2x)+2(3x+y)\\-3(-2x)+(3x+y)} \\=&\bmat{2x+2y\\9x+y} =\bmat{2&2\\9&1}\bmat{x\\y} =\bmat{2&2\\9&1}\m{x} \end{align*}

となるので,$AB=\bmat{2&2\\9&1}$と定義されていれば,結合法則$A(B\m{x})=(AB)\m{x}$が成り立ります.

このように,行列の積が結合法則をもつように定義しようとすると,行列の積の定義は以下のようになります.

$A\in\Mat_{mn}(\R)$の第$(i,j)$成分を$a_{ij}$,$B\in\Mat_{n\ell}(\R)$の第$(i,j)$成分を$b_{ij}$とする.このとき,積$AB$を以下で定義する.

\begin{align*} AB :=&\bmat{ \sum_{k=1}^{n} a_{1k}b_{k1}&\dots&\sum_{k=1}^{n} a_{1k}b_{k\ell}\\ \vdots&\ddots&\vdots\\ \sum_{k=1}^{n} a_{mk}b_{k1}&\dots&\sum_{k=1}^{n} a_{mk}b_{k\ell} } \end{align*}

多くの教科書で行列の積がこのように定義されるのを学んで,どうしてこのように定義するのか戸惑う人は多くいますが,上のような事情があるわけですね.

行列の積の計算はできるようにならなければいけませんが,この記事では計算よりもイメージを重視して説明しているので,この記事を読む範囲では行列の定義式を覚えておく必要はありません.

さて,上で説明したように行列の積は結合法則を満たしますが,実は交換法則が成り立ちません.すなわち,積$AB$と$BA$は必ずしも一致しないことに注意してください.

連立方程式と行列

連立方程式を考えます.例えば,$x$, $y$, $z$の連立方程式

\begin{align*} \begin{cases} x+2y+3z=1\\ 4x+5y+6z=2\\ 7x+8y+9z=3 \end{cases} \end{align*}

は上でみた行列とベクトルを用いると

\begin{align*} \bmat{1&2&3\\4&5&6\\7&8&9}\bmat{x\\y\\z}=\bmat{1\\2\\3} \end{align*}

と表せます.このように,行列$A$,変数ベクトル$\m{x}$,ベクトル$\m{c}$を用いて,$A\m{x}=\m{c}$と表される等式は連立方程式となります.

さて,連立方程式の解が存在するかどうかを考えたいとき,どのように考えれば良いでしょうか?

もちろん,この連立方程式を実際に解くことによっても解の存在は確かめられますが,別の方法を考えてみましょう.

この連立方程式は

\begin{align*} x\bmat{1\\4\\7}+y\bmat{2\\5\\8}+z\bmat{3\\6\\9}=\bmat{1\\2\\3} \end{align*}

と表すことができるので,

  • $\m{a}_1:=\bmat{1\\4\\7}$を$x$倍したベクトル
  • $\m{a}_2:=\bmat{2\\5\\8}$を$y$倍したベクトル
  • $\m{a}_3:=\bmat{3\\6\\9}$を$z$倍したベクトル

を繋ぎ合わせてベクトル$\m{c}:=\bmat{1\\2\\3}$になる,と解釈できます.

一般に,ベクトル$\m{a}_1,\dots,\m{a}_n$に対して,$c_1\m{a}_1+\dots+c_n\m{a}_n$と表されるベクトルを$\m{a}_1,\dots,\m{a}_n$の線形結合といいます.

したがって,$A=[\m{a}_1,\dots,\m{a}_n]$と表すと,「連立方程式$A\m{x}=\m{c}$を解く問題は$\m{a}_1,\dots,\m{a}_n$の線形結合で$\m{c}$を表す問題」だと考えることができます.

線形独立と逆行列

0でない実数$a$に対しては逆数が存在し,これを$a^{-1}$や$\dfrac{1}{a}$などと表すのでした.

正方行列に対してはこの逆数に相当する逆行列があり,正方行列$A$の逆行列を$A^{-1}$と表します.

ただ,零行列(成分が全て0の行列)でなくても行列に逆行列が存在するとは限らないところが実数の場合と異なり,逆行列をもつ行列のことを正則行列といいます.

1変数の場合の1次方程式$ax=c$ ($a\neq0$)は両辺に$a^{-1}$をかければ$x=\dfrac{c}{a}$となって解$x$が分かります.

これと同様に,正方行列$A$が逆行列$A^{-1}$を持つなら,連立方程式$A\m{x}=\m{c}$の両辺に左から$A^{-1}$をかけることで$\m{x}=A^{-1}\m{c}$と解$\m{x}$が分かります.

さて,$A=\bmat{1&0&0\\0&1&0\\1&1&0}$, $\m{x}=\bmat{x\\y\\z}$, $\m{c}=\bmat{c_1\\c_2\\c_3}$の場合には,連立方程式$A\m{x}=\m{c}$はベクトル$\m{a}_1:=\bmat{1\\0\\0}$, $\m{a}_2:=\bmat{0\\1\\0}$, $\m{a}_3:=\bmat{0\\1\\0}$の線形結合で$\m{c}$を表す問題であり,

\begin{align*} \begin{cases} x+0+z=c_1\\ 0+y+z=c_2\\ 0+0+0=c_3 \end{cases} \end{align*}

だから,これが解を持つには$c_3=0$でなければなりません.

$\m{a}_3=\m{a}_1+\m{a}_2$なので,$\m{a}_1$と$\m{a}_2$さえあれば,$\m{a}_3$はあってもなくても線形結合で表せるベクトルは変わりません.

こう考えると,$A=[\m{a}_1,\dots,\m{a}_n]$とするとき,ベクトル$\m{a}_1,\dots,\m{a}_n$の「どのベクトルも他のベクトルの線形結合で表せない(=バラバラに違う方向を向いた)」ベクトルであってくれれば,$\m{x}$の連立方程式$A\m{x}=\m{c}$は様々な$\m{c}$に対して解をもちそうです.

このように「ベクトル$\m{a},\dots,\m{a}_n$がバラバラに違う方向を向いていること」を$\m{a},\dots,\m{a}_n$が線形独立であるといいます.

さて,「行列$A=[\m{a}_1,\dots,\m{a}_n]$について,ベクトル$\m{a}_1,\dots,\m{a}_n$がバラバラなほど,多くの$\m{c}$に対して連立方程式$A\m{x}=\m{c}$が解をもちそう」という予想について,実は以下の定理が成り立ちます.

$n$次正方行列$A=[\m{a}_1,\dots,\m{a}_n]$に対して,次は同値である.

  • $\m{a}_1,\dots,\m{a}_n$が線形独立である.
  • $A$は正則である.すなわち,任意の$\m{c}\in\R^n$に対して,$\m{x}$の連立方程式$A\m{x}=\m{c}$は解$\m{x}=A^{-1}\m{c}$をもつ.

このように,行列$A$の列ベクトルの線形独立性と,連立方程式$A\m{x}=\m{c}$の解の存在が密接に関わっていることが示されます.

行列式

次に,列ベクトル$\m{a}_1,\dots,\m{a}_n$が線形独立であるかどうかを判定する方法を,連立方程式の考え方とは別の方法で考えましょう.

まず,2次正方行列$A$を

\begin{align*} A=\bmat{a&b\\c&d}=[\m{a}_1,\m{a}_2] \end{align*}

とします.

上でみたように,$A$が正則であることと$\m{a}_1$と$\m{a}_2$が線形独立であるということは同値です.

さらに$\m{a}_1$と$\m{a}_2$が線形独立であるということは,言い換えれば$\m{a}_1$と$\m{a}_2$が「バラバラに違う方向を向いている」ということなので,$\m{a}_1$と$\m{a}_2$が張る以下の平行四辺形の面積が0でないことは同値です.

Rendered by QuickLaTeX.com

$\m{a}_1=\bmat{a\\c}$, $\m{a}_2=\bmat{b\\d}$なので,この平行四辺形の面積は$|ad-bc|$ですから,$A$が正則であることと$ad-bc\neq0$であることは同値となります.

よって,$A=\bmat{a&b\\c&d}$の正則性を判定したければ,$ad-bc$の値が0か否かをみれば良いことになり,単なる行列成分の四則演算だけで正方行列の正則性が判定できることが分かりました.これはありがたいですね.

さて,$A=\bmat{a&b\\c&d}$に対して,$ad-bc$を$A$の行列式といい,$|A|$と表します.

では,3次行列

\begin{align*} A=\bmat{a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}} =[\m{a}_1,\m{a}_2,\m{a}_3] \end{align*}

についてはどう考えればよいでしょうか?

結論を言えば,列ベクトル$\m{a}_1$, $\m{a}_2$, $\m{a}_3$が張る以下のような平行六面体の(符号付きの)体積を$|A|$とすれば,$|A|$が0か否かをみれば$\m{a}_1$, $\m{a}_2$, $\m{a}_3$の線形独立性が分かりますね.

Rendered by QuickLaTeX.com

さて,この平行六面体の(符号付きの)体積は

\begin{align*} &a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32} \\&-a_{13}a_{22}a_{31}-a_{12}a_{21}a_{33}-a_{11}a_{23}a_{32} \end{align*}

で表されることが分かりで,これが$A=\bmat{a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}}$の行列式$|A|$です.

同様に$n$次正方行列$A=[\m{a}_1,\dots,\m{a}_n]$では,$A$の行列式$|A|$を$\m{a}_1,\dots,\m{a}_n$の張る平行多面体の$n$次元体積で定義します.これにより,やはり行列式$|A|$が0か否かで$\m{a}_1,\dots,\m{a}_n$の線形独立性が判定できます.

しかし,我々は$n$次元体積をイメージすることが難しく,この$n$次元の平行多面体の体積を求めようとするのは少し難があります.

そこで,結果としては$n$次元の平行多面体の体積に一致するが,体積を持ち出さずに$|A|$を定義する方法を採ります.

普通,$A=[\m{a}_1,\dots,\m{a}_n]$の行列式は置換を用いて定義されるため,何をやっているのかよく分からなくなってしまいがちですが,実は列ベクトル$\m{a}_1,\dots,\m{a}_n$の張る$n$次元の平行多面体の体積に一致する量を定義したいだけなのです.

線形空間と線形写像

さて,ここまでで空間$\R^n$と行列$A$について考えてきましたが,これを一般化することを考えます.

結論から言えば,

  • $\R^n$を一般化したものを線形空間
  • 行列を一般化したものを線形写像

といいます.

線形空間

例えば,実数係数の2次以下の整式(多項式または単項式)の集合

\begin{align*} \R[x]_2:=\set{a_0+a_1x+a_2x^2}{a_0,a_1,a_2\in\R} \end{align*}

を考えます.このとき,$a_0+a_1x+a_2x^2,b_0+b_1x+b_2x^2\in\R[x]_2$, $\alpha\in\R$に対して,自然な計算により

\begin{align*} &(a_0+a_1x+a_2x^2)+(b_0+b_1x+b_2x^2) \\&=(a_0+b_0)+(a_1+b_1)x+(a_2+b_2)x^2, \\&\alpha(a_0+a_1x+a_2x^2) \\&=(\alpha a_0)+(\alpha a_1)x+(\alpha a_2)x^2 \end{align*}

となります.これらはいずれも実数係数の2次以下の整式なので,$\R[x]_2$に属します.

このように,集合$V$に

  • $\R$倍

が定義されていて,(ここで詳しくは書きませんが)さらにいくつかの条件を満たすとき,$V$を$\R$上の線形空間といいます.

ここまで考えてきた$\R^n$や,いまみた$\R[x]_2$などは$\R$上の線形空間の例です.

この意味で,線形空間は$\R^n$の拡張ということができます.

線形写像

$n$行の行列$A$は,任意の$\m{a},\m{b}\in\R^n$, $\alpha\in\R$に対して

  • $A(\m{a}+\m{b})=A\m{a}+A\m{b}$
  • $A(\alpha\m{a})=\alpha (A\m{a})$

を満たします.このように,$\R$上の線形空間$U$, $V$に対して,写像$f:U\to V$が任意の$\m{u},\m{u}’\in U$, $\alpha\in\R$に対して

  • $f(\m{u}+\m{u}’)=f(\m{u})+f(\m{u}’)$
  • $f(\alpha\m{u})=\alpha f(\m{u})$

を満たすとき,$f$を線形写像といいます.すなわち,

  • 和を$f$で移した$f(\m{u}+\m{u’})$と,$f$で移したものの和$f(\m{u})+f(\m{u’})$が等しい
  • $\R$倍を$f$で移した$f(\alpha\m{u})$と,$f$で移したものの$\R$倍$\alpha f(\m{u})$が等しい

という2つの性質を満たす$\R$上の線形空間の間の写像を線形写像というわけです.

例えば,左から行列$A$をかける写像を$f$とすると,上で見たことから

\begin{align*} &f(\m{a}+\m{b})=A(\m{a}+\m{b})=A\m{a}+A\m{b}=f(\m{a})+f(\m{b}), \\&f(\alpha \m{a})=A(\alpha \m{a})=\alpha (A\m{a})=\alpha f(\m{a}) \end{align*}

となって,$f$は線形写像であると分かります.

この意味で,線形写像は行列の拡張ということができます.

線形空間の同型

先ほど,$a_0+a_1x+a_2x^2,b_0+b_1x+b_2x^2\in\R[x]_2$, $\alpha\in\R$に対して

\begin{align*} &(a_0+a_1x+a_2x^2)+(b_0+b_1x+b_2x^2) \\&=(a_0+b_0)+(a_1+b_1)x+(a_2+b_2)x^2, \\&\alpha(a_0+a_1x+a_2x^2) \\&=(\alpha a_0)+(\alpha a_1)x+(\alpha a_2)x^2 \end{align*}

が成り立つことをみましたが,これは係数に注目すると$\R^3$での

\begin{align*} &\bmat{a_0\\a_1\\a_2}+\bmat{b_0\\b_1\\b_2}=\bmat{a_0+b_0\\a_1+b_1\\a_0+b_0}, \\&\alpha\bmat{a_0\\a_1\\a_2}=\bmat{\alpha a_2\\\alpha a_1\\\alpha a_0} \end{align*}

という計算と対応していることが分かります.

すなわち,$a_0+a_1x+a_2x^2$と$\bmat{a_0\\a_1\\a_2}$を同じものとみなすことにより,$\R[x]_2$と$\R^3$は和とスカラー倍も含めて全く同じものとして同一視することができます.

このように,線形空間$U$, $V$が同一視できるとき,$U$と$V$は同型であるといい,$U\cong V$と表します.

線形空間$V$に対して,有限個の$\m{v}_1,\dots,\m{v}_n\in V$が存在して,任意の$\m{v}\in V$が

\begin{align*} \m{v}=c_1\m{v}_1+c_2\m{v}_2+\dots+c_n\m{v}_n \end{align*}

と表されるとき,$V$は有限次元といいます.有限次元ベクトル空間については,次の定理が非常に重要です.

任意の$\R$上の有限次元ベクトル空間$V$に対して,ある$n\in\N$が存在して,$V\cong\R^n$となる.

「線形空間は和と$\R$倍が定義され,いくつかの性質を満たすもの」で,$\R^n$や$\R[x]_2$などはそのうちの1つだと説明しましたが,実は見た目が全く違う線形空間$V$でも,$V$が有限次元でさえあれば,ある次元の$\R^n$と同一視できるというわけです.

$\R^n$はこれまで学んできた分かりやすい空間ですから,有限次元の線形空間$V$が分かりにくい空間であれば,全て$\R^n$に置き換えて考えればよいということになります.

表現行列

$U$と$V$を有限次元線形空間とし,$f:U\to V$を線形写像とします.

いまみたように,$U$と$V$はある次元の$\R^n$と同一視できるので,$U\cong\R^m$, $V\cong\R^k$とすると,線形写像$f:U\to V$は線形写像$f:\R^m\to\R^k$と同一視できることになりますね.

また,実は任意の線形写像$f:\R^m\to\R^k$は,ある$k\times m$次行列$A$によって,$f(\m{a})=A\m{a}$と表すことができます.

ここで,$\m{a}\in\R^m$に左から$k\times m$次行列$A$をかけると$\R^k$の元になることに注意しておきます.

これらのことから,線形写像$f:U\to V$はある行列$A$を左からかける写像と同一視できます.

このように線形写像が同一視できるような行列のことを$f$の表現行列といいます.

固有値と固有ベクトル

一般に,正方行列$A$に対して,一般に$A$のべき$A^n$を直接計算により求めるのは,現実的ではありませんが,固有値固有ベクトルを考えることによって,$A^n$を簡単に求められる場合があります.

このような行列の冪の計算は,固有値と固有ベクトルを考える大きな目的の1つです.

ベクトルの平行

例えば,$\R^3$のベクトル$\m{a}:=\bmat{1\\2\\3}$, $\m{b}:=\bmat{2\\4\\6}$は$\m{b}=2\m{a}$を満たします.

Rendered by QuickLaTeX.com

このように,2つのベクトル$\m{a}$と$\m{b}$がともに零ベクトル(成分が全て0のベクトル)でなく,一方の定数倍が他方に一致するとき,$\m{a}$と$\m{b}$は平行であるといいます.

さて,これまで$\R$成分の行列やベクトルを主に扱ってきましたが,成分が複素数の行列やベクトルを扱うこともよくあります.

「複素数の集合」は$\C$で表すので,$\C^n$は複素数成分の$n$次列ベクトルの集合を表します.ただ,成分が$\R$から$\C$になっても,これまで説明したことは本質的に変わりません.

いまみた$\R^n$の平行と同様に,$\m{a},\m{b}\in\C^n$がともに零ベクトルでなく,$\m{a}=\lambda\m{b}$となる$\lambda\in\C$が存在するとき,$\m{a}$と$\m{b}$は平行であるといいます.

固有値と固有ベクトル

$n$次正方行列$A$と$\m{a}\in\C^n$を考えます.

このとき,$\m{a}$と$A\m{a}$は「平行」であるとは限りませんが,たまたま$\m{v}$と$A\m{v}$が平行になることもあります.

このとき,ある$\lambda\in\C$が存在して

\begin{align*} A\m{a}=\lambda\m{a} \end{align*}

が成り立ちますが,このときの$\lambda$を$A$の固有値といい,$\m{a}$を$A$の固有値$\lambda$に属する固有ベクトルといいます.

すなわち,うまく$\m{v}$を選んで$A\m{v}$と$\m{v}$が平行,または$A\m{v}=\m{0}$となるとき$\m{v}$を固有値といい,そのときの伸び率$\lambda$を固有値というわけですね.

Rendered by QuickLaTeX.com

対角化

正方行列の第$(k,k)$成分を対角成分といい,対角成分以外の成分が0の行列を対角行列といいます.

たとえば,$A=\bmat{2&0&0\\0&1&0\\0&0&-3}$とすると,行列の積の定義から

\begin{align*} &A^2=\bmat{2&0&0\\0&1&0\\0&0&-3}\bmat{2&0&0\\0&1&0\\0&0&-3}=\bmat{4&0&0\\0&1&0\\0&0&9}, \\&A^3=A^2 A=\bmat{4&0&0\\0&1&0\\0&0&9}\bmat{2&0&0\\0&1&0\\0&0&-3}=\bmat{8&0&0\\0&1&0\\0&0&-27}, \\&A^4=A^3 A=\bmat{8&0&0\\0&1&0\\0&0&-27}\bmat{2&0&0\\0&1&0\\0&0&-3}=\bmat{16&0&0\\0&1&0\\0&0&81} \end{align*}

となります.これを続ければ,

\begin{align*} A^n=\bmat{2^n&0&0\\0&1^n&0\\0&0&(-3)^n} \end{align*}

であることが推察できますね.

一般に行列の積の計算は煩雑になりますが,対角行列は冪が簡単に計算できるのがが対角行列の特徴です.

そこで,もし正則行列$P$によって$B:=P^{-1}AP$が対角行列になったとしましょう.このとき,両辺を$m$乗すると,

\begin{align*} B^{m} =&(P^{-1}AP)^{m} \\=&(P^{-1}AP)(P^{-1}AP)\dots(P^{-1}AP) \\=&P^{-1}A(PP^{-1})A(PP^{-1})A\dots A(PP^{-1})AP \\=&P^{-1}A^{m}P \end{align*}

が成り立ち,これより$PB^{m}P^{-1}=A^{m}$が成り立ちます.

$B$は対角行列なので$B^{m}$は容易に計算でき,あとは$PB^{m}P^{-1}$を計算することにより,$A^{m}$が得られます.

このように,正方行列$A$に対して$P^{-1}AP$が対角行列となるような正則行列$P$が存在するとき,$A$は対角化可能であるといいます.

よって,我々は正方行列を対角化する正則行列$P$を見つける方法が知りたいわけですね.

そして,これについては以下の基本定理が成り立ちます.

$n$次正方行列$A$が異なる$n$個の固有値$\lambda_1,\dots,\lambda_n$をもつとき,$A$は対角化可能である.とくに$\m{v}_i$を固有値$\lambda_i$に属する固有ベクトルとする($i=1,\dots,n$)と,$P=[\m{v}_1,\dots,\m{v}_n]$により以下が成り立つ.

\begin{align*} P^{-1}AP=\bmat{\lambda_1&0&\dots&0\\0&\lambda_2&\ddots&\vdots\\\vdots&\ddots&\ddots&0\\0&\dots&0&\lambda_n}. \end{align*}

このように,固有値と固有ベクトルを求めることによって,対角化できる場合があります.

Jordan標準形

全ての複素正方行列が対角化可能であるとは限りませんが,対角化可能でない場合でも対角行列の拡張であるJordan標準形にすることはいつでもできます.

以下ように

  • 対角成分が$\lambda$
  • 第$(k,k-1)$成分が1

の行列を,固有値$\lambda$の$n$次Jordan細胞といい,$J_{n}(\lambda)$で表します:

\begin{align*} J_{n}(\lambda) =\bmat{\lambda&1&0&\dots&0\\ 0&\lambda&\ddots&\ddots&\vdots\\ \vdots&\ddots&\ddots&\ddots&0\\ \vdots&\ddots&\ddots&\lambda&1\\ 0&\dots&\dots&0&\lambda}. \end{align*}

そして,このJordan細胞を対角成分に並べてできる行列をJordan標準形といいます.

\begin{align*} \bmat{J_{n_1}(\lambda_1)&O&\dots&O\\O&J_{n_2}(\lambda_2)&\ddots&\vdots\\\vdots&\ddots&\ddots&O\\O&\dots&O&J_{n_k}(\lambda_k)} \end{align*}

対角行列はJordan細胞の字数が全て1のJordan標準形なので,対角行列もJordan標準形ですね.

対角行列ほどではありませんが,Jordan標準形も冪の計算がしやすい行列なので,「準対角化」といった気持ちで良いでしょう.

参考文献

線型代数入門 (齋藤正彦 著,東京大学出版会)

線形代数の教科書として半世紀に渡って売れ続けている超ロングセラーの教科書です.

本書が発行されて以来,多くの教科書が本書を真似て書かれてきたといっても過言ではないほど,日本の線形代数の指導方針にインパクトを与えた名著です.

「線型代数をとりあえず使えるようにするための教科書」ではなく「線形代数を理解するための教科書」のため,論理的に非常に詳しく書かれているのが特徴です.

内容のレベルも理論系(特に数学系)の学部生であれば,確実に理解しておきたいところです.

最後までありがとうございました!

参考になった方は是非シェアをお願いします!

フォローする

以下の関連記事もいかがですか?

SPONSORED LINK
関連記事

記事一覧はこちらからどうぞ!

記事一覧は

こちら

Twitterを

フォロー

大学院入試

解答例

大学受験

解説ブログ