バナッハの不動点定理|完備距離空間の縮小写像の不動点

写像$f:X\to X$を施しても変化しない,すなわち$f(x)=x$を満たす点$x\in X$を$f$の不動点といいます.

不動点に関する定理は様々なものがあり,[Banach(バナッハ)の不動点定理]もその1つです.

[Banachの不動点定理]は完備距離空間$X$上の縮小写像に関する不動点定理で,別名[縮小写像の定理]とも呼ばれています.

例えば,常微分方程式の解の存在と一意性を証明する方法としてPicard(ピカール)の逐次近似法(Picard–Lindelöfの定理)がありますが,これは本質的に[Banachの不動点定理]です.

この記事では,[Banachの不動点定理]について説明したのち,この定理の証明をします.

なお,[Picardの逐次近似法]については以下の記事を参照してください.

前提知識の準備

[Banachの不動点定理]を説明するために

  • 距離空間
  • 完備距離空間
  • 縮小写像

について定義を確認しておきます.

距離空間

距離空間の定義は以下の通りです.

集合$X$に対して,関数$d:X\times X\to\R$を考える.$d$が以下の全てを同時に満たすとする.

  1. 任意の$x,y\in X$に対して$d(x,y)\ge0$ (非負値性)
  2. $d(x,y)=0 \iff x=y$ (非退化性)
  3. 任意の$x,y\in X$に対して$d(x,y)=d(y,x)$ (対称性)
  4. 任意の$x,y,z\in X$に対して$d(x,z)\le d(x,y)+d(y,z)$ (劣加法性)

このとき,$d$を$X$の距離関数または距離 (metrix)といい,組$(X,d)$を距離空間 (metric space)という.また,距離$d$が明らかな場合には,単に$X$を距離空間という.

なお,劣加法性の不等式を三角不等式という.

距離空間について,詳しくは以下の記事を参照してください.

完備距離空間

距離空間の完備性を説明するためには,Cauchy(コーシー)列が必要です.

距離空間$(X,d)$の点列$\{x_n\}_{n=1}^{\infty}$がCauchy列であるとは,任意の$\epsilon>0$に対して,ある$N\in\N$に対して,$m,n>N$なら$d(x_m,x_n)<\epsilon$が成り立つことをいう.

大雑把に言えば,$X$上の点列$\{x_n\}_{n=1}^{\infty}$がCauchy列であるとは,「十分大きく$n$と$m$をとれば,$x_n$と$x_m$をいくらでも近くできる」ということですね.

さて,任意の収束列はCauchy列となるが,逆にCauchy列は$X$上に極限をもつとは限らないのでした.

例えば,有理数全体の集合$\Q$と写像$d:\Q\times\Q\to\R;(x,y)\mapsto|x-y|$の組$(\Q,d)$は距離空間ですが,この距離空間$(\Q,d)$でのCauchy列は$\Q$上に極限をもつとは限りません.

実際,$\Q$上の数列$\{x_n\}$を

  • $x_1=1$
  • $x_2=1.4$
  • $x_3=1.41$
  • $x_4=1.414$
  • $x_5=1.4142$
  • ……

と実数全体の集合$\R$の中で$\sqrt{2}$に収束するものとして定めると,$\{x_n\}$は$\Q$上のCauchy列ですが$\sqrt{2}\notin\Q$なので,$\Q$に極限を持ちません.

これについて,完備距離空間を以下のように定義します.

距離空間$(X,d)$上の任意のCauchy列が$X$上に極限をもつとき,$(X,d)$は完備(complete)であるという.

すなわち,$m$, $n$を大きくとって$x_m$と$x_n$をいくらでも近くできるなら,その空間の中に$\{x_n\}$の極限が存在するような距離空間を完備というわけですね.

例えば,実数全体の集合$\R$と写像$\tilde{d}:\R\times\R\to\R;(x,y)\mapsto|x-y|$の組$(\R,\tilde{d})$は完備距離空間です.

先ほどの完備でない距離空間$(\Q,d)$と距離の定義は同様ですが,$(\R,\tilde{d})$の方は完備になります.

余談ですが,実は$(\R,\tilde{d})$は$(\Q,d)$上のCauchy列がすべて極限をもつように$(\Q,d)$を拡張したものとなっています.

このように,完備でない距離空間$(X,d)$に対して,これを拡張してできる最小の完備距離空間$(\tilde{X},\tilde{d})$を$(X,d)$の完備化といいます.

縮小写像

距離空間の間の写像$f$について,$f$が縮小写像であるとは以下のように定義します.

距離空間$(X,d)$に対して,写像$f:X\to X$が縮小写像 (contraction)であるとは,ある$p\in(0,1)$が存在して,任意の$x,y\in X$に対して

\begin{align*} d(f(x),f(y))\le pd(x,y) \end{align*}

が成り立つことをいう.

なお,定義式は$d(f(x),f(y))\le pd(x,y)$であって,$d(f(x),f(y))<d(x,y)$とは異なることに注意します.微妙な差ですが,

\begin{align*} &d(f(x),f(y))\le pd(x,y) \\\Ra\ &d(f(x),f(y))<d(x,y) \end{align*}

は真ですが,この逆は成り立ちません.

$d(f(x),f(y))\le pd(x,y)$の場合には$\frac{d(f(x),f(y))}{d(x,y)}\le p$なので,比率の上限が1になることはありません

\begin{align*} \sup_{x,y\in X}\frac{d(f(x),f(y))}{d(x,y)}\le p<1. \end{align*}

一方,$d(f(x),f(y))<d(x,y)$の場合には$\frac{d(f(x),f(y))}{d(x,y)}<1$なので,比率の上限が1になることもあります

\begin{align*} \sup_{x,y\in X}\frac{d(f(x),f(y))}{d(x,y)}\le 1. \end{align*}

したがって,$f$が縮小写像であるとは,$f$によって単に2点の距離が縮まるだけではなく,2点の距離の拡大率がある$p\in(0,1)$未満となっているということをいう.

また,縮小写像の連続性については次が言えます.

縮小写像はLipschitz(リプシッツ)連続である.したがって,連続写像である.

完備距離空間$(X,d)$上の縮小写像$f$を考える.ある$p\in(0,1)$が存在して,任意の$x,y\in X$に対して

\begin{align*} d(f(x),f(y))\le pd(x,y) \end{align*}

が成り立つとする.このとき,任意の$\epsilon>0$に対して,$d(x,y)<\epsilon$を満たす任意の$x,y\in X$に対して,

\begin{align*} d(f(x),f(y))\le pd(x,y)<d(x,y)<\epsilon \end{align*}

だから,$f$はLipschitz連続である.

Banachの不動点定理

準備ができたので,[Banachの不動点定理]について説明します.

Banachの不動点定理の主張

以下が,この記事のメインの[Banachの不動点定理]です.

[Banachの不動点定理(縮小写像の原理)] 空でない完備距離空間$(X,d)$上の縮小写像$f$は不動点を唯一つもつ.

また,任意の$x\in X$に対して$\lim_{n\to\infty}f^n(x)$が,この$f$の不動点である.ここに,写像$f^n$は$f$を$n$回施す写像である.

つまり,完備距離空間$(X,d)$上の縮小写像$f$に対して,$f(x)=x$を満たす$x\in X$が存在して,それが唯一つに限るということですね.

例えば,Euclid距離空間$(\R^2,d)$は完備で,写像

\begin{align*} f:\R^2\to\R;\bmat{a_1\\a_2}\mapsto\bmat{\frac{1}{2}a_2\\\frac{1}{3}a_1} \end{align*}

を考えます.$f(\m{0})=\m{0}$なので,$\m{0}\in\R^2$が$f$の不動点であることはすぐに分かりますが,他には存在しないのでしょうか?

$\m{x}=[a_1,a_2]^T$, $\m{y}=[b_1,b_2]^T$とすると,

\begin{align*} d(f(\m{x}),d(\m{y})) =&d\bra{\bmat{\frac{1}{2}a_2\\\frac{1}{3}a_1},\bmat{\frac{1}{2}b_2\\\frac{1}{3}b_1}} \\=&\sqrt{\bra{\frac{1}{2}a_2-\frac{1}{2}b_2}^2+\bra{\frac{1}{3}a_1-\frac{1}{3}b_2}^1} \\=&\sqrt{\frac{1}{2^2}(a_2-b_2)^2+\frac{1}{3^2}(a_1-b_1)^2} \\\le&\sqrt{\frac{1}{2^2}(a_2-b_2)^2+\frac{1}{2^2}(a_1-b_1)^2} \\=&\frac{1}{2}\sqrt{(a_2-b_2)^2+(a_1-b_1)^2} =\frac{1}{2}d(\m{x},\m{y}) \end{align*}

が成り立つので,$f$は$(\R^2,d)$上の縮小写像となります.

よって,[Banachの不動点定理]より点$\m{0}\in\R^2$が唯一の不動点となります.

縮小写像によって空間が全体的にキュッと集まるので,ある1点以外では同じ点に留まることができないというイメージですね.

Banachの不動点定理の証明

$f$は縮小写像だから,ある$p\in(0,1)$が存在して,任意の$x,y\in X$に対して

\begin{align*} d(f(x),f(y))\le pd(x,y) \end{align*}

が成り立つ.

また,$X$上の任意の点$x_0\in X$から,$f(x_n)=x_{n+1}$によって帰納的に$X$上の点列$\{x_n\}_{n=0}^{\infty}$を定める.

以下,3つのステップに分けて不動点定理の証明を行う.

[Step 1] 点列$\{x_n\}_{n=0}^{\infty}$が極限を持つことを示す.

任意の$\epsilon>0$をとる.任意の$m,n\in\N$ ($m>n$)に対して,三角不等式より

\begin{align*} d(x_m,x_n) \le& d(x_m,x_{m-1})+d(x_{m-1},x_{n}) \\\le& d(x_m,x_{m-1})+d(x_{m-1},x_{m-2})+d(x_{m-2},x_{n}) \\&\vdots \\\le& d(x_m,x_{m-1})+d(x_{m-1},x_{m-2})+\dots+d(x_{n+1},x_{n}) \end{align*}

である.また,任意の$k\in\N$に対して,

\begin{align*} d(x_{k+1},x_k) =&d(f(x_k),f(x_{k-1})) \\\le& p d(x_k,x_{k-1}) \\=&p d(f(x_{k-1}),f(x_{k-2})) \\\le&p^2 d(x_{k-2},x_{k-3}) \\&\vdots \\\le&p^k d(x_1,x_0) \end{align*}

である.これらを併せて,$p\in(0,1)$に注意すると,

\begin{align*} d(x_m,x_n) \le& p^{m-1}d(x_1,x_0)+p^{m-2}d(x_1,x_0)+\dots+p^n d(x_1,x_0) \\=&\frac{p^n d(x_1,x_0)\bra{1-p^{m-n}}}{1-p} \\\le&\frac{p^n d(x_1,x_0)(1-0^{m-n})}{1-p} =\frac{p^n d(x_1,x_0)}{1-p} \end{align*}

である.よって,$n\ge\log_{p}\frac{(1-p)\epsilon}{2d(x_1,x_0)}$となる最小の$n$を$N$とすると,$m,n>N$のとき

\begin{align*} d(x_m,x_n) \le\frac{\epsilon}{2} <\epsilon \end{align*}

となるから,$\{x_n\}_{n=0}^{\infty}$はCauchy列である.

距離空間$(X,d)$は完備だから,Cauchy列$\{x_n\}_{n=0}^{\infty}$は極限$x:=\lim_{n\to\infty}x_n$をもつ.

[Step 2] 極限$x$が$f$の不動点であることを示す.

上の命題で示したように,$f$は連続写像だから,

\begin{align*} f(x_n)=x_{n+1} \Ra\ &\lim_{n\to\infty}f(x_n)=\lim_{n\to\infty}x_{n+1} \\\iff&f\bra{\lim_{n\to\infty}x_n}=\lim_{n\to\infty}x_{n+1} \\\iff&f(x)=x \end{align*}

が成り立つ.よって,$x$は$f$の不動点である.

[Step 3] $f$の不動点が唯一つであることを示す.

$x,y\in X$を$f$の不動点とすると,

\begin{align*} d(x,y) =d(f(x),f(y)) \le pd(x,y) \end{align*}

だから,$(1-p)d(x,y)\le0$である.

また,もとより$0\le(1-p)d(x,y)$だから$(1-p)d(x,y)=0$なので,$1-p\neq0$に注意すると$d(x,y)=0$を得る.

よって,非退化性より$x=y$となって不動点は唯一つである.

[Banachの不動点定理]は不動点が存在することを示す定理ですが,加えて

  • 不動点が一意であること
  • 任意の点から不動点を近似できること

が優れています.後者については,任意の点に$f$を繰り返し施すだけで不動点を近似できるわけですから,例えばプログラミングなどでも活躍しますね.

冒頭でも紹介しましたが,この[Banachの縮小写像]が分かっていれば,常微分方程式の解の存在と一意性に関する[Picard-Lindelöfの定理]のイメージも湧きやすくなります.

最後までありがとうございました!

参考になった方は是非シェアをお願いします!

フォローする

以下の関連記事もいかがですか?

SPONSORED LINK
関連記事

記事一覧はこちらからどうぞ!

記事一覧は

こちら

Twitterを

フォロー

大学院入試

解答例

大学受験

解説ブログ