行列のランク落ち，列フルランク，行フルランク，フルランクそれぞれのときのムーア・ペンローズ逆行列による連立一次方程式の解の意味について考える

本記事は以下の過去記事の内容を用います．

本記事は以下の過去記事の内容を既知とすると考えやすいです．

行列のランク落ち，列フルランク，行フルランク，フルランクそれぞれのときの4つの基本部分空間を図示する - エンジニアを目指す浪人のブログ

ムーア・ペンローズ逆行列(Moore-Penrose inverse)は擬似逆行列(pseudoinverse)と呼ばれることもあるとおり，行列が正則でない場合も連立一次方程式の解を逆行列を用いるように擬似的に表現することができます．この(擬似的な)解の意味の結果は文献[1]スライド5,6,7にまとまっていて，面白く感じたのでその結果を導出してまとめておくことにしました．連立一次方程式の解，最小二乗問題の解，最小ノルム解の関係も明らかになります．

=================================================================================

$\;$ 0. 準備
$\;$ 1. 最小二乗問題の解の集合と連立一次方程式の解の集合
$\;$ 2. ムーア・ペンローズ逆行列による連立一次方程式の解の意味

[ 0. 準備 ]

記号を準備します．

$\;\;\; \mathbf{R}^{n} \;\;\;\;\;\;\;\;$ $\mathbf{R}$ の要素を要素にもつ $n$ 次元ベクトルの集合
$\;\;\; \mathbf{R}^{m \times n} \;\;\;\;$ $\mathbf{R}$ の要素を要素にもつ $m \times n$ 行列の集合
$\;\;\; I_n \;\;\;\;\;\;\;\;\;\;$ $n \times n$ 単位行列
$\;\;\; x \;\;\;\;\;\;\;\;\;\;$ $n$ 次元ベクトル ( $x = [ x_1 \ \cdots \ x_n ]^T$ )
$\;\;\; A \;\;\;\;\;\;\;\;\;\;$ $m \times n$ 行列
$\;\;\; b \;\;\;\;\;\;\;\;\;\;$ $m$ 次元ベクトル
$\;\;\; C(A) \;\;\;\;\;$ $A$ の列空間
$\;\;\; A^+ \;\;\;\;\;\;\;\;$ $A$ のムーア・ペンローズ逆行列( $n \times m$ 行列 )

ムーア・ペンローズ逆行列 $A^+$ の定義は冒頭の過去記事(ムーア・ペンローズ逆行列の定義)にあります．

$\left\| \cdot \right\| \;\;\;$ (ユークリッド)ノルム $\left\| x \right\| = \sqrt{ x^T x } = \sqrt{ x_1^2 + \cdots + x_n^2 }$

[ 1. 最小二乗問題の解の集合と連立一次方程式の解の集合 ]

$A \in \mathbf{R}^{m \times n},\ b \in \mathbf{R}^{m}$ とします．最小二乗問題の解の集合 $\mathcal{X}$ と連立一次方程式の解の集合 $\mathcal{X}'$ は以下のように定義できます．

$\;\;\; \mathcal{X} \; = \{ x \in \mathbf{R}^n : \ \rho (x)= \left\| Ax - b \right\|^2 \ \mathrm{is \ minimized} \}$
$\;\;\; \mathcal{X}' = \{ x \in \mathbf{R}^n : \ Ax = b \}$

'--------------------------------------------------------------------------------------------------------------------------------------------
事実.

最小二乗問題の解と連立一次方程式の解は同じ形式で表現できる．

証明.

冒頭の過去記事(行列のランクに仮定をおかない)事実2.は以下である．

(1.1) $\;\;\;\;\;\; x \in \mathcal{X} \;\; \Longleftrightarrow \;\; x = A^+ b + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n$

冒頭の過去記事(ムーア・ペンローズ逆行列による連立一次方程式)定理 6.2(存在). と定理 6.3.より以下が成り立つ．

(1.2) $\;\;\; [ b \in C(A) ] \;\; \Longrightarrow \;\; [ x \in \mathcal{X}' \; \Longleftrightarrow \; x = A^+ b + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n ]$
(1.3) $\;\;\; [ b \notin C(A) ] \;\; \Longleftrightarrow \;\; [ \mathcal{X}'= \emptyset ]$

(証明終わり)
'--------------------------------------------------------------------------------------------------------------------------------------------

[ 2. ムーア・ペンローズ逆行列による連立一次方程式の解の意味 ]

行列 $A$ のランク落ち，列フルランク，行フルランク，フルランクにパターン分けし，それぞれの場合において $x = A ^+ b$ がどのような意味をもつのかを考えていきます．

パターン1. (ランク落ち)

$x = A ^+ b$ は連立一次方程式 $A x = b$ の二乗誤差 $\left\| Ax - b \right\|^2$ を最小化する点のうち最小のノルムをもつただ一つの点です．

理由: $b \notin C(A)$ のとき， $\mathcal{X},\mathcal{X}'$ は以下となり，最小二乗問題の解と連立一次方程式の解は同じ形式で表されそれぞれ無数にあります．

(2.1.1) $\;\;\; \mathcal{X} \; = \{ x \in \mathbf{R}^n : \ \rho (x)= \left\| Ax - b \right\|^2 \ \mathrm{is \ minimized} \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n \} \;\;\; \because$ (1.1)

(2.1.2) $\;\;\; \mathcal{X}' = \emptyset \;\;\; \because$ (1.3)

(2.1.3) $\;\;\; \mathcal{X}' \subset \mathcal{X}$

ここで $A^+ b \in \mathcal{X}$ について考えます．冒頭の過去記事(行列のランクに仮定をおかない)事実4.よりこの解はすべての $x \in \mathcal{X}$ の中で最小のノルムをもつただ一つの解です．

$b \in C(A)$ のときはほぼ同様にして以下となります．

(2.1.4) $\;\;\; \mathcal{X} \; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n \} \;\;\; \because$ (2.1.1)に同じ

(2.1.5) $\;\;\; \mathcal{X}' = \{ x \in \mathbf{R}^n : \ A x = b \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n \} \;\;\; \because$ (1.2)

(2.1.6) $\;\;\; \mathcal{X}' = \mathcal{X}$

ここで $A^+ b \in \mathcal{X} \ (= \mathcal{X}')$ について考えます．冒頭の過去記事(行列のランクに仮定をおかない)事実4.よりこの解はすべての $x \in \mathcal{X} \ (= \mathcal{X}')$ の中で最小のノルムをもつただ一つの解です．

パターン2. (列フルランク)

$x = A ^+ b$ は連立一次方程式 $A x = b$ の二乗誤差 $\left\| Ax - b \right\|^2$ を最小化するただ一つの点です．

補足: このパターンは多くの教科書等において最小二乗法として説明されている場合であり，冒頭の過去記事(最小二乗法)の内容と実質的に同じものです．

理由: $b \notin C(A)$ のとき，列フルランクより $A^+ A = I_n$ となるので $\mathcal{X},\mathcal{X}'$ は以下となり，最小二乗問題の解はただ一つに決まります．この内容は冒頭の過去記事(行列のランクに仮定をおかない)事実5.と同じことを意味しています．

(2.2.1) $\;\;\; \mathcal{X} \; = \{ x \in \mathbf{R}^n : \ \rho (x)= \left\| Ax - b \right\|^2 \ \mathrm{is \ minimized} \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n \} \;\;\; \because$ (1.1)
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - I_n)y, \;\;\; y \in \mathbf{R}^n \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ A^+ b \}$

(2.2.2) $\;\;\; \mathcal{X}' = \emptyset \;\;\; \because$ (1.3)

(2.2.3) $\;\;\; \mathcal{X}' \subset \mathcal{X}$

$b \in C(A)$ のときはほぼ同様にして以下となります．

(2.2.4) $\;\;\; \mathcal{X} \; = \{ A^+ b \} \;\;\; \because$ (2.2.1)に同じ

(2.2.5) $\;\;\; \mathcal{X}' = \{ A^+ b \} \;\;\; \because$ (1.2)を用いて(2.2.1)と同様に計算する

(2.2.6) $\;\;\; \mathcal{X}' = \mathcal{X}$

パターン3. (行フルランク)

$x = A ^+ b$ は連立一次方程式 $A x = b$ の無数の解のうち最小のノルムをもつただ一つの点です．

補足: このパターンは冒頭の過去記事(最小ノルム解)の内容と実質的に同じものです．また文献[3]に参考になる図があります．

理由: 行フルランクのとき常に $b \in C(A)$ です． $\mathcal{X},\mathcal{X}'$ は以下となり，最小二乗問題の解と連立一次方程式の解は同じ形式で表されそれぞれ無数にあります．

(2.3.1) $\;\;\; \mathcal{X} \; = \{ x \in \mathbf{R}^n : \ \rho (x)= \left\| Ax - b \right\|^2 \ \mathrm{is \ minimized} \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n \} \;\;\; \because$ (1.1)

(2.3.2) $\;\;\; \mathcal{X}' = \{ x \in \mathbf{R}^n : \ A x = b \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n \} \;\;\; \because$ (1.2)

(2.3.3) $\;\;\; \mathcal{X}' = \mathcal{X}$

パターン4. (フルランク)

$x = A ^+ b$ は連立一次方程式 $A x = b$ のただ一つの解です．

理由: フルランクのとき常に $b \in C(A)$ です． $A^+ = A^{-1}$ となるので $\mathcal{X},\mathcal{X}'$ は以下となり，最小二乗問題の解と連立一次方程式の解はそれぞれただ一つに決まり，それらは同じものです．

(2.4.1) $\;\;\; \mathcal{X} \; = \{ x \in \mathbf{R}^n : \ \rho (x)= \left\| Ax - b \right\|^2 \ \mathrm{is \ minimized} \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^+ b \; + (I_n - A^+ A)y, \;\;\; y \in \mathbf{R}^n \} \;\;\; \because$ (1.1)
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^{-1} b + (I_n - A^{-1} A)y, \;\;\; y \in \mathbf{R}^n \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^{-1} b + (I_n - \;\; I_n)y, \;\;\; y \in \mathbf{R}^n \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ x \in \mathbf{R}^n : \ x = A^{-1} b \}$
$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \{ A^{-1} b \} \; (= \{ A^+ b \} )$