エンジニアを目指す浪人のブログ

情報系に役立ちそうな応用数理をゆるめにメモします

一般化逆行列の定義の意味について考える

勉強を進めていて,一般化逆行列(generalized inverse)というものを知りました.その定義の意味についてモヤモヤしてしまったので,調べてまとめることにしました.


問題を設定するため,いくつか準備をします.

以下の定義を文献[3]から引用します(記号を一部変更しています).
---------------------------------------------------------------------------------------------------------------------------------------------
定義1. {\displaystyle m \times n } 行列を {\displaystyle A }{\displaystyle m \times m } 単位行列{\displaystyle I_m } とする.
{\displaystyle A_L^{-1} A=I_n } をみたす {\displaystyle n \times m } 行列 {\displaystyle A_L^{-1} } が存在するとき,{\displaystyle A } は左正則(left invertible)である,といい {\displaystyle A_L^{-1} } を左逆行列(left inverse)という.
{\displaystyle A A_R^{-1}=I_m } をみたす {\displaystyle n \times m } 行列 {\displaystyle A_R^{-1} } が存在するとき,{\displaystyle A } は右正則(right invertible)である,といい {\displaystyle A_R^{-1} } を右逆行列(right inverse)という.
---------------------------------------------------------------------------------------------------------------------------------------------

{\displaystyle m \times m } 行列 {\displaystyle A }{\displaystyle AA^{-1}=A^{-1}A=I_m } をみたす逆行列 {\displaystyle A^{-1} } が存在するとき,{\displaystyle A } は正則である,といいます.


以上の設定のもとで,本記事の目的に進みます.文献[1][2]を参考にして一般化逆行列の定義の意味を考えていきます.

{\displaystyle m \times n } 行列 {\displaystyle A } についての連立一次方程式を考えます.{\displaystyle \mathcal{C}(A) }{\displaystyle A } の列空間です.以下の {\displaystyle y \in \mathcal{C}(A) }{\displaystyle Ax=y } が解をもつための必要条件です(文献[5][6]にあります).

(1.0){\displaystyle \;\;\; Ax=y,\;\;\; y \in \mathcal{C}(A) }

{\displaystyle A } が正則,左正則,右正則のとき,この方程式の解を {\displaystyle x=A^{-1}y, \ A_L^{-1}y, \ A_R^{-1}y} と表現することができます.またそれぞれの場合に以下が成り立ちます.

(1.1){\displaystyle \;\;\; A A^{-1} A=A}
(1.2){\displaystyle \;\;\; A A_L^{-1} A=A}
(1.3){\displaystyle \;\;\; A A_R^{-1} A=A}

これらの逆行列が存在しないとき,(1.0)の解を {\displaystyle x=Gy } の形式で表現することができるでしょうか.このような {\displaystyle n \times m } 行列 {\displaystyle G } が存在するとき以下が成り立ちます.

(1.4){\displaystyle \;\;\; AGy=y, \;\;\; y \in \mathcal{C}(A) }

ここで {\displaystyle r = \mathrm{rank} \ A } とします.{\displaystyle y }{\displaystyle \mathcal{C}(A)} の基底 {\displaystyle v_1,\ldots,v_r } と定数 {\displaystyle c_1,\ldots,c_r } を用いて線形結合 {\displaystyle y=c_1 v_1 + \cdots + c_r v_r } とかけます.すると以下が成り立ちます.

{\displaystyle \;\;\; AGy=y }
{\displaystyle \;\;\;\;\;\;\;\; \Leftrightarrow \; AG(c_1 v_1 + \cdots + c_r v_r)=c_1 v_1 + \cdots + c_r v_r }
{\displaystyle \;\;\;\;\;\;\;\; \Leftrightarrow \; c_1 AG v_1 + \cdots + c_r AG v_r=c_1 v_1 + \cdots + c_r v_r }
{\displaystyle \;\;\;\;\;\;\;\; \Leftrightarrow \; AG v_i =v_i, \;\; i \in \{ 1,\ldots,r \} }

このことと {\displaystyle A } の各列は {\displaystyle y } と同様に {\displaystyle v_1,\ldots,v_r } の線形結合で表されることから以下を得ます.

(1.5){\displaystyle \;\;\; \forall y \in \mathcal{C}(A), \;\;\; [ AGy=y ] \; \Leftrightarrow \; [ AGA=A ] }

この {\displaystyle G } を一般化逆行列といいます.等価な二つの定義を以下に示します.Rao and Mitra(1972)から引用します(記法を若干変更しています).以上に考えてきたことのまとめになっています.
---------------------------------------------------------------------------------------------------------------------------------------------
定義 2.1. {\displaystyle m \times n } 行列を {\displaystyle A }{\displaystyle n \times m } 行列を {\displaystyle G } とする.方程式 {\displaystyle Ax=y } が少なくとも一つの解をもつような任意の {\displaystyle y } について {\displaystyle x=Gy }{\displaystyle Ax=y } の解となるとき,{\displaystyle G }{\displaystyle A } の一般化逆行列である,という.

定義 2.2. {\displaystyle AGA=A } が成り立つとき,{\displaystyle G }{\displaystyle A } の一般化逆行列である,という.
---------------------------------------------------------------------------------------------------------------------------------------------

上の定義から(なんとなく)わかるように,一般にある {\displaystyle A } についての一般化逆行列はただ一つとは限りません.一般化逆行列が存在し {\displaystyle m=n=\mathrm{rank} \ A } のとき {\displaystyle G=A^{-1} } となりただ一つに決まります.(1.1)(1.2)(1.3)より,{\displaystyle A^{-1}, A_L^{-1}, A_R^{-1} } は一般化逆行列 {\displaystyle G } の特別な場合であることがわかります.


以上,一般化逆行列の定義について考えてみました."一般化"という名称の意味がイメージできるようになったと思います.

 

参考文献
[1] Rao,C.R., and Mitra, S.K.(1972), Generalized inverse of a matrix and its applications, Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Theory of Statistics, University of California Press, Berkeley, Calif: 601-620.
[2] Wikipedia Generalized inverse のページ https://en.wikipedia.org/wiki/Generalized_inverse
[3] University of California, Berkeley Minseon Shin様のノート https://math.berkeley.edu/~shinms/SP14-54/left-right-invertible-matrices.pdf
[4] University of Puget Sound Ross MacAusland様のノート http://buzzard.ups.edu/courses/2014spring/420projects/math420-UPS-spring-2014-macausland-pseudo-inverse.pdf
[5] Massachusetts Institute of Technology Gilbert Strang先生のノート https://ocw.mit.edu/courses/mathematics/18-06sc-linear-algebra-fall-2011/ax-b-and-the-four-subspaces/column-space-and-nullspace/MIT18_06SCF11_Ses1.6sum.pdf
[6] Massachusetts Institute of Technology Gilbert Strang先生のノート https://ocw.mit.edu/courses/mathematics/18-06sc-linear-algebra-fall-2011/ax-b-and-the-four-subspaces/solving-ax-b-row-reduced-form-r/MIT18_06SCF11_Ses1.8sum.pdf

おまけ
[1] へのリンク https://pdfs.semanticscholar.org/bbcc/e916e55b28b283f37f67d36002f375cb9424.pdf