Generalized inverse

수학(mathematics), 특히 대수학(algebra)에서, 원소 x의 일반화된 역(generalized inverse, 또는 g-inverse)은 역 원소(inverse element)의 일부 속성을 가지지만 반드시 모든 속성을 가질 필요는 없는 원소 y입니다. 행렬의 일반화된 역을 구성하는 목적은 역-가능 행렬(invertible matrices)보다 더 넓은 행렬의 클래스에 대해 어떤 의미에서 역으로 작용할 수 있는 행렬을 얻는 것입니다. 일반화된 역은 결합적 곱셈을 포함하는 임의의 수학적 구조(mathematical structure), 즉 반그룹(semigroup)에서 정의될 수 있습니다. 이 기사는 행렬(matrix) $A$ 의 일반화된 역에 대해 설명합니다.

행렬 $A^{\mathrm {g} }\in \mathbb {R} ^{n\times m}$ 은 $AA^{\mathrm {g} }A=A$ 이면 행렬 $A\in \mathbb {R} ^{m\times n}$ 의 일반화된 역입니다.^[1]^[2]^[3] 일반화된 역은 임의적인 행렬에 대해 존재하고, 행렬이 정규 역(regular inverse)을 가질 때, 이 역은 그것의 고유한 일반화된 역입니다.^[1]

Motivation

다음 선형 시스템(linear system)을 생각해 보십시오:

Ax=y

여기서 $A$ 는 $n\times m$ 행렬이고 $y\in {\mathcal {R}}(A)$ 는 $A$ 의 열 공간(column space)입니다. 만약 $A$ 가 비-특이(nonsingular)이면 (이는 $n=m$ 을 의미), $x=A^{-1}y$ 는 시스템의 해가 될 것입니다. $A$ 가 비특이이면, 다음임에 주목하십시오:

AA^{-1}A=A.

이제 $A$ 가 직사각 ( $n\neq m$ )이거나, 정사각이고 특이라고 가정합니다. 그런-다음 모든 $y\in {\mathcal {R}}(A)$ 에 대해, 다음임을 만족하는 $m\times n$ 순서의 올바른 후보 $G$ 가 필요합니다:

AGy=y.

^[4]

즉, $x=Gy$ 는 선형 시스템 $Ax=y$ 의 해입니다. 동등하게, 우리는 다음임을 만족하는 $m\times n$ 순서의 행렬 $G$ 가 필요합니다:

AGA=A.

따라서 다음과 같이 일반화된 역을 정의할 수 있습니다: $m\times n$ 행렬 $A$ 가 주어졌을 때, $n\times m$ 행렬 $G$ 는 $AGA=A$ 이면 $A$ 의 일반화된 역이라고 말합니다.‍^[1]^[2]^[3] 행렬 $A^{-1}$ 은 일부 저자에 의해 $A$ 의 정규 역(regular inverse)이라고 이름-지어져 왔습니다.

Types

일반화된 역의 중요한 유형은 다음을 포함합니다:

한-쪽 역(One-sided inverse, 즉, 오른쪽 역 또는 왼쪽 역)
- 오른쪽 역: 만약 행렬 $A$ 가 차원 $n\times m$ 과 ${\textrm {rank}}(A)=n$ 를 가지면, $AA_{\mathrm {R} }^{-1}=I_{n}$ 을 만족하는 $A$ 의 오른쪽 역이라고 불리는 $m\times n$ 행렬 $A_{\mathrm {R} }^{-1}$ 가 존재하며, 여기서 $I_{n}$ 는 $n\times n$ 항등 행렬(identity matrix)입니다.
- 왼쪽 역: 만약 행렬 $A$ 가 차원 $n\times m$ 과 ${\textrm {rank}}(A)=m$ 를 가지면, $A_{\mathrm {L} }^{-1}A=I_{m}$ 를 만족하는 왼쪽 역이라고 불리는 $m\times n$ 행렬 $A_{\mathrm {L} }^{-1}$ 가 존재하며, 여기서 $I_{m}$ 는 $m\times m$ 항등 행렬입니다.^[5]
보트-더핀 역(Bott–Duffin inverse)
드레이즌 역(Drazin inverse)
무어-펜로즈 역(Moore–Penrose inverse)

일부 일반화된 역은 펜로즈 조건에 따라 정의되고 분류됩니다:

$AA^{\mathrm {g} }A=A$
$A^{\mathrm {g} }AA^{\mathrm {g} }=A^{\mathrm {g} }$
$(AA^{\mathrm {g} })^{*}=AA^{\mathrm {g} }$
$(A^{\mathrm {g} }A)^{*}=A^{\mathrm {g} }A,$

여기서 ${}^{*}$ 는 켤레 전치를 나타냅니다. 만약 $A^{\mathrm {g} }$ 가 첫 번째 조건을 만족시키면, 그것은 $A$ 의 일반화된 역입니다. 만약 그것이 처음 두 조건을 만족시키면, 그것은 $A$ 의 반사적 일반화된 역(reflexive generalized inverse)입니다. 만약 그것이 네 가지 조건을 모두 만족시키면, 그것은 $A$ 의 유사-역(pseudoinverse)이며, 이는 $A^{+}$ 로 표시되고 일라이어킴 헤이스팅스 무어(E. H. Moore)와 로저 펜로즈(Roger Penrose)의 선구적인 연구 후에 무어-펜로즈 역(Moore–Penrose inverse)으로도 알려져 있습니다.^[2]^[6]^[7]^[8]^[9]^[10] 위에 나열된 펜로즈 조건의 부분집합 $I\subset \{1,2,3,4\}$ 를 만족시키는 역으로 $A$ 의 $I$ -역( $I$ -inverse)을 정의하는 것이 편리합니다. $A^{(1,4)}AA^{(1,3)}=A^{+}$ 와 같은 관계는 $I$ -역의 이들 서로 다른 클래스 사이에 수립될 수 있습니다.^[1]

$A$ 가 비특이일 때, 임의의 일반화된 역 $A^{\mathrm {g} }=A^{-1}$ 이고 따라서 고유합니다. 특이 $A$ 에 대해, 드레이즌 역과 무어-펜로즈 역과 같은 일부 일반화된 역은 고유하지만, 다른 역은 반드시 고유하게 정의되는 것은 아닙니다.

Examples

Reflexive generalized inverse

다음이라고 놓습니다:

A={\begin{bmatrix}1&2&3\\4&5&6\\7&8&9\end{bmatrix}},\quad G={\begin{bmatrix}-{\frac {5}{3}}&{\frac {2}{3}}&0\\[4pt]{\frac {4}{3}}&-{\frac {1}{3}}&0\\[4pt]0&0&0\end{bmatrix}}.

$\det(A)=0$ 이기 때문에, $A$ 는 특이이고 정규 역을 가지지 않습니다. 어쨌든, $A$ 와 $G$ 는 펜로즈 조건 (1)과 (2)를 만족시키지만, (3) 또는 (4)는 만족시키지 않습니다. 그러므로, $G$ 는 $A$ 의 반사적 일반화된 역을 가집니다.

One-sided inverse

다음이라고 놓습니다:

A={\begin{bmatrix}1&2&3\\4&5&6\end{bmatrix}},\quad A_{\mathrm {R} }^{-1}={\begin{bmatrix}-{\frac {17}{18}}&{\frac {8}{18}}\\[4pt]-{\frac {2}{18}}&{\frac {2}{18}}\\[4pt]{\frac {13}{18}}&-{\frac {4}{18}}\end{bmatrix}}.

$A$ 가 정사각이 아니기 때문에, $A$ 는 정규 역을 가지지 않습니다. 어쨌든, $A_{\mathrm {R} }^{-1}$ 는 $A$ 의 오른쪽 역입니다. 행렬 $A$ 는 왼쪽 역을 가지지 않습니다.

Inverse of other semigroups (or rings)

원소 b가 원소 a의 일반화된 역인 것과 임의의 반그룹 (또는 링, 왜냐하면 임의의 링에서 곱셈 함수가 반그룹이기 때문)에서, $a\cdot b\cdot a=a$ 인 것은 필요충분 조건입니다.

링 $\mathbb {Z} /12\mathbb {Z}$ 에서 원소 3의 일반화된 역은 3, 7, 및 11인데, 왜냐하면 링 $\mathbb {Z} /12\mathbb {Z}$ 에서 다음이기 때문입니다:

3\cdot 3\cdot 3=3

3\cdot 7\cdot 3=3

3\cdot 11\cdot 3=3

링 $\mathbb {Z} /12\mathbb {Z}$ 에서 원소 4의 일반화된 역은 1, 4, 7, 및 10인데, 왜냐하면 링 $\mathbb {Z} /12\mathbb {Z}$ 에서 다음이기 때문입니다:

4\cdot 1\cdot 4=4

4\cdot 4\cdot 4=4

4\cdot 7\cdot 4=4

4\cdot 10\cdot 4=4

만약 반그룹 (또는 링)에서 원소 a가 역을 가지면, 그 역은 링 $\mathbb {Z} /12\mathbb {Z}$ 에서 원소 1, 5, ,7 및 11과 같이 이 원소의 유일한 일반화된 역이어야 합니다.

링 $\mathbb {Z} /12\mathbb {Z}$ 에서, 임의의 원소는 0의 일반화된 역이고, 어쨌든, 2는 일반화된 역을 가지지 않는데, 왜냐하면 $2\cdot b\cdot 2=2$ 를 만족하는 에서 b가 없기 때문입니다.

Construction

다음 특성은 확인하기 쉽습니다:

비-특이 행렬(non-square matrix) $A$ 의 오른쪽 역은 $A_{\mathrm {R} }^{-1}=A^{\intercal }\left(AA^{\intercal }\right)^{-1}$ 에 의해 제공되며, $A$ 가 완전한 행 랭크를 가잔다는 조건으로 합니다.^[5]
비-정사각 행렬 $A$ 의 왼쪽 역은 $A_{\mathrm {L} }^{-1}=\left(A^{\intercal }A\right)^{-1}A^{\intercal }$ 에 의해 제공되며, $A$ 가 완전한 열 랭크를 가짐을 조건으로 합니다.^[5]
만약 $A=BC$ 가 랭크 인수분해(rank factorization)이면, $G=C_{\mathrm {R} }^{-1}B_{\mathrm {L} }^{-1}$ 는 $A$ 의 g-역이며, 여기서 $C_{\mathrm {R} }^{-1}$ 는 $C$ 의 오른쪽 역이고 $B_{\mathrm {L} }^{-1}$ 은 $B$ 의 왼쪽 역입니다.
만약 임의의 비-특이 행렬 $P$ 와 $Q$ 에 대해 $A=P{\begin{bmatrix}I_{r}&0\\0&0\end{bmatrix}}Q$ 이면, $G=Q^{-1}{\begin{bmatrix}I_{r}&U\\W&V\end{bmatrix}}P^{-1}$ 는 임의적인 $U,V$ , 및 $W$ 에 대해 $A$ 의 일반화된 역입니다.
$A$ 를 랭크 $r$ 의 행렬이라고 놓습니다. 일반성의 손실 없이, 다음이라고 놓습니다 $A={\begin{bmatrix}B&C\\D&E\end{bmatrix}},$ 여기서 $B_{r\times r}$ 은 $A$ 의 비-특이 부분행렬입니다. 그런-다음, $G={\begin{bmatrix}B^{-1}&0\\0&0\end{bmatrix}}$ 이것이 $A$ 의 일반화된 역인 것과 $E=DB^{-1}C$ 인 것은 필요충분 조건입니다.

Uses

임의의 일반화된 역은 선형 방정식의 시스템이 임의의 해를 가지는지 여부를 결정하기 위해 사용될 수 있고, 그렇다면 모든 해를 제공합니다. 만약 n × m 선형 시스템에 대한 해가 존재하면

Ax=b

,

이때 벡터 $x$ 는 미지수이고 벡터 $b$ 는 상수이며, 모든 해는 임의적인 벡터 $w$ 에 대한 매개변수적으로 다음에 의해 제공됩니다:

x=A^{\mathrm {g} }b+\left[I-A^{\mathrm {g} }A\right]w

,

여기서 $A^{\mathrm {g} }$ 는 $A$ 의 임의의 일반화된 역입니다. 해가 존재하는 것과 $AA^{\mathrm {g} }b=b$ 인 것은 필요충분 조건입니다. 만약 A가 완전한 열 랭크를 가지면, 이 방정식에서 괄호친 표현은 영 행렬이고 따라서 해는 고유합니다.^[11]

Generalized inverses of matrices

행렬의 일반화된 역은 다음과 같이 특징지을 수 있습니다. $A\in \mathbb {R} ^{m\times n}$ 라고 놓고, 다음을

$A=U{\begin{bmatrix}\Sigma _{1}&0\\0&0\end{bmatrix}}V^{\textsf {T}}$

그것의 특이-값 분해(singular-value decomposition)라고 놓습니다. 그런-다음 임의의 일반화된 역 $A^{g}$ 에 대해, 다음임을 만족하는 행렬 $X$ , $Y$ , 및 $Z$ 가 존재합니다:^[1]

$A^{g}=V{\begin{bmatrix}\Sigma _{1}^{-1}&X\\Y&Z\end{bmatrix}}U^{\textsf {T}}.$

반대로, 이 형식의 행렬에 대해 $X$ , $Y$ , 및 $Z$ 의 임의의 선택은 $A$ 의 일반화된 역입니다.^[1] $\{1,2\}$ -역은 정확히 $Z=Y\Sigma _{1}X$ 에 대한 것이고, $\{1,3\}$ -역은 정확히 $X=0$ 에 대한 것이고, $\{1,4\}$ -역은 정확히 $Y=0$ 에 대한 것입니다. 특히, 유사역은 $X=Y=Z=0$ 에 의해 제공됩니다:

$A^{+}=V{\begin{bmatrix}\Sigma _{1}^{-1}&0\\0&0\end{bmatrix}}U^{\textsf {T}}.$

Transformation consistency properties

실제 응용에서, 일반화된 역수에 의해 보존되어야 하는 행렬 변환의 클래스를 식별해야 합니다. 예를 들어, 무어-펜로즈 역, $A^{+}$ 은 유니태리 행렬 U와 V를 포함하는 변환에 관해 다음과 같은 일관성의 정의를 만족시킵니다:

(UAV)^{+}=V^{*}A^{+}U^{*}

.

드레이즌 역, $A^{\mathrm {D} }$ 은 비-특이 행렬 S를 포함하는 닮음 변환에 관해 일관성의 다음 정의를 만족시킵니다:

\left(SAS^{-1}\right)^{\mathrm {D} }=SA^{\mathrm {D} }S^{-1}

.

단위-일관된 (UC) 역,^[12] $A^{\mathrm {U} }$ 은 비-특이 대각 행렬 D와 E를 포함하는 변환에 관해 일관성의 다음 정의를 만족시킵니다:

(DAE)^{\mathrm {U} }=E^{-1}A^{\mathrm {U} }D^{-1}

.

무어-펜로즈 역이 회전 (이는 직교 변환)에 관해 일관성을 제공한다는 사실은 유클리드 거리가 보존되어야 하는 물리학과 기타 응용 분야에서 널리 사용되는 이유를 설명합니다. 대조적으로, UC 역은 시스템 행동이 다른 상태 변수, 예를 들어, 마일 대 킬로미터에 대한 단위의 선택에 관해 불변일 것으로 예상되는 경우에 적용될 수 있습니다.

Citations

^ ^a ^b ^c ^d ^e ^f Ben-Israel & Greville 2003, pp. 2, 7
^ ^a ^b ^c Nakamura 1991, pp. 41–42
^ ^a ^b Rao & Mitra 1971, pp. vii, 20
^ Rao & Mitra 1971, p. 24
^ ^a ^b ^c Rao & Mitra 1971, p. 19
^ Rao & Mitra 1971, pp. 20, 28, 50–51
^ Ben-Israel & Greville 2003, p. 7
^ Campbell & Meyer 1991, p. 10
^ James 1978, p. 114
^ Nakamura 1991, p. 42
^ James 1978, pp. 109–110
^ Uhlmann 2018

Sources

Textbook

Ben-Israel, Adi; Greville, Thomas Nall Eden (2003). Generalized Inverses: Theory and Applications (2nd ed.). New York, NY: Springer. doi:10.1007/b97366. ISBN 978-0-387-00293-4.
Campbell, Stephen L.; Meyer, Carl D. (1991). Generalized Inverses of Linear Transformations. Dover. ISBN 978-0-486-66693-8.
Horn, Roger Alan; Johnson, Charles Royal (1985). Matrix Analysis. Cambridge University Press. ISBN 978-0-521-38632-6.
Nakamura, Yoshihiko (1991). Advanced Robotics: Redundancy and Optimization. Addison-Wesley. ISBN 978-0201151985.
Rao, C. Radhakrishna; Mitra, Sujit Kumar (1971). Generalized Inverse of Matrices and its Applications. New York: John Wiley & Sons. pp. 240. ISBN 978-0-471-70821-6.

Publication

James, M. (June 1978). "The generalised inverse". The Mathematical Gazette. 62 (420): 109–114. doi:10.2307/3617665. JSTOR 3617665.
Uhlmann, Jeffrey K. (2018). "A Generalized Matrix Inverse that is Consistent with Respect to Diagonal Transformations" (PDF). SIAM Journal on Matrix Analysis and Applications. 239 (2): 781–800. doi:10.1137/17M113890X.
Zheng, Bing; Bapat, Ravindra (2004). "Generalized inverse A(2)T,S and a rank equation". Applied Mathematics and Computation. 155 (2): 407–415. doi:10.1016/S0096-3003(03)00786-0.

[:0-1] ^ ^a ^b ^c ^d ^e ^f Ben-Israel & Greville 2003, pp. 2, 7

[:1-2] Nakamura 1991, pp. 41–42

[:2-3] Rao & Mitra 1971, pp. vii, 20

[4] Rao & Mitra 1971, p. 24

[:4-5] Rao & Mitra 1971, p. 19

[6] Rao & Mitra 1971, pp. 20, 28, 50–51

[:3-7] Ben-Israel & Greville 2003, p. 7

[8] Campbell & Meyer 1991, p. 10

[9] James 1978, p. 114

[10] Nakamura 1991, p. 42

[11] James 1978, pp. 109–110

[12] Uhlmann 2018

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]