Algebraic element satisfying some of the criteria of an inverse
"Pseudoinverse" redirects here. For the Moore–Penrose inverse, sometimes referred to as "the pseudoinverse", see
Moore–Penrose inverse .
수학(mathematics) , 특히 대수학(algebra) 에서, 원소 x 의 일반화된 역 (generalized inverse , 또는 g-inverse )은 역 원소(inverse element) 의 일부 속성을 가지지만 반드시 모든 속성을 가질 필요는 없는 원소 y 입니다. 행렬의 일반화된 역을 구성하는 목적은 역-가능 행렬(invertible matrices) 보다 더 넓은 행렬의 클래스에 대해 어떤 의미에서 역으로 작용할 수 있는 행렬을 얻는 것입니다. 일반화된 역은 결합적 곱셈을 포함하는 임의의 수학적 구조(mathematical structure) , 즉 반그룹(semigroup) 에서 정의될 수 있습니다. 이 기사는 행렬(matrix)
A
{\displaystyle A}
의 일반화된 역에 대해 설명합니다.
행렬
A
g
∈
R
n
×
m
{\displaystyle A^{\mathrm {g} }\in \mathbb {R} ^{n\times m}}
은
A
A
g
A
=
A
{\displaystyle AA^{\mathrm {g} }A=A}
이면 행렬
A
∈
R
m
×
n
{\displaystyle A\in \mathbb {R} ^{m\times n}}
의 일반화된 역입니다.[1] [2] [3] 일반화된 역은 임의적인 행렬에 대해 존재하고, 행렬이 정규 역(regular inverse) 을 가질 때, 이 역은 그것의 고유한 일반화된 역입니다.[1]
Motivation
다음 선형 시스템(linear system) 을 생각해 보십시오:
A
x
=
y
{\displaystyle Ax=y}
여기서
A
{\displaystyle A}
는
n
×
m
{\displaystyle n\times m}
행렬이고
y
∈
R
(
A
)
{\displaystyle y\in {\mathcal {R}}(A)}
는
A
{\displaystyle A}
의 열 공간(column space) 입니다. 만약
A
{\displaystyle A}
가 비-특이(nonsingular) 이면 (이는
n
=
m
{\displaystyle n=m}
을 의미),
x
=
A
−
1
y
{\displaystyle x=A^{-1}y}
는 시스템의 해가 될 것입니다.
A
{\displaystyle A}
가 비특이이면, 다음임에 주목하십시오:
A
A
−
1
A
=
A
.
{\displaystyle AA^{-1}A=A.}
이제
A
{\displaystyle A}
가 직사각 (
n
≠
m
{\displaystyle n\neq m}
)이거나, 정사각이고 특이라고 가정합니다. 그런-다음 모든
y
∈
R
(
A
)
{\displaystyle y\in {\mathcal {R}}(A)}
에 대해, 다음임을 만족하는
m
×
n
{\displaystyle m\times n}
순서의 올바른 후보
G
{\displaystyle G}
가 필요합니다:
A
G
y
=
y
.
{\displaystyle AGy=y.}
[4]
즉,
x
=
G
y
{\displaystyle x=Gy}
는 선형 시스템
A
x
=
y
{\displaystyle Ax=y}
의 해입니다. 동등하게, 우리는 다음임을 만족하는
m
×
n
{\displaystyle m\times n}
순서의 행렬
G
{\displaystyle G}
가 필요합니다:
A
G
A
=
A
.
{\displaystyle AGA=A.}
따라서 다음과 같이 일반화된 역 을 정의할 수 있습니다:
m
×
n
{\displaystyle m\times n}
행렬
A
{\displaystyle A}
가 주어졌을 때,
n
×
m
{\displaystyle n\times m}
행렬
G
{\displaystyle G}
는
A
G
A
=
A
{\displaystyle AGA=A}
이면
A
{\displaystyle A}
의 일반화된 역이라고 말합니다.[1] [2] [3] 행렬
A
−
1
{\displaystyle A^{-1}}
은 일부 저자에 의해
A
{\displaystyle A}
의 정규 역 (regular inverse )이라고 이름-지어져 왔습니다.
Types
일반화된 역의 중요한 유형은 다음을 포함합니다:
한-쪽 역(One-sided inverse , 즉, 오른쪽 역 또는 왼쪽 역)
오른쪽 역: 만약 행렬
A
{\displaystyle A}
가 차원
n
×
m
{\displaystyle n\times m}
과
rank
(
A
)
=
n
{\displaystyle {\textrm {rank}}(A)=n}
를 가지면,
A
A
R
−
1
=
I
n
{\displaystyle AA_{\mathrm {R} }^{-1}=I_{n}}
을 만족하는
A
{\displaystyle A}
의 오른쪽 역이라고 불리는
m
×
n
{\displaystyle m\times n}
행렬
A
R
−
1
{\displaystyle A_{\mathrm {R} }^{-1}}
가 존재하며, 여기서
I
n
{\displaystyle I_{n}}
는
n
×
n
{\displaystyle n\times n}
항등 행렬(identity matrix) 입니다.
왼쪽 역: 만약 행렬
A
{\displaystyle A}
가 차원
n
×
m
{\displaystyle n\times m}
과
rank
(
A
)
=
m
{\displaystyle {\textrm {rank}}(A)=m}
를 가지면,
A
L
−
1
A
=
I
m
{\displaystyle A_{\mathrm {L} }^{-1}A=I_{m}}
를 만족하는 왼쪽 역이라고 불리는
m
×
n
{\displaystyle m\times n}
행렬
A
L
−
1
{\displaystyle A_{\mathrm {L} }^{-1}}
가 존재하며, 여기서
I
m
{\displaystyle I_{m}}
는
m
×
m
{\displaystyle m\times m}
항등 행렬입니다.[5]
보트-더핀 역(Bott–Duffin inverse)
드레이즌 역(Drazin inverse)
무어-펜로즈 역(Moore–Penrose inverse)
일부 일반화된 역은 펜로즈 조건에 따라 정의되고 분류됩니다:
A
A
g
A
=
A
{\displaystyle AA^{\mathrm {g} }A=A}
A
g
A
A
g
=
A
g
{\displaystyle A^{\mathrm {g} }AA^{\mathrm {g} }=A^{\mathrm {g} }}
(
A
A
g
)
∗
=
A
A
g
{\displaystyle (AA^{\mathrm {g} })^{*}=AA^{\mathrm {g} }}
(
A
g
A
)
∗
=
A
g
A
,
{\displaystyle (A^{\mathrm {g} }A)^{*}=A^{\mathrm {g} }A,}
여기서
∗
{\displaystyle {}^{*}}
는 켤레 전치를 나타냅니다. 만약
A
g
{\displaystyle A^{\mathrm {g} }}
가 첫 번째 조건을 만족시키면, 그것은
A
{\displaystyle A}
의 일반화된 역 입니다. 만약 그것이 처음 두 조건을 만족시키면, 그것은
A
{\displaystyle A}
의 반사적 일반화된 역 (reflexive generalized inverse )입니다. 만약 그것이 네 가지 조건을 모두 만족시키면, 그것은
A
{\displaystyle A}
의 유사-역 (pseudoinverse )이며, 이는
A
+
{\displaystyle A^{+}}
로 표시되고 일라이어킴 헤이스팅스 무어(E. H. Moore) 와 로저 펜로즈(Roger Penrose) 의 선구적인 연구 후에 무어-펜로즈 역 (Moore–Penrose inverse )으로도 알려져 있습니다.[2] [6] [7] [8] [9] [10] 위에 나열된 펜로즈 조건의 부분집합
I
⊂
{
1
,
2
,
3
,
4
}
{\displaystyle I\subset \{1,2,3,4\}}
를 만족시키는 역으로
A
{\displaystyle A}
의
I
{\displaystyle I}
-역(
I
{\displaystyle I}
-inverse )을 정의하는 것이 편리합니다.
A
(
1
,
4
)
A
A
(
1
,
3
)
=
A
+
{\displaystyle A^{(1,4)}AA^{(1,3)}=A^{+}}
와 같은 관계는
I
{\displaystyle I}
-역의 이들 서로 다른 클래스 사이에 수립될 수 있습니다.[1]
A
{\displaystyle A}
가 비특이일 때, 임의의 일반화된 역
A
g
=
A
−
1
{\displaystyle A^{\mathrm {g} }=A^{-1}}
이고 따라서 고유합니다. 특이
A
{\displaystyle A}
에 대해, 드레이즌 역과 무어-펜로즈 역과 같은 일부 일반화된 역은 고유하지만, 다른 역은 반드시 고유하게 정의되는 것은 아닙니다.
Examples
Reflexive generalized inverse
다음이라고 놓습니다:
A
=
[
1
2
3
4
5
6
7
8
9
]
,
G
=
[
−
5
3
2
3
0
4
3
−
1
3
0
0
0
0
]
.
{\displaystyle A={\begin{bmatrix}1&2&3\\4&5&6\\7&8&9\end{bmatrix}},\quad G={\begin{bmatrix}-{\frac {5}{3}}&{\frac {2}{3}}&0\\[4pt]{\frac {4}{3}}&-{\frac {1}{3}}&0\\[4pt]0&0&0\end{bmatrix}}.}
det
(
A
)
=
0
{\displaystyle \det(A)=0}
이기 때문에,
A
{\displaystyle A}
는 특이이고 정규 역을 가지지 않습니다. 어쨌든,
A
{\displaystyle A}
와
G
{\displaystyle G}
는 펜로즈 조건 (1)과 (2)를 만족시키지만, (3) 또는 (4)는 만족시키지 않습니다. 그러므로,
G
{\displaystyle G}
는
A
{\displaystyle A}
의 반사적 일반화된 역을 가집니다.
One-sided inverse
다음이라고 놓습니다:
A
=
[
1
2
3
4
5
6
]
,
A
R
−
1
=
[
−
17
18
8
18
−
2
18
2
18
13
18
−
4
18
]
.
{\displaystyle A={\begin{bmatrix}1&2&3\\4&5&6\end{bmatrix}},\quad A_{\mathrm {R} }^{-1}={\begin{bmatrix}-{\frac {17}{18}}&{\frac {8}{18}}\\[4pt]-{\frac {2}{18}}&{\frac {2}{18}}\\[4pt]{\frac {13}{18}}&-{\frac {4}{18}}\end{bmatrix}}.}
A
{\displaystyle A}
가 정사각이 아니기 때문에,
A
{\displaystyle A}
는 정규 역을 가지지 않습니다. 어쨌든,
A
R
−
1
{\displaystyle A_{\mathrm {R} }^{-1}}
는
A
{\displaystyle A}
의 오른쪽 역입니다. 행렬
A
{\displaystyle A}
는 왼쪽 역을 가지지 않습니다.
Inverse of other semigroups (or rings)
원소 b 가 원소 a 의 일반화된 역인 것과 임의의 반그룹 (또는 링, 왜냐하면 임의의 링에서 곱셈 함수가 반그룹이기 때문)에서,
a
⋅
b
⋅
a
=
a
{\displaystyle a\cdot b\cdot a=a}
인 것은 필요충분 조건입니다.
링
Z
/
12
Z
{\displaystyle \mathbb {Z} /12\mathbb {Z} }
에서 원소 3의 일반화된 역은 3, 7, 및 11인데, 왜냐하면 링
Z
/
12
Z
{\displaystyle \mathbb {Z} /12\mathbb {Z} }
에서 다음이기 때문입니다:
3
⋅
3
⋅
3
=
3
{\displaystyle 3\cdot 3\cdot 3=3}
3
⋅
7
⋅
3
=
3
{\displaystyle 3\cdot 7\cdot 3=3}
3
⋅
11
⋅
3
=
3
{\displaystyle 3\cdot 11\cdot 3=3}
링
Z
/
12
Z
{\displaystyle \mathbb {Z} /12\mathbb {Z} }
에서 원소 4의 일반화된 역은 1, 4, 7, 및 10인데, 왜냐하면 링
Z
/
12
Z
{\displaystyle \mathbb {Z} /12\mathbb {Z} }
에서 다음이기 때문입니다:
4
⋅
1
⋅
4
=
4
{\displaystyle 4\cdot 1\cdot 4=4}
4
⋅
4
⋅
4
=
4
{\displaystyle 4\cdot 4\cdot 4=4}
4
⋅
7
⋅
4
=
4
{\displaystyle 4\cdot 7\cdot 4=4}
4
⋅
10
⋅
4
=
4
{\displaystyle 4\cdot 10\cdot 4=4}
만약 반그룹 (또는 링)에서 원소 a 가 역을 가지면, 그 역은 링
Z
/
12
Z
{\displaystyle \mathbb {Z} /12\mathbb {Z} }
에서 원소 1, 5, ,7 및 11과 같이 이 원소의 유일한 일반화된 역이어야 합니다.
링
Z
/
12
Z
{\displaystyle \mathbb {Z} /12\mathbb {Z} }
에서, 임의의 원소는 0의 일반화된 역이고, 어쨌든, 2는 일반화된 역을 가지지 않는데, 왜냐하면
2
⋅
b
⋅
2
=
2
{\displaystyle 2\cdot b\cdot 2=2}
를 만족하는 에서 b 가 없기 때문입니다.
Construction
다음 특성은 확인하기 쉽습니다:
비-특이 행렬(non-square matrix)
A
{\displaystyle A}
의 오른쪽 역은
A
R
−
1
=
A
⊺
(
A
A
⊺
)
−
1
{\displaystyle A_{\mathrm {R} }^{-1}=A^{\intercal }\left(AA^{\intercal }\right)^{-1}}
에 의해 제공되며,
A
{\displaystyle A}
가 완전한 행 랭크를 가잔다는 조건으로 합니다.[5]
비-정사각 행렬
A
{\displaystyle A}
의 왼쪽 역은
A
L
−
1
=
(
A
⊺
A
)
−
1
A
⊺
{\displaystyle A_{\mathrm {L} }^{-1}=\left(A^{\intercal }A\right)^{-1}A^{\intercal }}
에 의해 제공되며,
A
{\displaystyle A}
가 완전한 열 랭크를 가짐을 조건으로 합니다.[5]
만약
A
=
B
C
{\displaystyle A=BC}
가 랭크 인수분해(rank factorization) 이면,
G
=
C
R
−
1
B
L
−
1
{\displaystyle G=C_{\mathrm {R} }^{-1}B_{\mathrm {L} }^{-1}}
는
A
{\displaystyle A}
의 g-역이며, 여기서
C
R
−
1
{\displaystyle C_{\mathrm {R} }^{-1}}
는
C
{\displaystyle C}
의 오른쪽 역이고
B
L
−
1
{\displaystyle B_{\mathrm {L} }^{-1}}
은
B
{\displaystyle B}
의 왼쪽 역입니다.
만약 임의의 비-특이 행렬
P
{\displaystyle P}
와
Q
{\displaystyle Q}
에 대해
A
=
P
[
I
r
0
0
0
]
Q
{\displaystyle A=P{\begin{bmatrix}I_{r}&0\\0&0\end{bmatrix}}Q}
이면,
G
=
Q
−
1
[
I
r
U
W
V
]
P
−
1
{\displaystyle G=Q^{-1}{\begin{bmatrix}I_{r}&U\\W&V\end{bmatrix}}P^{-1}}
는 임의적인
U
,
V
{\displaystyle U,V}
, 및
W
{\displaystyle W}
에 대해
A
{\displaystyle A}
의 일반화된 역입니다.
A
{\displaystyle A}
를 랭크
r
{\displaystyle r}
의 행렬이라고 놓습니다. 일반성의 손실 없이, 다음이라고 놓습니다
A
=
[
B
C
D
E
]
,
{\displaystyle A={\begin{bmatrix}B&C\\D&E\end{bmatrix}},}
여기서
B
r
×
r
{\displaystyle B_{r\times r}}
은
A
{\displaystyle A}
의 비-특이 부분행렬입니다. 그런-다음,
G
=
[
B
−
1
0
0
0
]
{\displaystyle G={\begin{bmatrix}B^{-1}&0\\0&0\end{bmatrix}}}
이것이
A
{\displaystyle A}
의 일반화된 역인 것과
E
=
D
B
−
1
C
{\displaystyle E=DB^{-1}C}
인 것은 필요충분 조건입니다.
Uses
임의의 일반화된 역은 선형 방정식의 시스템 이 임의의 해를 가지는지 여부를 결정하기 위해 사용될 수 있고, 그렇다면 모든 해를 제공합니다. 만약 n × m 선형 시스템에 대한 해가 존재하면
A
x
=
b
{\displaystyle Ax=b}
,
이때 벡터
x
{\displaystyle x}
는 미지수이고 벡터
b
{\displaystyle b}
는 상수이며, 모든 해는 임의적인 벡터
w
{\displaystyle w}
에 대한 매개변수적으로 다음에 의해 제공됩니다:
x
=
A
g
b
+
[
I
−
A
g
A
]
w
{\displaystyle x=A^{\mathrm {g} }b+\left[I-A^{\mathrm {g} }A\right]w}
,
여기서
A
g
{\displaystyle A^{\mathrm {g} }}
는
A
{\displaystyle A}
의 임의의 일반화된 역입니다. 해가 존재하는 것과
A
A
g
b
=
b
{\displaystyle AA^{\mathrm {g} }b=b}
인 것은 필요충분 조건입니다. 만약 A 가 완전한 열 랭크를 가지면, 이 방정식에서 괄호친 표현은 영 행렬이고 따라서 해는 고유합니다.[11]
Generalized inverses of matrices
행렬의 일반화된 역은 다음과 같이 특징지을 수 있습니다.
A
∈
R
m
×
n
{\displaystyle A\in \mathbb {R} ^{m\times n}}
라고 놓고, 다음을
A
=
U
[
Σ
1
0
0
0
]
V
T
{\displaystyle A=U{\begin{bmatrix}\Sigma _{1}&0\\0&0\end{bmatrix}}V^{\textsf {T}}}
그것의 특이-값 분해(singular-value decomposition) 라고 놓습니다. 그런-다음 임의의 일반화된 역
A
g
{\displaystyle A^{g}}
에 대해, 다음임을 만족하는 행렬
X
{\displaystyle X}
,
Y
{\displaystyle Y}
, 및
Z
{\displaystyle Z}
가 존재합니다:[1]
A
g
=
V
[
Σ
1
−
1
X
Y
Z
]
U
T
.
{\displaystyle A^{g}=V{\begin{bmatrix}\Sigma _{1}^{-1}&X\\Y&Z\end{bmatrix}}U^{\textsf {T}}.}
반대로, 이 형식의 행렬에 대해
X
{\displaystyle X}
,
Y
{\displaystyle Y}
, 및
Z
{\displaystyle Z}
의 임의의 선택은
A
{\displaystyle A}
의 일반화된 역입니다.[1]
{
1
,
2
}
{\displaystyle \{1,2\}}
-역은 정확히
Z
=
Y
Σ
1
X
{\displaystyle Z=Y\Sigma _{1}X}
에 대한 것이고,
{
1
,
3
}
{\displaystyle \{1,3\}}
-역은 정확히
X
=
0
{\displaystyle X=0}
에 대한 것이고,
{
1
,
4
}
{\displaystyle \{1,4\}}
-역은 정확히
Y
=
0
{\displaystyle Y=0}
에 대한 것입니다. 특히, 유사역은
X
=
Y
=
Z
=
0
{\displaystyle X=Y=Z=0}
에 의해 제공됩니다:
A
+
=
V
[
Σ
1
−
1
0
0
0
]
U
T
.
{\displaystyle A^{+}=V{\begin{bmatrix}\Sigma _{1}^{-1}&0\\0&0\end{bmatrix}}U^{\textsf {T}}.}
Transformation consistency properties
실제 응용에서, 일반화된 역수에 의해 보존되어야 하는 행렬 변환의 클래스를 식별해야 합니다. 예를 들어, 무어-펜로즈 역,
A
+
{\displaystyle A^{+}}
은 유니태리 행렬 U 와 V 를 포함하는 변환에 관해 다음과 같은 일관성의 정의를 만족시킵니다:
(
U
A
V
)
+
=
V
∗
A
+
U
∗
{\displaystyle (UAV)^{+}=V^{*}A^{+}U^{*}}
.
드레이즌 역,
A
D
{\displaystyle A^{\mathrm {D} }}
은 비-특이 행렬 S 를 포함하는 닮음 변환에 관해 일관성의 다음 정의를 만족시킵니다:
(
S
A
S
−
1
)
D
=
S
A
D
S
−
1
{\displaystyle \left(SAS^{-1}\right)^{\mathrm {D} }=SA^{\mathrm {D} }S^{-1}}
.
단위-일관된 (UC) 역,[12]
A
U
{\displaystyle A^{\mathrm {U} }}
은 비-특이 대각 행렬 D 와 E 를 포함하는 변환에 관해 일관성의 다음 정의를 만족시킵니다:
(
D
A
E
)
U
=
E
−
1
A
U
D
−
1
{\displaystyle (DAE)^{\mathrm {U} }=E^{-1}A^{\mathrm {U} }D^{-1}}
.
무어-펜로즈 역이 회전 (이는 직교 변환)에 관해 일관성을 제공한다는 사실은 유클리드 거리가 보존되어야 하는 물리학과 기타 응용 분야에서 널리 사용되는 이유를 설명합니다. 대조적으로, UC 역은 시스템 행동이 다른 상태 변수, 예를 들어, 마일 대 킬로미터에 대한 단위의 선택에 관해 불변일 것으로 예상되는 경우에 적용될 수 있습니다.
See also
Citations
^ a b c d e f Ben-Israel & Greville 2003 , pp. 2, 7
^ a b c Nakamura 1991 , pp. 41–42
^ a b Rao & Mitra 1971 , pp. vii, 20
^ Rao & Mitra 1971 , p. 24
^ a b c Rao & Mitra 1971 , p. 19
^ Rao & Mitra 1971 , pp. 20, 28, 50–51
^ Ben-Israel & Greville 2003 , p. 7
^ Campbell & Meyer 1991 , p. 10
^ James 1978 , p. 114
^ Nakamura 1991 , p. 42
^ James 1978 , pp. 109–110
^ Uhlmann 2018
Sources
Textbook
Ben-Israel, Adi ; Greville, Thomas Nall Eden (2003). Generalized Inverses: Theory and Applications (2nd ed.). New York, NY: Springer. doi :10.1007/b97366 . ISBN 978-0-387-00293-4 .
Campbell, Stephen L.; Meyer, Carl D. (1991). Generalized Inverses of Linear Transformations . Dover. ISBN 978-0-486-66693-8 .
Horn, Roger Alan ; Johnson, Charles Royal (1985). Matrix Analysis . Cambridge University Press . ISBN 978-0-521-38632-6 .
Nakamura, Yoshihiko (1991). Advanced Robotics: Redundancy and Optimization . Addison-Wesley. ISBN 978-0201151985 .
Rao, C. Radhakrishna; Mitra, Sujit Kumar (1971). Generalized Inverse of Matrices and its Applications . New York: John Wiley & Sons. pp. 240 . ISBN 978-0-471-70821-6 .
Publication