Matrices similar to diagonal matrices
This article is about matrix diagonalization in linear algebra. For other uses, see
Diagonalization .
선형 대수(linear algebra) 에서, 정사각 행렬(square matrix)
A
{\displaystyle A}
는 만약 그것이 대각 행렬 과 닮았으면 , 즉,
P
−
1
A
P
=
D
{\displaystyle P^{-1}AP=D}
, 또는 동등하게
A
=
P
D
P
−
1
{\displaystyle A=PDP^{-1}}
를 만족하는 역가능 행렬(invertible matrix)
P
{\displaystyle P}
와 대각 행렬
D
{\displaystyle D}
가 존재하면 대각화-가능 (diagonalizable ) 또는 비-결합있는 (non-defective )이라고 불립니다. (그러한
P
{\displaystyle P}
,
D
{\displaystyle D}
는 고유하지 않습니다.) 유한-차원 벡터 공간
V
{\displaystyle V}
에 대해, 선형 맵(linear map)
T
:
V
→
V
{\displaystyle T:V\to V}
는 만약
T
{\displaystyle T}
의 고유벡터(eigenvectors) 로 구성된
V
{\displaystyle V}
의 순서화된 기저(ordered basis) 가 존재하면 대각화-가능 (diagonalizable )이라고 불립니다. 이들 정의는 동등합니다: 만약
T
{\displaystyle T}
가 위와 같이 행렬 표현
T
=
P
D
P
−
1
{\displaystyle T=PDP^{-1}}
를 가지면,
P
{\displaystyle P}
의 열 벡터는
T
{\displaystyle T}
의 고유벡터로 구성된 기저를 형성하고,
D
{\displaystyle D}
의 대각선 엔트리는
T
{\displaystyle T}
의 해당하는 고윳값(eigenvalues) 입니다; 이 고유벡터 기저에 관해,
A
{\displaystyle A}
는
D
{\displaystyle D}
에 의해 표시됩니다. 대각화 (Diagonalization )는 위의
P
{\displaystyle P}
와
D
{\displaystyle D}
를 찾는 과정입니다.
대각화-가능 행렬과 맵은 일단 그것들의 고윳값과 고유벡터가 알려져 있으면 특히 계산하기 쉽습니다. 대각 엔트리에 그 거듭제곱을 간단히 올림으로써 대각 행렬
D
{\displaystyle D}
를 거듭제곱할 수 있고, 대각 행렬의 행렬식(determinant) 은 단순히 모든 대각 엔트리의 곱입니다; 그러한 계산은 쉽게
A
=
P
D
P
−
1
{\displaystyle A=PDP^{-1}}
로 일반화됩니다. 기하학적으로, 대각화-가능 행렬은 비균질 팽창 (inhomogeneous dilation , 또는 이방성 스케일링 (anisotropic scaling ))입니다 — 그것은 균질 팽창 (homogeneous dilation ) 과 마찬가지로 공간을 스케일하지만, 각 고유벡터 축을 따라 다른 인수, 해당 고윳값에 의해 주어진 인수로 스케일합니다.
대각화-가능이 아닌 정사각 행렬은 결함-있는 (defective ) 것이라고 불립니다. 실수 엔트리를 갖는 행렬
A
{\displaystyle A}
는 실수에 걸쳐 결함-있는 것으로 발생할 수 있으며, 즉,
A
=
P
D
P
−
1
{\displaystyle A=PDP^{-1}}
은 실수 엔트리를 갖는 임의의 역가능
P
{\displaystyle P}
와 대각
D
{\displaystyle D}
에 대해 불가능하지만,
A
{\displaystyle A}
가 복소수에 걸쳐 대각화-가능이 되도록 복소수 엔트리로 가능합니다. 예를 들어, 이것은 일반 회전 행렬(rotation matrix) 에 대한 경우입니다.
대각화-가능 행렬에 대한 많은 결과는 대수적으로 닫힌 필드 (예를 들어, 복소수)에 걸쳐에서만 유지됩니다. 이 경우에서, 대각화-가능 행렬은 모든 행렬의 공간에서 조밀 하며, 이는 결함-있는 행렬이 작은 섭동(perturbation) 에 의해 대각화-가능 행렬로 변형될 수 있음을 의미합니다; 그리고 조르당 정규 형식(Jordan normal form) 은 임의의 행렬이 고유하게 대각화-가능 행렬과 거듭제곱영 행렬(nilpotent matrix) 의 합이라고 말합니다. 대수적으로 닫힌 필드에 걸쳐, 대각화-가능 행렬은 반-단순 행렬(semi-simple matrices) 과 동등합니다.
Definition
필드(field)
F
{\displaystyle F}
에서 엔트리를 갖는 정사각
n
×
n
{\displaystyle n\times n}
행렬,
A
{\displaystyle A}
는 만약
P
−
1
A
P
{\displaystyle P^{-1}AP}
가 대각 행렬임을 만족하는 역가능 행렬 (즉, 일반 선형 그룹 GLn (F )의 원소),
P
{\displaystyle P}
가 존재하면 대각화-가능 (diagonalizable ) 또는 비-결점있는 (nondefective )이라고 불립니다. 형식적으로
A
∈
F
n
×
n
diagonalizable
⟺
∃
P
∈
GL
n
(
F
)
:
P
−
1
A
P
diagonal
{\displaystyle A\in F^{n\times n}{\text{ diagonalizable}}\iff \exists \,P\in \operatorname {GL} _{n}(F):\;P^{-1}\!AP{\text{ diagonal}}}
Characterization
대각화-가능 맵과 행렬에 대한 토대적인 사실은 다음에 의해 표현됩니다:
필드
F
{\displaystyle F}
에 걸쳐
n
×
n
{\displaystyle n\times n}
행렬
A
{\displaystyle A}
가 대각화-가능인 것과 그 고유공간의 차원(dimensions) 의 합이
n
{\displaystyle n}
과 같은 것은 필요충분 조건이며, 이것이 그 경우인 것과
A
{\displaystyle A}
의 고윳값으로 구성된
F
n
{\displaystyle F^{n}}
의 기저(basis) 가 존재하는 것은 필요충분 조건입니다. 만약 그러한 기저가 발견되면, 이들 기저 벡터(basis vectors) 를 열로 가지는 행렬
P
{\displaystyle P}
를 형성할 수 있고,
P
−
1
A
P
{\displaystyle P^{-1}AP}
는 그 대각 엔트리가
A
{\displaystyle A}
의 고윳값인 대각 행렬일 것입니다. 행렬
P
{\displaystyle P}
는
A
{\displaystyle A}
에 대해 양식 행렬(modal matrix) 로 알려져 있습니다.
선형 맵
T
:
V
→
V
{\displaystyle T:V\to V}
가 대각화-가능인 것과 그 고유공간의 차원 의 합이
dim
(
V
)
{\displaystyle \dim(V)}
과 같은 것은 필요충분 조건이며, 이것이 그 경우인 것과
T
{\displaystyle T}
의 고유벡터로 구성된
V
{\displaystyle V}
의 기저가 존재하는 것은 필요충분 조건입니다. 그러한 기저에 관해,
T
{\displaystyle T}
는 대각 행렬에 의해 표현될 것입니다. 이 행렬의 대각 엔트리는
T
{\displaystyle T}
의 고윳값입니다.
다음의 충분 (필수는 아님) 조건이 종종 유용합니다.
n
×
n
{\displaystyle n\times n}
행렬
A
{\displaystyle A}
는 만약 그것이
F
{\displaystyle F}
에서 구별되는 고윳값을 가지면, 즉, 그것의 특성 다항식(characteristic polynomial) 이
F
{\displaystyle F}
에서
n
{\displaystyle n}
개의 구별되는 근을 가지면 필드
F
{\displaystyle F}
에 걸쳐 대각화-가능입니다; 어쨌든, 그 전환은 거짓일 수 있습니다. 다음을 생각해 보십시오:
[
−
1
3
−
1
−
3
5
−
1
−
3
3
1
]
,
{\displaystyle {\begin{bmatrix}-1&3&-1\\-3&5&-1\\-3&3&1\end{bmatrix}},}
이는 1, 2, 2 (모두가 구별되지는 않음)를 가지고 (
A
{\displaystyle A}
와 닮은 ) 대각 형식을 갖는 대각화-가능입니다:
[
1
0
0
0
2
0
0
0
2
]
{\displaystyle {\begin{bmatrix}1&0&0\\0&2&0\\0&0&2\end{bmatrix}}}
그리고 기저 행렬
P
{\displaystyle P}
의 변경 :
[
1
1
−
1
1
1
0
1
0
3
]
.
{\displaystyle {\begin{bmatrix}1&1&-1\\1&1&0\\1&0&3\end{bmatrix}}.}
그 전환은
A
{\displaystyle A}
가 1보다 큰 차원의 고유공간을 가질 때 실패합니다. 이 예제에서, 고윳값 2와 결합된
A
{\displaystyle A}
의 고유공간은 차원 2를 가집니다.
n
=
dim
(
V
)
{\displaystyle n=\dim(V)}
를 갖는 선형 맵
T
:
V
→
V
{\displaystyle T:V\to V}
은 만약 그것이
n
{\displaystyle n}
개의 구별되는 고윳값이면, 즉, 그것의 특성 다항식이
F
{\displaystyle F}
에서
n
{\displaystyle n}
개의 구별되는 근을 가지면 대각화-가능입니다.
A
{\displaystyle A}
를
F
{\displaystyle F}
에 걸쳐 행렬이라고 놓습니다. 만약
A
{\displaystyle A}
가 대각화-가능이면, 그것의 임의의 거듭제곱도 마찬가지입니다. 반대로, 만약
A
{\displaystyle A}
가 역-가능이고,
F
{\displaystyle F}
가 대수적으로 닫혀 있고,
A
n
{\displaystyle A^{n}}
이
F
{\displaystyle F}
의 특성의 정수 배수가 아닌 일부
n
{\displaystyle n}
에 대해 대각화-가능이면,
A
{\displaystyle A}
는 대각화-가능입니다. 증명: 만약
A
n
{\displaystyle A^{n}}
이 대각화-가능이면,
A
{\displaystyle A}
는 일부 다항식
(
x
n
−
λ
1
)
⋯
(
x
n
−
λ
k
)
{\displaystyle \left(x^{n}-\lambda _{1}\right)\cdots \left(x^{n}-\lambda _{k}\right)}
에 의해 소멸되며, 이는 중복 근을 가지지 않고 (왜냐하면
λ
j
≠
0
{\displaystyle \lambda _{j}\neq 0}
) ,
A
{\displaystyle A}
의 최소 다항식으로 나뉩니다.
복소수
C
{\displaystyle \mathbb {C} }
에 걸쳐, 거의 모든 각 행렬이 대각화-가능입니다. 보다 정확하게:
C
{\displaystyle \mathbb {C} }
에 걸쳐 대각화-가능이 아닌 복소수
n
×
n
{\displaystyle n\times n}
행렬의 집합은,
C
n
×
n
{\displaystyle \mathbb {C} ^{n\times n}}
의 부분집합 으로 고려되며, 르베그 측정(Lebesgue measure) 영을 가집니다. 역시 대각화-가능 행렬은 자르스키 토폴로지(Zariski topology) 에 관해 조밀한 부분집합을 형성한다고 말할 수 있습니다: 비-대각화가능 행렬은 초표면인 특성 다항식의 판별식(discriminant) 의 사리지는 집합(vanishing set) 내부에 있습니다. 그로부터 노름(norm) 에 의해 주어진 보통의 (강력한 ) 토폴로지에서 밀도도 따릅니다.
R
{\displaystyle \mathbb {R} }
에 대해서도 마찬가지입니다.
조르당–슈발레 분해(Jordan–Chevalley decomposition) 는 연산자를 그것의 반단순 (즉, 대각화-가능) 부분과 그것의 거듭제곱영(nilpotent) 부분의 합으로 표현합니다. 따라서, 행렬이 대각화-가능인 것과 그것의 거듭제곱영 부분이 영인 것은 필요충분 조건입니다. 다시 말로 하면, 행렬은 만약 그것의 조르당 형식에서 각 블록이 거듭제곱영 부분을 가지지 않으면 대각화-가능입니다; 즉, 각 "블록"은 일-대-일 행렬입니다.
Diagonalization
The diagonalization of a symmetric matrix can be interpreted as a rotation of the axes to align them with the eigenvectors.
만약 행렬
A
{\displaystyle A}
가 대각화될 수 있으면, 즉,
P
−
1
A
P
=
[
λ
1
0
⋯
0
0
λ
2
⋯
0
⋮
⋮
⋱
⋮
0
0
⋯
λ
n
]
,
{\displaystyle P^{-1}AP={\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}},}
다음과 같습니다:
A
P
=
P
[
λ
1
0
⋯
0
0
λ
2
⋯
0
⋮
⋮
⋱
⋮
0
0
⋯
λ
n
]
.
{\displaystyle AP=P{\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}}.}
P
{\displaystyle P}
를 열 벡터
α
i
{\displaystyle {\boldsymbol {\alpha }}_{i}}
의 블록 행렬 로 쓰면,
P
=
[
α
1
α
2
⋯
α
n
]
,
{\displaystyle P={\begin{bmatrix}{\boldsymbol {\alpha }}_{1}&{\boldsymbol {\alpha }}_{2}&\cdots &{\boldsymbol {\alpha }}_{n}\end{bmatrix}},}
위의 방정식은 다음과 같이 다시 쓸 수 있습니다:
A
α
i
=
λ
i
α
i
(
i
=
1
,
2
,
…
,
n
)
.
{\displaystyle A{\boldsymbol {\alpha }}_{i}=\lambda _{i}{\boldsymbol {\alpha }}_{i}\qquad (i=1,2,\dots ,n).}
따라서
P
{\displaystyle P}
의 열 벡터는
A
{\displaystyle A}
의 오른쪽 고유벡터(right eigenvectors) 이고, 해당하는 대각 엔트리는 해당하는 고윳값(eigenvalue) 입니다.
P
{\displaystyle P}
의 역-가능성은 역시 고유벡터가 선형적으로 독립(linearly independent) 이고
F
n
{\displaystyle F^{n}}
의 기저를 형성함을 시사합니다. 이것은 대각화-가능성과 대각화의 정식의 접근 방식을 위한 필요충분 조건입니다.
P
−
1
{\displaystyle P^{-1}}
의 행 벡터(row vectors) 는
A
{\displaystyle A}
의 왼쪽 고유벡터(left eigenvectors) 입니다.
복소수 행렬
A
∈
C
n
×
n
{\displaystyle A\in \mathbb {C} ^{n\times n}}
이 에르미트 행렬 (또는 더 일반적으로 정규 행렬 )일 때,
A
{\displaystyle A}
의 고유벡터는
C
n
{\displaystyle \mathbb {C} ^{n}}
의 직교정규 기저(orthonormal basis) 를 형성하도록 선택될 수 있고,
P
{\displaystyle P}
는 유니태리 행렬(unitary matrix) 이 되도록 선택될 수 있습니다. 만약 게다가,
A
∈
R
n
×
n
{\displaystyle A\in \mathbb {R} ^{n\times n}}
이 실수 대칭 행렬(symmetric matrix) 이면, 그것의 고유벡터는
R
n
{\displaystyle \mathbb {R} ^{n}}
의 직교정규 기저로 선택될 수 있고
P
{\displaystyle P}
는 직교 행렬(orthogonal matrix) 로 선택될 수 있습니다.
대부분의 실제 연구 행렬은 컴퓨터 소프트웨어를 사용하여 수치적으로 대각화됩니다. 이를 달성하기 위해 많은 알고리듬 이 존재합니다.
Simultaneous diagonalization
행렬의 집합은 만약
P
−
1
A
P
{\displaystyle P^{-1}AP}
가 그 집합에서 모든 각
A
{\displaystyle A}
에 대해 대각 행렬임을 만족하는 단일 역-가능 행렬
P
{\displaystyle P}
가 존재하면 동시에 대각화-가능 (simultaneously diagonalizable )이라고 말합니다. 다음 정리는 동시에 대각화-가능 행렬을 특징짓습니다: 대각화-가능 행렬이 교환하는 것과 그 집합이 동시에 대각화-가능인 것은 필요충분 조건입니다.[1] : p. 64
n
>
1
{\displaystyle n>1}
을 갖는 (
C
{\displaystyle \mathbb {C} }
에 걸쳐) 모든
n
×
n
{\displaystyle n\times n}
대각화-가능 행렬의 집합은 동시에 대각화-가능은 아닙니다. 예를 들어, 다음 행렬은
[
1
0
0
0
]
and
[
1
1
0
0
]
{\displaystyle {\begin{bmatrix}1&0\\0&0\end{bmatrix}}\quad {\text{and}}\quad {\begin{bmatrix}1&1\\0&0\end{bmatrix}}}
그것들이 교환하지 않기 때문에 대각화-가능이지만 동시에 대각화-가능은 아닙니다.
집합이 교환하는 정규 행렬(normal matrices) 로 구성되는 것과 그것이 유니태리 행렬(unitary matrix) 에 의해 동시에 대각화-가능인 것은 필요충분 조건입니다; 즉,
U
∗
A
U
{\displaystyle U^{*}AU}
가 그 집합에서 모든 각
A
{\displaystyle A}
에 대해 대각선임을 만족하는 유니태리 행렬
U
{\displaystyle U}
가 존재합니다.
리 이론(Lie theory) 의 언어에서, 동시에 대각화-가능 행렬의 집합은 토럴 리 대수(toral Lie algebra) 를 생성합니다.
Examples
Diagonalizable matrices
Matrices that are not diagonalizable
일반적으로, 회전 행렬(rotation matrix) 은 실수에 걸쳐 대각화-가능이 아니지만, 모든 회전 행렬(rotation matrices) 은 복소수 필드에 걸쳐 대각선-가능입니다. 심지어 행렬이 대각화-가능이 아니더라도, 항상 "할 수 있는 최선을 다하는 것"이 가능하고, 선행하는 대각선 위에 고윳값과 상부대각선(superdiagonal) 위에 1 또는 0으로 구성된 같은 속성을 갖는 행렬을 찾을 수 있습니다 – 조르당 정규 형식(Jordan normal form) 으로 알려져 있습니다.
일부 행렬은 임의의 필드에 걸쳐 대각화-가능이 아니며, 특히 비-영 거듭제곱영 행렬(nilpotent matrices) 이 그렇습니다. 이것은 고윳값의 대수적 및 기하학적 중복도 가 일치하지 않으면 더 일반적으로 발생합니다. 예를 들어, 다음을 생각해 보십시오:
C
=
[
0
1
0
0
]
.
{\displaystyle C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.}
이 행렬은 대각화-가능이 아닙니다:
U
−
1
C
U
{\displaystyle U^{-1}CU}
가 대각 행렬임을 만족하는 행렬
U
{\displaystyle U}
는 없습니다. 실제로,
C
{\displaystyle C}
는 하나의 고윳값 (즉, 0)을 가지고 이 고윳값은 대수적 중복도 2와 기하학적 중복도 1을 가집니다.
일부 실수 행렬은 실수에 걸쳐 대각화-가능이 아닙니다. 예를 들어 다음 행렬을 생각해 보십시오:
B
=
[
0
1
−
1
0
]
.
{\displaystyle B=\left[{\begin{array}{rr}0&1\\\!-1&0\end{array}}\right].}
행렬
B
{\displaystyle B}
는 임의의 실수 고윳값을 가지지 않으므로,
Q
−
1
B
Q
{\displaystyle Q^{-1}BQ}
가 대각 행렬임을 만족하는 실수 행렬
Q
{\displaystyle Q}
는 없습니다. 어쨌든, 복소수를 허용하면
B
{\displaystyle B}
를 대각화할 수 있습니다. 사실, 우리가 다음을 취한다면
Q
=
[
1
i
i
1
]
,
{\displaystyle Q={\begin{bmatrix}1&i\\i&1\end{bmatrix}},}
Q
−
1
B
Q
{\displaystyle Q^{-1}BQ}
는 대각입니다.
B
{\displaystyle B}
는 각도
θ
=
3
π
2
{\textstyle \theta ={\frac {3\pi }{2}}}
만큼 반시계 방향으로 회전하는 회전 행렬임을 쉽게 알 수 있습니다.
위의 예제는 대각화-가능 행렬의 합이 대각화-가능일 필요가 없음을 보여줌을 주목하십시오.
How to diagonalize a matrix
행렬을 대각화하는 것은 고유벡터가 기저를 형성하는 경우에서 그것의 고윳값과 고유벡터 를 찾는 것과 같은 과정입니다. 예를 들어, 다음 행렬을 생각해 보십시오:
A
=
[
0
1
−
2
0
1
0
1
−
1
3
]
.
{\displaystyle A=\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right].}
특성 다항식(characteristic polynomial)
p
(
λ
)
=
det
(
λ
I
−
A
)
{\displaystyle p(\lambda )=\det(\lambda I-A)}
의 근은 고윳값
λ
1
=
1
,
λ
2
=
1
,
λ
3
=
2
{\displaystyle \lambda _{1}=1,\lambda _{2}=1,\lambda _{3}=2}
을 가집니다. 선형 방정식
(
I
−
A
)
v
=
0
{\displaystyle \left(I-A\right)\mathbf {v} =\mathbf {0} }
을 푸는 것은 고유벡터
v
1
=
(
1
,
1
,
0
)
{\displaystyle \mathbf {v} _{1}=(1,1,0)}
와
v
2
=
(
0
,
2
,
1
)
{\displaystyle \mathbf {v} _{2}=(0,2,1)}
를 제공하지만,
(
2
I
−
A
)
v
=
0
{\displaystyle \left(2I-A\right)\mathbf {v} =\mathbf {0} }
는
v
3
=
(
1
,
0
,
−
1
)
{\displaystyle \mathbf {v} _{3}=(1,0,-1)}
를 제공합니다; 즉,
i
=
1
,
2
,
3
{\displaystyle i=1,2,3}
에 대해,
A
v
i
=
λ
i
v
i
{\displaystyle A\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}}
입니다. 이들 벡터는
V
=
R
3
{\displaystyle V=\mathbb {R} ^{3}}
의 기저를 형성하므로, 우리는 기저-의-변경 행렬
P
{\displaystyle P}
의 열 벡터로 그것들을 조합하여 다음을 얻을 수 있습니다:
P
−
1
A
P
=
[
1
0
1
1
2
0
0
1
−
1
]
−
1
[
0
1
−
2
0
1
0
1
−
1
3
]
[
1
0
1
1
2
0
0
1
−
1
]
=
[
1
0
0
0
1
0
0
0
2
]
=
D
.
{\displaystyle P^{-1}AP=\left[{\begin{array}{rrr}1&0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right]\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]={\begin{bmatrix}1&0&0\\0&1&0\\0&0&2\end{bmatrix}}=D.}
우리는 변환 측면에서 이 방정식을 볼 수 있습니다:
P
{\displaystyle P}
는 표준 기저를 고유기저,
P
e
i
=
v
i
{\displaystyle P\mathbf {e} _{i}=\mathbf {v} _{i}}
로 취하므로,
P
−
1
A
P
{\displaystyle P^{-1}AP}
가
D
{\displaystyle D}
의 정의하는 속성인 그것의 고유벡터로 표준 기저를 가지도록 다음을 얻습니다:
P
−
1
A
P
e
i
=
P
−
1
A
v
i
=
P
−
1
(
λ
i
v
i
)
=
λ
i
e
i
.
{\displaystyle P^{-1}AP\mathbf {e} _{i}=P^{-1}A\mathbf {v} _{i}=P^{-1}(\lambda _{i}\mathbf {v} _{i})=\lambda _{i}\mathbf {e} _{i}.}
P
{\displaystyle P}
에서 고유벡터의 선호하는 순위가 없음을 주목하십시오;
P
{\displaystyle P}
에서 고유벡터(eigenvectors) 의 순서를 변경하는 것은
A
{\displaystyle A}
의 대각화된 형식에서 고윳값(eigenvalues) 의 순서만 변경됩니다.[2]
Application to matrix functions
대각화는 행렬
A
=
P
D
P
−
1
{\displaystyle A=PDP^{-1}}
의 거듭제곱을 효율적으로 계산하기 위해 사용될 수 있습니다:
A
k
=
(
P
D
P
−
1
)
k
=
(
P
D
P
−
1
)
(
P
D
P
−
1
)
⋯
(
P
D
P
−
1
)
=
P
D
(
P
−
1
P
)
D
(
P
−
1
P
)
⋯
(
P
−
1
P
)
D
P
−
1
=
P
D
k
P
−
1
,
{\displaystyle {\begin{aligned}A^{k}&=\left(PDP^{-1}\right)^{k}=\left(PDP^{-1}\right)\left(PDP^{-1}\right)\cdots \left(PDP^{-1}\right)\\&=PD\left(P^{-1}P\right)D\left(P^{-1}P\right)\cdots \left(P^{-1}P\right)DP^{-1}=PD^{k}P^{-1},\end{aligned}}}
그리고 후자는 대각 행렬의 거듭제곱만 포함하기 때문에 계산하기 쉽습니다. 예를 들어, 위의 예에서 고윳값
λ
=
1
,
1
,
2
{\displaystyle \lambda =1,1,2}
을 갖는 행렬
A
{\displaystyle A}
에 대해, 다음을 계산합니다:
A
k
=
P
D
k
P
−
1
=
[
1
0
1
1
2
0
0
1
−
1
]
[
1
k
0
0
0
1
k
0
0
0
2
k
]
[
1
0
1
1
2
0
0
1
−
1
]
−
1
=
[
2
−
2
k
−
1
+
2
k
2
−
2
k
+
1
0
1
0
−
1
+
2
k
1
−
2
k
−
1
+
2
k
+
1
]
.
{\displaystyle {\begin{aligned}A^{k}=PD^{k}P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}1^{k}&0&0\\0&1^{k}&0\\0&0&2^{k}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2-2^{k}&-1+2^{k}&2-2^{k+1}\\0&1&0\\-1+2^{k}&1-2^{k}&-1+2^{k+1}\end{bmatrix}}.\end{aligned}}}
이 접근 방식은 거듭제곱 급수로 정의될 수 있는 행렬 지수(matrix exponential) 와 다른 행렬 함수(matrix functions) 로 일반화될 수 있습니다. 예를 들어,
exp
(
A
)
=
I
+
A
+
1
2
!
A
2
+
1
3
!
A
3
+
⋯
{\textstyle \exp(A)=I+A+{\frac {1}{2!}}A^{2}+{\frac {1}{3!}}A^{3}+\cdots }
를 정의하여, 다음을 가집니다:
exp
(
A
)
=
P
exp
(
D
)
P
−
1
=
[
1
0
1
1
2
0
0
1
−
1
]
[
e
1
0
0
0
e
1
0
0
0
e
2
]
[
1
0
1
1
2
0
0
1
−
1
]
−
1
=
[
2
e
−
e
2
−
e
+
e
2
2
e
−
2
e
2
0
e
0
−
e
+
e
2
e
−
e
2
−
e
+
2
e
2
]
.
{\displaystyle {\begin{aligned}\exp(A)=P\exp(D)P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}e^{1}&0&0\\0&e^{1}&0\\0&0&e^{2}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2e-e^{2}&-e+e^{2}&2e-2e^{2}\\0&e&0\\-e+e^{2}&e-e^{2}&-e+2e^{2}\end{bmatrix}}.\end{aligned}}}
이것은 피보나치 숫자(Fibonacci numbers) 와 같은 선형 재귀 수열(linear recursive sequences) 의 항에 대해 닫힌 형식 표현을 찾는 데 특히 유용합니다.
Particular application
예를 들어, 다음 행렬을 생각해 보십시오:
M
=
[
a
b
−
a
0
b
]
.
{\displaystyle M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}.}
M
{\displaystyle M}
의 다양한 거듭제곱을 계산하는 것은 다음과 같은 놀라운 패턴을 드러냅니다:
M
2
=
[
a
2
b
2
−
a
2
0
b
2
]
,
M
3
=
[
a
3
b
3
−
a
3
0
b
3
]
,
M
4
=
[
a
4
b
4
−
a
4
0
b
4
]
,
…
{\displaystyle M^{2}={\begin{bmatrix}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatrix}},\quad M^{3}={\begin{bmatrix}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatrix}},\quad M^{4}={\begin{bmatrix}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatrix}},\quad \ldots }
위의 현상은
M
{\displaystyle M}
을 대각화함으로써 설명될 수 있습니다. 이를 달성하기 위해,
M
{\displaystyle M}
의 고유벡터로 구성된
R
2
{\displaystyle \mathbb {R} ^{2}}
의 기저가 필요합니다. 그러한 고유벡터 기저 중 하나는 다음과 같이 주어집니다:
u
=
[
1
0
]
=
e
1
,
v
=
[
1
1
]
=
e
1
+
e
2
,
{\displaystyle \mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix}1\\1\end{bmatrix}}=\mathbf {e} _{1}+\mathbf {e} _{2},}
여기서
e
i
{\displaystyle \mathbf {e} _{i}}
가
R
n
{\displaystyle \mathbb {R} ^{n}}
의 표준 기저를 나타냅니다. 기저의 역 변경은 다음과 같이 주어집니다:
e
1
=
u
,
e
2
=
v
−
u
.
{\displaystyle \mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u} .}
간단한 계산은 다음임을 보여줍니다:
M
u
=
a
u
,
M
v
=
b
v
.
{\displaystyle M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v} .}
따라서,
a
{\displaystyle a}
와
b
{\displaystyle b}
는 각각
u
{\displaystyle \mathbf {u} }
와
v
{\displaystyle \mathbf {v} }
에 해당하는 고윳값입니다. 행렬 곱셈의 선형성에 의해, 우리는 다음임을 가집니다:
M
n
u
=
a
n
u
,
M
n
v
=
b
n
v
.
{\displaystyle M^{n}\mathbf {u} =a^{n}\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\mathbf {v} .}
표준 기준으로 다시 전환하여, 다음임을 가집니다:
M
n
e
1
=
M
n
u
=
a
n
e
1
,
M
n
e
2
=
M
n
(
v
−
u
)
=
b
n
v
−
a
n
u
=
(
b
n
−
a
n
)
e
1
+
b
n
e
2
.
{\displaystyle {\begin{aligned}M^{n}\mathbf {e} _{1}&=M^{n}\mathbf {u} =a^{n}\mathbf {e} _{1},\\M^{n}\mathbf {e} _{2}&=M^{n}\left(\mathbf {v} -\mathbf {u} \right)=b^{n}\mathbf {v} -a^{n}\mathbf {u} =\left(b^{n}-a^{n}\right)\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}.\end{aligned}}}
행렬 형식으로 표현되는 선행 관계는 다음과 같습니다:
M
n
=
[
a
n
b
n
−
a
n
0
b
n
]
,
{\displaystyle M^{n}={\begin{bmatrix}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatrix}},}
이에 따라서 위의 현상을 설명합니다.
Quantum mechanical application
양자 역학적 계산과 양자 화학적 계산에서, 행렬 대각화는 가장 자주 적용되는 수치적 과정 중 하나입니다. 기본적인 이유는 시간-독립적인 슈뢰딩거 방정식(Schrödinger equation) 이 무한 차원 공간 (힐베르트 공간 ) 위에 대부분의 물리적 상황에도 불구하고 고윳값 방정식이기 때문입니다.
매우 공통적인 근사는 힐베르트 공간을 유한 차원으로 자르는 것이며, 그 후에 슈뢰딩거 방정식은 실수 대칭, 또는 복소수 에르미트 행렬의 고윳값 문제로 공식화될 수 있습니다. 형식적으로 이 근사는 변형 원리(variational principle) 에 기초하며, 아래에서 경계진 해밀턴에 유효합니다.
일-차 섭동 이론(First-order perturbation theory) 은 역시 퇴화 상태에 대한 행렬 고윳값 문제로 이어집니다.
See also
Notes
References