Diagonalizable matrix

선형 대수(linear algebra)에서, 정사각 행렬(square matrix) $A$ 는 만약 그것이 대각 행렬과 닮았으면, 즉, $P^{-1}AP=D$ , 또는 동등하게 $A=PDP^{-1}$ 를 만족하는 역가능 행렬(invertible matrix) $P$ 와 대각 행렬 $D$ 가 존재하면 대각화-가능(diagonalizable) 또는 비-결합있는(non-defective)이라고 불립니다. (그러한 $P$ , $D$ 는 고유하지 않습니다.) 유한-차원 벡터 공간 $V$ 에 대해, 선형 맵(linear map) $T:V\to V$ 는 만약 $T$ 의 고유벡터(eigenvectors)로 구성된 $V$ 의 순서화된 기저(ordered basis)가 존재하면 대각화-가능(diagonalizable)이라고 불립니다. 이들 정의는 동등합니다: 만약 $T$ 가 위와 같이 행렬 표현 $T=PDP^{-1}$ 를 가지면, $P$ 의 열 벡터는 $T$ 의 고유벡터로 구성된 기저를 형성하고, $D$ 의 대각선 엔트리는 $T$ 의 해당하는 고윳값(eigenvalues)입니다; 이 고유벡터 기저에 관해, $A$ 는 $D$ 에 의해 표시됩니다. 대각화(Diagonalization)는 위의 $P$ 와 $D$ 를 찾는 과정입니다.

대각화-가능 행렬과 맵은 일단 그것들의 고윳값과 고유벡터가 알려져 있으면 특히 계산하기 쉽습니다. 대각 엔트리에 그 거듭제곱을 간단히 올림으로써 대각 행렬 $D$ 를 거듭제곱할 수 있고, 대각 행렬의 행렬식(determinant)은 단순히 모든 대각 엔트리의 곱입니다; 그러한 계산은 쉽게 $A=PDP^{-1}$ 로 일반화됩니다. 기하학적으로, 대각화-가능 행렬은 비균질 팽창(inhomogeneous dilation, 또는 이방성 스케일링(anisotropic scaling))입니다 — 그것은 균질 팽창(homogeneous dilation)과 마찬가지로 공간을 스케일하지만, 각 고유벡터 축을 따라 다른 인수, 해당 고윳값에 의해 주어진 인수로 스케일합니다.

대각화-가능이 아닌 정사각 행렬은 결함-있는(defective) 것이라고 불립니다. 실수 엔트리를 갖는 행렬 $A$ 는 실수에 걸쳐 결함-있는 것으로 발생할 수 있으며, 즉, $A=PDP^{-1}$ 은 실수 엔트리를 갖는 임의의 역가능 $P$ 와 대각 $D$ 에 대해 불가능하지만, $A$ 가 복소수에 걸쳐 대각화-가능이 되도록 복소수 엔트리로 가능합니다. 예를 들어, 이것은 일반 회전 행렬(rotation matrix)에 대한 경우입니다.

대각화-가능 행렬에 대한 많은 결과는 대수적으로 닫힌 필드 (예를 들어, 복소수)에 걸쳐에서만 유지됩니다. 이 경우에서, 대각화-가능 행렬은 모든 행렬의 공간에서 조밀하며, 이는 결함-있는 행렬이 작은 섭동(perturbation)에 의해 대각화-가능 행렬로 변형될 수 있음을 의미합니다; 그리고 조르당 정규 형식(Jordan normal form)은 임의의 행렬이 고유하게 대각화-가능 행렬과 거듭제곱영 행렬(nilpotent matrix)의 합이라고 말합니다. 대수적으로 닫힌 필드에 걸쳐, 대각화-가능 행렬은 반-단순 행렬(semi-simple matrices)과 동등합니다.

Definition

필드(field) $F$ 에서 엔트리를 갖는 정사각 $n\times n$ 행렬, $A$ 는 만약 $P^{-1}AP$ 가 대각 행렬임을 만족하는 역가능 행렬 (즉, 일반 선형 그룹 GL_n(F)의 원소), $P$ 가 존재하면 대각화-가능(diagonalizable) 또는 비-결점있는(nondefective)이라고 불립니다. 형식적으로

$A\in F^{n\times n}{\text{ diagonalizable}}\iff \exists \,P\in \operatorname {GL} _{n}(F):\;P^{-1}\!AP{\text{ diagonal}}$

Characterization

대각화-가능 맵과 행렬에 대한 토대적인 사실은 다음에 의해 표현됩니다:

필드 $F$ 에 걸쳐 $n\times n$ 행렬 $A$ 가 대각화-가능인 것과 그 고유공간의 차원(dimensions)의 합이 $n$ 과 같은 것은 필요충분 조건이며, 이것이 그 경우인 것과 $A$ 의 고윳값으로 구성된 $F^{n}$ 의 기저(basis)가 존재하는 것은 필요충분 조건입니다. 만약 그러한 기저가 발견되면, 이들 기저 벡터(basis vectors)를 열로 가지는 행렬 $P$ 를 형성할 수 있고, $P^{-1}AP$ 는 그 대각 엔트리가 $A$ 의 고윳값인 대각 행렬일 것입니다. 행렬 $P$ 는 $A$ 에 대해 양식 행렬(modal matrix)로 알려져 있습니다.
선형 맵 $T:V\to V$ 가 대각화-가능인 것과 그 고유공간의 차원의 합이 $\dim(V)$ 과 같은 것은 필요충분 조건이며, 이것이 그 경우인 것과 $T$ 의 고유벡터로 구성된 $V$ 의 기저가 존재하는 것은 필요충분 조건입니다. 그러한 기저에 관해, $T$ 는 대각 행렬에 의해 표현될 것입니다. 이 행렬의 대각 엔트리는 $T$ 의 고윳값입니다.

다음의 충분 (필수는 아님) 조건이 종종 유용합니다.

$n\times n$ 행렬 $A$ 는 만약 그것이 $F$ 에서 구별되는 고윳값을 가지면, 즉, 그것의 특성 다항식(characteristic polynomial)이 $F$ 에서 $n$ 개의 구별되는 근을 가지면 필드 $F$ 에 걸쳐 대각화-가능입니다; 어쨌든, 그 전환은 거짓일 수 있습니다. 다음을 생각해 보십시오: ${\begin{bmatrix}-1&3&-1\\-3&5&-1\\-3&3&1\end{bmatrix}},$ 이는 1, 2, 2 (모두가 구별되지는 않음)를 가지고 ( $A$ 와 닮은) 대각 형식을 갖는 대각화-가능입니다: ${\begin{bmatrix}1&0&0\\0&2&0\\0&0&2\end{bmatrix}}$ 그리고 기저 행렬 $P$ 의 변경: ${\begin{bmatrix}1&1&-1\\1&1&0\\1&0&3\end{bmatrix}}.$ 그 전환은 $A$ 가 1보다 큰 차원의 고유공간을 가질 때 실패합니다. 이 예제에서, 고윳값 2와 결합된 $A$ 의 고유공간은 차원 2를 가집니다.
$n=\dim(V)$ 를 갖는 선형 맵 $T:V\to V$ 은 만약 그것이 $n$ 개의 구별되는 고윳값이면, 즉, 그것의 특성 다항식이 $F$ 에서 $n$ 개의 구별되는 근을 가지면 대각화-가능입니다.

$A$ 를 $F$ 에 걸쳐 행렬이라고 놓습니다. 만약 $A$ 가 대각화-가능이면, 그것의 임의의 거듭제곱도 마찬가지입니다. 반대로, 만약 $A$ 가 역-가능이고, $F$ 가 대수적으로 닫혀 있고, $A^{n}$ 이 $F$ 의 특성의 정수 배수가 아닌 일부 $n$ 에 대해 대각화-가능이면, $A$ 는 대각화-가능입니다. 증명: 만약 $A^{n}$ 이 대각화-가능이면, $A$ 는 일부 다항식 $\left(x^{n}-\lambda _{1}\right)\cdots \left(x^{n}-\lambda _{k}\right)$ 에 의해 소멸되며, 이는 중복 근을 가지지 않고 (왜냐하면 $\lambda _{j}\neq 0$ ), $A$ 의 최소 다항식으로 나뉩니다.

복소수 $\mathbb {C}$ 에 걸쳐, 거의 모든 각 행렬이 대각화-가능입니다. 보다 정확하게: $\mathbb {C}$ 에 걸쳐 대각화-가능이 아닌 복소수 $n\times n$ 행렬의 집합은, $\mathbb {C} ^{n\times n}$ 의 부분집합으로 고려되며, 르베그 측정(Lebesgue measure) 영을 가집니다. 역시 대각화-가능 행렬은 자르스키 토폴로지(Zariski topology)에 관해 조밀한 부분집합을 형성한다고 말할 수 있습니다: 비-대각화가능 행렬은 초표면인 특성 다항식의 판별식(discriminant)의 사리지는 집합(vanishing set) 내부에 있습니다. 그로부터 노름(norm)에 의해 주어진 보통의 (강력한) 토폴로지에서 밀도도 따릅니다. $\mathbb {R}$ 에 대해서도 마찬가지입니다.

조르당–슈발레 분해(Jordan–Chevalley decomposition)는 연산자를 그것의 반단순 (즉, 대각화-가능) 부분과 그것의 거듭제곱영(nilpotent) 부분의 합으로 표현합니다. 따라서, 행렬이 대각화-가능인 것과 그것의 거듭제곱영 부분이 영인 것은 필요충분 조건입니다. 다시 말로 하면, 행렬은 만약 그것의 조르당 형식에서 각 블록이 거듭제곱영 부분을 가지지 않으면 대각화-가능입니다; 즉, 각 "블록"은 일-대-일 행렬입니다.

Diagonalization

만약 행렬 $A$ 가 대각화될 수 있으면, 즉,

P^{-1}AP={\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}},

다음과 같습니다:

AP=P{\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}}.

$P$ 를 열 벡터 ${\boldsymbol {\alpha }}_{i}$ 의 블록 행렬로 쓰면,

P={\begin{bmatrix}{\boldsymbol {\alpha }}_{1}&{\boldsymbol {\alpha }}_{2}&\cdots &{\boldsymbol {\alpha }}_{n}\end{bmatrix}},

위의 방정식은 다음과 같이 다시 쓸 수 있습니다:

A{\boldsymbol {\alpha }}_{i}=\lambda _{i}{\boldsymbol {\alpha }}_{i}\qquad (i=1,2,\dots ,n).

따라서 $P$ 의 열 벡터는 $A$ 의 오른쪽 고유벡터(right eigenvectors)이고, 해당하는 대각 엔트리는 해당하는 고윳값(eigenvalue)입니다. $P$ 의 역-가능성은 역시 고유벡터가 선형적으로 독립(linearly independent)이고 $F^{n}$ 의 기저를 형성함을 시사합니다. 이것은 대각화-가능성과 대각화의 정식의 접근 방식을 위한 필요충분 조건입니다. $P^{-1}$ 의 행 벡터(row vectors)는 $A$ 의 왼쪽 고유벡터(left eigenvectors)입니다.

복소수 행렬 $A\in \mathbb {C} ^{n\times n}$ 이 에르미트 행렬 (또는 더 일반적으로 정규 행렬)일 때, $A$ 의 고유벡터는 $\mathbb {C} ^{n}$ 의 직교정규 기저(orthonormal basis)를 형성하도록 선택될 수 있고, $P$ 는 유니태리 행렬(unitary matrix)이 되도록 선택될 수 있습니다. 만약 게다가, $A\in \mathbb {R} ^{n\times n}$ 이 실수 대칭 행렬(symmetric matrix)이면, 그것의 고유벡터는 $\mathbb {R} ^{n}$ 의 직교정규 기저로 선택될 수 있고 $P$ 는 직교 행렬(orthogonal matrix)로 선택될 수 있습니다.

대부분의 실제 연구 행렬은 컴퓨터 소프트웨어를 사용하여 수치적으로 대각화됩니다. 이를 달성하기 위해 많은 알고리듬이 존재합니다.

Simultaneous diagonalization

행렬의 집합은 만약 $P^{-1}AP$ 가 그 집합에서 모든 각 $A$ 에 대해 대각 행렬임을 만족하는 단일 역-가능 행렬 $P$ 가 존재하면 동시에 대각화-가능(simultaneously diagonalizable)이라고 말합니다. 다음 정리는 동시에 대각화-가능 행렬을 특징짓습니다: 대각화-가능 행렬이 교환하는 것과 그 집합이 동시에 대각화-가능인 것은 필요충분 조건입니다.^[1]^{: p. 64}

$n>1$ 을 갖는 ( $\mathbb {C}$ 에 걸쳐) 모든 $n\times n$ 대각화-가능 행렬의 집합은 동시에 대각화-가능은 아닙니다. 예를 들어, 다음 행렬은

{\begin{bmatrix}1&0\\0&0\end{bmatrix}}\quad {\text{and}}\quad {\begin{bmatrix}1&1\\0&0\end{bmatrix}}

그것들이 교환하지 않기 때문에 대각화-가능이지만 동시에 대각화-가능은 아닙니다.

집합이 교환하는 정규 행렬(normal matrices)로 구성되는 것과 그것이 유니태리 행렬(unitary matrix)에 의해 동시에 대각화-가능인 것은 필요충분 조건입니다; 즉, $U^{*}AU$ 가 그 집합에서 모든 각 $A$ 에 대해 대각선임을 만족하는 유니태리 행렬 $U$ 가 존재합니다.

리 이론(Lie theory)의 언어에서, 동시에 대각화-가능 행렬의 집합은 토럴 리 대수(toral Lie algebra)를 생성합니다.

Examples

Diagonalizable matrices

인볼루션(Involutions)은 대각선 위에 ±1을 갖는 실수 (그리고 실제로 2가 아닌 특성의 임의의 필드)에 걸쳐 대각선-가능입니다.
유한 차수 자기-사상(endomorphisms)은 대각선 위에 단위의 근(roots of unity)을 갖는 $\mathbb {C}$ (또는 필드의 특성이 자기사상의 차수를 나누지 않는 대수적으로 닫힌 필드)에 걸쳐 대각화-가능입니다. 이것은 최소 다항식이 분리-가능(separable)이기 때문에 따르는데, 왜냐하면 단위의 근이 구별되기 때문입니다.
투영(Projections)은 대각선 위에 0과 1을 갖는 대각화-가능입니다.
실수 대칭 행렬(symmetric matrices)은 직교 행렬(orthogonal matrices)에 의해 대각화-가능입니다; 즉, 실수 대칭 행렬 $A$ 가 주어졌을 때, $Q^{\mathrm {T} }AQ$ 는 일부 직교 행렬 $Q$ 에 대해 대각선입니다. 보다 일반적으로, 행렬이 유니태리 행렬(unitary matrices)에 의해 대각화-가능인 것과 그것들이 정규(normal)인 것은 필요충분 조건입니다. 실수 대칭 행렬의 경우에서, $A=A^{\mathrm {T} }$ 임을 알 수 있으므로, 분명히 $AA^{\mathrm {T} }=A^{\mathrm {T} }A$ 가 성립합니다. 정규 행렬의 예제는 실수 대칭 (또는 반-대칭) 행렬 (예를 들어, 공분산 행렬)과 에르미트 행렬 (또는 반-에르미트 행렬)을 포함합니다. 무한-차원 벡터 공간에 대한 일반화에 대해 스펙트럼 정리(spectral theorems)를 참조하십시오.

Matrices that are not diagonalizable

일반적으로, 회전 행렬(rotation matrix)은 실수에 걸쳐 대각화-가능이 아니지만, 모든 회전 행렬(rotation matrices)은 복소수 필드에 걸쳐 대각선-가능입니다. 심지어 행렬이 대각화-가능이 아니더라도, 항상 "할 수 있는 최선을 다하는 것"이 가능하고, 선행하는 대각선 위에 고윳값과 상부대각선(superdiagonal) 위에 1 또는 0으로 구성된 같은 속성을 갖는 행렬을 찾을 수 있습니다 – 조르당 정규 형식(Jordan normal form)으로 알려져 있습니다.

일부 행렬은 임의의 필드에 걸쳐 대각화-가능이 아니며, 특히 비-영 거듭제곱영 행렬(nilpotent matrices)이 그렇습니다. 이것은 고윳값의 대수적 및 기하학적 중복도가 일치하지 않으면 더 일반적으로 발생합니다. 예를 들어, 다음을 생각해 보십시오:

C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.

이 행렬은 대각화-가능이 아닙니다: $U^{-1}CU$ 가 대각 행렬임을 만족하는 행렬 $U$ 는 없습니다. 실제로, $C$ 는 하나의 고윳값 (즉, 0)을 가지고 이 고윳값은 대수적 중복도 2와 기하학적 중복도 1을 가집니다.

일부 실수 행렬은 실수에 걸쳐 대각화-가능이 아닙니다. 예를 들어 다음 행렬을 생각해 보십시오:

B=\left[{\begin{array}{rr}0&1\\\!-1&0\end{array}}\right].

행렬 $B$ 는 임의의 실수 고윳값을 가지지 않으므로, $Q^{-1}BQ$ 가 대각 행렬임을 만족하는 실수 행렬 $Q$ 는 없습니다. 어쨌든, 복소수를 허용하면 $B$ 를 대각화할 수 있습니다. 사실, 우리가 다음을 취한다면

Q={\begin{bmatrix}1&i\\i&1\end{bmatrix}},

$Q^{-1}BQ$ 는 대각입니다. $B$ 는 각도 ${\textstyle \theta ={\frac {3\pi }{2}}}$ 만큼 반시계 방향으로 회전하는 회전 행렬임을 쉽게 알 수 있습니다.

위의 예제는 대각화-가능 행렬의 합이 대각화-가능일 필요가 없음을 보여줌을 주목하십시오.

How to diagonalize a matrix

행렬을 대각화하는 것은 고유벡터가 기저를 형성하는 경우에서 그것의 고윳값과 고유벡터를 찾는 것과 같은 과정입니다. 예를 들어, 다음 행렬을 생각해 보십시오:

A=\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right].

특성 다항식(characteristic polynomial) $p(\lambda )=\det(\lambda I-A)$ 의 근은 고윳값 $\lambda _{1}=1,\lambda _{2}=1,\lambda _{3}=2$ 을 가집니다. 선형 방정식 $\left(I-A\right)\mathbf {v} =\mathbf {0}$ 을 푸는 것은 고유벡터 $\mathbf {v} _{1}=(1,1,0)$ 와 $\mathbf {v} _{2}=(0,2,1)$ 를 제공하지만, $\left(2I-A\right)\mathbf {v} =\mathbf {0}$ 는 $\mathbf {v} _{3}=(1,0,-1)$ 를 제공합니다; 즉, $i=1,2,3$ 에 대해, $A\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}$ 입니다. 이들 벡터는 $V=\mathbb {R} ^{3}$ 의 기저를 형성하므로, 우리는 기저-의-변경 행렬 $P$ 의 열 벡터로 그것들을 조합하여 다음을 얻을 수 있습니다: $P^{-1}AP=\left[{\begin{array}{rrr}1&0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right]\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]={\begin{bmatrix}1&0&0\\0&1&0\\0&0&2\end{bmatrix}}=D.$ 우리는 변환 측면에서 이 방정식을 볼 수 있습니다: $P$ 는 표준 기저를 고유기저, $P\mathbf {e} _{i}=\mathbf {v} _{i}$ 로 취하므로, $P^{-1}AP$ 가 $D$ 의 정의하는 속성인 그것의 고유벡터로 표준 기저를 가지도록 다음을 얻습니다: $P^{-1}AP\mathbf {e} _{i}=P^{-1}A\mathbf {v} _{i}=P^{-1}(\lambda _{i}\mathbf {v} _{i})=\lambda _{i}\mathbf {e} _{i}.$ $P$ 에서 고유벡터의 선호하는 순위가 없음을 주목하십시오; $P$ 에서 고유벡터(eigenvectors)의 순서를 변경하는 것은 $A$ 의 대각화된 형식에서 고윳값(eigenvalues)의 순서만 변경됩니다.^[2]

Application to matrix functions

대각화는 행렬 $A=PDP^{-1}$ 의 거듭제곱을 효율적으로 계산하기 위해 사용될 수 있습니다:

{\begin{aligned}A^{k}&=\left(PDP^{-1}\right)^{k}=\left(PDP^{-1}\right)\left(PDP^{-1}\right)\cdots \left(PDP^{-1}\right)\\&=PD\left(P^{-1}P\right)D\left(P^{-1}P\right)\cdots \left(P^{-1}P\right)DP^{-1}=PD^{k}P^{-1},\end{aligned}}

그리고 후자는 대각 행렬의 거듭제곱만 포함하기 때문에 계산하기 쉽습니다. 예를 들어, 위의 예에서 고윳값 $\lambda =1,1,2$ 을 갖는 행렬 $A$ 에 대해, 다음을 계산합니다:

{\begin{aligned}A^{k}=PD^{k}P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}1^{k}&0&0\\0&1^{k}&0\\0&0&2^{k}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2-2^{k}&-1+2^{k}&2-2^{k+1}\\0&1&0\\-1+2^{k}&1-2^{k}&-1+2^{k+1}\end{bmatrix}}.\end{aligned}}

이 접근 방식은 거듭제곱 급수로 정의될 수 있는 행렬 지수(matrix exponential)와 다른 행렬 함수(matrix functions)로 일반화될 수 있습니다. 예를 들어, ${\textstyle \exp(A)=I+A+{\frac {1}{2!}}A^{2}+{\frac {1}{3!}}A^{3}+\cdots }$ 를 정의하여, 다음을 가집니다:

{\begin{aligned}\exp(A)=P\exp(D)P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}e^{1}&0&0\\0&e^{1}&0\\0&0&e^{2}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2e-e^{2}&-e+e^{2}&2e-2e^{2}\\0&e&0\\-e+e^{2}&e-e^{2}&-e+2e^{2}\end{bmatrix}}.\end{aligned}}

이것은 피보나치 숫자(Fibonacci numbers)와 같은 선형 재귀 수열(linear recursive sequences)의 항에 대해 닫힌 형식 표현을 찾는 데 특히 유용합니다.

Particular application

예를 들어, 다음 행렬을 생각해 보십시오:

M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}.

$M$ 의 다양한 거듭제곱을 계산하는 것은 다음과 같은 놀라운 패턴을 드러냅니다:

M^{2}={\begin{bmatrix}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatrix}},\quad M^{3}={\begin{bmatrix}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatrix}},\quad M^{4}={\begin{bmatrix}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatrix}},\quad \ldots

위의 현상은 $M$ 을 대각화함으로써 설명될 수 있습니다. 이를 달성하기 위해, $M$ 의 고유벡터로 구성된 $\mathbb {R} ^{2}$ 의 기저가 필요합니다. 그러한 고유벡터 기저 중 하나는 다음과 같이 주어집니다:

\mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix}1\\1\end{bmatrix}}=\mathbf {e} _{1}+\mathbf {e} _{2},

여기서 $\mathbf {e} _{i}$ 가 $\mathbb {R} ^{n}$ 의 표준 기저를 나타냅니다. 기저의 역 변경은 다음과 같이 주어집니다:

\mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u} .

간단한 계산은 다음임을 보여줍니다:

M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v} .

따라서, $a$ 와 $b$ 는 각각 $\mathbf {u}$ 와 $\mathbf {v}$ 에 해당하는 고윳값입니다. 행렬 곱셈의 선형성에 의해, 우리는 다음임을 가집니다:

M^{n}\mathbf {u} =a^{n}\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\mathbf {v} .

표준 기준으로 다시 전환하여, 다음임을 가집니다:

{\begin{aligned}M^{n}\mathbf {e} _{1}&=M^{n}\mathbf {u} =a^{n}\mathbf {e} _{1},\\M^{n}\mathbf {e} _{2}&=M^{n}\left(\mathbf {v} -\mathbf {u} \right)=b^{n}\mathbf {v} -a^{n}\mathbf {u} =\left(b^{n}-a^{n}\right)\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}.\end{aligned}}

행렬 형식으로 표현되는 선행 관계는 다음과 같습니다:

M^{n}={\begin{bmatrix}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatrix}},

이에 따라서 위의 현상을 설명합니다.

Quantum mechanical application

양자 역학적 계산과 양자 화학적 계산에서, 행렬 대각화는 가장 자주 적용되는 수치적 과정 중 하나입니다. 기본적인 이유는 시간-독립적인 슈뢰딩거 방정식(Schrödinger equation)이 무한 차원 공간 (힐베르트 공간) 위에 대부분의 물리적 상황에도 불구하고 고윳값 방정식이기 때문입니다.

매우 공통적인 근사는 힐베르트 공간을 유한 차원으로 자르는 것이며, 그 후에 슈뢰딩거 방정식은 실수 대칭, 또는 복소수 에르미트 행렬의 고윳값 문제로 공식화될 수 있습니다. 형식적으로 이 근사는 변형 원리(variational principle)에 기초하며, 아래에서 경계진 해밀턴에 유효합니다.

일-차 섭동 이론(First-order perturbation theory)은 역시 퇴화 상태에 대한 행렬 고윳값 문제로 이어집니다.

Notes

References

^ Horn, Roger A.; Johnson, Charles R. (2013). Matrix Analysis, second edition. Cambridge University Press. ISBN 9780521839402.
^ Anton, H.; Rorres, C. (22 Feb 2000). Elementary Linear Algebra (Applications Version) (8th ed.). John Wiley & Sons. ISBN 978-0-471-17052-5.

[HornJohnson-1] Horn, Roger A.; Johnson, Charles R. (2013). Matrix Analysis, second edition. Cambridge University Press. ISBN 9780521839402.

[2] Anton, H.; Rorres, C. (22 Feb 2000). Elementary Linear Algebra (Applications Version) (8th ed.). John Wiley & Sons. ISBN 978-0-471-17052-5.

[1]

[2]