Jump to content

Rank (linear algebra)

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

선형 대수(linear algebra)에서, 행렬(matrix) A랭크(rank)는 그의 열에 의해 생성된 (또는 스팬된) 벡터 공간차원(dimension)입니다.[1][2][3] 이것은 A의 선형적으로 독립 열의 최대 숫자에 해당합니다. 이것은, 차례로, 그의 행에 의해 스팬된 벡터 공간의 차원과 동일합니다.[4] 랭크는 따라서 선형 방정식 시스템의 "비-축약성(nondegenerateness)"과 A에 의해 인코딩된 선형 변환의 측정입니다. 랭크의 여러 동등한 정의가 있습니다. 행렬의 랭크는 그것의 가장 기본적인 특성 중 하나입니다.

랭크는 공통적으로 rank(A) 또는 rk(A)에 의해 표시됩니다;[2] 때때로, rank A에서 처럼, 괄호는 쓰이지 않습니다.[i]

Main definitions

이 섹션에서, 행렬의 랭크에 대한 몇 가지 정의를 제공합니다. 많은 정의가 가능합니다; 이들 중 몇 가지에 대해 대안적인 정의를 참조하십시오.

A열 랭크A열 공간(column space)차원(dimension)이고, 반면에 A행 랭크A행 공간(row space)의 차원입니다.

선형 대수에서 근본적인 결과는 열 랭크와 행 랭크가 항상 같다는 것입니다. (이 결과에 대한 두 가지 증명은 아래 § Proofs that column rank = row rank에 나와 있습니다.) 이 숫자 (즉, 선형적으로 독립 행 또는 열의 개수)는 단순히 A랭크라고 불립니다.

행렬은 만약 그것의 랭크가 같은 차원의 행렬에 대해 가능한 가장 큰 행과 열의 숫자 중 더 작은 값과 같을 때 완전한 랭크(full rank)를 가진다고 말합니다. 행렬이 완전한 랭크를 가지지 않으면 랭크-부족한(rank-deficient) 것이라고 말합니다. 행렬의 랭크 부족(rank deficiency)은 행과 열의 수 중 더 작은 수와 랭크 사이의 차이입니다.

선형 맵(linear map) 또는 연산자 의 랭크는 그것의 이미지(image)의 차원으로 정의됩니다:[5][6][7][8]여기서 은 벡터 공간의 차원이고, 는 맵의 이미지입니다.

Examples

다음 행렬은 랭크 2를 가집니다: 처음 두 열은 선형적으로 독립(linearly independent)이므로, 랭크는 적어도 2이지만, 세 번째 열은 처음 두 열의 선형 조합(첫 번째 열에서 두 번째 열을 뺀 것)이기 때문에, 세 열은 선형 종속이므로 랭크는 3보다 작아야 합니다.

다음 행렬은 랭크 1을 가집니다: 비-영 열이 있으므로, 랭크는 양수이지만, 임의의 열의 쌍은 선형적으로 종속입니다. 마찬가지로, A의 다음 전치(transpose) 랭크 1을 가집니다. 실제로 A의 열 벡터는 A전치(transpose)의 행 벡터이기 때문에, 행렬의 열 랭크가 행 랭크와 같다는 명제는 행렬의 랭크가 전치의 랭크와 같다는 명제와 동등합니다. 즉, rank(A) = rank(AT)입니다.

Computing the rank of a matrix

Rank from row echelon forms

행렬의 랭크를 찾는 공통적인 접근 방식은 기본 행 연산(elementary row operations)에 의한 행렬을 더 간단한 형식, 일반적으로 행 사다리꼴 형식(row echelon form)으로 줄이는 것입니다. 행 연산은 행 공간을 변경하지 않고 (따라서 행 랭크를 변경하지 않음), 역-가능인 것은 열 공간을 동형적 공간에 매핑합니다 (따라서 열 랭크를 변경하지 않습니다). 일단 행 사다리꼴 형식에서, 랭크는 행 랭크와 열 랭크 모두에 대해 분명하게 같고, 피벗 (또는 기본 열)의 숫자와 같고 비-영 행의 숫자와 같습니다.

예를 들어, 다음과 같이 주어진 행렬 A 다음 기본 행 연산을 사용함으로써 기약 행-사다리꼴 형식으로 넣을 수 있습니다: 최종 행렬 (행 사다리꼴 형식)은 2개의 비-영 행을 가지고 따라서 행렬 A의 랭크는 2입니다.

Computation

컴퓨터의 부동 점(floating point) 계산에 적용될 때, 기본 가우스 소거법 (LU 분해)은 신뢰할 수 없고, 랭크-공개 분해는 대신 사용되어야 합니다. 효과적인 대안은 특이값 분해(singular value decomposition) (SVD)이지만, 피벗팅을 갖는 QR 분해 (소위 랭크-공개 QR 인수분해)와 같이 가우스 소거법보다 수치적으로 더 강건한 다른 저렴한 선택이 있습니다. 랭크의 수치적 결정은 SVD로부터 특이값과 같은 값이 영으로 처리되어야 할 때 결정하기 위한 기준이 필요하며, 이는 행렬과 응용에 따라 달라지는 실용적인 선택입니다.

Proofs that column rank = row rank

Proof using row reduction

임의의 행렬의 열 랭크와 행 랭크가 같은 형식이라는 사실은 선형 대수에서 기본입니다. 많은 증명이 제공되어 왔습니다. 가장 기초적인 증명 중 하나는 § Rank from row echelon forms에 간략히 서술되어 있습니다. 다음은 이 증명의 변형입니다:

기본 행 연산(elementary row operation)에 의해 행 랭크도 변하지 않고 열 랭크도 변하지 않는다는 것을 보여주는 것은 간단합니다. 기본 행 연산에 의한 가우스 소거법(Gaussian elimination)이 진행됨에 따라, 행렬의 감소된 행 사다리꼴 형식(reduced row echelon form)은 원래 행렬과 같은 행 랭크와 같은 열 랭크를 가집니다. 추가 기본 열 연산은 행렬을 영들의 행과 열로 둘러싸인 항등 행렬(identity matrix)의 형식으로 넣는 것을 허용합니다. 다시 말하지만, 이것은 행 랭크도 변경하지 않고 열 랭크도 변경하지 않습니다. 이 결과 행렬의 행 랭크와 열 랭크는 모두 비-영 엔트리의 숫자입니다.

우리는 이 결과에 대한 두 가지 다른 증명을 제시합니다. 첫 번째는 벡터의 선형 조합(linear combinations)의 기본 속성만 사용하고, 임의의 필드(field)에 걸쳐 유효합니다. 증명은 Wardlaw (2005)를 기반으로 합니다.[9] 두 번째는 직교성(orthogonality)을 사용하고 실수에 걸쳐 행렬에 대해 유효합니다; 그것은 Mackiw (1995)를 기반으로 합니다.[4] 두 증명 모두 Banerjee와 Roy(2014)의 책에서 찾을 수 있습니다.[10]

Proof using linear combinations

Am × n 행렬이라고 놓습니다. A의 열 랭크를 r로 놓고, c1, ..., crA의 열 공간에 대한 임의의 기저라고 놓습니다. 이것들을 m × r 행렬 C의 열로 배치합니다. A의 모든 각 열은 C에서 r 열의 선형 조합으로 표현될 수 있습니다. 이것은 A = CR을 만족하는 r × n 행렬 R이 있음을 의미합니다. Ri번째 열이 Ai번째 열을 Cr 열의 선형 조합으로 제공하는 계수로부터 구성된 행렬입니다. 다시 말해서, RA의 열 공간의 기저에 대한 배수를 포함하는 행렬 (이는 C임)이며, 그런-다음 A를 전체로 형성하기 위해 사용됩니다. 이제, A의 각 행은 Rr 행의 선형 조합에 의해 제공됩니다. 그러므로, R의 행은 A의 행 공간의 스패닝 집합을 형성하고, 슈타이니츠 교환 정리(Steinitz exchange lemma)에 의해, A의 행 랭크는 r을 초과할 수 없습니다. 이것은 A의 행 랭크가 A의 열 랭크보다 작거나 같음을 입증합니다. 이 결과는 임의의 행렬에 적용될 수 있으므로, 결과를 A의 전치에 적용합니다. A의 전치의 행 랭크는 A의 열 랭크이고 A의 전치의 열 랭크는 A의 행 랭크이며, 이것은 역 부등식을 수립하고 우리는 A의 행 랭크와 열 랭크의 상등을 얻습니다. (역시, 랭크 인수분해(Rank factorization)를 참조하십시오.)

Proof using orthogonality

A를 행 랭크가 r인 실수에서 엔트리를 갖는 m × n 행렬이라고 놓습니다. 그러므로, A의 행 공간의 차원은 r입니다. x1, x2, …, xrA의 행 공간의 기저(basis)라고 놓습니다. 우리는 벡터 Ax1, Ax2, …, Axr선형적으로 독립(linearly independent)이라고 주장합니다. 그 이유를 알아보기 위해, 스칼라 계수 c1, c2, …, cr를 갖는 이들 벡터를 포함하는 선형 동차 관계를 생각해 보십시오: 여기서 v = c1x1 + c2x2 + ⋯ + crxr입니다. 우리는 두 가지를 관찰합니다: (a) vA의 행 공간에 있는 벡터의 선형 조합이며, 이는 vA의 행 공간에 속함을 의미하고, (b) Av = 0이므로, 벡터 vA의 모든 각 행 벡터에 직교(orthogonal)이고, 따라서, A의 행 공간에 있는 모든 각 벡터와 직교입니다. 사실 (a)와 (b)는 함께 v가 자신과 직교한다는 것을 암시하며, 이는 v = 0, 또는 v의 정의에 의해 다음임을 입증합니다: 그러나 xiA의 행 공간의 기저로 선택되었고 따라서 선형적으로 독립적이라는 점을 상기하십시오. 이것은 c1 = c2 = ⋯ = cr = 0임을 의미합니다. 그것으로부터, Ax1, Ax2, …, Axr은 선형적으로 독립임이 따라옵니다.

이제, 각 Axi는 분명하게 A의 열 공간에 있는 벡터입니다. 따라서, Ax1, Ax2, …, AxrA의 열 공간에 있는 r 선형적으로 독립 벡터 집합이고 따라서 A의 열 공간의 차원 (즉, A의 열 랭크)는 적어도 r만큼 커야 합니다. 이것은 A의 행 랭크가 A의 열 랭크보다 크지 않다는 것을 입증합니다. 이제 이 결과를 A의 전치에 적용하여 역 부등식을 얻고 이전 증명에서와 같은 결론을 내립니다.

Alternative definitions

이 섹션에 있는 모든 정의에서, 행렬 A는 임의적인 필드(field) F에 걸쳐 m × n 행렬로 취합니다.

Dimension of image

행렬 가 주어지면, 다음에 의해 정의된

다음과 같은 결합된 선형 매핑(linear mapping)이 있습니다:

의 랭크는 의 이미지의 차원입니다. 이 정의는 특정 행렬에 대한 필요성 없이 임의의 선형 맵에 적용될 수 있다는 장점을 가집니다.

Rank in terms of nullity

위에서와 같은 선형 매핑 f가 주어지면, 랭크는 n에서 f커널(kernel)의 차원을 뺀 값입니다. 랭크-널러티 정리(rank–nullity theorem)는 이 정의가 이전 정의와 동등하다고 말합니다.

Column rank – dimension of column space

A의 랭크는 A의 선형적으로 독립 열 의 최대 개수입니다; 이것은 A열 공간(column space)차원(dimension)입니다 (열 공간은 A의 열에 의해 생성된 Fm의 부분 공간이며, 실제로는 A와 결합된 선형 맵 f의 이미지입니다).

Row rank – dimension of row space

A의 랭크는 A의 선형적으로 독립 행의 최대 개수입니다; 이것은 A행 공간(row space)의 차원입니다.

Decomposition rank

A의 랭크는 A로 인수화될 수 있음을 만족하는 가장 작은 정수 k이며, 여기서 Cm × k 행렬이고 Rk × n 행렬입니다. 사실, 모든 정수 k에 대해, 다음은 동등합니다:

  1. A의 열 랭크는 k보다 작거나 같습니다,
  2. A의 모든 각 열이 의 선형 조합임을 만족하는 크기 mk가 존재합니다,
  3. 를 만족하는 행렬 C 행렬 R이 존재합니다 (k가 랭크일 때, 이것은 A랭크 인수분해(rank factorization)입니다),
  4. A의 모든 각 행은 의 선형 조합임을 만족하는 크기 nk이 존재합니다,
  5. A의 행 랭크는 k보다 작거나 같습니다.

실제로, 다음과 같은 동등성은 명백합니다: . 예를 들어, (2)에서 (3)을 입증하기 위해, (2)에서 열이 인 행렬로 C를 취합니다. (3)에서 (2)를 입증하기 위해, C의 열로 취합니다.

동등성 에서 행 랭크는 열 랭크와 같음이 따라옵니다.

"이미지의 차원" 특성화의 경우에서와 같이, 이것은 임의의 선형 맵의 랭크의 정의로 일반화될 수 있습니다: 선형 맵 f : VW의 랭크는 f가 맵 VX와 맵 XW의 합성으로 쓸 수 있음을 만족하는 중간 공간 X의 최소 차원 k입니다. 불행히도, 이 정의는 랭크를 계산하는 효율적인 방법을 제안하지 않습니다 (이것에 대해 대안적인 정의 중 하나를 사용하는 것이 더 좋습니다). 자세한 내용에 대해 랭크 인수분해(rank factorization)를 참조하십시오.

Rank in terms of singular values

A의 랭크는 비-영 특이값(singular values)의 개수와 같으며, 이는 특이값 분해(singular value decomposition) 에서 의 비-영 대각선 원소의 개수와 같습니다.

Determinantal rank – size of largest non-vanishing minor

A의 랭크는 A에서 임의의 비-영 소행렬식(minor)의 가장 큰 차수입니다. (소행렬식의 차수는 그것이 행렬식인 정사각 부분-행렬의 변-길이입니다.) 분해 랭크 특성화와 마찬가지로, 이것은 랭크를 계산하는 효율적인 방법을 제공하지 않지만, 이론적으로는 유용합니다: 단일 비-영 소행렬식은 행렬의 랭크에 대해 아래쪽 경계 (즉, 그것의 차수)를 목격하며, 이는 (예를 들어) 특정 연산은 행렬의 랭크를 낮추지 않음을 입증하기 위해 유용할 수 있습니다.

비-사라지는 p-소행렬식 (비-영 행렬식을 갖는 p × p 부분행렬)은 해당 부분행렬의 행과 열이 선형적으로 독립이고, 따라서 완전한 행렬의 해당 행과 열은 (완전한 행렬에서) 선형적으로 독립이므로, 행과 열 랭크는 적어도 행렬식의 랭크만큼 크다는 것을 보여줍니다; 어쨌든, 그 전환은 덜 간단합니다. 행렬식의 랭크와 열 랭크의 동등성은 만약 n 벡터의 스팬이 p 차원을 가지면, 해당 벡터의 p가 공간에 스팬한다는 명제를 강화합니다 (동등하게, 벡터의 부분집합인 스팬하는 집합을 선택할 수 있다는 명제): 동등성은 행의 부분-집합과 열의 부분-집합이 동시에 역-가능 부분-행렬을 정의함을 의미합니다 (동등하게, 만약 n 벡터의 스팬이 p 차원을 가지면, 이들 벡터의 p는 공간에 스팬하고 그것들이 선형적으로 독립인 p 좌표의 집합이 있습니다).

Tensor rank – minimum number of simple tensors

A의 랭크는 Ak 랭크 1 행렬의 합으로 쓸 수 있음을 만족하는 가장 작은 숫자 k이며, 여기서 행렬이 랭크 1을 가지는 것으로 정의되는 것과 그것이 열 벡터 c와 행 벡터 r의 비-영 곱 로 쓸 수 있는 것은 필요충분 조건입니다. 이 랭크의 개념은 텐서 랭크(tensor rank)라고 불립니다; 그것은 특이값 분해(singular value decomposition)분리-가능 모델(separable models) 해석에서 일반화될 수 있습니다.

Properties

우리는 Am × n 행렬이라고 가정하고, 위와 같이 선형 맵 ff(x) = Ax로 정의합니다.

  • m × n 행렬의 랭크는 비-음의 정수이고 m 또는 n보다 클 수 없습니다. 즉,랭크 min(m, n)을 가지는 행렬은 완전한 랭크(full rank)를 가진다고 말합니다; 그렇지 않으면, 그 행렬은 랭크가 부족한(deficient) 것입니다.
  • 오직 영 행렬(zero matrix)이 랭크 영을 가집니다.
  • f단사(injective) (또는 "일-대-일")인 것과 A가 랭크 n을 가지는 것은 필요충분 조건입니다 (이 경우에서, 우리는 A완전한 열 랭크를 가진다고 말합니다).
  • f전사(surjective) (또는 "위로의")인 것과 A가 랭크 m을 가지는 것은 필요충분 조건입니다 (이 경우에서, 우리는 A완전한 행 랭크를 가진다고 말합니다).
  • 만약 A가 정사각 행렬 (즉, m = n)이면, A역-가능(invertible)인 것과 A가 랭크 n을 가지는 것은 필요충분 조건입니다 (즉, A는 완전한 랭크를 가집니다).
  • 만약 B가 임의의 n × k 행렬이면,
  • 만약 B가 랭크 nn × k 행렬이면,
  • 만약 C가 랭크 ml × m 행렬이면,
  • A의 랭크가 r과 같은 것은 역-가능 m × m 행렬 X가 존재하고 다음을 만족하는 역-가능 n × n 행렬 Y가 존재하는 것은 필요충분 조건입니다: 여기서 Irr × r 항등 행렬(identity matrix)을 표시합니다.
  • 실베스터(Sylvester)의 랭크 부등식: 만약 Am × n 행렬이고 Bn × k 행렬이면,[ii] 이것은 다음 부등식의 특별한 경우입니다.
  • 프로베니우스(Frobenius)에 기인한 부등식: 만약 AB, ABC, 및 BC가 정의되면,[iii]
  • 부분-덧셈성: AB가 같은 차원의 것입니다. 결과로써, 랭크-k 행렬은 k 랭크-1 행렬의 합으로 쓸 수 있지만, 더 적지는 않습니다.
  • 행렬의 랭크 더하기 행렬의 널러티(nullity)는 행렬의 열의 개수와 같습니다. (이것이 랭크-널러티 정리(rank–nullity theorem)입니다.)
  • 만약 A가 실수에 걸쳐 행렬이면 A의 랭크와 그것의 대응하는 그람 행렬(Gram matrix)의 랭크는 같습니다. 따라서, 실수 행렬에 대해 이것은 그것들의 널 공간(null spaces)의 상등을 입증함으로써 보일 수 있습니다. 그람 행렬의 널 공간은 인 벡터 x에 의해 제공됩니다. 만약 이 조건이 충족되면, 우리는 역시 를 가집니다.[11]
  • 만약 A복소수(complex numbers)에 걸쳐 행렬이고 A의 복소 켤레를 나타내고 AA의 켤레 전치 (즉, A인접(adjoint))를 나타내면,

Applications

행렬의 랭크를 계산하는 유용한 응용 중 하나는 선형 방정식 시스템(system of linear equations)의 해의 개수를 계산하는 것입니다. 루셰–카펠리 정리(Rouché–Capelli theorem)에 따르면, 그 시스템은 만약 증가된 행렬(augmented matrix)의 랭크가 계수 행렬(coefficient matrix)의 랭크보다 크면 비-일관적입니다. 만약 다른 한편으로, 이들 두 행렬의 랭크가 같으면, 그 시스템은 적어도 하나의 해를 가져야 합니다. 그 해가 고유한 것과 랭크가 변수의 숫자와 같은 것은 필요충분 조건입니다. 그렇지 않으면 일반 해는 k 자유 매개변수를 가지며, 여기서 k는 변수 숫자와 랭크 사이의 차이입니다. 이 경우 (및 방정식 시스템이 실수 또는 복소수에 있다는 가정)에서, 방정식 시스템은 무한하게 많은 해를 가집니다.

제어 이론(control theory)에서, 행렬의 랭크는 선형 시스템(linear system)제어-가능(controllable)인지, 또는 관찰-가능(observable)인지 여부를 결정하기 위해 사용될 수 있습니다.

통신 복잡성(communication complexity)의 분야에서, 기능의 통신 행렬의 랭크는 두 당사자가 기능을 계산하는 데 필요한 통신 총양에 대한 경계를 제공합니다.

Generalization

행렬의 열 랭크, 행 랭크, 열 공간의 차원, 및 행 공간의 차원이 다른 것과 다를 수 있거나 존재하지 않을 수 있는 임의적인 링(rings)에 걸쳐 행렬에 대한 랭크 개념의 다른 일반화가 있습니다.

행렬을 텐서(tensors)로 생각하면, 텐서 랭크(tensor rank)는 임의적인 텐서로 일반화됩니다; 차수가 2보다 큰 텐서 (행렬은 차수 2 텐서임)에 대해, 랭크는 행렬과 달리 계산하기에 매우 어렵습니다.

매끄러운 매니폴드(smooth manifolds) 사이의 매끄러운 맵(smooth maps)에 대해 랭크(rank)의 개념이 있습니다. 그것은 도함수(derivative)의 선형 랭크와 같습니다.

Matrices as tensors

행렬 랭크는 텐서 랭크라고 불리는 텐서 차수(tensor order)와 혼동해서는 안 됩니다. 텐서 차수는 텐서를 작성하는 데 필요한 인덱스의 숫자이고, 따라서 행렬은 모두 텐서 차수 2를 가집니다. 보다 정확하게, 행렬은 (1,1) 유형의 텐서로, 하나의 행 인덱스와 하나의 열 인덱스를 가지며, 공변 차수 1과 반변 차수 1이라고도 불립니다; 자세한 내용에 대해 Tensor (intrinsic definition)를 참조하십시오.

행렬의 텐서 랭크는 행렬을 선형 조합으로 표현하는 데 필요한 단순 텐서(simple tensors)의 최소 개수를 의미할 수도 있고, 이 정의는 여기서 논의된 행렬 랭크와 일치합니다.

See also

Notes

  1. ^ Alternative notation includes from Katznelson & Katznelson (2008, p. 52, §2.5.1) and Halmos (1974, p. 90, § 50).
  2. ^ Proof: Apply the rank–nullity theorem to the inequality
  3. ^ Proof. The mapis well-defined and injective. We thus obtain the inequality in terms of dimensions of kernel, which can then be converted to the inequality in terms of ranks by the rank–nullity theorem. Alternatively, if is a linear subspace then ; apply this inequality to the subspace defined by the orthogonal complement of the image of in the image of , whose dimension is ; its image under has dimension .

References

  1. ^ Axler (2015) pp. 111-112, §§ 3.115, 3.119
  2. ^ a b Roman (2005) p. 48, § 1.16
  3. ^ Bourbaki, Algebra, ch. II, §10.12, p. 359
  4. ^ a b Mackiw, G. (1995), "A Note on the Equality of the Column and Row Rank of a Matrix", Mathematics Magazine, 68 (4)
  5. ^ Hefferon (2020) p. 200, ch. 3, Definition 2.1
  6. ^ Katznelson & Katznelson (2008) p. 52, § 2.5.1
  7. ^ Valenza (1993) p. 71, § 4.3
  8. ^ Halmos (1974) p. 90, § 50
  9. ^ Wardlaw, William P. (2005), "Row Rank Equals Column Rank", Mathematics Magazine, 78 (4): 316–318, doi:10.1080/0025570X.2005.11953349, S2CID 218542661
  10. ^ Banerjee, Sudipto; Roy, Anindya (2014), Linear Algebra and Matrix Analysis for Statistics, Texts in Statistical Science (1st ed.), Chapman and Hall/CRC, ISBN 978-1420095388
  11. ^ Mirsky, Leonid (1955). An introduction to linear algebra. Dover Publications. ISBN 978-0-486-66434-7.

Sources

Further reading

  • Roger A. Horn and Charles R. Johnson (1985). Matrix Analysis. ISBN 978-0-521-38632-6.
  • Kaw, Autar K. Two Chapters from the book Introduction to Matrix Algebra: 1. Vectors [1] and System of Equations [2]
  • Mike Brookes: Matrix Reference Manual. [3]