Jump to content

Euclidean distance

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning
(Redirected from Euclidean length)
Illustration for n=3, repeated application of the Pythagorean theorem yields the formula

수학(mathematics)에서, 유클리드 거리(Euclidean distance) 또는 유클리드 메트릭(Euclidean metric)은 유클리드 공간(Euclidean space)에서 두 점 사이의 "보통의" 직선(straight-line) 거리(distance)입니다. 이 거리와 함께, 유클리드 공간은 메트릭 공간(metric space)이 됩니다. 결합된 노름(norm)유클리드 노름(Euclidean norm)으로 불립니다. 더-오래된 문헌은 그 메트릭(metric)피타고라스 메트릭(Pythagorean metric)으로 참조합니다. 유클리드 노름에 대한 일반화된(generalized) 용어는 L2 노름 또는 L2 거리입니다.

Definition

pq 사이의 유클리드 거리는 그들을 연결하는 선분(line segment) ()의 길이입니다.

데카르트 좌표(Cartesian coordinates)에서, 만약 p = (p1p2,..., pn) 및 q = (q1q2,..., qn)가 유클리드 n-공간(Euclidean n-space)에서 두 점이면, p로부터 q까지, 또는 q로부터 p까지 거리 (d)는 피타고라스 공식(Pythagorean formula)에 의해 제공됩니다:[1]

 

 

 

 

(1)

유클리드 n-공간에서 점의 위치는 유클리드 벡터(Euclidean vector)입니다. 그래서, pq는, 공간의 원점 (시작 점)에서 시작하여 두 점에서 끝나는 그들의 머리 (끝점)와 함께 유클리드 벡터로 표현될 수 있을 것입니다. 벡터의 유클리드 노름(Euclidean norm), 또는 유클리드 거리, 또는 크기는 그 벡터의 거리를 측정합니다:[1]

여기서 마지막 표현은 점 곱(dot product)을 포함합니다.

유클리드 공간의 원점(origin) (벡터 꼬리)에서, 그 공간에서 한 점 (벡터 머리)까지의 방향화된 선분으로 벡터를 묘사하면, 그의 길이는 실제로 그의 꼬리에서 그의 머리까지의 거리입니다. 벡터의 유클리드 노름은 꼬리와 머리 사이의 단지 유클리드 거리로 보일 것입니다.

pq 사이의 관계는 방향 (예를 들어, p에서 q로)을 포함할 수 있으므로, 그것이 그럴 때, 이 관계는 자체로 벡터에 의해 표현될 수 있으며, 다음으로 제공됩니다:

이- 또는 삼-차 공간 (n = 2, 3)에서, 이것은 p로부터 q까지 화살표로 시각적으로 표현될 수 있습니다. 임의의 공간에서, 그것은 p에 대한 q의 위치로 여길 수 있습니다. 그것은, 만약 pq가 일부 움직이는 점의 두 위치를 나타내면, 변위(displacement) 벡터로 역시 불립니다.

pq 사이의 유클리드 거리는 단지 이 변위 벡터의 유클리드 길이입니다:

 

 

 

 

(2)

이것은 방정식 1과 동등하고, 역시 다음과 동등합니다:

One dimension

유클리드 기하학(Euclidean geometry)의 문맥에서, 메트릭은 일 차원에서 직선(line) 위의 두 점(points)을 고정하고, 하나를 원점(origin)으로 선택함으로써 수립됩니다. 이들 점 사이의 선분(line segment)의 길이는 거리의 단위를 정의하고 원점으로부터 두 번째 점까지 방향은 양의 방향으로 정의됩니다. 이 선분은 그의 길이가 단위 거리의 배수에 해당하는 더 긴 선분을 형성하기 위해 직선을 따라 이동될(translated) 수 있을 것입니다. 이 방식으로, 실수(real number)는 (원점에서 그 점까지의 거리로) 직선 위의 점과 결합될 수 있고 이들은 지금 실수 직선으로 불리는 것 위의 점의 데카르트 좌표(Cartesian coordinates)입니다. 메트릭을 수립하기 위한 대안적인 방법으로, 직선 위의 두 점을 선택하는 대신에, 하나의 점을 원점, 길이의 단위 및 양의 것으로 부르는 직선을 따라 방향을 선택하십시오. 두 번째 점은 그런-다음 원점에서 일 양의 단위의 거리에 있는 직선의 위의 그 점으로 고유하게 결정됩니다.

실수 직선 위의 임의의 두 점 사이의 거리는 그들 좌표의 수치적 차이의 절댓값(absolute value)입니다. 그것은 그의 데카르트 좌표와 함께 한 점의 이름을 식별하는 것이 공통입니다. 따라서 만약 pq가 실수 직선 위의 두 점이면, 그들 사이의 거리는 다음으로 제공됩니다:

일 차원에서, 하나의 동차, 길이의 스케일 인수까지(up to), (평행)이동-불변 메트릭(metric) (다른 말로, 노름(norm)에 의해 추론될 수 있는 거리)이 있으며, 이것은 유클리드 거리이며, 절댓-값 노름(absolute-value norm)에 의해 유도됩니다 (이것은 일차원에서, 스케일까지 고유한 노름입니다). 더 높은 차원에서, 노름 (이것은 일차원에서 모두 같습니다)과 같은, 다른 가능한 노름이 있고, 일차원에서 다른 메트릭 (임의의 단조로운 함수(monotonic function)에 의한 스케일링 유클리드 거리)이 있지만, 그들은 노름에 의해 유도될 수 없습니다 (메트릭으로, 그들은 동차는 아니고 이동-불변입니다).

Two dimensions

Euclidean distance in R2

유클리드 평면에서, 만약 p = (p1p2) 및 q = (q1q2)이면, 거리는 다음으로 제공됩니다:

이것은 피타고라스 정리(Pythagorean theorem)와 동등합니다.

대안적으로, 그것은 만약 점 p극 좌표(polar coordinates)가 (r1, θ1)이고 q의 그것이 (r2, θ2)이면, 그 점 사이의 거리는 다음인 것은 (2)로부터 따릅니다:

Three dimensions

삼-차원 유클리드 공간에서, 거리는 다음입니다:

n dimensions

일반적으로, n-차원 공간에서 거리는 다음입니다:

Squared Euclidean distance

제곱된 유클리드 거리(squared Euclidean distance (SED))로 알려져 있는, 표준 유클리드 거리의 제곱은 역시 관심이 있습니다; 방정식으로:

제곱된 유클리는 거리는 통계적 모델(statistical model)의 매개변수를 추정하는 것에서 가장 중요하며, 여기서 그것은 최소 제곱(least squares)의 방법, 회귀 분석(regression analysis)에 대한 표준 접근법에서 사용됩니다. 해당하는 손실 함수(loss function)제곱된 오차 손실(squared error loss) (SEL)이고, 더 큰 오류에 대한 점진적으로 더 큰 가중값을 놓습니다. 해당하는 위험 함수(risk function) (예상된 손실(expected loss))는 평균 제곱된 오차(mean squared error) (MSE)입니다.

제곱된 유클리드 거리는 메트릭(metric)이 아닌데, 왜냐하면 그것은 삼각형 부등식(triangle inequality)을 만족시키지 못하기 때문입니다. 어쨌든, 그것은 거리의 더 일반적인 개념, 즉 발산(divergence) (특히 브레그만 발산(Bregman divergence))이고, 통계적 거리(statistical distance)로 사용될 수 있습니다. 피타고라스 정리(Pythagorean theorem)는 제곱된 거리의 관점에서 더 간단합니다 (왜냐하면 제곱근이 없기 때문입니다); 만약 이면,

정보 기하학(information geometry)에서, 피타고라스의 항등식은, 최소 제곱의 일반화된 형식을 비-선형 문제를 해결하기 위해 사용되는 것을 허용하는, 상대 엔트로피(relative entropy) (쿨백-라이블러 발산(Kullback–Leibler divergence))을 포함하는, SED로부터 다른 브레그만 발산까지 일반화될 수 있습니다.

SED는, 거리와 달리, 두 점의 매끄러운, 엄격하게 볼록 함수(convex function)이며, 이것은 두 점이 같을 때 매끄럽지 않고 엄격하게 볼록도 아닙니다 (왜냐하면 그것은 선형이기 때문입니다). SED는 따라서 최적 이론(optimization theory)에서 선호되며, 왜냐하면 그것은 볼록 해석학(convex analysis)을 사용하도록 허용하기 때문입니다. 제곱화는 비-음의 값의 단조로운 함수(monotonic function)이므로, SED를 최소화하는 것은 유클리드 거리를 최소화하는 것과 동등하므로, 최적 문제는 어느 쪽의 관점이든 동등하지만, SED를 사용하여 푸는 것이 더 쉽습니다.

만약 그 점들의 하나가 고정되면, SED는 퍼텐셜 함수(potential function)로 해석될 수 있으며, 그 경우에서, 절반의 정규 인수가 사용되고, 부호는, 관례에 따라, 전환됩니다. 세부적으로, 벡터 에서 까지를 가리키고, 그들 유클리드 거리와 비례하는 크기를 가집니다. 만약 하나를 에 고정하면, 우리는 따라서 에 의한 "에서 가리키는" 매끄러운 벡터 필드(vector field)를 정의할 수 있습니다. 이것은 "로부터" 스칼라-값 함수 "절반 SED"의 그래디언트이며, 여기서 그 절반은 거듭제곱 규칙(power rule)에서 그 이(2)를 취소합니다. 로부터 절반 제곱된 거리를 쓰면, 우리는 를 가집니다. 대안적으로, 우리는 로부터 가리키는 벡터 필드를 고려할 수 있고, 음의 부호를 생략합니다.

정보 기하학에서, "한 점에서 다른 것까지 가리키는 것"의 벡터 필드의 개념은 통계적 매니폴드(statistical manifold)로 일반화될 수 있습니다 – 우리는 다른 점에서 접 벡터를 연결하기 위해 아핀 연결(affine connection)을 사용할 수 있고 한 점에서 다른 점까지 흐리기 위해 지수 맵(exponential map)을 사용할 수 있고, 통계적 매니폴드 위에서 이것은 역-가능하며, 주어진 임의의 점에서 다른 점까지 고유한 "차이 벡터"를 정의합니다. 이 문맥에서, SED (그의 그래디언트가 표준 차이 벡터를 생성합니다)는 매니폴드의 정보 기하학을 생성하는 발산으로 일반화됩니다; (기하학적 구조가 주어지면) 그러한 발산의 균등 구성은 정식의 발산(canonical divergence)으로 불립니다.[2]

유리 삼각법(rational trigonometry)의 분야에서, SED는 제곱-거리(quadrance)로 참조됩니다.

See also

References

  1. ^ a b Anton, Howard (1994), Elementary Linear Algebra (7th ed.), John Wiley & Sons, pp. 170–171, ISBN 978-0-471-58742-2
  2. ^ Ay & Amari 2015, 2. A New Approach to the General Inverse Problem.

Further reading

  • Deza, Elena; Deza, Michel Marie (2009). Encyclopedia of Distances. Springer. p. 94.
  • "Cluster analysis". March 2, 2011.