Jump to content

Normalization (statistics)

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

통계학(statistics)과 통계학의 응용에서, 정규화(normalization)는 다양한 의미를 가질 수 있습니다.[1] 가장 단순한 경우에서, 평가의 정규화(normalization of ratings)는 종종 평균화하기 전에 개념적으로 공통 스케일로 다른 스케일로 측정된 값을 조정하는 것을 의미합니다. 보다 복잡한 경우에서, 정규화는 그 의도가 조정된 값의 전체 확률 분포(probability distribution)를 정렬하려는 곳에 보다 정교한 조정을 참조할 수 있습니다. 교육 평가에서 점수의 정규화(normalization of scores)의 경우에서, 분포를 정규 분포(normal distribution)로 정렬하기 위한 의도일 수 있습니다. 확률 분포의 정규화에 대한 다른 접근 방법은 서로 다른 측정의 분위-숫자(quantile)가 정렬되는 분위-숫자 정규화(quantile normalization)입니다.

통계학의 또 다른 사용법에서, 정규화는 통계량의 이동되고 스케일된 버전의 생성을 의미하며, 여기서 의도는 이들 정규화된 값(normalized values)이 변칙 시간 급수(anomaly time series)에서 처럼 특정 심한 영향의 효과를 제거하는 방법에서 다른 데이터집합에 대해 해당 정규화된 값의 비교를 허용하는 것입니다. 정규화의 일부 유형은 일부 크기 변수와 관련된 값에 도달하기 위해, 오직 재-스케일을을 포함합니다. 측정의 레벨(levels of measurement)의 관점에서, 그러한 비율은 (오직 거리가 의미이지만, 비율은 아닌) 구간(interval) 측정이 아닌, (측정의 비율이 의미있는) 비율(ratio) 측정에 오직 적합합니다.

이론적인 통계학에서, 매개변수 정규화는 종종 중추적 양(pivotal quantity) – 그의 표본 분포(sampling distribution)가 매개변수에 의존하지 않는 함수 – 및 보조 통계량(ancillary statistic) – 매개변수를 모른 채, 관측으로부터 계산될 수 있는 중추적 수량 – 으로 이어질 수 있습니다.

Examples

통계에서 다양한 유형의 정규화가 있습니다 – 오차, 잔여, 평균, 및 표준 편차(standard deviations)의 무차원 비율, 이것들은 따라서 스케일 불변(scale invariant)입니다 – 그것 중 일부는 다음과 같이 요약될 수 있습니다. 측정의 수준의 관점에서, 이들 비율은 구간 측정 (여기서 오직 거리가 의미있지만, 비율은 아님)이 아니라, 비율 측정 (여기서 측정의 비율이 의미있음)에 오직 의미가 있습니다. 역시 통계적 비율을 참조하십시오.

이름 공식 사용처
표준 점수 모집단 매개변수가 알려져 있을 때 오류 정규화. 정규적으로 분포된(normally distributed) 모집단에 잘 작동합니다.[2]
스튜던트의 t-통계량 가설된 값에서 매개변수의 추정된 값의 이탈, 표준 오차에 의해 정규화됩니다.
스튜던트화 잔여 매개변수가 추정될 때, 특히 회귀 분석(regression analysis)에서 서로 다른 데이터 점에 걸쳐 잔여를 정규화합니다.
표준화 모멘트 표준편차 를 스케일로 사용하여 모멘트를 정규화합니다.
변동의
계수
평균 를 스케일의 측정으로 사용하는, , 특히 지수 분포푸아송 분포와 같은 양의 분포에 대해 분산을 정규화합니다.
최소-최대 특색 스케일링 특색 스케일링(Feature scaling)은 모든 값을 [0,1] 범위로 가져오기 위해 사용됩니다. 이것은 역시 단위-기반 정규화라고 불립니다. 이것은 예를 들어 를 사용하여 어떤 임의적인 점 사이의 데이터집합에서 값의 범위를 억제하기 위해 일반화될 수 있습니다.

분산-대-평균 비율(variance-to-mean ratio) 와 같은 일부 다른 비율은 역시 정규화를 위해 수행되지만, 무차원이 아님을 주목하십시오; 단위가 취소되지 않고, 따라서 비율이 단위를 가지고, 스케일-불변이 아닙니다.

Other types

분포에 대한 가정없이 사용될 수 있는 다른 무-차원 정규화는 다음을 포함합니다:

See also

References

  1. ^ Dodge, Y (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9 (entry for normalization of scores)
  2. ^ Freedman, David; Pisani, Robert; Purves, Roger (2007-02-20). Statistics: Fourth International Student Edition. W.W. Norton & Company. ISBN 9780393930436.