Jump to content

Average absolute deviation

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

데이터 집합의 평균 절대 편차(average absolute deviation 줄여서 AAD)는 중심 점(central point)에서 절대(absolute) 편차(deviations)평균(average)입니다. 그것은 통계적 산포도(statistical dispersion) 또는 변동가능성의 요약 통계량(summary statistic)입니다. 일반적인 형식에서, 중심 점은 평균(mean), 중앙값(median), 최빈값(mode), 또는 주어진 데이터 집합에 관한 집중 경향 또는 임의의 참조 값의 임의의 다른 측정의 결과일 수 있습니다. AAD는 평균 절대 편차(mean absolute deviation)와 중앙값 절대 편차(median absolute deviation)를 포함합니다 (둘 다는 MAD로 축약됩니다).

Measures of dispersion

통계적 산포도(statistical dispersion)의 여러 측정은 절대 편차의 관점에서 정의됩니다. 용어 "평균 절대 편차"는 통계적 산포도(statistical dispersion)의 측정을 고유하게 식별하지 않는데, 왜냐하면 절대 편차를 측정하기 위해 사용될 수 있는 여러 측정이 있고, 마찬가지로 사용될 수 있는 중심 경향(central tendency)의 여러 측정이 있기 때문입니다. 따라서, 절대 편차를 고유하게 식별하기 위해, 편차의 측정과 중심 경향의 측정 둘 다를 지정하는 것이 필요합니다. 불행하게도, 통계적 문헌은 아직 표준 표기법을 채택하지 않았는데, 왜냐하면 평균 주변의 평균 절대 편차중앙값 주변의 중앙값 절대 편차 둘 다는 문헌에서 "MAD"라는 첫글자로 표시되어 왔으며, 이것이 혼동으로 이어질 수 있기 때문이며, 일반적으로, 그것들은 서로 상당히 다른 값을 가질 수 있기 때문입니다.

Mean absolute deviation around a central point

집합 {x1, x2, ..., xn}의 평균 절대 편차는 다음입니다:

중심 경향의 측정, 의 선택은 평균 편차에 현저한 영향을 미칩니다. 예를 들어, 데이터 집합 {2, 2, 3, 4, 14}에 대해:

중심 경향의 측정 평균 절대 편차
산술 평균(Arithmetic Mean) = 5
중앙값(Median) = 3
최빈값(Mode) = 2

중앙값에서 평균 절대 편차는 평균에서 평균 절대 편차보다 작거나 같습니다. 사실, 중앙값에서 평균 절대 편차는 항상 임의의 다른 고정된 숫자에서 평균 절대 편차보다 작거나 같습니다.

평균에서 평균 절대 편차는 표준 편차(standard deviation)보다 작거나 같습니다; 이것을 입증하는 한 방법은 옌센 부등식(Jensen's inequality)에 의존합니다.

정규 분포(normal distribution)에 대해, 표준 편차에 대한 평균 절대 편차의 비율은 입니다. 따라서, 만약 X가 기댓값 0을 갖는 정규적으로 분포된 확률 변수이면, Geary (1935)를 참조하십시오:[1]

다른 말로, 정규 분포에 대해, 평균 절대 편차는 표준 편차의 약 0.8배입니다. 어쨌든, 표본-내 측정은 작은 n에 대해 평향과 함께, 다음 경계: 을 갖는 주어진 가우스 표본 n에 대해 평균 절대 편차 / 표준 편차의 비율의 값을 제공합니다.[2]

Mean absolute deviation around the mean

역시 "평균 편차(mean deviation)" 또는 때때로 "평균 절대 편차(average absolute deviation)"로 참조되는 평균 절대 편차(mean absolute deviation, 줄여서 MAD)는 데이터 평균 주변의 데이터의 절대 편차의 평균입니다: 평균으로부터의 평균 (절대) 거리입니다. "평균 절대 편차(average absolute deviation)"는 이 사용법, 또는 지정된 중심 점에 관해 일반적인 형식으로 참조될 수 있습니다 (위를 참조).

MAD는 실생활에 더 잘 부합하므로 표준편차(standard deviation)의 자리에 사용되도록 제안되어 왔습니다.[3] MAD는 표준편차(standard deviation)보다 변동가능성의 더 단순한 측정이기 때문에, 학교 교육에 유용할 수 있습니다.[4][5]

이 방법의 예측 정확도는 단지 예측의 평균 제곱된 오차인 평균 제곱된 오차(mean squared error) (MSE) 방법과 매우 밀접하게 관련되어 있습니다. 비록 이들 방법은 매우 밀접하게 관련되어 있지만, MAD가 보다 공통적으로 사용되는데 왜냐하면 그것이 계산하기에 더 쉽고 (제곱할 필요가 없음)[6] 이해하기 더 쉽기 때문입니다.[7]

Mean absolute deviation around the median

중앙값(median)은 평균 편차가 최소화되는 점입니다. MAD 중앙값은 그것의 중앙값 주변의 확률 변수의 스케일의 직접 측정을 제공합니다:

이것은 라플라스 분포(Laplace distribution)의 스케일 매개변수 최대 가능도(maximum likelihood) 추정량입니다. 정규 분포에 대해, 우리는 를 가집니다. 중앙값은 평균 절대 편차를 최소화하기 때문에, 우리는 를 가집니다.

일반적인 산포도 함수를 사용함으로써, Habib (2011)는 중앙값에 대한 MAD를 다음으로 정의했습니다:

여기서 지시자 함수는 다음입니다:

이 표시는 MAD 중앙값 상관 계수를 획득하는 것을 허용합니다.

Median absolute deviation around a central point

원칙적으로 평균 또는 임의의 다른 중심 점이 중앙값 절대 편차에 대해 중심 점으로 취할 수 있지만, 더 자주 중앙값이 대신 취합니다.

Median absolute deviation around the median

중앙값 절대 편차(median absolute deviation, 줄여서 역시 MAD)는 중앙값에서 절대 편차의 중앙값입니다. 그것은 산포도의 강건한 추정량입니다.

예제 {2, 2, 3, 4, 14}에 대해: 3은 중앙값이므로, 중앙값에서 절대 편차는 중앙값 1을 갖는 {1, 1, 0, 1, 11}이며 ({0, 1, 1, 1, 11}로 재순서화됨), 이 경우에서 이상값 14의 값에 영향을 받지 않으므로, 중앙값 절대 편차는 1입니다.

대칭 분포에 대해, 중앙값 절대 편차는 사분위수-사이 범위(interquartile range) 절반과 같습니다.

Maximum absolute deviation

임의적인 점 주변의 최대 절대 편차는 해당 점에서 표본의 절대 편차의 최댓값입니다. 엄밀하게 중심 경향의 측정은 아니지만, 최대 절대 편차는 와 함께 위에서 처럼 평균 절대 편차에 대해 공식을 사용하여 구할 수 있으며, 여기서 표본 최댓값(sample maximum)입니다.

Minimization

절대 편차에서 파생된 통계적 산포도의 측정은 산포도를 최소화하는 것으로 중심 경향의 다양한 측정을 특징짓습니다: 중앙값은 절대 편차와 가장 결합된 중심 경향의 측정입니다. 일부 위치 매개변수는 다음과 같이 비교될 수 있습니다:

Estimation

표본의 평균 절대 편차는 모집단의 평균 절대 편차의 편향된 추정량(biased estimator)입니다. 절대 편차에 대해 불편향 추정량이 되기 위해, 모든 표본 절대 편차의 기댓값 (평균)이 모집단 절대 편차와 같아야 합니다. 어쨌든, 그렇지 않습니다. 모집단 1,2,3에 대해, 중앙값에 대한 모집단 절대 편차와 평균에 대한 모집단 절대 편차 둘 다는 2/3입니다. 모집단에서 추출되어질 수 있는 크기 3의 평균에 대한 모든 표본 절대 편차의 평균은 44/81이고, 반면에 중앙값에 대한 모든 표본 절대 편차의 평균은 4/9입니다. 그러므로, 절대 편차는 편향된 추정량입니다.

어쨌든, 이 논증은 평균-편향성(mean-unbiasedness)의 개념에 기반을 두고 있습니다. 위치의 각 측정은 그것 자체의 불편향성의 형식을 가집니다 (편향된 추정량(biased estimator)에 대한 엔트리를 참조하십시오). 불편향성의 관련 형식은 여기서 중앙값 불편향성입니다.

See also

References

  1. ^ Geary, R. C. (1935). The ratio of the mean deviation to the standard deviation as a test of normality. Biometrika, 27(3/4), 310–332.
  2. ^ See also Geary's 1936 and 1946 papers: Geary, R. C. (1936). Moments of the ratio of the mean deviation to the standard deviation for normal samples. Biometrika, 28(3/4), 295–307 and Geary, R. C. (1947). Testing for normality. Biometrika, 34(3/4), 209–242.
  3. ^ Taleb, Nassim Nicholas (2014). "What scientific idea is ready for retirement?". Edge. Archived from the original on 2014-01-16. Retrieved 2014-01-16.{{cite web}}: CS1 maint: bot: original URL status unknown (link)
  4. ^ Kader, Gary (March 1999). "Means and MADS". Mathematics Teaching in the Middle School. 4 (6): 398–403. Archived from the original on 2013-05-18. Retrieved 20 February 2013.
  5. ^ Franklin, Christine, Gary Kader, Denise Mewborn, Jerry Moreno, Roxy Peck, Mike Perry, and Richard Scheaffer (2007). Guidelines for Assessment and Instruction in Statistics Education (PDF). American Statistical Association. ISBN 978-0-9791747-1-1. Archived (PDF) from the original on 2013-03-07. Retrieved 2013-02-20.{{cite book}}: CS1 maint: multiple names: authors list (link)
  6. ^ Nahmias, Steven; Olsen, Tava Lennon (2015), Production and Operations Analysis (7th ed.), Waveland Press, p. 62, ISBN 9781478628248, MAD is often the preferred method of measuring the forecast error because it does not require squaring.
  7. ^ Stadtler, Hartmut; Kilger, Christoph; Meyr, Herbert, eds. (2014), Supply Chain Management and Advanced Planning: Concepts, Models, Software, and Case Studies, Springer Texts in Business and Economics (5th ed.), Springer, p. 143, ISBN 9783642553097, the meaning of the MAD is easier to interpret.

External links