Deviation (statistics)

수학(mathematics)과 통계학(statistics)에서, 편차(deviation)는 변수(variable)의 관측된 값과 일부 다른 변수, 종종 해당 변수의 평균(mean) 사이의 차이의 측정입니다. 편차의 부호(sign)는 그 차이의 방향을 보고합니다 (편차는 관측된 값이 참조 값을 초과할 때 양수입니다). 값의 크기는 차이의 크기를 나타냅니다.

Types

관측된 값과 관심있는 양의 참 값 사이의 차이인 편차는 오차(error)입니다 (여기서 참 값은 모집단 평균과 같은 기댓값을 나타냅니다.)

관측된 값과 참 값의 추정 사이의 차이인 편차는 잔여(residual)입니다 (예를 들어, 표본 평균; 표본의 기댓값은 모집단의 기댓값의 추정으로 사용될 수 있습니다). 이들 개념은 측정의 구간(interval) 수준과 측정의 비율(ratio) 수준에서 데이터에 대해 적용할 수 있습니다.

Unsigned or absolute deviation

통계학(statistics)에서, 데이터 집합(data set)의 원소의 절대 편차(absolute deviation)는 해당 원소와 주어진 점 사이의 절대 차이(absolute difference)입니다. 전형적으로 편차는 일부 유형의 평균(average)으로 해석되는 중심 값(central value)에서 계산되며, 가장 자주 중앙값(median) 또는 때때로 테이터 집합의 평균(mean)으로 해석됩니다: $D_{i}=|x_{i}-m(X)|,$ 여기서

D_i는 절대 편차입니다,
x_i는 데이터 원소입니다,
m(X)는 데이터 집합의 중심 경향(central tendency)의 선택된 측정입니다–때때로 평균(mean) ( ${\overline {x}}$ )이 선택되지만, 가장 자우 중앙값(median)이 선택됩니다.

Measures

Mean signed deviation

불편향된 추정량(unbiased estimator)에 대해, 비관찰된 모집단 매개변수 값에서 모든 관측의 전체 집합에 걸쳐 부호화된 편차의 평균은 임의적인 큰 숫자의 표본에 걸쳐 평균하면 영입니다. 어쨌든, 구성에 의해 표본 평균 값에서 값의 부호화된 편차의 평균은 항상 영이지만, 표본 중앙값과 같은 중심 경향의 또 다른 측정으로부터의 평균 부호화된 편차는 영일 필요는 없습니다.

Dispersion

편차의 분포의 통계는 통계적 산포도(statistical dispersion)의 측정으로 사용됩니다.

표준 편차(standard deviation)는 자주 사용되는 산포도의 측정입니다: 그것은 제곱된(squared) 편차를 사용하고 바람직한 속성을 가지지만, 강건(robust)하지는 않습니다.
평균 절대 편차(average absolute deviation)는 편차의 절댓값 합을 관측의 숫자로 나눈 값입니다.
중앙값 절대 편차(median absolute deviation)는 절대 편차의 평균이 아닌 중앙값을 사용하는 강건한 통계량(robust statistic)입니다.
최대 절대 편차(maximum absolute deviation)는 최대 절대 편차를 사용하는 고도로 비-강건한 측정입니다.

Normalization

편차는 측정 스케일의 단위를 가집니다 (예를 들어, 길이를 측정하면 미터). 우리는 두 가지 방법에서 무차원화(nondimensionalize)할 수 있습니다.

한 가지 방법은 스케일 (통계적 산포도(statistical dispersion))의 측정, 가장 자주 표준화(standardizing)에서 모집단 표준 편차를, 스튜던트화(studentizing) (예를 들어, 스튜던트화 잔여(Studentized residual))에서 표본 표준 편차로 나누는 것입니다.

우리는 산포도가 아닌 위치를 대신 스케일링할 수 있습니다: 백분율 편차(percent deviation)에 대해 공식(formula)은 관찰된 값에서 허용된 값을 뺀 값을 허용된 값으로 나눈 값에 100%를 곱한 것입니다.