Jump to content

Statistic

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

통계량(statistic) (특이(singular)) 또는 표본 통계량(sample statistic)은 통계적 목적에 대해 고려된 표본(sample)에서 값으로부터 계산된 임의의 양입니다. 통계적 목적은 모집단(population) 매개변수 추정, 표본의 설명, 또는 가설의 평가를 포함합니다. 표본 값의 평균(average)은 통계량입니다. 용어 통계량은 주어진 표본의 함수와 함수의 값에 대해 둘 다 사용됩니다. 통계량이 특정 목적을 위해 사용될 때, 그것의 목적을 나타내는 이름으로 참조될 수 있습니다.

통계량이 모집단 매개변수를 추정하는 것에 사용될 때, 통계량은 추정량이라고 불립니다. 모집단 매개변수는 연구 중인 모집단의 임의의 특성이지만, 모집단 매개변수의 값을 직접 측정하는 것이 가능하지 않을 때, 통계적 방법은 모집단에서 취해진 표본에서 계산된 통계량을 기반으로 매개변수의 가능한 값을 추론하기 위해 사용됩니다. 예를 들어, 표본 평균(sample mean)은 모집단 평균의 불편향된 추정량(unbiased estimator)입니다. 이것은 표본 평균의 기댓값(expected value)이 실제 모집단 평균과 같음을 의미합니다.[1]

기술 통계량(descriptive statistic)은 표본 데이터를 요약하기 위해 사용됩니다. 테스트 통계량(test statistic)통계적 가설 테스팅(statistical hypothesis testing)에서 사용됩니다. 단일 통계량은 여러 목적으로 사용될 수 있음을 주목하십시오 – 예를 들어 표본 평균은 모집단 평균을 추정, 표본 데이터 집합을 설명하거나, 가설을 테스트하기 위해 사용될 수 있습니다.

Examples

통계량의 일부 예제는 다음과 같습니다:

  • "최근 미국인을 대상으로 한 설문조사에서 공화당원(Republicans)52%가 지구 온난화가 일어나고 있다고 답했습니다."

이 경우에서, "52%"는 통계량, 즉 지구 온난화를 믿는 설문 표본에서 공화당원의 백분율입니다. 모집단은 미국에서 모든 공화당원의 집합(set)이고, 추정되는 모집단 매개변수는 지구 온난화를 믿는 단지 조사 대상이 아닌 미국에서 모든 공화당원의 백분율입니다.

  • "디즈니 월드 근처에 위치한 대형 호텔의 매니저는 20 선택된 손님이 5.6일과 같은 평균 체류 기간을 가진다고 말했습니다."

이 예제에서, "5.6일"은 통계량, 즉 20명의 호텔 손님의 샘플에 대해 평균 체류 기간입니다. 모집단은 이 호텔의 모든 손님의 집합이고, 추정되는 모집단 매개변수는 모든 손님의 평균 체류 기간입니다.[2] 이 경우에서 추정량이 불편향인지 여부는 표본 선택 과정에 따라 다릅니다; 검사 역설(the inspection paradox)을 참조하십시오.

통계량을 계산하기 위해 사용되는 다양한 함수가 있습니다. 일부는 다음과 같습니다:

Properties

Observability

통계량은 통계적 모집단(statistical population)의 속성을 설명하는 일반적으로 비-관찰가능 양인 매개변수에서, 및 관찰된 측정과 모집단 평균 사이의 차이와 같은 비-관찰가능 확률 변수 둘 다와 구별되는 관찰-가능 확률 변수(random variable)입니다. 매개변수는 만약 전체 모집단이 오류없이 관찰될 수 있으면 오직 정확하게 계산될 수 있습니다; 예를 들어, 완벽한 설문조사 또는 표준화된 테스트(standardized test) 응시자의 모집단에 대해 그렇습니다.

통계학자들은 종종 표본이 무작위로 추출되는 모집단의 각 구성원의 일부 측정-가능 측면의 분포일 수 있는 확률 분포(probability distribution)매개변수화된 가족(parameterized family)을 심사 숙고합니다. 예를 들어, 매개변수는 북미에 있는 25세 남성의 평균 키일 수 있습니다. 그러한 남성 100명의 표본 구성원의 키가 측정됩니다; 그들 100개의 숫자의 평균은 통계량입니다. 모집단의 모든 구성원의 키 평균은 (모집단의 모든 각 구성원을 측정하는 것과 같이) 어떻게든 확인되지 않은 한 통계량이 아닙니다. 북미 모든 25세 남성의 키를 모두 사용하여 계산될 평균 키는 통계량이 아니라 매개변수입니다.

Statistical properties

통계량의 중요한 잠재적 속성은 완전성(completeness), 일관성(consistency), 충분성(sufficiency), 불편향(unbiased)성, 최소 평균 제곱 오차, 낮은 분산, 강건성(robustness), 및 계산 편의성을 포함합니다.

Information of a statistic

모델 매개변수에 대한 통계량의 정보는 여러 가지 방에서 정의될 수 있습니다. 가장 공통적인 것은 통계량에 의해 유도된 통계량 모델에 정의된 피셔 정보(Fisher information)입니다. 쿨백 정보(Kullback information) 측정이 역시 사용될 수 있습니다.

See also

References

  • Kokoska, Stephen (2015). Introductory Statistics: A Problem-Solving Approach (2nd ed.). New York: W. H. Freeman and Company. ISBN 978-1-4641-1169-3.
  • Parker, Sybil P (editor in chief). "Statistic". McGraw-Hill Dictionary of Scientific and Technical Terms. Fifth Edition. McGraw-Hill, Inc. 1994. ISBN 0-07-042333-4. Page 1912.
  • DeGroot and Schervish. "Definition of a Statistic". Probability and Statistics. International Edition. Third Edition. Addison Wesley. 2002. ISBN 0-321-20473-5. Pages 370 to 371.

  1. ^ Kokoska 2015, p. 296-308.
  2. ^ Kokoska 2015, p. 296-297.