Jump to content

Statistical population

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning
(Redirected from Population mean)

통계학(statistics)에서, 모집단(population)은 어떤 질문이나 실험(experiment)에 대해 관심사이 있는 비슷한 항목 또는 사건의 집합(set)입니다.[1] 통계적 모집단은 존재하는 대상의 그룹 (예를 들어, 은하수(Milky Way) 은하(galaxy) 내의 모든 의 집합) 또는 경험으로부터 일반화로써 대상의 가설적인 및 잠재적인 무한한(infinite) 그룹 (예를 들어, 포커의 게임에서 모든 가능한 한 손의 집합)일 수 있습니다.[2] 통계적 해석의 공통 목표는 일부 선택된 모집단에 대한 정보를 생성하는 것입니다.[3]

통계적 추론에서, 모집단의 부분집합 (통계적 표본(sample))은 통계적 해석에서 모집단을 나타내기 위해 선택됩니다.[4] 게다가, 통계적 표본은 모집단을 불편향(unbiased)되고 정확하게(accurately) 모델링되어야 합니다 (모집단의 모든 각 단위는 같은 선택의 기회를 가집니다). 이 통계적 표본의 크기와 모집단의 크기의 비율은 표본화 분수(sampling fraction)라고 불립니다. 그런-다음 적절한 표본 통계학(sample statistics)을 사용하여 모집단 매개변수(population parameters)를 추정(estimate)하는 것이 가능합니다.

Mean

모집단 평균(population mean), 또는 모집단 기댓값(expected value)확률 분포(probability distribution) 또는 해당 분포에 의해 특징지은 확률 변수(random variable)중심 경향(central tendency)의 측정입니다.[5] 확률 변수 X이산 확률 분포(discrete probability distribution)에서, 평균은 해당 값의 확률에 의해 가중된 모든 각 가능한 값의 합과 같습니다; 즉, X의 각 가능한 값 x와 그것의 확률 p(x)의 곱을 취하고, 그런-다음 모든 이들 곱을 함께 더함으로써 계산되며, 를 제공합니다.[6][7] 연속 확률 분포(continuous probability distribution)의 경우에도 유사한 공식이 적용됩니다. 모든 각 확률 분포가 정의된 평균을 가지는 것은 아닙니다 (예제에 대해 코시 분포(Cauchy distribution)를 참조하십시오). 게다가, 일부 분포에 대해 그 평균이 무한일 수 있습니다.

유한한 모집단에 대해, 모집단의 모든 각 구성원을 고려하면서 속성의 모집단 평균은 주어진 속성의 산술 평균과 같습니다. 예를 들어, 모집단 평균 키는 모든 각 개인의 키를 합한 값을 개인의 전체 숫자로 나눈 값과 같습니다. 표본 평균(sample mean)은 특히 작은 표본에 대해 모집단 평균과 다를 수 있습니다. 큰 숫자의 법칙(law of large numbers)은 표본의 크기가 클수록, 표본 평균이 모집단 평균에 가까울 가능성이 높다는 것입니다.[8]

Sub population

하나 이상의 추가 속성을 공유하는 모집단의 부분집합은 부분 모집단(sub population)이라고 불립니다. 예를 들어, 모집단이 모두 이집트인이면, 부분 모집단은 모두 이집트 남성입니다; 모집단이 세계에서 모든 약국이면, 부분 모집단은 이집트에서 모든 약국입니다. 대조적으로, 표본은 임의의 추가 속성을 공유하도록 선택되지 않은 모집단의 부분집합입니다.

기술 통계학은 다른 부분 모집단에 대해 다른 결과를 산출할 수 있습니다. 예를 들어, 특정 의약품은 다른 부분 모집단에 대해 서로 다른 영향을 미칠 수 있고, 그러한 특수 부분 모집단이 식별되지 않고 개별적으로 조사되지 않으면 이들 효과가 모호하거나 무시될 수 있습니다.

유사하게, 부분 모집단을 분리하면 종종 매개변수를 더 정확하게 추정할 수 있습니다: 예를 들어 사람들 사이의 키 분포는 남성과 여성을 별도의 부분 모집단으로 고려함으로써 더 잘 모델링됩니다.

부분 모집단으로 구성된 모집단은 무분 모집단 내의 분포를 전체 모집단 분포로 결합하는 혼합 모델(mixture models)에 의해 모델링될 수 있습니다. 심지어 부분 모집단이 주어진 단순 모델에 의해 잘-모델링되더라도, 전체 모집단은 주어진 단순 모델에 의해 잘 맞지 않을 수 있습니다 – 잘 맞지 않는 것은 부분 모집단의 존재에 대한 증거일 수 있습니다. 예를 들어, 두 개의 같은 부분 모집단이 주어지고, 둘 다 정규적으로 분포되면, 그것들이 같은 표준 편차와 다른 평균을 가지면, 전체 분포는 단일 정규 분포에 비해 낮은 뾰족함(kurtosis)을 나타낼 것입니다 – 부분 모집단의 평균은 전체 분포의 어깨에 떨어집니다. 만약 충분하게 분리되면, 이것들은 두-봉우리 분포(bimodal distribution)를 형성합니다; 그렇지 않으면, 그것은 단순히 넓은 돌출부를 가집니다. 더 나아가서, 그것은 주어진 변동을 갖는 단일 정규 분포에 관해 과대산포(overdispersion)를 전시할 것입니다. 대안적으로, 같은 평균을 가지지만 다른 표준 편차를 갖는 두 개의 부분 모집단이 주어지면, 전체 모집단은 단일 분포보다 더 뾰족한 돌출부와 더 두꺼운 꼬리 (및 그에 따라 더 얕은 어깨)로 높은 뾰족함을 전시할 것입니다.

See also

References

  1. ^ "Glossary of statistical terms: Population". Statistics.com. Retrieved 22 February 2016.
  2. ^ Weisstein, Eric W. "Statistical population". MathWorld.
  3. ^ Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd ed.). New York: Freeman. ISBN 978-0-7167-4773-4. Archived from the original on 2005-02-09.
  4. ^ "Glossary of statistical terms: Sample". Statistics.com. Retrieved 22 February 2016.
  5. ^ Feller, William (1950). Introduction to Probability Theory and its Applications, Vol I. Wiley. p. 221. ISBN 0471257087.
  6. ^ Elementary Statistics by Robert R. Johnson and Patricia J. Kuby, p. 279
  7. ^ Weisstein, Eric W. "Population Mean". mathworld.wolfram.com. Retrieved 2020-08-21.
  8. ^ Schaum's Outline of Theory and Problems of Probability by Seymour Lipschutz and Marc Lipson, p. 141

External links