Jump to content

Sample size determination

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

표본 크기 결정(Sample size determination)은 통계 표본(statistical sample)에 포함하기 위한 관찰의 횟수 또는 복제(Replication)를 선택하는 행위입니다. 표본 크기는 목표가 표본으로부터 모집단(population)에 대해 추론(inferences)을 만드는 것에서 임의의 경험적 연구의 중요한 특징입니다. 실제에서, 연구에서 사용된 표본 크기는 보통 데이터 수집의 비용, 시간 또는 편의성, 및 충분한 통계적 힘(statistical power)을 제공할 필요성에 기초하여 결정됩니다. 복잡한 연구에서, 여러 다른 표본 크기가 있을 수 있습니다: 예를 들어, 계층화된(stratified) 조사(survey)에서 각 지층마다 다른 크기일 수 있습니다. 인구 조사(census)에서, 데이터는 전체 모집단에 대해 찾아지며, 따라서 의도된 표본 크기는 모집단과 같습니다. 연구가 다른 치료 그룹(treatment group)으로 나뉠 수 있는, 실험 설계(experimental design)에서, 각 그룹마다 다른 표본 크기가 있을 수 있습니다.

표본 크기는 여러 가지 방법에서 선택될 수 있습니다:

  • 경험을 사용하는 것 – 작은 표본은, 비록 때때로 피할 수 없을지라도, 넓은 신뢰 구간(confidence interval)통계적 가설 테스트(statistical hypothesis testing)에서 오류의 위험을 초래할 수 있습니다.
  • 최종적으로 얻어진 표본으로부터 나오게 되는 추정에 대해 목표 분산을 사용하는 것, 즉, 만약 높은 정밀도 (좁은 신뢰 구간)가 요구되면 이것은 추정기의 낮은 목표 분산으로 이동합니다.
  • 한번 표본이 수집되면 적용될 통계적 테스트(statistical test)의 힘에 대한 목표를 사용하는 것.
  • 신뢰 수준을 사용하는 것, 즉, 요구된 신뢰 수준이 더 클수록, (일정한 정밀도 요구-사항이 주어지면) 표본 크기가 더 커집니다.

Introduction

더 큰 표본 크기는 일반적으로 미지수 매개변수를 추정(estimating)할 때 정확도(precision) 향상으로 이어집니다. 예를 들어, 만약 우리가 병원체에 감염된 특정 어종의 비율을 알고 싶다면, 우리는 100 마리가 아닌 200 마리의 물고기를 표본화하고 검사하면, 일반적으로 이 비율을 더 정확하게 추정할 수 있을 것입니다. 수학 통계의 몇 가지 기본 사실은, 큰 숫자의 법칙(law of large numbers)중심 극한 정리(central limit theorem)를 포함하여, 이 현상을 설명합니다.

일부 상황에서, 더 큰 표본 크기에 대해 정확도 증가는 최소, 또는 심지어 비-존재입니다. 이것은 시스템적인 오차(systematic error)의 존재 또는 데이터에 강한 의존성(dependence), 또는 만약 데이터가 두터운-꼬리 분포를 따르는 결과로써 발생합니다.

표본 크기는 결과 추정의 품질에 의해 평가될 수 있습니다. 예를 들어, 만약 비율이 추정되는 것이면, 0.06 단위 폭보다 작게 되는 95% 신뢰 구간(confidence interval)을 가지기를 원할 수 있습니다. 대안적으로, 표본 크기는 가설 테스트의 힘(power)에 기초하여 접근될 수 있습니다. 예를 들어, 만약 우리가 여성 사이의 특정 정치적 후보에 대한 지원을 남성 사이의 해당 후보에 대한 지원과 비교하면, 우리는 0.04 단위의 지원 수준에서 차이를 감지하기 위해 80% 힘을 가지기를 원할 수 있습니다.

Estimation

Estimation of a proportion

상대적으로 간단한 상황은 비율(proportion)의 추정입니다. 예를 들어, 우리는 지역 사회에서 적어도 65세인 주민의 비율을 추정하기를 원할 수 있습니다.

비율(proportion)추정기(estimator)이며, 여기서 X는 '긍정적인' 관찰의 숫자 (예를 들어, n명의 표본-추출된 사람 중에서 적어도 65세인 사람의 숫자)입니다. 관찰이 독립(independent)일 때, 이 추정기는 (스케일된) 이항 분포(binomial distribution)를 가집니다 (그리고 역시 베르누이 분포(Bernoulli distribution)로부터 데이터의 표본(sample) 평균(mean)이기도 합니다). 이 분포의 최대 분산(variance)은 0.25/n이며, 이것은 참 매개변수(parameter)p = 0.5일 때 발생합니다. 실제에서, p가 미지수이기 때문에, 최대 분산은 종종 표본 크기 평가에 사용됩니다.

충분하게 큰 n에 대해, 의 분포는 정규 분포(normal distribution)에 의해 밀접하게 근사될 것입니다.[1] 이 근사를 사용하여, 이 분포 확률의 약 95%가 평균의 2 표준 편차 이내에 놓임을 보일 수 있습니다. 이항 분포에 대해 발드 방법(Wald method for the binomial distribution)을 사용하여, 형식

의 구간은 참 비율에 대해 95% 신뢰 구간을 형성할 것입니다. 만약 이 구간이 W 단위 폭을 넘지 않아야 하는 것이 필요하면, 방정식

n = 4/W2 = 1/B2을 산출하는,[2][3] n에 대해 해결될 수 있으며, 여기서 B는 추정에 대한 오차 경계입니다. 즉, 추정은 보통 ± B 이내로 제공됩니다. 따라서, B = 10%에 대해 n = 100을 요구하며, B = 5%에 대해 n = 400이 필요하며, B = 3%에 대해 요구사항은 n = 1000에 근접하며, 반면에 B = 1%에 대해 n = 10000의 표본 크기가 요구됩니다. 이들 숫자는 여론 투표(opinion poll) 및 기타 표본 조사(sample survey)의 뉴스 보고서에서 종종 인용됩니다. 어쨌든, 숫자가 이상적으로 반올림하는 것이 바람직하기 때문에, 보고된 결과가 정확한 값이 아닐 수 있음을 항상 기억하십시오. n의 값이 원하는 결과를 얻기 위한 필요한 최소 표본 숫자임을 알고 있으므로, 응답자의 숫자는 최솟값 이상이어야 합니다.

Estimation of a mean

비율은 평균의 특별한 경우입니다. 각 데이터 값이 분산 σ2을 가지는 크기 n의 독립이고 동일하게 분포된 (iid) 표본을 사용하여 모집단 평균을 추정할 때, 표본 평균의 표준 오차(standard error)는 다음입니다:

이 표현은 표본 크기가 증가함에 따라 추정값이 어떻게 더 정밀해지는지 정량적으로 설명합니다. 정규 분포를 갖는 표본 평균을 근사하는 것을 정당화하기 위해 중심 극한 정리(central limit theorem)를 사용하면 다음 형식의 근사적으로 95% 신뢰 구간을 산출합니다:

만약 우리는 폭에서 W 단위인 신뢰 구간을 가지기를 원하면, 우리는 n에 대해 다음을 풀 것입니다:

표본 크기 n = 16σ2/W2을 산출합니다.

예를 들어, 만약 우리가 약물이 폭 6 단위인 신뢰 구간을 갖는 피험자의 혈압을 낮추는 양을 추정하는데 관심이 있고, 우리가 모집단에서 표준 혈압의 표준 편차가 15이면, 요구된 표본 크기는 100입니다.

Required sample sizes for hypothesis tests

통계학자에 의해 직면된 공통적인 문제는, 미리-결정된 유형 I 오류(Type I error) 율 α가 주어지면, 테스트에 대해 특정 힘(power)을 산출하는 것이 요구되는 표본 크기를 계산하는 것입니다. 다음과 같이, 이것은 특정 값에 대해 미리-결정된 테이블에 의해, 미드(Mead)의 자원 방정식에 의해, 또는, 보다 일반적으로 누적 분포 함수(cumulative distribution function)에 의해 추정될 수 있습니다:

Tables

[4]
 
힘(Power)
코헨의 디(Cohen's d)
0.2 0.5 0.8
0.25 84 14 6
0.50 193 32 13
0.60 246 40 16
0.70 310 50 20
0.80 393 64 26
0.90 526 85 34
0.95 651 105 42
0.99 920 148 58

오른쪽에 표시된 테이블은 이-표본 t-테스트(two-sample t-test)에서 실험 그룹(experimental group)과 같은 크기의 제어 그룹(control group)의 표본 크기, 즉, 시행에서 개인의 전체 숫자가 주어진 숫자의 그것의 두 배, 및 원하는 신뢰 수준(significance level)이 0.05임을 추정하기 위해 사용할 수 있습니다.[4] 사용된 매개-변수는 다음입니다:

Mead's resource equation

미드의 자원 방정식은 많은 다른 실험실 실험뿐만 아니라 실험실 동물(laboratory animal)의 표본 크기를 추정하는 것에 종종 사용됩니다. 표본 크기를 추정하는 것에서 다른 방법을 사용하는 것만큼 정확하지는 않지만, 예상된 표준 편차 또는 그룹 사이의 값에서 예상된 차이와 같은 매개-변수가 미지수 또는 추정하기 매우 어려운 적절한 표본 크기에 대한 그것의 힌트를 제공합니다.[5]

방정식에서 모든 매개-변수는 실제로 그들의 개념의 숫자의 자유도(degrees of freedom)이고, 따라서 그들의 숫자는 방정식에 삽입하기 전에 1만큼 뺍니다.

그 방정식은 다음입니다:[5]

여기서:

  • N은 연구에서 개인 또는 단위의 전체 숫자입니다 (빼기 1)
  • B차단하는 성분, 설계에서 허용된 환경 영향을 나타냅니다 (빼기 1).
  • T는 사용되는 (제어 그룹(control group)을 포함하는) 처리 그룹(treatment groups)의 숫자, 또는 물어지는 질문의 숫자에 해당하는, 처리 성분입니다 (빼기 1).
  • E오차 성분의 자유도이고, 10과 20 사이의 어딘가에 있어야 합니다.

예를 들어, 만약 실험실 동물을 사용하는 연구가 4 처리 그룹 (T=3), 그룹당 8 동물과 함께 계획되어, 임의의 추가 계층화(stratification) (B=0)없이 총 32 동물 (N=31)을 만들면, E는 28과 같으며, 이것은 20의 절단 위에 있으며, 표본 크기가 조금 너무 클 수 있고, 그룹당 6 동물이 더 적합할 수 있음을 나타냅니다.[6]

Cumulative distribution function

Xi, i = 1, 2, ..., n를 미지수 평균 μ와 알려진 분산 σ2을 갖는 정규 분포(normal distribution)에서 취해진 독립 관측으로 놓습니다. 두 가설, 무 가설(null hypothesis)

및 일부 '가장-작은 중요한 차이' μ* > 0에 대해 대안적인 가설:

을 생각해 보십시오. 이것은 우리가 차이를 관찰하는 데 관심을 기울이는 가장-작은 값입니다. 이제, 만약 우리가 (1) Ha가 참 (즉, 1 − β힘(power))일 때 적어도 1 − β에서의 확률을 갖는 H0를 거절하고, (2) H0가 참일 때 확률 α를 갖는 H0를 거절하면, 우리는 다음을 필요합니다:

만약 zα가 표준 정규 분포의 위쪽 α 백분율 점이면,

및 따라서

'만약 우리의 표본 평균 ()가 이상이면 H0를 거절함'

은 (2)를 만족시키는 결정 규칙(decision rule)입니다. (이것이 1-꼬리달린 테스트입니다.)

이제 우리는 Ha가 참일 때 적어도 1 − β에서 확률을 갖는 발생하는 이것을 바랍니다. 이 경우에서, 우리의 표본 평균은 평균 μ*을 갖는 정규 분포에서 나올 것입니다. 그러므로, 우리는 다음을 요구합니다:

조심스러운 조작을 통해, 이것은 다음일 때 발생하는 것으로 보일 것입니다 (Statistical power#Example를 참조하십시오):

여기서 는 정규 누적 분포 함수(cumulative distribution function)입니다.

Stratified sample size

계층화된 표본화(stratified sampling)와 같은, 보다 복잡한 표본화 기술과 함께, 표본은 부분-표본으로 종종 분할될 수 있습니다. 전형적으로, 만약 (H 다른 지층에서) H 그러한 부분-표본이 있으면, 그들의 각각은 표본 크기 nh, h = 1, 2, ..., H입니다. 이들 nhn1 + n2 + ... + nH = n (즉, 해당 전체 표본 크기는 부분-표본 크기의 합에 의해 제공됩니다)인 규칙을 준수해야 합니다. 최적으로 이들 nh를 선택하는 것은, (예를 들어) 네이만의 최적 할당을 사용하여, 다양한 방법에서 행해질 수 있습니다.

계층화된 표본화를 사용해야 하는 많은 이유가 있습니다:[7] 표본 추정의 분산을 감소시키는 것, 부분적으로 비-무작위 방법을 사용하는 것, 또는 개별적으로 지층을 연구하는 것입니다. 유용하고, 부분적으로 비-무작위 방법은 쉽게 접근할 수 있는 곳에서 개인을 표본화하는 것이지만, 여기서 여행 비용을 절약하기 위해 클러스터를 표본화하지 않습니다.[8]

일반적으로, H 지층에 대해, 가중된 표본 평균은 다음입니다:

또한, 분산은 다음입니다:

[9]

가중, 는, 자주이지만, 항상 그런 것은 아닌, 지층에서 모집단 원소의 비율을 나타내고, 입니다. 고정된 표본 크기에 대해, 즉 이며,

[10]

이것은 만약 각 지층 이내의 표본화 율(sampling rate)이 각 지층 이내의 표준 편차에 비례하게 되면 최소가 될 수 있습니다: , 여기서 를 만족하는 상수입니다.

"최적 할당"은 지층 이내의 표본화 율이 지층 이내의 표준 편차에 직접 비례하게 되고 지층 이내의 원소당 표본화 비용, 의 제곱근에 반비례할 때 도달됩니다:

[11]

여기서 , 또는, 보다 일반적으로, 다음을 만족할 때 상수입니다:

[12]

Qualitative research

질적 연구에서 표본 크기 결정은 다른 접근법을 취합니다. 연구가 진행될 때, 일반적으로 주관적인 판단입니다.[13] 한 가지 접근법은 포화(saturation)에 도달할 때까지 추가 참가자 또는 자료를 계속 포함하는 것입니다.[14] 포화에 도달하기 위해 요구되는 숫자는 경험적으로 조사되어 왔습니다.[15][16][17][18]

연구를 시작하기 전에 표본 크기 추정에 대한 신뢰할만한 지침이 부족하며, 주어진 제안된 범위가 다양합니다.[16][19][20][21] 음의 이항 분포(negative binomial distribution)를 기반으로, 양적 힘 계산과 유사한 도구가 주제 분석(thematic analysis)에 대해 제안되어 왔습니다.[22][21]

See also

Notes

  1. ^ NIST/SEMATECH, "7.2.4.2. Sample sizes required", e-Handbook of Statistical Methods.
  2. ^ "Inference for Regression". utdallas.edu.
  3. ^ "Confidence Interval for a Proportion" Archived 2011-08-23 at the Wayback Machine
  4. ^ a b Chapter 13, page 215, in: Kenny, David A. (1987). Statistics for the social and behavioral sciences. Boston: Little, Brown. ISBN 978-0-316-48915-7.
  5. ^ a b Kirkwood, James; Robert Hubrecht (2010). The UFAW Handbook on the Care and Management of Laboratory and Other Research Animals. Wiley-Blackwell. p. 29. ISBN 978-1-4051-7523-4. online Page 29
  6. ^ Isogenic.info > Resource equation by Michael FW Festing. Updated Sept. 2006
  7. ^ Kish (1965, Section 3.1)
  8. ^ Kish (1965), p. 148.
  9. ^ Kish (1965), p. 78.
  10. ^ Kish (1965), p. 81.
  11. ^ Kish (1965), p. 93.
  12. ^ Kish (1965), p. 94.
  13. ^ Sandelowski, M. (1995). Sample size in qualitative research. Research in Nursing & Health, 18, 179–183
  14. ^ Glaser, B. (1965). The constant comparative method of qualitative analysis. Social Problems, 12, 436–445
  15. ^ Francis, J. J., Johnston, M., Robertson, C., Glidewell, L., Entwistle, V., Eccles, M. P., & Grimshaw, J. M. (2010). What is an adequate sample size? Operationalising data saturation for theory-based interview studies. Psychology and Health, 25, 1229–1245. doi:10.1080/08870440903194015
  16. ^ a b Guest, G., Bunce, A., & Johnson, L. (2006). How many interviews are enough?: An experiment with data saturation and variability. Field Methods, 18, 59–82. doi:10.1177/1525822X05279903
  17. ^ Wright, A., Maloney, F. L., & Feblowitz, J. C. (2011). Clinician attitudes toward and use of electronic problem lists: a thematic analysis. BMC Medical Informatics and Decision Making, 11, 36. doi:10.1186/1472-6947-11-36
  18. ^ "Sample Size and Saturation in PhD Studies Using Qualitative Interviews – Mason – Forum Qualitative Sozialforschung / Forum: Qualitative Social Research". Qualitative-research.net. 11 (3). 2010-08-24.
  19. ^ Emmel, N. (2013). Sampling and choosing cases in qualitative research: A realist approach. London: Sage.
  20. ^ Onwuegbuzie, A. J., & Leech, N. L. (2007). A call for qualitative power analyses. Quality & Quantity, 41, 105–121. doi:10.1007/s11135-005-1098-1
  21. ^ a b Fugard AJB; Potts HWW (10 February 2015). "Supporting thinking on sample sizes for thematic analyses: A quantitative tool" (PDF). International Journal of Social Research Methodology. 18 (6): 669–684. doi:10.1080/13645579.2015.1005453.
  22. ^ Galvin R (2015). How many interviews are enough? Do qualitative interviews in building energy consumption research produce reliable knowledge? Journal of Building Engineering, 1:2–12.

References

Further reading

  • NIST: Selecting Sample Sizes
  • ASTM E122-07: Standard Practice for Calculating Sample Size to Estimate, With Specified Precision, the Average for a Characteristic of a Lot or Process

External links