Bias (statistics)

통계적 편향(Statistical bias)은 결과와 사실 사이의 차이를 유발하는 시스템적 경향입니다. 편향은 데이터의 출처, 선택된 추정기(estimator), 및 데이터가 분석되었던 방법을 포함하여 데이터 분석의 프로세스의 수에 존재합니다. 편향은 예를 들어 사람들의 구매 습관을 조사하기 위해 결과에 심각한 영향을 미칠 수 있습니다. 만약 표본 크기가 충분히 크지 않으면, 결과가 모든 사람들의 구매 습관을 대표하지 않을 수 있습니다. 즉, 설문 결과와 실제 결과 사이에 불일치가 있을 수 있습니다. 그러므로, 통계적 편향의 출처를 이해하면 관찰된 결과가 실제 결과에 가까운지 여부를 평가하기 위해 도움이 될 수 있습니다.

편향은 정확성 (기기 오류/부적절함), 데이터의 부족, 또는 필사에서 실수 (오타)와 같은 다른 실수와 구별될 수 있습니다. 편향은 데이터 선택이 수집 기준에 의해 왜곡되었을 수 있음을 의미합니다.

편향은 임의의 다른 실수의 존재를 배제하지 않습니다. 우리는 잘못 설계된 표본, 부정확한 측정 장치, 및 데이터 기록에서 오타가 동시에 있을 수 있습니다.

역시 "오류"라는 용어는 프로세스 (테스트 중인 가설의 거부 또는 수락 오류)보다는 결과를 구체적으로 지칭한다는 것을 인식하는 것이 유용합니다. 이들 구체적으로 정의된 결과-기반 용어와 절차 상의 오류를 구별하기 위해 결함(flaw)이나 실수(mistake)를 사용하는 것이 좋습니다.

Bias of an estimator

통계적 편향은 그것의 결과의 통계(statistical) 기술 또는 결과의 특징이며 그것에 의해 결과의 기댓값(expected value)이 추정되는 실제 놓여있는 정량적 매개변수(parameter)와 다릅니다. 매개변수 추정기의 편향은 정밀도의 정도와 혼동되어서는 안 되는데, 왜냐하면 정밀도의 정도는 표본화 오류의 측정이기 때문입니다. 편향은 다음과 같이 정의됩니다: $T$ 를 매개변수 $\theta$ 를 추정하기 위해 사용되는 통계량으로 놓고, $\operatorname {E} (T)$ 는 $T$ 의 기댓값을 나타냅니다. 그런-다음, 다음은

\operatorname {bias} (T,\theta )=\operatorname {bias} (T)=\operatorname {E} (T)-\theta

( $\theta$ 에 관한) 통계량 $T$ 의 편향이라고 불립니다. 만약 $\operatorname {bias} (T,\theta )=0$ 이면, $T$ 는 $\theta$ 의 불-편향 추정량(unbiased estimator)이라고 말합니다; 그렇지 않으면, 그것은 $\theta$ 의 편향된 추정량(biased estimator)이라고 말합니다.

통계량 $T$ 의 편향은 항상 추정하기 위해 사용되는 매개변수 $\theta$ 에 상대적이지만, 매개변수 $\theta$ 는 문맥에서 추정되는 것이 명확할 때 종종 생략됩니다.

Types

통계적 편향은 데이터 분석의 모든 단계에서 발생합니다. 다음 편향 원천은 각 단계에 별도로 나열될 것입니다:

Data selection

선택 편향(Selection bias)은 개인이 다른 사람보다 연구 대상으로 선택될 가능성이 더 많아 표본을 편향시키는 것과 관련됩니다. 이것은 선택 효과, 표본화 편향(sampling bias), 및 베르소니안 편향(Berksonian bias)이라고도 합니다.^[1]

스펙트럼 편향(Spectrum bias)은 편향된 환자 표본에 대한 진단 테스트를 평가할 때 발생하여, 테스트의 민감도와 특이성을 과대평가하게 됩니다. 예를 들어, 연구 모집단에서 질병 유병률이 높으면 양성 예측 값이 증가하여, 예측 값과 실제 값 사이에 편향이 발생합니다.^[2]
관찰자 선택 편향(Observer selection bias)은 제시된 증거가 관찰자에 의해 사전-필터링되었을 때 발생하며, 이는 소위 인류의 원칙(anthropic principle)입니다. 수집된 데이터는 실험 설계뿐만 아니라 연구를 수행하는 사람이 있어야 한다는 필수 전제 조건에 따라 필터링됩니다.^[3] 과거에서 지구의 충돌이 그 예제입니다. 충돌 사건은 지능 동물의 멸종을 초래할 수 있거나, 그 당시에는 지능 동물이 없었을 수 있습니다. 그러므로, 일부 충돌 사건은 관찰되지 않았지만, 그것들은 과거에 발생했을 수 있습니다.^[4]
자원 봉사자 편향은 자원 봉사자가 연구 대상 모집단과 본질적으로 다른 특성을 가질 때 발생합니다.^[5] 연구에 따르면 자원 봉사자는 사회 경제적 지위가 높은 가정에서 오는 경향이 있습니다.^[6] 더욱이, 또 다른 연구에 따르면 여성이 남성보다 연구 자원 봉사를 할 가능성이 더 높습니다.^[7]
자금-조달 편향(Funding bias)은 연구의 재정 후원자에게 유리한 결과, 테스트 표본 또는 테스트 절차의 선택으로 이어질 수 있습니다.^[8]
마찰 편향(Attrition bias)은 참가자의 손실, 예를 들어 연구 중 후속 조치 손실로 인해 발생합니다.^[9]
회상 편향(Recall bias)은 과거 사건에 대한 참가자 기억의 정확성 또는 완전성의 차이로 인해 발생합니다; 예를 들어, 환자는 지난 주에 담배를 몇 개비 피웠는지 정확히 기억할 수 없으므로 과대 평가 또는 과소 평가됩니다.

Hypothesis testing

통계적 가설 테스트(statistical hypothesis testing)에서 유형 I 오류와 유형 II 오류는 잘못된 결과로 이어집니다.^[10] 유형 I 오류는 널 가설이 정확하지만 거부될 때 발생합니다. 예를 들어, 평균 운전 제한 속력이 75~85km/h이면 과속으로 여기지 않는다는 널 가설을 가정합니다. 다른 한편으로, 평균 속력이 그 범위에 있지 않으면 과속으로 여깁니다. 누군가가 평균 운전 속력이 7km/h인 티켓을 받으면 의사 결정자는 유형 I 오류를 범한 것입니다. 다시 말해서, 평균 주행 속력은 널 가설을 만족하지만 거부됩니다. 이에 반해 유형 II 오류는 널 가설이 정확하지 않고 받아들여질 때 발생합니다.

Estimator selection

추정기의 편향(bias of an estimator)은 추정기의 기댓값과 추정될 매개변수의 실제 값 사이의 차이입니다. 비록 불-편향 추정량이 이론적으로 편향된 추정기보다 바람직하지만, 실제로는 작은 편향을 갖는 편향된 추정기가 자주 사용됩니다. 편향된 추정기는 여러 가지 이유로 더 유용할 수 있습니다. 첫째, 불-편향 추정기는 추가 가정 없이 존재할 수 없습니다. 둘째, 때로는 불-편향 추정기는 계산하기 어렵습니다. 셋째, 편향된 추정기는 평균 제곱 오차의 더 낮은 값을 가질 수 있습니다.

편향된 추정기는 푸아송 분포(Poisson distribution)에서 발생하는 불-편향 추정기보다 좋습니다.^[11]^[12] 편향된 추정기의 값은 항상 양수이고 그것의 평균 제곱 오차가 불-편향 추정기보다 작으며, 이는 편향된 추정기를 더 정확하게 만듭니다.

생략된-변수 편향(Omitted-variable bias)은 가정된 사양이 모델에 있어야 하는 독립 변수를 생략할 때 회귀 분석의 매개변수 추정에 나타나는 편향입니다.

Analysis methods

탐지 편향은 특정 연구 대상 집합에 대해 현상이 관찰될 가능성이 더 높을 때 발생합니다. 예를 들어, 비만과 당뇨병이 관련된 증후군은 의사가 마른 환자보다 비만 환자에서 당뇨병을 더 많이 찾을 가능성이 있음을 의미할 수 있으며, 왜곡된 탐지 노력으로 인해 비만 환자 사이에서 당뇨병의 인플레이션을 초래할 수 있습니다.
교육 측정(educational measurement)에서, 편향은 "일부 응시자가 실제 능력보다 더 낮거나 높은 점수를 받을 수 있는 시험 내용, 시험 관리 및/또는 채점 절차의 체계적인 오류"로 정의됩니다.^[13] 편향의 원인은 테스트가 측정하려는 특성과 관련이 없습니다.
관찰자 편향(Observer bias)은 판단이 실험 수행 방법/결과 기록 방법을 변경할 수 있는 인지 편향(cognitive bias)으로 인해 연구자가 무의식적으로 실험에 영향을 미칠 때 발생합니다.

Interpretation

보고 편향(Reporting bias)은 특정 종류의 관찰이 보고될 유효성이 더 높아지도록 데이터 이용-가능성의 왜곡을 포함합니다.

References

^ Rothman, Kenneth J.; Greenland, Sander; Lash, Timothy L. (2008). Modern Epidemiology. Lippincott Williams & Wilkins. pp. 134–137.
^ Mulherin, Stephanie A.; Miller, William C. (2002-10-01). "Spectrum bias or spectrum effect? Subgroup variation in diagnostic test evaluation". Annals of Internal Medicine. 137 (7): 598–602. doi:10.7326/0003-4819-137-7-200210010-00011. ISSN 1539-3704. PMID 12353947. S2CID 35752032.
^ Bostrom, Nick (2013-05-31). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. doi:10.4324/9780203953464. ISBN 978-0-203-95346-4.
^ Ćirković, Milan M.; Sandberg, Anders; Bostrom, Nick (2010). "Anthropic Shadow: Observation Selection Effects and Human Extinction Risks". Risk Analysis. 30 (10): 1495–1506. doi:10.1111/j.1539-6924.2010.01460.x. ISSN 1539-6924. PMID 20626690. S2CID 6485564.
^ Tripepi, Giovanni; Jager, Kitty J.; Dekker, Friedo W.; Zoccali, Carmine (2010). "Selection Bias and Information Bias in Clinical Research". Nephron Clinical Practice. 115 (2): c94–c99. doi:10.1159/000312871. ISSN 1660-2110. PMID 20407272. S2CID 18856450.
^ "Volunteer bias". Catalog of Bias. 2017-11-17. Retrieved 2021-12-18.
^ Alex, Evans (2020). "Why Do Women Volunteer More Than Men?". Retrieved 2021-12-22.
^ Krimsky, Sheldon (2013-07-01). "Do Financial Conflicts of Interest Bias Research?: An Inquiry into the "Funding Effect" Hypothesis". Science, Technology, & Human Values. 38 (4): 566–587. doi:10.1177/0162243912456271. ISSN 0162-2439. S2CID 42598982.
^ Higgins, Julian P. T.; Green, Sally (March 2011). "8. Introduction to sources of bias in clinical trials". In Higgins, Julian P. T.; et al. (eds.). Cochrane Handbook for Systematic Reviews of Interventions (version 5.1). The Cochrane Collaboration.
^ Neyman, Jerzy; Pearson, Egon S. (1936). "Contributions to the theory of testing statistical hypotheses". Statistical Research Memoirs. 1: 1–37.
^ Romano, Joseph P.; Siegel, A. F. (1986-06-01). Counterexamples in Probability And Statistics. CRC Press. ISBN 978-0-412-98901-8.
^ Hardy, Michael (2003). "An Illuminating Counterexample". The American Mathematical Monthly. 110 (3): 234–238. doi:10.2307/3647938. ISSN 0002-9890. JSTOR 3647938.
^ National Council on Measurement in Education (NCME). "NCME Assessment Glossary". Archived from the original on 2017-07-22.

[1] Rothman, Kenneth J.; Greenland, Sander; Lash, Timothy L. (2008). Modern Epidemiology. Lippincott Williams & Wilkins. pp. 134–137.

[2] Mulherin, Stephanie A.; Miller, William C. (2002-10-01). "Spectrum bias or spectrum effect? Subgroup variation in diagnostic test evaluation". Annals of Internal Medicine. 137 (7): 598–602. doi:10.7326/0003-4819-137-7-200210010-00011. ISSN 1539-3704. PMID 12353947. S2CID 35752032.

[3] Bostrom, Nick (2013-05-31). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. doi:10.4324/9780203953464. ISBN 978-0-203-95346-4.

[4] Ćirković, Milan M.; Sandberg, Anders; Bostrom, Nick (2010). "Anthropic Shadow: Observation Selection Effects and Human Extinction Risks". Risk Analysis. 30 (10): 1495–1506. doi:10.1111/j.1539-6924.2010.01460.x. ISSN 1539-6924. PMID 20626690. S2CID 6485564.

[5] Tripepi, Giovanni; Jager, Kitty J.; Dekker, Friedo W.; Zoccali, Carmine (2010). "Selection Bias and Information Bias in Clinical Research". Nephron Clinical Practice. 115 (2): c94–c99. doi:10.1159/000312871. ISSN 1660-2110. PMID 20407272. S2CID 18856450.

[6] "Volunteer bias". Catalog of Bias. 2017-11-17. Retrieved 2021-12-18.

[7] Alex, Evans (2020). "Why Do Women Volunteer More Than Men?". Retrieved 2021-12-22.

[8] Krimsky, Sheldon (2013-07-01). "Do Financial Conflicts of Interest Bias Research?: An Inquiry into the "Funding Effect" Hypothesis". Science, Technology, & Human Values. 38 (4): 566–587. doi:10.1177/0162243912456271. ISSN 0162-2439. S2CID 42598982.

[9] Higgins, Julian P. T.; Green, Sally (March 2011). "8. Introduction to sources of bias in clinical trials". In Higgins, Julian P. T.; et al. (eds.). Cochrane Handbook for Systematic Reviews of Interventions (version 5.1). The Cochrane Collaboration.

[10] Neyman, Jerzy; Pearson, Egon S. (1936). "Contributions to the theory of testing statistical hypotheses". Statistical Research Memoirs. 1: 1–37.

[11] Romano, Joseph P.; Siegel, A. F. (1986-06-01). Counterexamples in Probability And Statistics. CRC Press. ISBN 978-0-412-98901-8.

[12] Hardy, Michael (2003). "An Illuminating Counterexample". The American Mathematical Monthly. 110 (3): 234–238. doi:10.2307/3647938. ISSN 0002-9890. JSTOR 3647938.

[13] National Council on Measurement in Education (NCME). "NCME Assessment Glossary". Archived from the original on 2017-07-22.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]