Jump to content

Dependent and independent variables

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

종속(dependent) 및 독립 변수(independent variables)는 수학적 모델링(mathematical modeling), 통계적 모델(statistical model)실험 과학(experimental science)에서 변수(variables)입니다. 종속 변수는 이 이름을 받는데, 왜냐하면, 실험에서, 그들의 값이 어떤 법칙 또는 규칙 (예를 들어, 수학적 함수(mathematical function))에 의해, 다른 변수의 값에 의존한다는 가정 또는 가설 아래에서 연구되기 때문입니다. 독립 변수는, 차례로, 질문에서 그 실험의 범위에서 다른 변수에 의존하는 것으로 보이지 않습니다; 따라서, 심지어 존재하는 의존성이 역-가능일지라도 (예를 들어, 그것이 존재할 때 역함수(inverse function)를 찾음으로써), 명명법은 만약 역 의존성이 실험에서 연구의 대상이 아니면 유지됩니다. 이런 의미에서, 일부 공통적인 독립 변수는 시간(time), 공간(space), 밀도(density), 질량(mass), 유체 흐름 율(fluid flow rate),[1][2] 및 미래의 값 (종속 변수)을 예측하기 위해 관심 (예를 들어, 인간 모집단 크기)의 일부 관측된 값의 이전 값입니다.[3]

이 둘 중, 통계적(statistical) 문맥에서 회귀기(regressors)로 역시 알려진, 입력을 변경함으로써, 그의 변동(variation)이 연구되는 항상 종속 변수입니다. 실험에서, 실험자가 조작하는[clarification needed] 임의의 변수는 독립 변수라고 불릴 수 있습니다. 모델(Models)실험(experiments)은 독립 변수가 종속 변수에 미치는 영향을 테스트합니다. 때때로, 심지어 그들의 영향이 직접적인 관심이 아닐지라도, 독립 변수는 잠재적 혼란(confounding) 효과를 설명하기 위한 것과 같은 다른 이유에 대해 포함될 수 있습니다.

In single variable calculus, a function is typically graphed with the horizontal axis representing the independent variable and the vertical axis representing the dependent variable.[4] In this function, y is the dependent variable and x is the independent variable.

Mathematics

수학에서, 함수(function)는 입력 (가장 간단한 경우에서, 숫자 또는 숫자의 집합)[5]을 취하고 출력 (역시 숫자일 수 있음)을 제공하는 규칙입니다.[5] 임의의 입력을 나타내는 기호는 독립 변수(independent variable)라고 불리지만, 임의의 출력을 나타내는 기호는 종속 변수(dependent variable)라고 불립니다.[6] 입력에 대해 가장 공통적인 기호는 x이고, 출력에 대해 가장 공통적인 기호는 y입니다; 함수 자체는 공통적으로 로 쓰입니다.[6][7]

여러 독립 변수 또는 여러 종속 변수를 가질 수 있습니다. 예를 들어, 다변수 미적분학(multivariable calculus)에서, 우리는 형식 의 함수를 자주 만나게 되며, 여기서 z는 종속 변수이고 xy는 독립 변수입니다.[8] 여러 출력을 갖는 함수는 종종 벡터-값 함수(vector-valued functions)로 참조됩니다.

Statistics

실험(experiment)에서, 실험자에 의해 조작되는 변수는 독립 변수라고 불립니다.[9] 종속 변수는 독립 변수가 조작될 때 변경될 것으로 예상되는 사건입니다.[10]

(다변수 통계학(multivariate statistics)기계 학습(machine learning)에 대해) 데이터 채광(data mining) 도구에서, 종속 변수는 역할을 목표 변수(target variable) (또는 일부 도구에서 레이블 속성(label attribute))로 지정되지만, 독립 변수는 역할을 정규 변수(regular variable)로 지정될 수 있습니다.[11] 목표 변수에 대해 알려진 값은 수련하는 데이터 집합 및 테스트 데이터(test data) 집합에 제공되지만, 다른 데이터에 대해 예측되어야 합니다. 목표 변수는 지도 학습(supervised learning) 알고리듬에는 사용되지만 비-지도 학습에서는 사용되지 않습니다.

Modeling

수학적 모델링(mathematical modeling)에서, 종속 변수는 만약 및 얼마나 독립 변수가 변할 때 그것이 변하는지 알 기 위해 연구됩니다. 간단한 확률적(stochastic) 선형 모델(linear model) 에서, 항 는 종속 변수의 i-번째 값이고 는 독립 변수의 i-번째 값입니다. 항 는 "오차"로 알려져 있고 독립 변수에 의해 설명되지 않은 종속 변수의 변동가능성을 포함합니다.

다수 독립 변수와 함께, 모델은 이며, 여기서 n은 독립 변수의 숫자입니다.[citation needed]

선형 회귀 모델은 이제 논의됩니다. 선형 회귀를 사용하기 위해, 데이터의 흩어진 그림은 독립 변수로 X, 종속 변수로 Y와 함께 생성됩니다. 이것은 이변수 데이터-집합, 이라고 역시 불립니다. 단순 선형 회귀 모델은 에 대해 형식 를 취합니다. 이 경우에서, 은 독립 확률 변수입니다. 이것은 측정이 서로 영향을 미치지 않을 때 발생합니다. 독립성의 전파를 통해, 의 독립성은 비록 각 가 다른 기댓값을 가질지라도, 의 독립을 의미합니다. 각 는 0의 기댓값과 의 분산을 가집니다. [12]

의 기대 증명:

[13]

이변수 데이터-집합에 가장 적합한 직선은 형식 을 취하고 회귀 직선이라고 불립니다. 는 각각 절편과 기울기에 해당합니다.[14]

Simulation

모의실험(simulation)에서, 종속 변수는 독립 변수에서 변화에 대한 응답에서 변화입니다.

Statistics synonyms

문맥에 따라, 독립 변수는 때때로 "예측 변수(predictor variable)", 회귀기(regressor), 공변수(covariate), "조작 변수(manipulated variable)", "설명 변수(explanatory variable)", 노출 변수(exposure variable) (신뢰성 이론(reliability theory) 참조), "위험 요인(risk factor)" (의료 통계(medical statistics) 참조), "특색(feature)" (기계 학습(machine learning)패턴 인식(pattern recognition)) 또는 "입력 변수(input variable)"라고 불립니다.[15][16] 계량경제학(econometrics)에서, 용어 "제어 변수(control variable)"는 보통 "공변수(covariate)" 대신에 사용됩니다.[17][18][19][20][21]

경제 공동 사회로부터, 우리는 독립 변수를 외인성(exogenous)이라고 역시 불릴 수 있습니다.

문맥에 따라, 종속 변수는 때때로 "응답 변수(response variable)", "피-회귀(regressand)", "기준(criterion)", "예측된 변수(predicted variable)", "측정된 변수(measured variable)", "설명된 변수(explained variable)", "실험 변수(experimental variable)", "반응하는 변수(responding variable)", "결과 변수(outcome variable)", "출력 변수(output variable)", "대상(target)" 또는 "레이블(label)"이라고 불립니다.[16] 경제학에서, 내인성 변수는 보통 목표를 참조하는 것입니다.

"설명 변수"는 독립 변수로 취급된 양이 연구원에 의해 통계적으로 독립적 또는 독립적으로 조작될 수 없을 때 "독립 변수"보다 일부 저자에 의해 선호됩니다.[22][23] 만약 독립 변수가 "설명 변수"로 참조되면, 용어 "응답 변수"는 종속 변수에 대해 일부 저자에 의해 선호됩니다.[16][22][23]

"설명된 변수"는, "종속 변수"로 취급되는 양이 통계적으로 종속이 아닐 때, "종속 변수"보다 일부 저자에 의해 선호됩니다.[24] 만약 종속 변수가 "설명된 변수"로 참조되면, 용어 "예측 변수"는 독립 변수에 대해 일부 저자에 의해 선호됩니다.[24]

변수는 그들 형식에 의해 역시 참조될 수 있습니다: 연속(continuous) 또는 카테고리적(categorical), 이것은 다른 것 사이에서 차례로 이진/이분법, 명목형 카테고리적, 및 순서-숫자 카테고리적일 수 있습니다.

예제는 Woodworth (1987)에 의한 해수면에서 경향 분석에 의해 제공됩니다. 여기서 종속 변수 (및 가장 관심있는 변수)는 일련의 연간 값이 이용될 수 있는 주어진 위치에서 연간 평균 해수면이었습니다. 주요 독립 변수는 시간이었습니다. 해수면에서 연간 평균 대기압의 연간 값으로 구성된 공변수를 사용했습니다. 결과는 공변수의 포함은 공변수를 생략한 분석에 비해 얻어진 시간에 대한 경향의 개선된 추정을 허용함을 보여주었습니다.

Other variables

변수는 종속 또는 독립 변수를 바꾸는 것으로 생각될 수 있지만, 실제로는 실험의 초점이 아닐 수 있습니다. 그 변수가 실험에 미치는 영향을 최소화를 시도하기 위해 일정하게 유지되거나 모니터링됩니다. 그러한 변수는 "제어된 변수", "제어 변수" 또는 "고정된 변수(control variable)"로 지정될 수 있습니다.

외래의 변수가, 만약 독립 변수로 회귀 분석(regression analysis)에 포함되면, 정확한 응답 매개-변수 추정, 예측(prediction), 및 적합성(goodness of fit)을 가진 연구원을 도울 수 있지만, 검사 아래에서 가설(hypothesis)에 실질적인 관심의 것은 아닙니다. 예를 들어, 고등 교육이 평생 소득에 미치는 영향을 조사한 연구에서, 일부 외래의 변수는 성별, 민족, 사회 계층, 유전, 지능, 나이, 등일 수 있습니다. 변수는 종속 변수(dependent variable)에 영향을 미치는 것으로 가정 (또는 표시)될 수 있을 때 오직 외래의 것입니다. 만약 회귀에 포함되면, 모델의 적합도(fit of the model)를 개선할 수 있습니다. 만약 그것이 회귀로부터 제외되고 하나 이상의 관심있는 독립 변수와 비-영 공분산(covariance)을 가지면, 그것은 생략은 관심있는 해당 독립 변수의 영향에 대해 회귀의 결과를 편향(bias)할 것입니다. 이 효과는 혼란(confounding) 또는 생략된 변수 편향(omitted variable bias)이라고 불립니다; 이들 상황에서, 설계 변경 및/또는 변수에 대한 제어하면, 통계 제어가 필요합니다.

외래의 변수는 종종 세 가지 유형으로 분류됩니다:

  1. 그들의 행동에 영향을 줄 수 있는 연구 대상 개인의 특성인 주제 변수. 이들 변수는 나이, 성별, 건강 상태, 기분, 배경, 등을 포함합니다.
  2. 차단 변수 또는 실험 변수는 사람의 행동 방식에 영향을 줄 수 있는 실험을 수행하는 사람의 특질입니다. 성별, 인종 차별의 존재, 언어, 또는 다른 요인이 그러한 변수로 인정될 수 있습니다.
  3. 상황 변수는 연구 또는 연구가 수행된 환경의 특성이며, 실험의 결과에 부정적인 방향을 낳습니다. 기온, 활동의 수준, 조명, 및 시간이 포함됩니다.

모델링에서, 독립 변수에 덮이지 않는 변동가능성은 로 지정되고 "잔여(residual)", "주변 효과", "오차(error)", "설명되지 않은 공유", "잔여 변수", "방해" 또는 "허용"으로 알려져 있습니다.

Examples

  • 식물 성장에 대한 비료의 영향:
식물의 성장에 비료의 다른 양의 영향을 측정하는 연구에서, 독립 변수는 사용되는 비료의 총양입니다. 종속 변수는 식물의 키 또는 무게의 성장입니다. 제어된 변수는 식물의 유형, 비료의 유형, 식물이 받는 햇빛의 총양, 화분의 크기 등입니다.
  • 증상 중증도에 대한 약물 용량의 영향:
약물의 다른 정량이 증상의 심각성에 어떤 영향을 미치는지에 대한 연구에서, 연구원은 다른 정량이 투여될 때 증상의 빈도와 강도를 비교할 수 있습니다. 여기서 독립 변수는 정량이고 종속 변수는 증상의 빈도/강도입니다.
  • 색소 침착에 대한 온도의 영향:
다른 온도에서 사탕무의-뿌리 표본으로부터 제거된 색의 총양을 측정하는 것에서, 온도는 독립 변수이고 제거된 그림-물감의 총양은 종속 변수입니다.
  • 커피에 첨가된 설탕의 효과:
커피에 첨가된 설탕의 총양에 따라 맛이 달라집니다. 여기서 설탕은 독립 변수이지만, 맛은 종속 변수입니다.

See also

References

  1. ^ Aris, Rutherford (1994). Mathematical modelling techniques. Courier Corporation.
  2. ^ Boyce, William E.; Richard C. DiPrima (2012). Elementary differential equations. John Wiley & Sons.
  3. ^ Alligood, Kathleen T.; Sauer, Tim D.; Yorke, James A. (1996). Chaos an introduction to dynamical systems. Springer New York.
  4. ^ Hastings, Nancy Baxter. Workshop calculus: guided exploration with review. Vol. 2. Springer Science & Business Media, 1998. p. 31
  5. ^ a b Carlson, Robert. A concrete introduction to real analysis. CRC Press, 2006. p.183
  6. ^ a b Stewart, James. Calculus. Cengage Learning, 2011. Section 1.1
  7. ^ Anton, Howard, Irl C. Bivens, and Stephen Davis. Calculus Single Variable. John Wiley & Sons, 2012. Section 0.1
  8. ^ Larson, Ron, and Bruce Edwards. Calculus. Cengage Learning, 2009. Section 13.1
  9. ^ http://onlinestatbook.com/2/introduction/variables.html
  10. ^ Random House Webster's Unabridged Dictionary. Random House, Inc. 2001. Page 534, 971. ISBN 0-375-42566-7.
  11. ^ English Manual version 1.0 Archived 2014-02-10 at the Wayback Machine for RapidMiner 5.0, October 2013.
  12. ^ Dekking, F.M. (Frederik Michel), 1946- (2005). A modern introduction to probability and statistics : understanding why and how. Springer. ISBN 1-85233-896-2. OCLC 783259968.{{cite book}}: CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)
  13. ^ Dekking, F.M. (Frederik Michel), 1946- (2005). A modern introduction to probability and statistics : understanding why and how. Springer. ISBN 1-85233-896-2. OCLC 783259968.{{cite book}}: CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)
  14. ^ Dekking, F.M. (Frederik Michel), 1946- (2005). A modern introduction to probability and statistics : understanding why and how. Springer. ISBN 1-85233-896-2. OCLC 783259968.{{cite book}}: CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)
  15. ^ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9 (entry for "independent variable")
  16. ^ a b c Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9 (entry for "regression")
  17. ^ Gujarati, Damodar N.; Porter, Dawn C. (2009). "Terminology and Notation". Basic Econometrics (Fifth international ed.). New York: McGraw-Hill. p. 21. ISBN 978-007-127625-2.
  18. ^ Wooldridge, Jeffrey (2012). Introductory Econometrics: A Modern Approach (Fifth ed.). Mason, OH: South-Western Cengage Learning. pp. 22–23. ISBN 978-1-111-53104-1.
  19. ^ Last, John M., ed. (2001). A Dictionary of Epidemiology (Fourth ed.). Oxford UP. ISBN 0-19-514168-7.
  20. ^ Everitt, B. S. (2002). The Cambridge Dictionary of Statistics (2nd ed.). Cambridge UP. ISBN 0-521-81099-X.
  21. ^ Woodworth, P. L. (1987). "Trends in U.K. mean sea level". Marine Geodesy. 11 (1): 57–87. doi:10.1080/15210608709379549. {{cite journal}}: Invalid |ref=harv (help)
  22. ^ a b Everitt, B.S. (2002) Cambridge Dictionary of Statistics, CUP. ISBN 0-521-81099-X
  23. ^ a b Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9
  24. ^ a b Ash Narayan Sah (2009) Data Analysis Using Microsoft Excel, New Delhi. ISBN 978-81-7446-716-4