Jump to content

Conditional expectation

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

확률 이론(probability theory)에서, 확률 변수(random variable)조건부 기대(conditional expectation), 조건부 기댓값(conditional expected value) 또는 조건부 평균(conditional mean)은 "조건"의 특정 집합이 발생하는 것으로 알려져 있다고 주어지는 그것의 기댓값(expected value)임의적인 큰 숫자(arbitrarily large number)의 발생에 걸쳐 "평균적으로" 취하는 값입니다. 만약 확률 변수가 유한한 수의 값만 취할 수 있으면, "조건"은 변수가 해당 값의 부분집합만 취할 수 있다는 것입니다. 보다 형식적으로, 확률 변수가 이산 확률 공간(probability space)에 걸쳐 정의되는 경우에서, "조건"은 이 확률 공간의 분할(partition)입니다.

문맥에 따라, 조건부 기대는 확률 변수 또는 함수일 수 있습니다. 확률 변수는 조건부 확률(conditional probability)과 유사하게 로 표시됩니다. 함수 형식은 또는 를 의미하는 것으로 도입될 때와 같이 분리 함수 기호로 표시됩니다.

Examples

Example 1: Dice rolling

공정한 주사위의 굴림을 생각해 보십시오. 만약 숫자가 짝수 (즉, 2, 4, 또는 6)이면 A = 1이고 그렇지 않으면 A = 0이라고 놓습니다. 게다가, 숫자가 소수 (즉, 2, 3, 또는 5)이면 B = 1이고 그렇지 않으면 B = 0이라고 놓습니다.

1 2 3 4 5 6
A 0 1 0 1 0 1
B 0 1 1 0 1 0

A의 무조건부 기대는 이지만, B = 1에 대한 조건부 (즉, 주사위를 굴려서 2, 3, 또는 5가 나왔다는 조건부)에 대한 A의 기대는 이고, B = 0에 대한 조건부 (즉, 주사위를 굴려서 1, 4, 또는 6이 나왔다는 조건부) A의 기대는 입니다 마찬가지로, A = 1에 대한 조건부 B의 기대는 이고, A = 0에 대한 조건부 B의 기대는 입니다.

Example 2: Rainfall data

1990년 1월 1일부터 1999년 12월 31일까지 10년 (3652일) 기간의 매일 기상 관측소에서 수집된 일일 강우 데이터 (매일 강우량 mm)가 있다고 가정합니다. 지정되지 않은 날에 대해 무조건부 기대는 해당 3652일 동안의 총 강우량의 평균입니다. 3월 (조건부)로 알려진 달리 지정되지 않은 날에 대한 조건부 강우량의 기대는 3월에 해당하는 10년 기간의 전체 310일 동안의 일일 강우량의 평균입니다. 그리고 3월 2일 날짜에 대한 조건부 강우량의 조건부 기대는 해당 날짜의 10일 동안 발생했던 강우량의 평균입니다.

History

조건부 확률(conditional probability)의 관련 개념은 최소한 조건부 분포를 계산했던 적어도 라플라스(Laplace)로 거슬러 올라갑니다. 1933년에 라돈–니코딤 정리(Radon–Nikodym theorem)를 사용하여 그것을 공식화한 사람은 안드레이 콜모고로프(Andrey Kolmogorov)였습니다.[1] 1953년에서 폴 핼모스(Paul Halmos)[2] 조셉 L. 두브(Joseph L. Doob)[3] 연구에서, 조건부 기대는 부분-σ-대수(sub-σ-algebras)를 사용하여 현대적인 정의로 일반화되었습니다.[4]

Definitions

Conditioning on an event

만약 가 비-영 확률을 갖는 에서 사건이고, 이산 확률 변수(discrete random variable)이면, 주어진 에 대한 의 조건부 기대는 다음과 같습니다:

여기서 합은 의 모든 가능한 결과에 걸쳐 취합니다.

이면, 조건부 기대는 영에 의한 나눗셈으로 기인하여 정의되지 않음에 주목하십시오.

Discrete random variables

이산 확률 변수(discrete random variables)이면, 주어진 에 대한 의 조건부 기대는 다음과 같습니다:

여기서 결합 확률 질량 함수(joint probability mass function)입니다. 그 합은 의 모든 가능한 결과에 걸쳐 취합니다.

이산 확률 변수에 대한 조건화는 해당하는 사건에 대한 조건화와 같음에 주목하십시오:

여기서 는 집합 입니다.

Continuous random variables

를 결합 밀도 , 의 밀도 및 주어진 사건 에 대한 의 조건부 밀도 를 갖는 연속 확률 변수(continuous random variables)로 놓습니다. 주어진 에 대한 의 조건부 기대는 다음과 같습니다:

분모가 영일 때, 기대는 정의되지 않습니다.

연속 확률 변수에 대한 조건화는 이산 경우에서와 같이 사건 에 대한 조건화와 같지 않음에 주목하십시오. 자세한 논의에 대해, 확률 영의 사건에 대한 조건화(Conditioning on an event of probability zero)를 참조하십시오. 이 구분을 존중하지 않는 것은 보렐–콜모고로프 역설(Borel-Kolmogorov paradox)에 의해 설명된 바와 같이 모순된 결론을 초래할 수 있습니다.

L2 random variables

이 섹션에서 모든 확률 변수는 , 즉, 제곱 적분-가능(square integrable)에 있다고 가정합니다. 전체 일반성에서, 조건부 기대는 이 가정 없이 전개됩니다. 아래의 부분--대수에 관한 조건부 기대를 참조하십시오. 이론은, 어쨌든, 더 직관적으로 여겨지고[5] 중요한 일반화를 인정합니다. 확률 변수의 문맥에서, 조건부 기대는 역시 회귀(regression)라고도 불립니다.

다음에서 를 확률 공간, 에서 평균 분산(variance) 를 갖는다고 놓습니다. 기대 평균 제곱 오차(mean squared error)를 최소화합니다:

.

의 조건부 기대는 단일 숫자 대신에, 그 결과가 함수 일 것이라는 점을 제외하고 유사하게 정의됩니다. 확률 벡터(random vector)로 놓습니다. 조건부 기대 는 다음을 만족하는 측정-가능 함수입니다:

.

와 달리, 조건부 기대 는 일반적으로 고유하지 않음에 주목하십시오: 평균 제곱 오차의 최소화기가 여러 개 있을 수 있습니다.

Uniqueness

Example 1: 가 항상 1인 상수 확률 변수인 경우를 생각해 보십시오. 그런-다음 평균 제곱 오차는 다음 형식의 임의의 함수에 의해 최소화됩니다:

Example 2: 가 2-차원 확률 벡터 인 경우를 생각해 보십시오. 그런-다음 분명하게 다음이지만,

함수의 관점에서 그것은 또는 또는 무한하게 많은 다른 방법에서 표현될 수 있습니다. 선형 회귀(linear regression)의 문맥에서, 이러한 고유성의 결여를 다중-공선성(multicollinearity)이라고 불립니다.

조건부 기대는 에서 측정 영의 집합까지(up to) 고유합니다. 사용된 측정은 에 의해 유도된 밂 측정(pushforward measure)입니다.

첫 번째 예제에서, 밂 측정은 1에서 디랙 분포(Dirac distribution)입니다. 두 번째에서, 그것은 교차하지 않은 측정 0을 가지는 임의의 집합이 되도록 "대각선" 에 집중되어 있습니다.

Existence

에 대해 최소화기의 존재는 비-자명입니다. 그것은 다음이

힐베르트 공간 의 닫힌 부분-공간임을 쉽게 보일 수 있습니다. 힐베르트 투영 정리(Hilbert projection theorem)에 의해, 에 대해 최소화기가 되는 필요-충분 조건은 에서 모든 에 대해 우리가 다음을 가진다는 것입니다:

.

말로 하자면, 이 방정식은 잔여(residual) 의 모든 함수의 공간 에 수직이라고 말합니다. 지시 함수(indicator functions) 에 적용되는 이 수직성 조건은 아래에서 가 반드시 에 있지는 않은 경우에 조건부 기대를 확장하기 위해 사용됩니다.

Connections to regression

조건부 기대는 해석적으로 계산하고, 보간에 대해 어렵기 때문에 응용 수학(applied mathematics)통계(statistics)에서 종종 근사화됩니다.[6]

위에 정의된 다음 힐베르트 공간은

임의의 측정-가능 함수를 허용하는 것이 아니라 의 함수 형식을 제한함으로써 그것으로부터 부분-집합으로 대체됩니다. 이것의 예는 단순 함수(simple function)라고 요구될 때 결정 트리 회귀(decision tree regression), 아핀(affine)으로 요구될 때 선형 회귀(linear regression), 등입니다.

조건부 기대의 이들 일반화는 더 이상 유지하지 않는 그것의 많은 속성을 희생합니다. 예를 들어, 의 모든 선형 함수의 공간이라고 놓고, 을 이 일반화된 조건부 기대/ 투영을 나타낸다고 놓습니다. 만약 상수 함수(constant functions)를 포함하지 않으면, 탑 속성(tower property) 은 유지되지 않을 것입니다.

중요한 특별한 경우는 가 결합적으로 정규 분포될 때의 경우입니다. 이 경우에서, 조건부 기대가 선형 회귀와 동등함을 보일 수 있습니다:

계수 에 대해 Multivariate normal distribution#Conditional distributions에서 설명됩니다.

Conditional expectation with respect to a sub-σ-algebra

Conditional expectation with respect to a σ-algebra: in this example the probability space is the [0,1] interval with the Lebesgue measure. We define the following σ-algebras: ; is the σ-algebra generated by the intervals with end-points 0, ¼, ½, ¾, 1; and is the σ-algebra generated by the intervals with end-points 0, ½, 1. Here the conditional expectation is effectively the average over the minimal sets of the σ-algebra.

다음을 생각해 보십시오:

의 부분 -대수이기 때문에, 함수 는 보통 -측정가능이 아니고, 따라서 형식 의 적분의 존재는, 여기서 에 대한 의 제한이며, 일반적으로 말할 수 없습니다. 지역 평균 는 조건부 기대의 도움과 함께 에서 회복될 수 있습니다.

주어진 에 대한 조건부 기대(conditional expectation)는, 으로 나타내며, 각 에 대해 다음을 만족시키는 임의의 -측정가능 함수(measurable function) 입니다:[7]

토론에서 언급된 것처럼, 이것은 잔여(residual) 가 지시 함수 와 수직이라고 말하는 것과 동등한 조건입니다:

Existence

의 존재는 에 대해 에 관해 절대적으로 연속(absolutely continuous) 위에 유한 측정임을 언급함으로써 수립될 수 있습니다. 만약 에서 로의 자연스러운 단사(natural injection)이면, 로의 의 제한이고 로의 의 제한입니다. 게다가, 에 관한 절대적으로 연속인데, 왜냐하면 다음 조건은

다음임을 의미하기 때문입니다:

따라서, 우리는 다음을 가집니다:

여기서 도함수는 측정의 라돈–니코딤 도함수(Radon–Nikodym derivatives)입니다.

Conditional expectation with respect to a random variable

위의 것 외에도, 다음을 생각해 보십시오:

주어진 에 대한 의 조건부 기대는 에 의해 생성된 σ-대수에 대한 위의 구성을 적용함으로써 정의됩니다:

.

두브-딘킨 보조정리(Doob-Dynkin lemma)에 의해, 다음을 만족하는 함수 가 존재합니다:

.

Discussion

  • 이것은 구성적 정의가 아닙니다; 우리는 조건부 기대가 만족시켜야 하는 필수 속성만 제공됩니다.
    • 의 정의는 사건 에 대해 의 정의와 닮아 있지만 이것들은 매우 다른 대상입니다. 전자는 -측정가능 함수 이지만, 후자는 의 원소이고 에 대해 입니다.
    • 고유성은 거의 확실하게(almost sure) 표시될 수 있습니다: 즉, 같은 조건부 기대의 버전은 확률 영의 집합(set of probability zero)에서만 다릅니다.
  • σ-대수 는 조건화의 "세분성(granularity)"을 제어합니다. 더 미세한 (더 큰) σ-대수 에 걸쳐 조건부 기대 는 사건의 더 큰 클래스의 확률에 대한 정보를 보유합니다. 더 거친 (더 작은) σ-대수에 걸쳐 조건부 기대는 더 많은 사건에 걸쳐 평균입니다.

Conditional probability

에서 보렐 부분집합 에 대해, 우리는 다음 확률 변수의 모음을 생각해 보십시오:

.

그것들은 마르코프 커널(Markov kernel), 즉, 거의 모든 에 대해, 가 확률 측정이라는 것을 알 수 있습니다.[8]

무의식 통계학자의 법칙(Law of the unconscious statistician)은 그런-다음 다음과 같습니다:

.

이것은 조건부 기대가, 그것들의 무조건부 짝처럼, 조건부 측정에 대항한 적분임을 보여줍니다.

Basic properties

모든 다음 공식은 거의 확실한 의미로 이해되어야 합니다. σ-대수 는 확률 변수 로 대체될 수 있습니다. 즉, 로 대체될 수 있습니다.

  • 독립 인수를 빼 냅니다:
    • 만약 독립(independent)이면, 입니다.
증명

라고 놓습니다. 그런-다음 과 독립이므로, 우리는 다음임을 얻습니다:

따라서 조건부 기대의 정의는 원했던 대로 상수 확률 변수 에 의해 만족시킵니다.

    • 만약 와 독립이면, 입니다. 이것은 만약 가 오직 와 독립이고 와 독립이면 반드시 그 경우는 아님을 주목하십시오.
    • 만약 가 , 와 독립이고, 와 독립이고 와 독립이면, 입니다.
  • 안정(Stability):
    • 만약 -측정가능이면, 입니다.
    • 특히, 부분-σ-대수 에 대해 우리는 임을 가집니다.
    • 만약 가 확률 변수이면, 입니다. 그것의 가장 단순한 형식에서, 이것은 임을 말합니다.
  • 알려진 인수를 빼 냅니다:
    • 만약 -측정가능이면, 입니다.
    • 만약 가 확률 변수이면, 입니다.
  • 전체 기대의 법칙(Law of total expectation): .[9]
  • 탑 속성(Tower property):
    • 부분-σ-대수 에 대해 우리는 임을 가집니다.
      • 특별한 경우 는 전체 기대의 법칙을 회복합니다: .
      • 특별한 경우는 -측정가능 확률 변수일 때입니다. 그런-다음 이고 따라서 입니다.
      • 두브 마틴게일(Doob martingale) 속성: (-측정가능임)을 갖는 위의 것과 역시 를 사용하여, 를 제공합니다.
    • 확률 변수 에 대해 우리는 임을 가집니다.
    • 확률 변수 에 대해 우리는 임을 가집니다.
  • 선형성(Linearity): 우리는 에 대해 를 가집니다.
  • 양수성(Positivity): 만약 이면 입니다.
  • 단조성(Monotonicity): 만약 이면 입니다.
  • 단조 수렴(Monotone convergence): 만약 이면 입니다.
  • 지배 수렴(Dominated convergence): 만약 과 함께 이면, 입니다.
  • 파투의 보조정리(Fatou's lemma): 만약 이면, 입니다.
  • 옌센 부등식(Jensen's inequality): 만약 볼록 함수(convex function)이면, 입니다.
  • 조건부 분산(Conditional variance): 조건부 기대를 사용하여, 우리는, 평균에서 평균 제곱 편차로 분산의 정의와 유사하게, 조건부 분산을 정의할 수 있습니다:
    • 정의:
    • 분산에 대해 대수적 공식:
    • 전체 분산의 법칙(Law of total variance): .
  • 마틴게일 수렴(Martingale convergence): 확률 변수 에 대해, 그것이 유한 기대를 가지며, 만약 가 부분-σ-대수의 증가하는 급수이고 이거나 만약 가 부분-σ-대수의 감소하는 급수이고 이면 임을 가집니다.
  • -투영으로 조건부 기대: 만약 제곱-적분가능(square-integrable) 실수 확률 변수 (유한 이차 모멘트를 갖는 실수 확률 변수)의 힐베르트 공간(Hilbert space)에 있으면,
    • -측정가능 에 대해, 임을 가지며, 즉 조건부 기대 스칼라 곱의 의미에서 에서 -측정가능 함수의 선형 부분공간(linear subspace)으로의 직교 투영(orthogonal projection)입니다. (이것은 힐베르트 투영 이론(Hilbert projection theorem)에 기초한 조건부 기대의 존재를 정의하고 입증하는 것을 허용합니다.)
    • 매핑 자체-인접(self-adjoint)입니다:
  • 조건화는 공간 축약(contractive) 투영이며, 즉, 임의의 에 대해 입니다.
  • 두브의 조건부 독립 속성:[10] 만약 가 주어진 조건부 독립(conditionally independent)이면, (동등하게, )입니다.

See also

Probability laws

Notes

  1. ^ Kolmogorov, Andrey (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung (in German). Berlin: Julius Springer. p. 46.
  2. ^ Oxtoby, J. C. (1953). "Review: Measure theory, by P. R. Halmos" (PDF). Bull. Amer. Math. Soc. 59 (1): 89–91. doi:10.1090/s0002-9904-1953-09662-8.
  3. ^ J. L. Doob (1953). Stochastic Processes. John Wiley & Sons. ISBN 0-471-52369-0.
  4. ^ Olav Kallenberg: Foundations of Modern Probability. 2. edition. Springer, New York 2002, ISBN 0-387-95313-2, p. 573.
  5. ^ "probability - Intuition behind Conditional Expectation". Mathematics Stack Exchange.
  6. ^ Hastie, Trevor. The elements of statistical learning : data mining, inference, and prediction (PDF) (Second, corrected 7th printing ed.). New York. ISBN 978-0-387-84858-7.
  7. ^ Billingsley, Patrick (1995). "Section 34. Conditional Expectation". Probability and Measure (3rd ed.). John Wiley & Sons. p. 445. ISBN 0-471-00710-2.
  8. ^ Klenke, Achim. Probability theory : a comprehensive course (Second ed.). London. ISBN 978-1-4471-5361-0.
  9. ^ "Conditional expectation". www.statlect.com. Retrieved 2020-09-11.
  10. ^ Kallenberg, Olav (2001). Foundations of Modern Probability (2nd ed.). York, PA, USA: Springer. p. 110. ISBN 0-387-95313-2.

References

  • William Feller, An Introduction to Probability Theory and its Applications, vol 1, 1950, page 223
  • Paul A. Meyer, Probability and Potentials, Blaisdell Publishing Co., 1966, page 28
  • Grimmett, Geoffrey; Stirzaker, David (2001). Probability and Random Processes (3rd ed.). Oxford University Press. ISBN 0-19-857222-0., pages 67–69

External links