확률 변수 는 X가 주어졌을 때 Y의 최상의 예측기입니다. 즉, 그것은 형식 f(X)의 모든 확률 변수의 클래스에 대한 평균 제곱 오차 를 최소화합니다. ). 이 확률 변수의 클래스는 만약 X가, 말하자면, 2X로 대체되면 그대로 유지됩니다. 따라서, 입니다. 그것은 를 의미하는 것은 아닙니다; 오히려, 입니다. 특히, 입니다. 보다 일반적으로, 모든 가능한 값 X의 집합에서 일-대-일인 모든 각 함수 g에 대해 입니다. X의 값은 관련이 없습니다; 중요한 것은 (αX로 표시됨) 표본 공간 Ω를 서로소 집합 {X = xn}으로의 분할입니다:
(여기서 는 X의 모든 가능한 값입니다.) Ω의 임의적인 분할 α가 주어지면, 확률 변수 를 정의할 수 있습니다. 그래도 여전히, 입니다.
조건부 확률은 조건부 기대의 특별한 경우로 취급될 수 있습니다. 즉, 만약 Y가 A의 지시(indicator)이면, P ( A | X ) = E ( Y | X )입니다. 그러므로 조건부 확률도 X 자체가 아니라 X에 의해 생성된 분할 αX에 따라 달라집니다; P ( A | g(X) ) = P (A | X) = P (A | α),α = αX = αg(X).
다른 한편으로, 사건 B에 대한 조건화는 B를 여러 부분 중 하나로 포함할 수 있는 분할에 관계없이 라는 조건 아래에서 잘-정의됩니다.
H ( X; 3, 7 )를 확률 분포 ({0,1,2,3}에 대한 모든 측정의 4-차원 공간에 있는 확률 벡터)로 취급하면, Y의 무조건적 분포를 얻는 기대를 취할 수 있습니다 — 이항 분포(binomial distribution)Bin ( 3, 0.5 )입니다. 이 사실은 y = 0,1,2,3에 대해 상등에 해당합니다:
예제. 구 x2 + y2 + z2 = 1의 한 점은 구의 균등 분포에 따라 무작위로 선택됩니다. 확률 변수 X, Y, Z는 무작위 점의 좌표입니다. X, Y, Z의 결합 밀도는 존재하지 않지만 (왜냐하면 구의 부피가 0이므로), X, Y의 결합 밀도 fX,Y는 존재합니다:
(구와 평면 사이의 각도가 일정하지 않기 때문에 밀도가 일정하지 않습니다.) X의 밀도는 적분에 의해 계산될 수 있습니다:
놀랍게도, 결과는 (−1,1)에서 x에 의존하지 않습니다:
이는 X가 (−1,1) 위에 균등하게 분포됨을 의미합니다. 같은 것은 Y와 Z에 대해 참입니다 (그리고 실제로, a2 + b2 + c2 = 1일 때마다 aX + bY + cZ에 대해서도 마찬가지입니다).
조건부 확률 P ( Y ≤ 0.75 | X = 0.5 )는 P ( Y ≤ 0.75, X = 0.5 ) / P ( X = 0.5 )로 해석될 수 없는데, 왜냐하면 후자는 0/0을 제공하기 때문입니다. 이에 따라서, P ( Y ≤ 0.75 | X = 0.5 )는 경험적 빈도를 통해 해석될 수 없는데, 왜냐하면 정확한 값 X = 0.5는 독립적인 시행의 무한 순서열 중에 한 번도 무작위로 나타날 기회가 없기 때문입니다.
조건부 확률은 극한으로 해석될 수 있습니다:
Conditional expectation
조건부 기대 E ( Y | X = 0.5 )는 덜 흥미롭습니다; 그것은 단지 대칭에 의해 사라집니다. 그것은 |Z|를 X, Y의 함수로 처리하여 E ( |Z| | X = 0.5 )를 계산하는 것이 더 흥미롭습니다:
확률 변수 E(|Z| | X)는 X가 주어졌을 때 |Z|의 최상의 예측기입니다. 즉, 그것은 형식 f(X)의 모든 확률 변수의 클래스에 대한 평균 제곱 오차 E ( |Z| - f(X) )2를 최소화합니다. 이산 사례와 유사하게, (−1,1) 위에 일-대-일인 모든 각 측정-가능한 함수 g에 대해 E ( |Z| | g(X) ) = E ( |Z| | X )입니다.
Conditional distribution
X = x가 주어지면, 밀도 fY|X=x(y)에 의해 주어진 Y의 조건부 분포는 (다시-크기 조절된) 아크사인 분포입니다; 그것의 누적 분포 함수는 x2 + y2 < 1임을 만족하는 모든 x와 y에 대해 다음과 같습니다:
h(x,Y)의 해당하는 기대는 조건부 기대 E ( h(X,Y) | X=x )에 불과합니다. (X의 분포에 따라) 모든 x에 대해 취한 이들 조건부 분포의 혼합(mixture)은 Y의 무조건부 분포입니다. 이 사실은 다음 상등에 해당합니다:
이산 수준에서, 조건화는 조건이 비-영 확률 (0으로 나눌 수 없음)인 경우에만 가능합니다. 밀도의 수준에서, X = x에 대한 조건화는 P ( X = x ) = 0임에도 불구하고 가능합니다. 이 성공은 조건화가 항상 가능하다는 환상을 만들 수 있습니다. 유감스럽게도, 아래에 제시된 몇 가지 이유로 그렇지 않습니다.
Geometric intuition: caution
위에서 언급한 결과 P ( Y ≤ 0.75 | X = 0.5 ) = 5/6는 다음과 같은 의미에서 기하학적으로 명백합니다. 조건 x = 0.5을 만족시키는 구 x2 + y2 + z2 = 1의 점 (x,y,z)는 평면 x = 0.5에서 반지름 의 원 y2 + z2 = 0.75입니다. 부등식 y ≤ 0.75는 호 위에 유지됩니다. 호의 길이는 원의 길이의 5/6이며, 이는 조건부 확률이 5/6과 같은 이유입니다.
이 성공적인 기하학적 설명은 다음 질문이 자명하다는 착각을 일으킬 수 있습니다.
주어진 구의 한 점이 무작위로 (균등하게) 선택됩니다. 그 점이 주어진 평면 위에 있다고 주어지면, 조건부 분포는 무엇입니까?
주어진 원 (주어진 구와 주어진 평면의 교차점)에서 조건부 분포가 균등해야 한다는 것이 명백해 보일 수 있습니다. 때로는 실제로 그렇지만 일반적으로 그렇지 않습니다. 특히, Z는 (–1,+1) 위에 균등하게 분포되고 비율 Y/X와 독립적이며, 따라서, P ( Z ≤ 0.5 | Y/X ) = 0.75입니다. 다른 한편으로, 부등식 z ≤ 0.5는 원 x2 + y2 + z2 = 1, y = cx (임의의 c에 대해)의 호 위에 유지됩니다. 호의 길이는 원의 길이의 2/3입니다. 어쨌든, 조건부 확률은 2/3이 아니라 3/4입니다. 이것은 고전적인 보렐 역설의 표현입니다.[3][4]
대칭성에 대한 호소는 만약 불변 인수로 형식화되지 않으면 오해의 소지가 있을 수 있습니다.
또 다른 예제. 삼-차원 공간의 확률 회전(random rotation)은 무작위 축을 중심으로 무작위 각도로 회전하는 것입니다. 기하학적 직관에 따르면 각도는 축과 독립적이고 균등하게 분포됩니다. 어쨌든, 후자는 틀렸습니다; 각도의 작은 값은 가능성이 낮습니다.
The limiting procedure
영 확률의 사건 B가 주어지면, 공식 는 쓸모가 없지만, Bn ↓ B (즉, 및 )를 만족하는 비-영 확률의 적절한 일련의 사건 Bn에 대해 를 시도할 수 있습니다. 위에 한 가지 예제가 나와 있습니다. 또 다른 두 가지 예제는 브라운 다리와 브라운 소풍입니다.
후자의 두 예에서, 전체 확률의 법칙은 관련이 없는데, 왜냐하면 단일 사건 (조건)만 제공되기 때문입니다. 대조적으로, 위의 예제에서, 전체 확률의 법칙이 적용되는데, 왜냐하면 사건 X = 0.5는 사건의 가족 X = x에 포함되며, 여기서 x는 (−1,1)을 초과하고, 이들 사건은 확률 공간의 분할이기 때문입니다.
역설 (예를 들어 보렐의 역설)을 피하기 위해, 다음과 같은 중요한 구분이 고려되어야 합니다. 만약 주어진 사건의 확률이 비-영이면, 위에서 언급한 것처럼 그것에 대한 조건화는 (임의의 다른 사건에 관계없이) 잘-정의되어 있습니다. 대조적으로, 만약 주어진 사건이 영 확률의 것이면, 일부 추가 입력이 제공되지 않은 한 그것에 대한 조건화는 잘못-정의됩니다. 이 추가 입력을 잘못 선택하면, 잘못된 조건부 확률 (예상, 분포)로 이어집니다. 이런 의미에서, "확률이 영과 같은 고립된 가설에 관한 조건부 확률의 개념은 허용되지 않습니다." (Kolmogorov[5])
추가 입력은 (a) 대칭 (불변 그룹); (b) Bn ↓ B, P ( Bn ) > 0을 만족하는 사건 Bn의 순서열; (c) 주어진 사건을 포함하는 분할. 측정-이론적 조건화 (아래)는 사례 (c)를 조사하고, 일반적으로 (b)와의 관계와 적용-가능할 때 (a)와의 관계를 공개합니다.
영 확률의 일부 사건은 조건화의 범위를 벗어납니다. 예제: Xn을 (0,1) 위에 균등하게 분포된 독립 확률 변수라고 놓고, B를 사건 "Xn → 0 as n → ∞"라고 놓습니다; P ( Xn < 0.5 | B )에 대한 것이 무엇입니까? 그것이 1이 되는 경향이 있습니까? 또 다른 예제: X를 (0,1) 위에 균등하게 분포된 확률 변수라고 놓고, B를 사건 "X는 유리수이다"라고 놓습니다; P ( X = 1/n | B )에 대한 것은 무엇입니까? 유일한 대답은 다시 한 번 다음과 같습니다:
다시 한 번, 확률 변수 P ( Y ≤ 1/3 | X ) = g2 (X)의 기대는 (무조건부) 확률 E ( P ( Y ≤ 1/3 | X ) ) = P ( Y ≤ 1/3 )과 같으며, 즉,
어쨌든, 힐베르트 공간 접근 방식은 g2를 개별 함수가 아닌 함수의 동치 클래스로 취급합니다. g2의 측정-가능성은 보장되지만, 연속성 (또는 심지어 리만 적분-가능성)은 보장되지 않습니다. 값 g2 (0.5)는 점 0.5가 X의 분포의 원자이기 때문에 고유하게 결정됩니다. 다른 값 x는 원자가 아니며, 따라서, 해당하는 값 g2 (x)는 고유하게 결정되지 않습니다. 다시 한 번, "그 확률이 영과 같은 고립된 가설에 관한 조건부 확률의 개념은 허용되지 않습니다." (Kolmogorov.[5])
(힐베르트 공간과 라돈-니코딤 도함수를 통한) 접근 방식 둘 다는 g를 함수의 동치 클래스로 취급합니다; 두 함수 g와 g′은 g (X) = g′ (X)가 거의 확실하면 동등한 것으로 취급됩니다. 이에 따라, 조건부 확률 P ( Y ≤ 1/3 | X )은 확률 변수의 동치 클래스로 취급됩니다; 평소와 같이, 두 확률 변수는 만약 그것들이 거의 확실하게 같으면 동등한 것으로 취급됩니다.
Conditional expectation
조건부 기대 는 X가 주어졌을 때 Y의 최상의 예측기로 정의될 수 있습니다. 즉, 그것은 h(X) 형식의 모든 확률 변수의 클래스에 대한 평균 제곱 오차 를 최소화합니다.
경우 f = f1에서, 해당하는 함수 h = h1는 명시적으로 계산될 수 있습니다,[details 2]
경우 f = f2에서, 해당하는 함수 h = h2는 아마도 명시적으로 계산될 수 없습니다. 그럼에도 불구하고 그것은 존재하고, 위의 g2 — 힐베르트 공간의 직교 투영과 같은 방법으로 수치적으로 계산될 수 있습니다. 전체 기대의 법칙은 유지되는데, 왜냐하면 투영은 부분공간에 속한 상수 1에 의해 스칼라 곱을 변경할 수 없기 때문입니다.
이 역설적인 결과는 측정 이론에 의해 다음과 같이 설명됩니다. 주어진 y에 대해, 해당하는 는 (x의) 함수의 동치 클래스로 (힐베르트 공간 또는 라돈-니코딤 도함수를 통해) 잘-정의되어 있습니다. 주어진 x에 대해 y의 함수로 취급된, 그것은 일부 추가적인 입력이 제공되지 않은 한 잘못 정의됩니다. 즉, (x의) 함수는 모든 각 (또는 적어도 거의 모든 각) 동치 클래스 내에서 선택되어야 합니다. 잘못된 선택은 잘못된 조건부 누적 분포 함수로 이어집니다.
올바른 선택은 다음과 같이 할 수 있습니다. 먼저, 는 유리수 y에 대해서만 고려됩니다. (임의의 다른 조밀한 셀-수-있는 집합도 똑같이 잘 사용될 수 있습니다.) 따라서, 동치 클래스의 셀-수-있는 집합만 사용됩니다; 이들 클래스 내에서 함수의 모든 선택은 서로 동등하고, 유리수 y의 해당하는 함수는 (거의 모든 각 x에 대해) 잘-정의되어 있습니다. 둘째, 함수는 오른쪽 연속성에 의해 유리수에서 실수로 확장됩니다.
일반적으로 조건부 분포는 (X의 분포에 따라) 거의 모든 x에 대해 정의되지만, 때때로 결과가 x에서 연속적이며, 이 경우에서 개별 값이 허용됩니다. 고려된 예제에서 이것이 사실입니다; x = 0.75에 대한 올바른 결과,
이는 X = 0.75이 주어졌을 때 Y의 조건부 분포는 각각 확률 1/3 및 2/3의 0.25 및 0.5에서 두 원자로 구성됨을 보여줍니다.
유사하게, 조건부 분포는 (0, 0.5) 또는 (0.5, 1)에서 모든 x에 대해 계산될 수 있습니다.
값 x = 0.5는 X의 분포의 원자이며, 따라서, 해당하는 조건부 분포는 잘-정의되어 있고 기본적인 수단으로 계산될 수 있습니다 (분모는 사라지지 않습니다); X = 0.5가 주어졌을 때 Y의 조건부 분포는 (2/3, 1) 위에 균등합니다. 측정 이론은 같은 결과로 이어집니다.
모든 조건부 분포의 혼합은 Y의 (무조건부) 분포입니다.
조건부 기대 는 조건부 분포에 관한 기대에 불과합니다.
경우 f = f2에서, 해당하는 는 아마도 명시적으로 계산될 수 없습니다. 주어진 y에 대해, 그것은 (힐베르트 공간 또는 라돈-니코딤 도함수를 통해) (x의) 함수의 동치 클래스로 잘-정의됩니다. 이들 동치 클래스 내에서 함수의 올바른 선택은 위와 같이 할 수 있습니다; 그것은 올바른 조건부 누적 분포 함수, 즉, 조건부 분포로 이어집니다. 일반적으로, 조건부 분포는 원자적(atomic)이거나 절대적으로 연속적(absolutely continuous)일 필요는 없습니다 (두 유형의 혼합도 아닙니다). 아마도, 고려된 예제에서 그것들은 (칸토어 분포와 같이) 특이(singular)입니다 .
다시 한번, 모든 조건부 분포의 혼합은 (무조건부) 분포이고, 조건부 기대는 조건부 분포에 관한 기대입니다.
^Buchanan, K.; Huff, G. H. (July 2011). "A comparison of geometrically bound random arrays in euclidean space". 2011 IEEE International Symposium on Antennas and Propagation (APSURSI): 2008–2011. doi:10.1109/APS.2011.5996900. ISBN978-1-4244-9563-4.
^Buchanan, K.; Flores, C.; Wheeland, S.; Jensen, J.; Grayson, D.; Huff, G. (May 2017). "Transmit beamforming for radar applications using circularly tapered random arrays". 2017 IEEE Radar Conference: 0112–0117. doi:10.1109/RADAR.2017.7944181. ISBN978-1-4673-8823-8.