확률 이론(probability theory )과 통계학(statistics) 에서, 두 개의 결합적으로 분포된 확률 변수(random variable)
X
{\displaystyle X}
와
Y
{\displaystyle Y}
가 주어지면, 주어진
X
{\displaystyle X}
에 대한
Y
{\displaystyle Y}
의 조건부 확률 분포 (conditional probability distribution )는
X
{\displaystyle X}
가 특정 값으로 알려졌을 때
Y
{\displaystyle Y}
의 확률 분포(probability distribution) 입니다; 일부 경우에서, 조건부 확률은 매개 변수로
X
{\displaystyle X}
의 미지정 값
x
{\displaystyle x}
를 포함하는 함수로 표현될 수 있습니다.
X
{\displaystyle X}
와
Y
{\displaystyle Y}
둘 다가 카테고리형 변수(categoryical variables) 일 때, 조건부 확률 테이블(conditional probability table) 이 전형적으로 조건부 확률을 나타내기 위해 사용됩니다. 조건부 분포는 확률 변수의 주변 분포(marginal distribution) 와 대조되며, 이는 나머지 다른 변수의 값에 대한 참조없이 그것의 분포입니다.
만약 주어진
X
{\displaystyle X}
에 대한
Y
{\displaystyle Y}
의 조건부 분포가 연속 분포(continuous distribution) 이면, 그것의 확률 밀도 함수(probability density function) 는 조건부 밀도 함수 (conditional density function )로 알려져 있습니다.[1] 모멘트(moments) 와 같은 조건부 분포의 속성은 종종 조건부 평균(conditional mean) 과 조건부 분산(conditional variance) 과 같은 해당 이름에 의해 참조됩니다.
보다 일반적으로, 세 개 이상의 변수 집합의 부분집합의 조건부 분포를 참조할 수 있습니다; 이 조건부 분포는 모든 남아있는 변수의 값을 의존하고, 만약 둘 이상의 변수가 부분집합에 포함되면 이 조건부 분포는 포함된 변수의 조건부 결합 분포(joint distribution) 입니다.
Conditional discrete distributions
이산 확률 변수(discrete random variables) 에 대해, 주어진
X
=
x
{\displaystyle X=x}
에 대한
Y
{\displaystyle Y}
의 조건부 확률 질량 함수는 그것의 정의에 따라 다음과 같이 작성될 수 있습니다:
p
Y
|
X
(
y
∣
x
)
≜
P
(
Y
=
y
∣
X
=
x
)
=
P
(
{
X
=
x
}
∩
{
Y
=
y
}
)
P
(
X
=
x
)
{\displaystyle p_{Y|X}(y\mid x)\triangleq P(Y=y\mid X=x)={\frac {P(\{X=x\}\cap \{Y=y\})}{P(X=x)}}\qquad }
분모에서
P
(
X
=
x
)
{\displaystyle P(X=x)}
의 발생으로 인해, 이것은 비-영 (따라서 엄격하게 양수)
P
(
X
=
x
)
{\displaystyle P(X=x)}
에 대해서만 정의됩니다.
주어진
Y
{\displaystyle Y}
에 대한
X
{\displaystyle X}
의 확률 분포와의 관계는 다음과 같습니다:
P
(
Y
=
y
∣
X
=
x
)
P
(
X
=
x
)
=
P
(
{
X
=
x
}
∩
{
Y
=
y
}
)
=
P
(
X
=
x
∣
Y
=
y
)
P
(
Y
=
y
)
.
{\displaystyle P(Y=y\mid X=x)P(X=x)=P(\{X=x\}\cap \{Y=y\})=P(X=x\mid Y=y)P(Y=y).}
Example
공정한 주사위의 굴려서 숫자가 짝수 (즉, 2, 4, 또는 6)이면
X
=
1
{\displaystyle X=1}
을 놓고 그렇지 않으면
X
=
0
{\displaystyle X=0}
를 놓는 것을 생각해 보십시오. 게다가, 숫자가 소수 (즉, 2, 3, 또는 5)이면
Y
=
1
{\displaystyle Y=1}
을 놓고 그렇지 않으면
Y
=
0
{\displaystyle Y=0}
을 놓습니다.
D
1
2
3
4
5
6
X
0
1
0
1
0
1
Y
0
1
1
0
1
0
그런-다음
X
=
1
{\displaystyle X=1}
일 무조건부 확률은 3/6 = 1/2입니다 (왜냐하면 주사위의 여섯 가능한 면이 있고 그 중 세 개는 짝수이기 때문입니다). 반면에 조건부
Y
=
1
{\displaystyle Y=1}
에 대한
X
=
1
{\displaystyle X=1}
일 확률은 1/3입니다 (셋의 가능한 소수 면, 2,3, 및 5가 있고 그 중 하나가 짝수이기 때문입니다).
Conditional continuous distributions
유사하게 연속 확률 변수(continuous random variables) 에 대해, 주어진
X
{\displaystyle X}
의 값
x
{\displaystyle x}
의 발생에 대한
Y
{\displaystyle Y}
의 조건부 확률 밀도 함수(probability density function) 는 다음과 같이 쓸 수 있습니다:[2] : p. 99
f
Y
∣
X
(
y
∣
x
)
=
f
X
,
Y
(
x
,
y
)
f
X
(
x
)
{\displaystyle f_{Y\mid X}(y\mid x)={\frac {f_{X,Y}(x,y)}{f_{X}(x)}}\qquad }
여기서
f
X
,
Y
(
x
,
y
)
{\displaystyle f_{X,Y}(x,y)}
는
X
{\displaystyle X}
와
Y
{\displaystyle Y}
의 결합 밀도(joint density) 이고,
f
X
(
x
)
{\displaystyle f_{X}(x)}
는
X
{\displaystyle X}
에 대해 주변 밀도(marginal density) 를 제공합니다. 역시 이 경우에서,
f
X
(
x
)
>
0
{\displaystyle f_{X}(x)>0}
임을 요구합니다.
주어진
Y
{\displaystyle Y}
에 대한
X
{\displaystyle X}
의 확률 분포와의 관계는 다음에 의해 주어집니다:
f
Y
∣
X
(
y
∣
x
)
f
X
(
x
)
=
f
X
,
Y
(
x
,
y
)
=
f
X
|
Y
(
x
∣
y
)
f
Y
(
y
)
.
{\displaystyle f_{Y\mid X}(y\mid x)f_{X}(x)=f_{X,Y}(x,y)=f_{X|Y}(x\mid y)f_{Y}(y).}
연속 확률 변수의 조건부 분포의 개념은 보이는 것처럼 직관적이지 않습니다: 보렐의 역설(Borel's paradox) 은 조건부 확률 밀도 함수가 좌표 변환 아래에서 불변일 필요가 없다는 것을 보여줍니다.
Example
Bivariate normal joint density
그래프는 확률 변수
X
{\displaystyle X}
와
Y
{\displaystyle Y}
에 대해 이변수 정규 결합 밀도(bivariate normal joint density) 를 보여줍니다. 조건부
X
=
70
{\displaystyle X=70}
에 대한
Y
{\displaystyle Y}
의 분포를 보기 위해, 먼저
X
,
Y
{\displaystyle X,Y}
평면에서 직선
X
=
70
{\displaystyle X=70}
을 시각화할 수 있고, 그런-다음 해당 직선을 포함하고
X
,
Y
{\displaystyle X,Y}
평면에 수직인 평면을 시각화합니다. 해당 평면과 결합 정규 밀도의 교차점은, 교차점 아래에 단위 넓이를 제공하도록 크기가 조정되면,
Y
{\displaystyle Y}
의 관련된 조건부 밀도입니다.
Y
∣
X
=
70
∼
N
(
μ
1
+
σ
1
σ
2
ρ
(
70
−
μ
2
)
,
(
1
−
ρ
2
)
σ
1
2
)
.
{\displaystyle Y\mid X=70\ \sim \ {\mathcal {N}}\left(\mu _{1}+{\frac {\sigma _{1}}{\sigma _{2}}}\rho (70-\mu _{2}),\,(1-\rho ^{2})\sigma _{1}^{2}\right).}
Relation to independence
확률 변수
X
{\displaystyle X}
,
Y
{\displaystyle Y}
가 독립(independent) 인 것과 주어진
X
{\displaystyle X}
에 대한
Y
{\displaystyle Y}
의 조건부 분포가,
X
{\displaystyle X}
의 모든 가능한 실현에 대해,
Y
{\displaystyle Y}
의 무조건부 분포와 같은 것은 필요충분 조건입니다. 이산 확률 변수에 대해, 이것은 모든 가능한
y
{\displaystyle y}
와
P
(
X
=
x
)
>
0
{\displaystyle P(X=x)>0}
를 갖는
x
{\displaystyle x}
에 대해
P
(
Y
=
y
|
X
=
x
)
=
P
(
Y
=
y
)
{\displaystyle P(Y=y|X=x)=P(Y=y)}
임을 의미합니다. 결합 밀도 함수(joint density function) 를 가지는, 연속 확률 변수
X
{\displaystyle X}
와
Y
{\displaystyle Y}
에 대해, 그것은 모든 가능한
y
{\displaystyle y}
와
f
X
(
x
)
>
0
{\displaystyle f_{X}(x)>0}
을 갖는
x
{\displaystyle x}
에 대해
f
Y
(
y
|
X
=
x
)
=
f
Y
(
y
)
{\displaystyle f_{Y}(y|X=x)=f_{Y}(y)}
임을 의미합니다.
Properties
주어진
x
{\displaystyle x}
에 대해
y
{\displaystyle y}
의 함수로 볼 때,
P
(
Y
=
y
|
X
=
x
)
{\displaystyle P(Y=y|X=x)}
는 확률 밀도 함수이고 따라서 모든
y
{\displaystyle y}
에 걸쳐 그 합 (또는 그것이 연속 확률 밀도이면 적분)은 1입니다. 주어진
y
{\displaystyle y}
에 대해
x
{\displaystyle x}
의 함수로 볼 때, 그것은 모든
x
{\displaystyle x}
에 걸쳐 그 합이 1일 필요가 없도록 가능도 함수(likelihood function) 입니다.
추가적으로, 결합 분포의 주변은 해당 조건부 분포의 기댓값으로 표현될 수 있습니다. 예를 들어,
p
X
(
x
)
=
E
Y
[
p
X
|
Y
(
X
|
Y
)
]
{\displaystyle p_{X}(x)=E_{Y}[p_{X|Y}(X\ |\ Y)]}
.
Measure-theoretic formulation
(
Ω
,
F
,
P
)
{\displaystyle (\Omega ,{\mathcal {F}},P)}
를 확률 공간,
G
⊆
F
{\displaystyle {\mathcal {G}}\subseteq {\mathcal {F}}}
를
F
{\displaystyle {\mathcal {F}}}
에서
σ
{\displaystyle \sigma }
-필드로 놓습니다.
A
∈
F
{\displaystyle A\in {\mathcal {F}}}
가 주어지면, 라돈–니코딤 정리(Radon-Nikodym theorem) 는 모든 각
G
∈
G
{\displaystyle G\in {\mathcal {G}}}
에 대해 다음을 만족하는 조건부 확률 이라고 불리는
G
{\displaystyle {\mathcal {G}}}
-측정가능 확률 변수
P
(
A
∣
G
)
:
Ω
→
R
{\displaystyle P(A\mid {\mathcal {G}}):\Omega \to \mathbb {R} }
가 있음을 의미합니다:[3]
∫
G
P
(
A
∣
G
)
(
ω
)
d
P
(
ω
)
=
P
(
A
∩
G
)
{\displaystyle \int _{G}P(A\mid {\mathcal {G}})(\omega )dP(\omega )=P(A\cap G)}
그리고 그러한 확률 변수는 확률 영의 집합까지 고유하게 정의됩니다. 조건부 확률은
P
(
⋅
∣
B
)
(
ω
)
{\displaystyle \operatorname {P} (\cdot \mid {\mathcal {B}})(\omega )}
가 모든
ω
∈
Ω
{\displaystyle \omega \in \Omega }
에 대해
(
Ω
,
F
)
{\displaystyle (\Omega ,{\mathcal {F}})}
위의 확률 측정(probability measure) 이면 정규 (regular ) 라고 불립니다.
특별한 경우:
자명한 시그마 대수
G
=
{
∅
,
Ω
}
{\displaystyle {\mathcal {G}}=\{\emptyset ,\Omega \}}
에 대해, 조건부 확률은 상수 함수
P
(
A
∣
{
∅
,
Ω
}
)
=
P
(
A
)
{\displaystyle \operatorname {P} \!\left(A\mid \{\emptyset ,\Omega \}\right)=\operatorname {P} (A)}
입니다.
만약
A
∈
G
{\displaystyle A\in {\mathcal {G}}}
이면,
P
(
A
∣
G
)
=
1
A
{\displaystyle \operatorname {P} (A\mid {\mathcal {G}})=1_{A}}
, 지시 함수입니다 (아래에 정의됩니다).
X
:
Ω
→
E
{\displaystyle X:\Omega \to E}
를
(
E
,
E
)
{\displaystyle (E,{\mathcal {E}})}
-값 확률 변수라고 놓습니다. 각
B
∈
E
{\displaystyle B\in {\mathcal {E}}}
에 대해, 다음을 정의합니다:
μ
X
|
G
(
B
|
G
)
=
P
(
X
−
1
(
B
)
|
G
)
.
{\displaystyle \mu _{X\,|\,{\mathcal {G}}}(B\,|\,{\mathcal {G}})=\mathrm {P} (X^{-1}(B)\,|\,{\mathcal {G}}).}
임의의
ω
∈
Ω
{\displaystyle \omega \in \Omega }
에 대해, 함수
μ
X
|
G
(
⋅
|
G
)
(
ω
)
:
E
→
R
{\displaystyle \mu _{X\,|{\mathcal {G}}}(\cdot \,|{\mathcal {G}})(\omega ):{\mathcal {E}}\to \mathbb {R} }
는 주어진
G
{\displaystyle {\mathcal {G}}}
에 대한
X
{\displaystyle X}
의 조건부 확률 (conditional probability ) 분포 라고 불립니다. 만약 그것이
(
E
,
E
)
{\displaystyle (E,{\mathcal {E}})}
위에 확률 측정이면, 그것은 정규 (regular ) 라고 불립니다.
(
R
{\displaystyle \mathbb {R} }
위에 보렐
σ
{\displaystyle \sigma }
-필드
R
1
{\displaystyle {\mathcal {R}}^{1}}
에 관해) 실수-값 확률 변수에 대해, 모든 각 조건부 확률 분포는 정규입니다.[4] 이 경우에서, 거의 확실하게
E
[
X
∣
G
]
=
∫
−
∞
∞
x
μ
(
d
x
,
⋅
)
{\displaystyle E[X\mid {\mathcal {G}}]=\int _{-\infty }^{\infty }x\,\mu (dx,\cdot )}
입니다.
Relation to conditional expectation
임의의 사건
A
∈
F
{\displaystyle A\in {\mathcal {F}}}
에 대해, 지시 함수(indicator function) 를 정의합니다:
1
A
(
ω
)
=
{
1
if
ω
∈
A
,
0
if
ω
∉
A
,
{\displaystyle \mathbf {1} _{A}(\omega )={\begin{cases}1\;&{\text{if }}\omega \in A,\\0\;&{\text{if }}\omega \notin A,\end{cases}}}
이것은 확률 변수입니다. 이 확률 변수의 기댓값은
A
{\displaystyle A}
자체의 확률과 같음에 주목하십시오:
E
(
1
A
)
=
P
(
A
)
.
{\displaystyle \operatorname {E} (\mathbf {1} _{A})=\operatorname {P} (A).\;}
σ
{\displaystyle \sigma }
-필드
G
⊆
F
{\displaystyle {\mathcal {G}}\subseteq {\mathcal {F}}}
가 주어지면, 조건부 확률
P
(
A
∣
G
)
{\displaystyle \operatorname {P} (A\mid {\mathcal {G}})}
은
A
{\displaystyle A}
에 대해 지시 함수의 조건부 기댓값(conditional expectation) 의 버전입니다:
P
(
A
∣
B
)
=
E
(
1
A
∣
B
)
{\displaystyle \operatorname {P} (A\mid {\mathcal {B}})=\operatorname {E} (\mathbf {1} _{A}\mid {\mathcal {B}})\;}
정규 조건부 확률에 관한 확률 변수의 기댓값은 그것의 조건부 기댓값과 같습니다.
See also
References
Citations
Sources