Conditional probability distribution

확률 이론(probability theory)과 통계학(statistics)에서, 두 개의 결합적으로 분포된 확률 변수(random variable) $X$ 와 $Y$ 가 주어지면, 주어진 $X$ 에 대한 $Y$ 의 조건부 확률 분포(conditional probability distribution)는 $X$ 가 특정 값으로 알려졌을 때 $Y$ 의 확률 분포(probability distribution)입니다; 일부 경우에서, 조건부 확률은 매개 변수로 $X$ 의 미지정 값 $x$ 를 포함하는 함수로 표현될 수 있습니다. $X$ 와 $Y$ 둘 다가 카테고리형 변수(categoryical variables)일 때, 조건부 확률 테이블(conditional probability table)이 전형적으로 조건부 확률을 나타내기 위해 사용됩니다. 조건부 분포는 확률 변수의 주변 분포(marginal distribution)와 대조되며, 이는 나머지 다른 변수의 값에 대한 참조없이 그것의 분포입니다.

만약 주어진 $X$ 에 대한 $Y$ 의 조건부 분포가 연속 분포(continuous distribution)이면, 그것의 확률 밀도 함수(probability density function)는 조건부 밀도 함수(conditional density function)로 알려져 있습니다.^[1] 모멘트(moments)와 같은 조건부 분포의 속성은 종종 조건부 평균(conditional mean)과 조건부 분산(conditional variance)과 같은 해당 이름에 의해 참조됩니다.

보다 일반적으로, 세 개 이상의 변수 집합의 부분집합의 조건부 분포를 참조할 수 있습니다; 이 조건부 분포는 모든 남아있는 변수의 값을 의존하고, 만약 둘 이상의 변수가 부분집합에 포함되면 이 조건부 분포는 포함된 변수의 조건부 결합 분포(joint distribution)입니다.

Conditional discrete distributions

이산 확률 변수(discrete random variables)에 대해, 주어진 $X=x$ 에 대한 $Y$ 의 조건부 확률 질량 함수는 그것의 정의에 따라 다음과 같이 작성될 수 있습니다:

p_{Y|X}(y\mid x)\triangleq P(Y=y\mid X=x)={\frac {P(\{X=x\}\cap \{Y=y\})}{P(X=x)}}\qquad

분모에서 $P(X=x)$ 의 발생으로 인해, 이것은 비-영 (따라서 엄격하게 양수) $P(X=x)$ 에 대해서만 정의됩니다.

주어진 $Y$ 에 대한 $X$ 의 확률 분포와의 관계는 다음과 같습니다:

P(Y=y\mid X=x)P(X=x)=P(\{X=x\}\cap \{Y=y\})=P(X=x\mid Y=y)P(Y=y).

Example

공정한 주사위의 굴려서 숫자가 짝수 (즉, 2, 4, 또는 6)이면 $X=1$ 을 놓고 그렇지 않으면 $X=0$ 를 놓는 것을 생각해 보십시오. 게다가, 숫자가 소수 (즉, 2, 3, 또는 5)이면 $Y=1$ 을 놓고 그렇지 않으면 $Y=0$ 을 놓습니다.

D	1	2	3	4	5	6
X	0	1	0	1	0	1
Y	0	1	1	0	1	0

그런-다음 $X=1$ 일 무조건부 확률은 3/6 = 1/2입니다 (왜냐하면 주사위의 여섯 가능한 면이 있고 그 중 세 개는 짝수이기 때문입니다). 반면에 조건부 $Y=1$ 에 대한 $X=1$ 일 확률은 1/3입니다 (셋의 가능한 소수 면, 2,3, 및 5가 있고 그 중 하나가 짝수이기 때문입니다).

Conditional continuous distributions

유사하게 연속 확률 변수(continuous random variables)에 대해, 주어진 $X$ 의 값 $x$ 의 발생에 대한 $Y$ 의 조건부 확률 밀도 함수(probability density function)는 다음과 같이 쓸 수 있습니다:^[2]^{: p. 99}

f_{Y\mid X}(y\mid x)={\frac {f_{X,Y}(x,y)}{f_{X}(x)}}\qquad

여기서 $f_{X,Y}(x,y)$ 는 $X$ 와 $Y$ 의 결합 밀도(joint density)이고, $f_{X}(x)$ 는 $X$ 에 대해 주변 밀도(marginal density)를 제공합니다. 역시 이 경우에서, $f_{X}(x)>0$ 임을 요구합니다.

주어진 $Y$ 에 대한 $X$ 의 확률 분포와의 관계는 다음에 의해 주어집니다:

f_{Y\mid X}(y\mid x)f_{X}(x)=f_{X,Y}(x,y)=f_{X|Y}(x\mid y)f_{Y}(y).

연속 확률 변수의 조건부 분포의 개념은 보이는 것처럼 직관적이지 않습니다: 보렐의 역설(Borel's paradox)은 조건부 확률 밀도 함수가 좌표 변환 아래에서 불변일 필요가 없다는 것을 보여줍니다.

Example

그래프는 확률 변수 $X$ 와 $Y$ 에 대해 이변수 정규 결합 밀도(bivariate normal joint density)를 보여줍니다. 조건부 $X=70$ 에 대한 $Y$ 의 분포를 보기 위해, 먼저 $X,Y$ 평면에서 직선 $X=70$ 을 시각화할 수 있고, 그런-다음 해당 직선을 포함하고 $X,Y$ 평면에 수직인 평면을 시각화합니다. 해당 평면과 결합 정규 밀도의 교차점은, 교차점 아래에 단위 넓이를 제공하도록 크기가 조정되면, $Y$ 의 관련된 조건부 밀도입니다. $Y\mid X=70\ \sim \ {\mathcal {N}}\left(\mu _{1}+{\frac {\sigma _{1}}{\sigma _{2}}}\rho (70-\mu _{2}),\,(1-\rho ^{2})\sigma _{1}^{2}\right).$

Relation to independence

확률 변수 $X$ , $Y$ 가 독립(independent)인 것과 주어진 $X$ 에 대한 $Y$ 의 조건부 분포가, $X$ 의 모든 가능한 실현에 대해, $Y$ 의 무조건부 분포와 같은 것은 필요충분 조건입니다. 이산 확률 변수에 대해, 이것은 모든 가능한 $y$ 와 $P(X=x)>0$ 를 갖는 $x$ 에 대해 $P(Y=y|X=x)=P(Y=y)$ 임을 의미합니다. 결합 밀도 함수(joint density function)를 가지는, 연속 확률 변수 $X$ 와 $Y$ 에 대해, 그것은 모든 가능한 $y$ 와 $f_{X}(x)>0$ 을 갖는 $x$ 에 대해 $f_{Y}(y|X=x)=f_{Y}(y)$ 임을 의미합니다.

Properties

주어진 $x$ 에 대해 $y$ 의 함수로 볼 때, $P(Y=y|X=x)$ 는 확률 밀도 함수이고 따라서 모든 $y$ 에 걸쳐 그 합 (또는 그것이 연속 확률 밀도이면 적분)은 1입니다. 주어진 $y$ 에 대해 $x$ 의 함수로 볼 때, 그것은 모든 $x$ 에 걸쳐 그 합이 1일 필요가 없도록 가능도 함수(likelihood function)입니다.

추가적으로, 결합 분포의 주변은 해당 조건부 분포의 기댓값으로 표현될 수 있습니다. 예를 들어, $p_{X}(x)=E_{Y}[p_{X|Y}(X\ |\ Y)]$ .

Measure-theoretic formulation

$(\Omega ,{\mathcal {F}},P)$ 를 확률 공간, ${\mathcal {G}}\subseteq {\mathcal {F}}$ 를 ${\mathcal {F}}$ 에서 $\sigma$ -필드로 놓습니다. $A\in {\mathcal {F}}$ 가 주어지면, 라돈–니코딤 정리(Radon-Nikodym theorem)는 모든 각 $G\in {\mathcal {G}}$ 에 대해 다음을 만족하는 조건부 확률이라고 불리는 ${\mathcal {G}}$ -측정가능 확률 변수 $P(A\mid {\mathcal {G}}):\Omega \to \mathbb {R}$ 가 있음을 의미합니다:^[3] $\int _{G}P(A\mid {\mathcal {G}})(\omega )dP(\omega )=P(A\cap G)$ 그리고 그러한 확률 변수는 확률 영의 집합까지 고유하게 정의됩니다. 조건부 확률은 $\operatorname {P} (\cdot \mid {\mathcal {B}})(\omega )$ 가 모든 $\omega \in \Omega$ 에 대해 $(\Omega ,{\mathcal {F}})$ 위의 확률 측정(probability measure)이면 정규(regular)라고 불립니다.

특별한 경우:

자명한 시그마 대수 ${\mathcal {G}}=\{\emptyset ,\Omega \}$ 에 대해, 조건부 확률은 상수 함수 $\operatorname {P} \!\left(A\mid \{\emptyset ,\Omega \}\right)=\operatorname {P} (A)$ 입니다.
만약 $A\in {\mathcal {G}}$ 이면, $\operatorname {P} (A\mid {\mathcal {G}})=1_{A}$ , 지시 함수입니다 (아래에 정의됩니다).

$X:\Omega \to E$ 를 $(E,{\mathcal {E}})$ -값 확률 변수라고 놓습니다. 각 $B\in {\mathcal {E}}$ 에 대해, 다음을 정의합니다: $\mu _{X\,|\,{\mathcal {G}}}(B\,|\,{\mathcal {G}})=\mathrm {P} (X^{-1}(B)\,|\,{\mathcal {G}}).$ 임의의 $\omega \in \Omega$ 에 대해, 함수 $\mu _{X\,|{\mathcal {G}}}(\cdot \,|{\mathcal {G}})(\omega ):{\mathcal {E}}\to \mathbb {R}$ 는 주어진 ${\mathcal {G}}$ 에 대한 $X$ 의 조건부 확률(conditional probability) 분포라고 불립니다. 만약 그것이 $(E,{\mathcal {E}})$ 위에 확률 측정이면, 그것은 정규(regular)라고 불립니다.

( $\mathbb {R}$ 위에 보렐 $\sigma$ -필드 ${\mathcal {R}}^{1}$ 에 관해) 실수-값 확률 변수에 대해, 모든 각 조건부 확률 분포는 정규입니다.^[4] 이 경우에서, 거의 확실하게 $E[X\mid {\mathcal {G}}]=\int _{-\infty }^{\infty }x\,\mu (dx,\cdot )$ 입니다.

Relation to conditional expectation

임의의 사건 $A\in {\mathcal {F}}$ 에 대해, 지시 함수(indicator function)를 정의합니다:

\mathbf {1} _{A}(\omega )={\begin{cases}1\;&{\text{if }}\omega \in A,\\0\;&{\text{if }}\omega \notin A,\end{cases}}

이것은 확률 변수입니다. 이 확률 변수의 기댓값은 $A$ 자체의 확률과 같음에 주목하십시오:

\operatorname {E} (\mathbf {1} _{A})=\operatorname {P} (A).\;

$\sigma$ -필드 ${\mathcal {G}}\subseteq {\mathcal {F}}$ 가 주어지면, 조건부 확률 $\operatorname {P} (A\mid {\mathcal {G}})$ 은 $A$ 에 대해 지시 함수의 조건부 기댓값(conditional expectation)의 버전입니다:

\operatorname {P} (A\mid {\mathcal {B}})=\operatorname {E} (\mathbf {1} _{A}\mid {\mathcal {B}})\;

정규 조건부 확률에 관한 확률 변수의 기댓값은 그것의 조건부 기댓값과 같습니다.

References

Citations

^ Ross, Sheldon M. (1993). Introduction to Probability Models (Fifth ed.). San Diego: Academic Press. pp. 88–91. ISBN 0-12-598455-3.
^ Park,Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3.
^ Billingsley (1995), p. 430
^ Billingsley (1995), p. 439

Sources

Billingsley, Patrick (1995). Probability and Measure (3rd ed.). New York, NY: John Wiley and Sons.

[1] Ross, Sheldon M. (1993). Introduction to Probability Models (Fifth ed.). San Diego: Academic Press. pp. 88–91. ISBN 0-12-598455-3.

[KunIlPark-2] Park,Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3.

[3] Billingsley (1995), p. 430

[4] Billingsley (1995), p. 439

[1]

[2]

[3]

[4]

Conditional discrete distributions

Example

Conditional continuous distributions

Example

Relation to independence

Properties

Measure-theoretic formulation

Relation to conditional expectation

See also

References

Citations

Sources