Jump to content

Random variable

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

확률 및 통계에서, 확률 변수(random variable), 확률 양(random quantity), 우연 변수(aleatory variable) 또는 통계 변수(stochastic variable)는 그의 값이 확률(random) 현상의 결과(outcomes)의존하는(depend) 변수로 비공식적으로 묘사합니다.[1] 확률 변수의 공식적인 수학적 처리는 확률 이론(probability theory)에서 주제입니다. 해당 맥락에서, 확률 변수는 표본 공간(sample space)에서 실수로 매핑하는 확률 공간(probability space) 위에 정의된 측정-가능 함수(measurable function)로 이해됩니다.[2]

This graph shows how random variable is a function from all possible outcomes to real values. It also shows how random variable is used for defining probability mass functions.

확률 변수의 가능한 값은 아직-수행되지-않은 실험의 가능한 결과 또는 이미-존재하는-값이 (예를 들어, 부정확한 측정 또는 양자 불확실성(quantum uncertainty)으로 인해) 불확실한, 과거 실험의 가능한 결과를 나타낼 수 있습니다. 그들은, (주사위를 굴리는 것과 같은) "객관적으로" 무작위 과정의 결과 또는 양의 불완전한 지식으로 인한 "주관적인" 무작위성을 역시 개념적으로 나타낼 수 있습니다. 확률 변수의 잠재적 값에 할당된 확률의 의미는 확률 이론(probability theory) 자체의 일부는 아니지만 대신에 확률의 해석(interpretation of probability)에 걸쳐 철학적 논증과 관련됩니다. 수학은 사용에서 특정 해석과 상관없이 같게 작동합니다.

함수로서, 확률 변수가 측정-가능(measurable)인 것이 요구되며, 이것은 확률에 대해 그의 잠재적 값의 집합에 할당되는 것을 허용합니다. 결과는 예측할 수 없는 일부 물리적 변수에 의존하는 것이 공통적입니다. 예를 들어, 공정한 동전을 던질 때, 앞면 또는 뒷면의 마지막 결과는 불확실한 물리적 조건에 달려 있습니다. 어떤 결과가 관찰될지는 확실하지 않습니다. 동전은 바닥에 틈에 들어갈 수 있지만 그러한 가능성은 고려 대상에서 제외됩니다.

확률 변수의 도메인(domain)은 표본 공간이며, 이것은 확률 현상의 가능한 결과의 집합으로 해석됩니다. 예를 들어, 동전 던지기의 경우에서, 오직 두 가능한 결과, 즉 앞면 또는 뒷면이 고려됩니다.

확률 변수는 확률 분포(probability distribution)를 가지며, 이것은 그의 범위의 보렐 부분-집합의 확률을 지정합니다. 확률 변수는 이산(discrete), 즉, 확률 변수의 확률 분포의 확률 질량 함수(probability mass function) 특성이 부여된, (셀-수-있는 범위를 가지는) 지정된 유한 또는 값의 셀-수-있는 목록(countable list) 중 하나를 취하는 것; 또는 연속(continuous), 확률 변수의 확률 분포의 특징인 확률 밀도 함수(probability density function)를 통해, (셀-수-없는 범위를 가지는) 구간 또는 구간의 모음에서 임의의 수치를 취하는 것; 또는 두 유형의 혼합일 수 있습니다.

같은 확률 분포를 갖는 두 확률 변수는 다른 확률 변수와 결합 또는 독립(independence)의 관점에서 여전히 다를 수 있습니다. 확률 변수의 실현, 즉, 변수의 확률 분포 함수에 따라 값을 무작위로 선택한 결과는 확률 변이(random variate)로 불립니다.

Definition

확률 변수는 가능한 결과(outcome)의 집합 에서 측정-가능 공간(measurable space) 로의 측정-가능 함수(measurable function) 입니다. 기술적인 공리적 정의는 확률 세-쌍(probability triple) 의 표본 공간인 것을 요구합니다 (측정-이론적 정의(measure-theoretic definition)를 참조하십시오).

측정-가능 집합 에서 값을 취하는 확률은 다음으로 쓰입니다:

Standard case

많은 경우에서, 실수-값(real-valued), 즉, 입니다. 일부 문맥에서, 용어 확률 원소(random element) (확장(extensions)을 참조하십시오)는 이 형식이 아닌 확률 변수를 나타내기 위해 사용됩니다.

이미지(image) (또는 치역)가 셀-수-있을(countable) 때, 확률 변수가 이산 확률 변수라고 불리고,[3]: 399  그의 분포는 이산 확률 분포(discrete probability distribution), 즉, 의 이미지에서 각 값에 확률을 할당하는 확률 질량 함수(probability mass function)에 의해 설명될 수 있습니다. 만약 이미지가 셀-수-없이 무한이면, 연속 확률 변수로 불립니다. 절대적으로 연속(absolutely continuous)인 특수한 경우에서, 그의 분포는 확률 밀도 함수(probability density function)에 의해 설명될 수 있으며, 이것은 확률을 구간에 할당합니다; 특히, 각 개별적인 점은 절대적으로 연속 확률 변수에 대해 확률 영을 반드시 필연적으로 가집니다. 모든 연속 확률 변수가 절대적으로 연속적인 것은 아닌데,[4] 예를 들어 혼합 분포(mixture distribution)가 있습니다. 그러한 확률 변수는 확률 밀도 또는 확률 질량 함수에 의해 절대 설명될 수 없습니다.

임의의 확률 변수는 그의 누적 분포 함수(cumulative distribution function)에 의해 설명될 수 있으며, 이것은 확률 변수가 특정 값보다 작거나 같을 확률을 설명합니다.

Extensions

통계학에서 용어 "확률 변수"는 전통적으로 실수-값(real-valued) 경우 ()로 제한됩니다. 이 경우에서, 실수의 구조는 확률 변수의 기댓값(expected value)분산(variance), 그의 누적 분포 함수(cumulative distribution function), 및 그의 분포의 모멘트(moment)와 같은 양을 정의하기 위한 가능성을 만듭니다.

어쨌든, 위의 정의는 값의 임의의 측정-가능 공간(measurable space) 에 대해 유효합니다. 따라서 우리는 확률 부울 값(boolean value), 카테고리 값(categorical value), 복소수(complex numbers), 벡터(vector), 행렬(matrices), 수열(sequence), 트리(tree), 집합(set), 모양(shape), 매니폴드(manifold), 및 함수(function)와 같은, 다른 집합 의 확률 원소를 고려할 수 있습니다. 우리는 그런-다음 유형(type) 의 확률 변수, 또는 -값 확률 변수를 구체적으로 참조할 것입니다.

확률 원소(random element)의 이 보다 일반적인 개념은 그래프 이론(graph theory), 기계 학습(machine learning), 자연 언어 처리(natural language processing), 및 이산 수학(discrete mathematics)컴퓨터 과학(computer science)의 다른 분야와 같은 분야에서 특히 유용하며, 여기서 우리는 비-수치적 데이터 구조(data structure)의 확률 변형을 모델링하는 것에 종종 관심이 있습니다. 일부 경우에서, 그럼에도 불구하고 하나 이상의 실수를 사용하여 의 각 원소를 나타내는 것이 편리합니다. 이 경우에서, 확률 원소는 실수-값 확률 변수의 벡터로 선택적으로 표시될 수 있습니다 (같은 놓여있는 확률 공간 위에 정의된 모두, 이것은 다른 확률 변수를 함께 변하는(covary) 것을 허용합니다). 예를 들면:

  • 확률 단어는 가능한 단어의 어휘에 대한 인덱스로 역할을 하는 확률 정수로 표현될 수 있습니다. 대안적으로, 그의 길이가 어휘의 크기와 같은 확률 표시기 벡터로 표시될 수 있으며, 여기서 오직 양의 확률 값은 , , 이고 1의 위치는 단어를 나타냅니다.
  • 주어진 길이 의 확률 문장은 확률 단어의 벡터로 표현될 수 있습니다.
  • 주어진 꼭짓점 확률 그래프(random graph)는 확률 변수의 행렬로 표현될 수 있으며, 그의 값은 확률 그래프의 인접 행렬(adjacency matrix)을 지정합니다.
  • 확률 함수(random function) 는 확률 변수 의 모음으로 표현될 수 있으며, 함수 도메인에서 다양한 점 에서 함수의 값을 제공합니다. 는 함수가 실수-값인 것을 제공하는 보통의 실수-값 확률 변수입니다. 예를 들어, 확률 과정(stochastic process)은 시간의 확률 함수이며, 확률 벡터(random vector)와 같은 일부 인덱스 집합의 확률 함수이고, 확률 필드(random field)는 임의의 집합 (전형적으로 시간, 공간, 또는 이산 집합) 위에 확률 함수입니다.

Distribution functions

만약 확률 공간 위에 정의된 확률 변수 가 주어지면, 우리는 "의 값이 2일 가능성은 얼마나 됩니까?"와 같은 질문을 할 수 있습니다. 이것은 사건 의 확률과 같으며 종종 짧게 or 으로 쓸 수 있습니다.

실수-값 확률 변수 의 출력 범위의 모든 이들 확률을 기록하면 확률 분포(probability distribution)가 산출됩니다. 확률 분포는 를 정의하기 위해 사용된 특정 확률 공간에 대해 "잊어버리고" 단지 의 여러 값의 확률을 기록합니다. 그러한 확률 분포는 그의 누적 확률 함수(cumulative distribution function)에 의해 획득됩니다:

그리고 때때로 역시 확률 밀도 함수(probability density function), 를 사용하여 획득됩니다. 측정-이론적 관점에서, 우리는 확률 변수 위의 측정을 위의 측정 로 "밀어 넣기" 위해 사용합니다. 놓여-있는 확률 공간 는 확률 변수의 존재를 보장하기 위해, 때때로, 그것들을 구성하기 위해, 및 같은 확률 공간 위에 둘 이상의 확률 변수의 결합 분포(joint distribution)에 기초하여 상관과 종속(correlation and dependence) 또는 독립(independence)과 같은 개념을 정의하기 위해 사용합니다. 실제에서, 우리는 공간 전부를 종종 버리고 단지 측정 1을 전체 실수 직선에 할당하는 위에 측정을 지정합니다. 즉, 우리는 확률 변수 대신에 확률 분포를 사용합니다. 완전한 개발에 대해 분위-숫자 함수(quantile function)에 관한 기사를 참조하십시오.

Examples

Discrete random variable

실험에서, 사람은 무작위로 선택될 수 있고, 하나의 확률 변수는 사람의 키일 수 있습니다. 수학적으로, 확률 변수는 사람을 사람의 키로의 매핑하는 함수로 해석됩니다. 확률 변수와 결합된 확률 분포는 키가 180에서 190cm 사이의 확률, 또는 키가 150미만 또는 200cm 보다 큰 확률과 같은, 키가 가능한 값의 임의의 부분-집합에 있는 확률의 계산을 허용합니다.

또-다른 확률 변수는 사람의 자녀의 숫자일 수 있습니다; 이것은 비-음의 정수 값을 가진 이산 확률 변수입니다. 그것은 개별적인 정수 값 – 확률 질량 함수 (PMF) – 또는 무한 집합를 포함한 값의 집합에 대해 확률의 계산을 허용합니다. 예를 들어, 관심 있는 사건은 "자녀의 짝수"일 수 있습니다. 유한 및 무한 사건의 집합 둘 다에 대해, 그들의 확률은 원소의 PMF를 더함으로써 구할 수 있습니다; 즉, 자녀의 짝수의 확률은 무한 합 입니다.

이들과 같은 예제에서, 표본 공간(sample space)은 종종 억제되는데, 왜냐하면 그것이 수학적으로 설명하기 어렵기 때문이고, 확률 변수의 가능한 값은 그런-다음 표본 공간으로 취급됩니다. 그러나 두 확률 변수가, 키와 자녀의 숫자가 같은 무작위 사람에 대해 계산되는 것과 같은, 결과의 같은 표본 공간 위에 측정될 때, 만약 키와 자녀의 숫자 둘 다가, 예를 들어 그러한 확률 변수가 상관되었는지 여부의 질문이 제기될 수 있도록, 같은 무자위 사람으로부터 온 것으로 인정되면, 관계를 추적하는 것이 더 쉽습니다.

만약 가 실수의 셀-수-있는 집합이고,이면, 는 이산 분포 함수입니다. 여기서 에 대해 , 에 대해 입니다. 예를 들어 모든 유리수를 로 열거하면, 우리는 계단 함수 또는 조각별 상수가 아닌 이산 분포 함수를 얻습니다.[3]

Coin toss

하나의 동전 던짐에 대해 가능한 결과는 표본 공간 에 의해 묘사될 수 있습니다. 우리는 다음으로 앞면에 성공한 베팅에 대해 $1 수익을 모델링하는 실수-값 확률 변수 를 도입할 수 있습니다:

만약 동전이 공정한 동전(fair coin)이면, Y는 다음에 의해 제공되는 확률 질량 함수(probability mass function) 를 가집니다:

Dice roll

If the sample space is the set of possible numbers rolled on two dice, and the random variable of interest is the sum S of the numbers on the two dice, then S is a discrete random variable whose distribution is described by the probability mass function plotted as the height of picture columns here.

확률 변수는 주사위를 굴리는 과정과 가능한 결과를 묘사하기 위해 역시 사용될 수 있습니다. 두-주사위 경우에 대해 가장 명백한 표현은 표본 공간으로 (두 주사위 위의 숫자를 나타내는) {1, 2, 3, 4, 5, 6}로부터 숫자 n1n2의 쌍의 집합을 취하는 것입니다. 굴려진 총 숫자 (각 쌍에서 숫자의 합)은 그런-다음 그 쌍을 합에 매핑하는 함수에 의해 제공되는 확률 변수 X입니다:

그리고 (만약 주사위가 공정하면) 다음에 의해 제공되는 확률 질량 함수 ƒX를 가집니다:

Continuous random variable

공식적으로, 연속 확률 변수는 그의 누적 분포 함수(cumulative distribution function)가 어디에서나 연속(continuous)인 확률 변수입니다.[5] "틈(gaps)"은 없으며, 이것은 발생하는(occurring) 것의 유한 확률을 가지는 숫자에 해당합니다. 대신에, 연속 확률 변수는 정확히 규정된 값 c거의 취하지 않지만 (공식적으로, ) 그 값이 임의적으로 작을(arbitrarily small) 수 있는 특정 구간(intervals)에 있을 양의 가능성이 있습니다. 연속 확률 변수는 보통 확률 밀도 함수(probability density function) (PDF)를 인정하며, 이것은 그들의 CDF 및 확률 측정(probability measure)을 특징짓습니다; 그러한 분포는 절대적으로 연속(absolutely continuous)으로 역시 불립니다; 그러나 일부 연속 분포는 특이(singular), 또는 절대적으로 연속 부분과 특이 부분의 혼합입니다.

연속 확률 변수의 예제는 수평 방향을 선택할 수 있는 스피너를 기반으로 하는 하나일 것입니다. 그런-다음 확률 변수에 의해 취해진 값은 방향입니다. 우리는 이들 방향을 북쪽, 서쪽, 동쪽, 남쪽, 남동쪽 등으로 나타낼 수 있습니다. 어쨌든, 표본 공간을 실수인 값을 취하는 확률 변수에 매핑하는 것이 공통적으로 보다 편리합니다. 이것은, 예를 들어, 방향을 북쪽으로부터 시계-방향 각도에서 가지는 것으로 매핑하여 행해질 수 있습니다. 확률 변수는 그런-다음 구간 [0, 360)으로부터 실수인 값을 취하며, 범위의 모든 부분이 "같은 가능성"이 있습니다. 이 경우에서, X = 회전된 각도입니다. 임의의 실수는 선택될 확률이 영이지만, 양의 확률은 값의 임의의 범위에 할당될 수 있습니다. 예를 들어, [0, 180]에서 숫자를 선택할 확률은 12입니다. 확률 질량 함수를 말하는 대신에, 우리는 X의 확률 밀도는 1/360이라고 말합니다. [0, 360)의 부분-집합의 확률은 집합의 측정 값에 1/360을 곱함으로써 계산될 수 있습니다. 일반적으로, 주어진 연속 확률 변수에 대해 집합의 확률은 주어진 집합에 걸쳐 밀도를 적분함으로써 계산될 수 있습니다.

임의의 구간(interval) 이 주어지면,[nb 1] "연속 균등(continuous uniform) 확률 변수" (CURV)로 불리는 확률 변수 는 같은 가능성을 갖는 구간에서 임의의 값을 취하는 것으로 정의됩니다.[nb 2] 임의의 부분-구간 [nb 1]에 떨어지는 의 확률은 부분-구간의 길이(length)비례(proportional)하며, 특히

여기서 분모는 확률의 단위성 공리(unitarity axiom)로부터 옵니다. CURV 확률 밀도 함수(probability density function)는 구간의 길이에 의해 정규화된 지원(support)의 그의 구간의 지사자 함수(indicator function)에 의해 제공됩니다:

특별한 관심은 단위 구간(unit interval) 위에 균등 분포입니다. 임의의 원하는 확률 분포(probability distribution) 의 표본은 단위 구간 위에 균등하게 분포된 무작위로-생성된 숫자(randomly-generated number)에 대한 분위-숫자 함수(quantile function)를 계산함으로써 생성될 수 있습니다. 이것은 누적 분포 함수의 속성(properties of cumulative distribution functions)을 이용하며, 이것은 모든 확률 변수에 대해 통합하는 프레임워크입니다.

Mixed type

혼합된 확률 변수는 그의 누적 분포 함수(cumulative distribution function)조각별-상수(piecewise-constant) (이산 확률 변수)도 아니고 어디에서나-연속(everywhere-continuous)도 아닌 확률 변수입니다.[5] 그것은 이산 확률 변수와 연속 확률 변수의 합으로 구현될 수 있습니다; 이 경우에서 CDF는 성분 변수의 CDF의 가중된 평균이 됩니다.[5]

혼합된 유형의 확률 변수의 예제는 동전이 던져지고 스피너는 오직 만약 동전 던지기의 결과가 앞면이면 회전하는 실험을 기반으로 합니다. 만약 결과가 뒷면이면 X = −1; 그렇지 않으면 이전 예제에서 처럼 X = 스피너의 값입니다. 이 확률 변수는 –1의 값을 가질 것에 대해 12의 확률입니다. 다른 값의 범위는 마지막 예제의 확률의 절반을 가집니다.

가장 일반적으로, 실수 직선 위의 모든 각 확률 분포는 이산 부분, 특이 부분, 및 절대적으로 연속 부분의 혼합입니다; Lebesgue's decomposition theorem § Refinement를 참조하십시오. 이산 부분은 셀-수-있는 집합에 집중되어 있지만, 이 집합은 (모든 유리수의 집합과 같이) 밀도가 높을 수 있습니다.

Measure-theoretic definition

확률 변수의 가장 공식적, 공리적(axiomatic) 정의는 측정 이론(measure theory)을 포함합니다. 연속 확률 변수는 그러한 집합을 확률에 매핑하는 함수와 함께 숫자의 집합(set)의 관점에서 정의됩니다. 만약 그러한 집합이 불충분하게 구속되면 발생하는 다양한 어려움 (예를 들어, 바나흐-타르스키 역설(Banach–Tarski paradox))때문에, 어떤 확률에 걸쳐 정의될 수 있는 가능한 집합을 제한하기 위해 시그마-대수(sigma-algebra)로 이름 지은 것을 도입해야 합니다. 통상적으로, 특정 그러한 시그마-대수가 사용되며, 보렐 σ-대수(Borel σ-algebra), 이것은 숫자의 연속 구간으로부터 직접 또는 그러한 구간의 합집합(union) 및/또는 교집합(intersection)의 유한 또는 셀-수-있는 무한(countably infinite)에서 파생될 수 있는 임의의 집합에 걸쳐 정의되는 확률을 허용합니다.[2]

측정-이론적 정의는 다음과 같습니다.

확률 공간(probability space)으로 놓고 측정-가능 공간(measurable space)으로 놓습니다. 그런-다음 -값 확률 변수는 측정-가능 함수 이며, 이것은 모든 각 부분-집합 에 대해, 그의 이전-이미지(preimage) 임을 의미하며, 여기서 입니다.[6] 이 정의는 그의 이전-이미지를 봄으로써 타킷 공간에서 임의의 부분-집합 을 측정하는 것을 활성화합니다.

보다 직관적인 관점에서, 의 구성원은 가능한 결과이며, 의 구성원은 가능한 결과의 측정-가능 부분-집합이며, 함수 는 각 그러한 측정-가능 부분-집합의 확률을 제공하며, 는 확률 변수가 (실수의 집합과 같은) 취할 수 있는 값의 집합을 나타내고, 의 구성원은 의 "잘-행동하는" (측정-가능) 부분-집합입니다 (그것들에 대해 확률이 결정될 수 있습니다). 확률 변수는 그때에 임의의 결과로부터 양으로의, 확률 변수에 대해 양의 임의의 유용한 부분-집합으로 이어지는 결과가 잘-정의된 확률을 가짐을 만족하는, 함수입니다.

가 토폴로지적 공간일 때, σ-대수(σ-algebra) 에 대해 가장 공통적인 선택은 보렐 σ-대수(Borel σ-algebra) 이며, 이것은 에서 모든 열린 집합의 모음에 의해 생성된 σ-대수입니다. 그러한 경우에서, -값 확률 변수는 -값 확률 변수로 불립니다. 게다가, 공간 가 실수 직선 일 때, 그러한 실수-값 확률 변수는 간단히 확률 변수로 불립니다.

Real-valued random variables

이 경우에서, 관측 공간은 실수의 집합입니다. 상기하십시오, 는 확률 공간입니다. 실수 관측 공간에 대해, 함수 는 만약 다음이면 실수-값 확률 변수입니다:

이 정의는 위의 특별한 경우인데 왜냐하면 집합 은 실수의 집합 위에 보렐 σ-대수를 생성하고, 모든 생성하는 집합에서 측정-가능성을 검사하는 것으로 충분하기 때문입니다. 여기서 우리는 인 사실을 사용함으로써 이 생성하는 집합 위에 측정-가능성을 입증할 수 있습니다.

Moments

확률 변수의 확률 분포는 매개-변수의 작은 숫자에 의해 종종 특징지어지며, 이것은 역시 실제 해석을 가집니다. 예를 들어, 그것은 종종 그의 "평균 값"이 무엇인지 아는 것으로 충분합니다. 이것은 확률 변수의 기댓값(expected value)의 수학적 개념에 의해 포착되며, 로 표시되고, 종종 첫 번째 모멘트(moment)로 역시 불립니다. 일반적으로, 과 같지 않습니다. 한번 "평균 값"이 알려지면, 우리는 그런-다음 확률 변수의 분산(variance)표준 편차(standard deviation)에 의해 대답되는 질문, 의 값이 이 평균값에서 얼마나 멀리 떨어져 있는지 전형적으로 묻습니다. 는 무한 모집단으로부터 얻어진 평균으로 직관적으로 보일 수 있으며, 이것의 구성원은 의 특정 평가입니다.

수학적으로, 이것은 (일반화된) 모멘트의 문제(problem of moments)로 알려져 있습니다: 확률 변수 의 주어진 클래스에 대해, 기댓값 가 확률 변수 분포(distribution)를 완전히 특징짓는 것을 만족하는 함수의 모음 를 찾는 것입니다.

모멘트는 확률 변수의 실수-값 (또는 복소-값 등.) 함수에 대해 오직 정의될 수 있습니다. 만약 확률 변수가 자체로 실수-값이면, 변수 자체의 모멘트는 취할 수 있으며, 이것은 확률 변수의 항등 함수 의 모멘트와 동등합니다. 어쨌든, 심지어 비-실수-값 확률 변수에 대해, 모멘트는 그들의 변수의 실수-값 함수로 취할 수 있습니다. 예를 들어, 이름의(nominal) 값 "red", "blue" 또는 "green"을 취할 수 있는 카테고리적(categorical) 확률 변수 X에 대해, 실수-값 함수 는 구성될 수 있습니다: 이것은 아이버슨 괄호(Iverson bracket)를 사용하고, 만약 가 값 "green"을 가지면 값 1을 가지며, 그렇지 않으면 0입니다. 그런-다음 기댓값(expected value) 및 이 함수의 다른 모멘트는 결정될 수 있습니다.

Functions of random variables

새로운 확률 변수 Y실수-값(real-valued) 확률 변수 의 결과에 실수 보렐 측정-가능 함수(Borel measurable function) 적용함(applying)으로써 정의될 수 있습니다. 즉, 입니다. 누적 분포 함수(cumulative distribution function)는 그런-다음 다음입니다:

만약 역-가능이고 (즉, 가 존재, 여기서 역함수(inverse function)입니다) 증가하는 또는 감소하는(increasing or decreasing) 것이면, 이전 관계는 다음을 획득하기 위해 확장될 수 있습니다:

의 역-가능성의 같은 가설과 함께, 역시 미분-가능성(differentiability)이 가정되면, 확률 밀도 함수(probability density function) 사이의 관계는, 다음을 획득하기 위해, 위의 표현의 양쪽 변을 에 관해 미분함으로써 구할 수 있습니다:[5]

만약 의 역-가능성은 없지만 가 많아야 근의 셀-수-있는 숫자 (즉, 를 만족하는 의 유한, 또는 셀-수-있는 무한, 숫자)를 수용하면, 확률 분포 함수(probability density function) 사이의 이전 관계는 다음으로 일반화될 수 있습니다:

여기서 이며, 역함수 정리(inverse function theorem)를 따릅니다. 밀도에 대해 공식은 증가되는 를 요구하지 않습니다.

측정-이론적, 확률에 대한 원자적 접근(axiomatic approach)에서, 만약 위에 확률 변수 이고 보렐 측정-가능 함수(Borel measurable function) 이면, 는 역시 위의 확률 변수인데, 왜냐하면 측정-가능 함수의 합성은 역시 측정-가능입니다. (어쨌든, 이것은 만약 르베그 측정-가능(Lebesgue measurable)이면 필연적으로 참은 아닙니다.[citation needed]) 확률 공간 에서 로 가는 것을 허용하는 같은 절차는 의 분포를 획득하기 위해 사용될 수 있습니다..

Example 1

를 실수-값, 연속 확률 변수(continuous random variable)로 놓고 로 놓습니다.

만약 이면, 이며, 따라서

만약 이면, 다음입니다:

따라서

Example 2

가 다음 누적 분포를 갖는 확률 변수로 가정합니다:

여기서 는 고정된 매개-변수입니다. 확률 변수 를 생각해 보십시오. 그런-다음,

마지막 표현은 의 누적 분포의 관점에서 계산될 수 있으며, 따라서

이것은 지수 분포의 누적 분포 함수(cumulative distribution function) (CDF)입니다.

Example 3

표준 정규 분포를 갖는 확률 분포임을 가정하며, 그의 밀도는 다음입니다:

확률 변수 를 생각해 보십시오. 우리는 변수의 변경에 대해 위의 공식을 사용하여 밀도를 구할 수 있습니다:

이 경우에서, 변경은 단조적(monotonic)이지 않은데, 왜냐하면 의 모든 각 값은 의 두 대응하는 값 (하나의 양수 및 음수)를 가집니다. 어쨌든, 대칭이기 때문에, 둘 다 절반은 동일하게 변환될 것입니다. 즉,

역 변환은 다음입니다:

그리고 그의 도함수는 다음입니다:

그런-다음,

이것은 일 자유도(degree of freedom)를 갖는 카이-제곱된 분포(chi-squared distribution)입니다.

Example 4

정규 분포(normal distribution)를 갖는 확률 변수로 가정하며, 그의 밀도는 다음입니다:

확률 변수 를 생각해 보십시오. 우리는 변수의 변경에 대해 위의 공식을 사용하여 밀도를 구할 수 있습니다:

이 경우에서, 변경은 단조적(monotonic)이지 않은데, 왜냐하면 의 모든 각 값은 의 두 대응하는 값 (하나는 양수 및 음수)을 가집니다. 이전 예제와 다르게, 이 경우에서 어쨌든, 대칭이 없고 우리는 두 구별되는 항을 계산해야 합니다:

역 변환은 다음입니다:

그리고 그의 도함수는 다음입니다:

그런-다음,

이것은 일 자유도(degree of freedom)를 갖는 비-중심 카이-제곱된 분포(noncentral chi-squared distribution)입니다.

Equivalence of random variables

확률 변수가 동등한 것으로 여길 수 있는 여러 다른 의미가 있습니다. 두 확률 변수는 같거나, 거의 확실하게 같거나, 분포에서 같을 수 있습니다.

강도의 증가하는 순서에서, 동등성의 이들 개념의 정확한 정의는 아래에 주어집니다.

Equality in distribution

만약 표본 공간이 실수 직선의 부분-집합이면, 확률 변수 XY는 만약 그들이 같은 분포 함수를 가지면, (로 표시되는) 분포에서 같습니다:

분포에서 같게 되기 위해, 확률 변수는 같은 확률 공간 위에 정의될 필요는 없습니다. 같은 모멘트 생성하는 함수(moment generating function)를 가지는 두 확률 변수는 같은 분포입니다. 이것은, 예를 들어, 독립, 동일하게 분포된 (IID) 확률 변수의 특정 함수의 상등을 검사하는 유용한 방법을 제공합니다. 어쨌든, 모멘트 생성하는 함수는 정의된 라플라스 변환(Laplace transform)을 가지는 분포에 대해 오직 존재합니다.

Almost sure equality

두 확률 변수 XY가 (로 표시되는) 거의 확실하게(almost surely) 같은 것과 그들이 다른 확률이 영(zero)인 것은 필요충분 조건입니다:

확률 이론에서 모든 실용적인 목적에 대해, 동등성의 이 개념은 실제적인 상등만큼 강력합니다. 그것은 다음 거리와 관련됩니다:

여기서 "ess sup"는 측정 이론(measure theory)의 의미에서 필수적인 상한(essential supremum)을 나타냅니다.

Equality

마지막으로, 두 확률 변수 XY는 만약 그들이 그들의 측정-가능 공간 위의 함수로 같으면, 같습니다:

이 개념은 전형적으로 확률 이론에서 가장 유용한데, 왜냐하면 실제와 이론에서, 실험(experiment)의 놓여-있는 측정 공간(measure space)은 거의 명시적으로 특성화 또는 심지어 특성화-가능이 아닙니다.

Convergence

수학적 통계에서 중요한 주제는 확률 변수의 특정 수열(sequence)에 대해 수렴 결과를 획득하는 것으로 구성됩니다; 예를 들어, 큰 숫자의 법칙(law of large numbers)중심 극한 정리(central limit theorem)입니다.

확률 변수의 수열 이 확률 변수 로 수렴할 수 있는 다양한 의미가 있습니다. 이것들은 확률 변수의 수렴(convergence of random variables)에 대한 기사에서 설명됩니다.

Notes

  1. ^ a b The interval I can be closed (of the form ), open () or clopen (of the form or ). The singleton sets and have measure zero and so are equivalent from the perspective of the Lebesgue measure and measures absolutely continuous with respect to it.
  2. ^ Formally, given any subsets of equal Lebesgue measure, the probabilities that X is contained in and are equal: .

See also

References

  1. ^ Blitzstein, Joe; Hwang, Jessica (2014). Introduction to Probability. CRC Press. ISBN 9781466575592.
  2. ^ a b Steigerwald, Douglas G. "Economics 245A – Introduction to Measure Theory" (PDF). University of California, Santa Barbara. Retrieved April 26, 2013.
  3. ^ a b Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd ed.). New York: Freeman. ISBN 978-0-7167-4773-4. Archived from the original on 2005-02-09.
  4. ^ L. Castañeda; V. Arunachalam; S. Dharmaraja (2012). Introduction to Probability and Stochastic Processes with Applications. Wiley. p. 67. ISBN 9781118344941. {{cite book}}: Unknown parameter |last-author-amp= ignored (|name-list-style= suggested) (help)
  5. ^ a b c d Bertsekas, Dimitri P. (2002). Introduction to Probability. Tsitsiklis, John N., Τσιτσικλής, Γιάννης Ν. Belmont, Mass.: Athena Scientific. ISBN 188652940X. OCLC 51441829.
  6. ^ Fristedt & Gray (1996, page 11)

Literature

External links