Jump to content

Probability space

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

확률 이론(probability theory)에서, 확률 공간(probability space) 또는 확률 세-쌍(probability triple) 무작위(randomly) 프로세서 또는 "실험"의 공식적인 모델링을 제공하는 수학적 구성(mathematical construct)입니다. 예를 들어, 우리는 주사위의 던짐을 모델링하는 확률 공간을 정의할 수 있습니다.

확률 공간은 세 원소로 구성됩니다:[1][2]

  1. 표본 공간(sample space), , 이것은 모든 가능한 결과의 집합입니다.
  2. 사건 공간, 이것은 사건(event) 의 집합이며, 사건은 표본 공간에서 결과(outcomes)의 집합입니다.
  3. 확률 사건, 이것은 0과 1 사이의 숫자인 사건 공간 확률(probabilities)에서 각 사건을 할당합니다.

확률의 현명한 모델을 제공하기 위해, 이들 원소들은, 기사에서 자세히 설명된, 많은 공리를 만족시켜야 합니다.

표준 주사위의 던짐의 예제에서, 우리는 표본 공간을 으로 취할 것입니다. 사건 공간에 대해, 우리는 표본 공간의 모든 부분-집합의 집합(set of all subsets)을 간단히 사용할 수 있으며, 이것은 그런-다음 ("주사위가 5로 떨어짐") 와 같은 간단한 사건, 마찬가지로 ("주사위가 짝수로 떨어짐") 와 같은 복잡한 사건이 포함될 것입니다. 마지막으로, 확률 함수에 대해, 우리는 각 사건을 해당 사건에서 결과를 숫자를 6으로 나눈 숫자로 매핑할 것입니다 – 따라서, 예를 들어, 에 매핑될 것이고, 에 맵핑될 것입니다.

실험이 수행될 때, 우리는 표본 공간 에서부터 단일 결과, 를 "자연스럽게" "선택한다"고 상상합니다. 선택된 결과 를 포함하는 사건 공간 에서 모든 사건은 "발생했다"라고 말합니다. 이 "선택"은, 만약 실험이 큰 숫자의 횟수로 반복되면, 실험의 전체 숫자의 일부로써, 각 사건의 발생의 숫자는 확률 함수 에 할당된 확률을 향하는 경향일 것입니다.

러시아 수학자 안드레이 콜모고로프(Andrey Kolmogorov)는 1930년대 확률 공간의 개념을 다른 확률의 공리(axioms of probability)와 함께 도입했습니다. 현대 확률 이론에서, 공리화 — 예를 들어 확률 변수의 대수학(Algebra of random variables)에 대해 여러 대안적인 접근이 있습니다.

Introduction

확률 공간은 실-세계 상황의 특정 클래스에 대해 모델(model)을 제공하는 수학적 세-쌍 입니다. 다른 모델과 마찬가지로, 그의 저자는 궁극적으로 원소 , , 및 가 포함할 것을 정의합니다.

  • 표본 공간(sample space) 는 가능한 모든 결과의 집합입니다. 결과(outcome)는 모델의 단일 실행의 결과입니다. 결과는 자연의 상태, 가능성, 실험 결과 및 좋아하는 것일 수 있습니다. 실-세계 상황 (또는 실험의 실행)의 모든 각 경우는 정확히 하나의 결과를 생성해야 합니다. 만약 실험의 다른 실행의 결과가 문제가 되는 임의의 방법에서 다르면, 그들은 구별되는 결과입니다. 문제가 되는 차이는 우리가 행하기를 원하는 분석의 종류에 달려 있습니다. 이것은 표본 공간의 다른 선택으로 이어집니다.
  • σ-대수(σ-algebra) 는 우리가 고려하기를 원하는 모든 사건(event)의 모음입니다. 이 모음은 기본(elementary) 사건의 각각을 포함하거나 포함하지 않을 수 있습니다. 여기서 "사건"은 영 이상 결과의 집합, 즉, 표본 공간의 부분-집합(subset)입니다. 사건은 후자의 결과가 사건의 원소일 때 실험동안 "발생한" 것으로 여겨집니다. 같은 결과가 많은 사건의 구성원일 수 있으므로, 단일 결과로 주어진 많은 사건이 발생했을 수 있습니다. 예를 들어, 시행이 두 주사위를 던지는 것으로 구성되면, 7점의 합을 갖는 모든 결과의 집합이 사건을 구성할 수 있지만, 점의 홀수를 갖는 결과는 또 다른 사건을 구성할 수 있습니다. 만약 결과가 첫 번째 주사위에서 두 점과 두 번째 주사위에서 다섯 점의 기본 사건의 원소이면, 사건의 둘 다, "7 점" 및 "점의 홀수"는 발생했다고 말합니다.
  • 확률 측정(probability measure) 는 사건의 확률(probability)을 반환하는 함수입니다. 확률은 0 (불가능한 사건은, 비록 확률-영 사건이 필연적으로 불가능은 아닐지라도, 확률 영을 가집니다) 및 일 (사건은 거의 완전한 확실성과 함께 거의 확실하게(almost surely) 발생합니다) 사이의 실수입니다. 따라서 는 함수 입니다. 확률 측정 함수는 두 가지 간단한 요구-사항을 충족시켜야 합니다: 첫째, 서로 배타적 사건의 셀-수-있는(countable) 합집합의 확률은 이들 사건의 각각의 확률의 셀-수-있는 합과 같아야 합니다. 예를 들어, 하나의 동전 던지기의 확률 실험에서 서로 배타적 사건 의 합집합의 확률, 에 대해 확률과 에 대해 확률의 합, 입니다. 둘째, 표본 공간 의 확률은 1과 같아야 합니다 (이것은, 모델의 실행이 주어지면, 일부 결과는 발생해야 한다는 사실을 설명합니다). 이전 예제에서, 결과의 집합 의 확률은 1과 같아야 하는데, 왜냐하면 결과는, 단일 동전 던지기에서, 또는 일 것임이 전적으로 사실이기 때문입니다 (모델은 임의의 다른 가능성을 무시합니다).

표본 공간 의 모든 각 부분-집합이 필연적으로 사건으로 여겨져야 하는 것은 아닙니다: 부분-집합의 일부는 단순히 관심의 대상이 아니며, 다른 것은 "측정될(measured)" 수 없습니다. 이것은 동전 던지기와 같은 경우에서 그렇게 분명하지는 않습니다. 다른 예제에서, 우리는 창 던지기 길이를 고려할 수 있으며, 여기서 사건은 전형적으로 "60과 65미터 사이"와 같은 구간 및 그러한 구격의 합집합이지만, "60에서 65미터 사이의 무리수"와 같은 집합은 아닙니다.

Definition

한마리도 말하자면, 확률 공간은 전체 공간의 측정이 일과 같음을 만족하는 측정 공간(measure space)입니다.

확장된 정의는 다음입니다: 확률 공간은 다음으로 구성된 세-쌍 입니다:

  • 표본 공간(sample space) — 임의의 비-빈 집합(non-empty set),
  • σ-대수(σ-algebra) (역시 σ-필드로 불림) — 다음을 만족하는, 사건(events)으로 불리는, 의 부분-집합의 집합:
    • 는 표본 공간: 을 구성합니다,
    • 여집합(complements) 아래에 닫혀 있습니다: 만약 이면, 역시 입니다,
    • 셀-수-있는(countable) 합집합(unions) 아래에 닫혀 있습니다: 만약 에 대해 이면, 역시 입니다.
      • 이전 두 속성과 드 모르간의 법칙(De Morgan’s law)으로부터 따름정리는 가 역시 셀-수-있는 교집합(intersections) 아래에 닫혀 있다는 것입니다: 만약 에 대해 이면, 역시 입니다.
  • 확률 측정(probability measure) — 다음을 만족하는 위의 함수:
    • P셀-수-있는 덧셈적(countably additive)입니다 (역시 σ-덧셈적으로 불림): 만약 가 쌍별 서로소 집합(disjoint sets)의 셀-수-있는 모음이면, 입니다,
    • 전체 표본 공간의 측정은 일과 같습니다: 입니다.

Discrete case

이산 확률 이론은 오직 많아야 셀-수-있는(at most countable) 표본 공간 를 필요로 합니다. 확률은 을 만족하는 확률 질량 함수(probability mass function) 에 의해 의 점에 속하는 것으로 생각할 수 있습니다. 의 모든 부분-집합은 사건으로 처리될 수 있습니다 (따라서, 거듭제곱 집합(power set)입니다). 확률 측정은 다음의 간단한 형태를 취합니다: 가장-큰 σ-대수 는 완전한 정보를 설명합니다. 일반적으로, σ-대수 는 유한 또는 셀-수-있는 분할(partition)에 해당하며, 사건 의 일반적인 형식은 입니다. 역시 예제를 참조하십시오.

경우 는 정의에 의해 허용되지만, 드물게 사용되는데, 왜냐하면 그러한 는 표본 공간으로부터 안전하게 제외될 수 있기 때문입니다.

General case

만약 Ω가 셀-수-없는(uncountable) 것이면, 여전히, 일부 ω에 대해 p(ω) ≠ 0인 것이 발생할 수 있습니다; 그러한 ω원자(atom)라고 불립니다. 그것들은 기껏해야 셀-수-있는 (아마도 빈(empty)) 집합이며, 그것의 확률은 모든 원자의 확률의 합입니다. 만약 이 합이 1과 같으면, 모든 다른 점은 표본 공간으로부터 안전하게 제외되며, 개별적인 경우로 반환합니다. 그렇지 않으면, 만약 모든 원자의 확률의 합이 0과 1 사이이면, 확률 공간은 이산 (원자적) 부분 (아마도 빈) 및 비-원자(non-atomic) 부분으로 분해됩니다.

Non-atomic case

만약 모든 ω∈Ω에 대해 p(ω) = 0이면 (이 경우에서, Ω는 반드시 셀-수-없는 것인데, 왜냐하면 그렇지 않으면 P(Ω)=1은 충족시킬 수 없기 때문입니다), 방정식 (*)는 실패합니다: 집합의 확률은 그의 원소의 확률에 걸쳐 필연적으로 합이 아닌데, 왜냐하면 합은 원소의 셀-수-있는 숫자에 대해 오직 정의되기 때문입니다. 이것은 확률 공간 이론을 훨씬 더 기술적으로 만듭니다. 합보다 더 강한 공식, 측정 이론(measure theory)이 적용-가능합니다. 초기에는 확률이 일부 "생성기" 집합에 속하는 것으로 생각되었습니다 (예제를 참조하십시오). 그런-다음 극한하는 절차는 생성기 집합의 수열의 극한, 또는 극한의 극한, 등으로 집합에 확률을 할당하는 것을 허용합니다. 모든 이들 집합은 σ-대수 입니다. 기술적 세부 사항에 대해 카라테오도리 확장 정리(Carathéodory's extension theorem)를 참조하십시오. 에 속하는 집합은 측정-가능(measurable)으로 불립니다. 일반적으로 그들은 생성기 집합보다 훨씬 더 복잡하지만, 비-측정가능 집합(non-measurable set)보다 훨씬 낫습니다.

Complete probability space

확률 공간 은 만약 을 갖는 모든 및 모든 에 대해 우리가 를 가지면 완전한 확률 공간이라고 말합니다. 종종, 확률 공간의 연구는 완전한 확률 공간으로 제한됩니다.

Examples

Discrete examples

Example 1

만약 실험이 단지 공정한 동전(fair coin)의 한 번의 던짐으로 구성되면, 결과는 앞면 또는 뒷면 중 하나입니다: . σ-대수 사건을 포함하며, 즉: (“앞면”), (“뒷면”), (“앞면도 뒷면도 아닌 것”), 및 (“앞면 또는 뒷면 중 하나”); 달리 말해서, 입니다. 앞면을 던질 확률은 50%, 뒷면에 대해 50%이므로, 이 예제에서 확률 측정은 , , , 입니다.

Example 2

공정한 동전이 세 번 던져집니다. 8 가능한 결과가 있습니다: Ω = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} (여기서 “HTH”는 예를 들어 첫 번째 앞면, 두 번째 뒷면, 및 세 번째 다시 앞면임을 의미합니다). 완전한 정보는 σ-대수 = 2Ω, 즉, 28 = 256 사건에 의해 설명되며, 여기서 각 사건은 Ω의 부분-집합입니다.

앨리스는 오직 두 번째 던짐의 결과를 알고 있습니다. 따라서 그녀의 불완전한 정보는 분할 Ω = A1 ⊔ A2 = {HHH, HHT, THH, THT} ⊔ {HTH, HTT, TTH, TTT}에 의해 설명되며, 여기서 ⊔는 서로소 합집합(disjoint union)이고, 해당하는 σ-대수 Alice = {{}, A1, A2, Ω}입니다. 브라이언은 오직 총 뒷변의 숫자를 알고 있습니다. 그의 분할은 네 부분으로 구성됩니다: Ω = B0 ⊔ B1 ⊔ B2 ⊔ B3 = {HHH} ⊔ {HHT, HTH, THH} ⊔ {TTH, THT, HTT} ⊔ {TTT}; 따라서 그의 σ-대수 Bryan는 24 = 16 사건을 포함합니다.

두 σ-대수는 비-비교가능(incomparable)입니다: AliceBryan도 아니고 BryanAlice도 아닙니다: 둘 다는 2Ω의 부분-σ-대수입니다.

Example 3

만약 100 유권자가 캘리포니아에서 모든 유권자 사이에서 무작위로 뽑히고 그들이 주지사에 대해 누구를 투표할 것인지를 물으면, 100 캘리포니아 유권자의 모든 수열(sequence)의 집합은 표본 공간 Ω가 됩니다. 우리는 복원없는 표본화(sampling without replacement)가 사용된다고 가정합니다: 오직 100 다른 유권자의 수열이 허용됩니다. 간단성에 대해, 순서화된 표본이 고려되며, 즉 수열 {Alice, Bryan}은 {Bryan, Alice}와 다릅니다. 우리는 각 잠재적 유권자가 그의/그녀의 미래 선택을 정확히 알고 있다는 것, 즉 무작위로 선택하지 않음을 역시 당연한 것으로 받아들입니다.

앨리스는 아놀드 슈왈제네거(Arnold Schwarzenegger)가 적어도 60 표를 얻었는지 여부를 오직 알고 있습니다. 그녀의 불완전한 정보는 다음을 포함하는 σ-대수 Alice에 의해 설명됩니다: (1) 적어도 60명이 슈왈제네거에 투표하는 Ω에서 모든 수열의 집합; (2) 슈왈제네거에 대해 60 미만의 투표를 하는 모든 수열의 집합; (3) 전체 표본 공간 Ω; 및 (4) 빈 집합 ∅.

브라이언은 슈워제네거에 대해 투표할 유권자의 정확한 숫자를 알고 있습니다. 그의 불완전한 정보는 대응하는 분할 Ω = B0 ⊔ B1 ... ⊔ B100에 의해 설명되고 σ-대수 Bryan는 2101 사건으로 구성됩니다.

이 경우에서 앨리스의 σ-대수는 브라이언의 것의 부분-집합입니다: AliceBryan. 브라이언의 σ-대수는 차례로 2n(n−1)...(n−99)으로 구성되는 훨씬 더 큰 "완전한 정보" σ-대수 2Ω의 부분-집합이며, 여기서 n은 캘리포니아에서 모든 잠재적 유권자의 숫자입니다.

Non-atomic examples

Example 4

0과 1 사이의 숫자가 무작위로, 균등하게 선택됩니다. 여기서 Ω = [0,1], 는 Ω에 대한 보렐 집합(Borel set)의 σ-대수이고, P는 [0,1]에 대한 르베그 측정(Lebesgue measure)입니다.

이 경우에서, 형식 (a,b)의 열린 구간은, 여기서 0 < a < b < 1, 생성기 집합으로 취할 수 있습니다. 각 그러한 집합은 P((a,b)) = (b − a)의 확률에 속하는 것으로 생각하며, 이것은 [0,1]에 대한 르베그 측정(Lebesgue measure) 및 Ω에 대한 보렐 σ-대수(Borel σ-algebra)를 생성합니다.

Example 5

공정한 동전이 끝없이 던져집니다. 여기서 우리는 Ω = {0,1}, 숫자 0과 1의 모든 무한 수열의 집합을 취할 수 있습니다. 원기둥 집합(Cylinder set) {(x1x2, ...) ∈ Ω : x1 = a1, ..., xn = an}은 생성기 집합으로 사용될 수 있을 것입니다. 각 그러한 집합은 먼저 n 던짐은 고정된 수열 (a1, ..., an)를 초래하고, 수열의 나머지는 임의적일 수 있는 수열을 묘사합니다. 각 그러한 사건은 2n의 확률이 자연스럽게 주어질 수 있습니다.

이들 두 비-원자 예제는 밀접하게 관련됩니다: 수열 (x1,x2,...) ∈ {0,1}은 숫자 2−1x1 + 2−2x2 + ... ∈ [0,1]로 이어집니다. 이것은 {0,1}과 [0,1] 사이의 일-대-일 대응(one-to-one correspondence)이 아닙니다. 어쨌든: 그것은 동형-사상 모듈로 영(isomorphism modulo zero)이며, 이것은 두 확률 공간을 같은 확률 공간의 두 형식으로 처리하는 것을 허용합니다. 사실, 모든 비-병리적 비-원자 확률 공간은 이 의미에서 같습니다. 그들은 소위 표준 확률 공간(standard probability space)입니다. 확률 공간의 기본 응용은 표준화에 둔감합니다. 어쨌든, 비-이산 조건화는 표준 확률 공간에서 쉽고 자연스러우며, 그렇지 않으면 그것은 모호해집니다.

Related concepts

Probability distribution

임의의 확률 분포(probability distribution)는 확률 측정을 정의합니다.

Random variables

확률 변수(random variable) X는 표본 공간 Ω에서 상태 공간으로 불리는 또 다른 측정-가능 공간 S로의 측정-가능 함수(measurable function) X: Ω → S입니다.

만약 AS이면, 표기법 Pr(XA)은 P({ω ∈ Ω: X(ω) ∈ A})에 대해 공통족으로 사용된 속기입니다.

Defining the events in terms of the sample space

만약 Ω가 셀-수-있으면(countable), 우리는 거의 항상 Ω의 거듭제곱 집합(power set)으로 를 정의합니다, 즉, = 2Ω이며, 이것은 자명하게 σ-대수이고 우리가 Ω를 사용하여 생성할 수 있는 가장-큰 것입니다. 우리는 따라서 를 생략할 수 있고 단지 확률 공간을 정의하기 위해 (Ω,P)라고 씁니다.

다른 한편으로, 만약 Ω가 셀-수-없고(uncountable) 우리가 = 2Ω를 사용하면, 우리는 확률 공간 P를 정의함에 곤경에 빠지는데 왜냐하면 는 너무 "큽니다", 즉, 고유한 측정을 할당하는 것이 불가능한 집합이 종종 있습니다. 이 경우에서, 우리는 더 작은 σ-대수 를 사용해야 하며, 예를 들어 Ω의 보렐 대수(Borel algebra), 이것은 모든 열린 집합을 측정-가능으로 만드는 가장-작은 σ-대수입니다.

Conditional probability

확률 공간의 콜모고르프의 정의는 조건부 확률(conditional probability)의 자연스러운 개념을 일으킵니다. 비-영 확률을 갖는 모든 각 집합 A (즉, P(A) > 0)는 공간 위의 또-다른 확률 측정을 정의합니다:

.

이것은 보통 "주어진 A에 대한 B의 확률"로 발음합니다.

P(B) > 0를 만족하는 임의의 사건 B에 대해, 모든 사건 A에 대해 Q(A) = P(A|B)에 의해 정의된 함수 Q는 그 자체로 확률 측정입니다.

Independence

두 사건 AB는 만약 P(AB)=P(A)P(B)이면 독립(independent)이라고 말합니다.

두 확률 변수, XY는 만약 X의 관점에서 정의된 임의의 사건이 Y의 관점에서 정의된 임의의 사건과 독립이면 독립이라고 말합니다. 공식적으로, 그들은 독립적인 σ-대수를 생성하며, 여기서 F의 부분-집합인 두 σ-대수 GH는 만약 G의 임의의 원소가 H의 임의의 원소와 독립이면 독립이라고 말합니다.

Mutual exclusivity

두 사건, AB는 만약 하나의 발생이 나머지 하나의 비-발생을 의미하면, 즉, 그들의 교집합이 빈집합이면, 서로 배타적(mutually exclusive) 또는 서로소(disjoint)라고 말합니다. 이것은 그들의 교집합의 확률이 영이 되는 것보다 더 강한 조건입니다.

만약 AB가 서로소 사건이면, P(AB) = P(A) + P(B)입니다. 이것은 사건의 (유한 또는 셀-수-있는 무한) 수열로 확장합니다. 어쨌든, 사건의 셀-수-없는 집합의 합집합의 확률은 그들의 확률의 합이 아닙니다. 예를 들어, 만약 Z정규적으로 분포된(normally distributed) 확률 변수이면, P(Z=x)는 임의의 x에 대해 0이지만, P(ZR) = 1입니다.

사건 AB은 "A이고 B"로 참조되고, 사건 AB는 "A 또는 B"로 참조됩니다.

See also

References

  1. ^ Loève, Michel. Probability Theory, Vol 1. New York: D. Van Nostrand Company, 1955.
  2. ^ Stroock, D. W. (1999). Probability theory: an analytic view. Cambridge University Press.

Bibliography

The first major treatise blending calculus with probability theory, originally in French: Théorie Analytique des Probabilités.
The modern measure-theoretic foundation of probability theory; the original German version (Grundbegriffe der Wahrscheinlichkeitrechnung) appeared in 1933.
An empiricist, Bayesian approach to the foundations of probability theory.
Foundations of probability theory based on nonstandard analysis. Downloadable. http://www.math.princeton.edu/~nelson/books.html
  • Patrick Billingsley: Probability and Measure, John Wiley and Sons, New York, Toronto, London, 1979.
  • Henk Tijms (2004) Understanding Probability
A lively introduction to probability theory for the beginner, Cambridge Univ. Press.
  • David Williams (1991) Probability with martingales
An undergraduate introduction to measure-theoretic probability, Cambridge Univ. Press.
  • Gut, Allan (2005). Probability: A Graduate Course. Springer. ISBN 0-387-22833-0.

External links