Jump to content

Uniform distribution (continuous)

This is a fully translated article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning
Uniform
Probability density function
PDF of the uniform probability distribution using the maximum convention at the transition points.
Using maximum convention
Cumulative distribution function
CDF of the uniform probability distribution.
Notation
Parameters
Support
PDF
CDF
Mean
Median
Mode any value in
Variance
Skewness 0
Ex. kurtosis
Entropy
MGF
CF

확률 이론(probability theory)통계학(statistics)에서, 연속 균등 분포(continuous uniform distribution) 또는 직사각형 분포(rectangular distribution)는 대칭적(symmetric) 확률 분포(probability distributions)의 가족입니다. 그 분포는 특정 경계 사이에 놓이는 임의적인 결과가 있는 실험을 설명합니다.[1] 그 경계는 최솟값과 최댓값인 매개 변수 ab에 의해 정의됩니다. 그 구간은 닫힌(closed) (예를 들어, [a, b]) 또는 열린(open) (예를 들어, (a, b)) 것일 수 있습니다.[2] 그러므로, 그 분포는 종종 U (a, b)로 축약되며, 여기서 U는 균등 분포를 의미합니다.[1] 경계 사이의 차이는 구간 길이를 정의합니다; 분포의 지원(support) 위에 같은 길이의 모든 구간(interval)은 같은 가능성이 있습니다. 그것은 분포의 지원에 포함된 것 이외의 제약 조건없는 아래에서 확률 변수(random variable) X에 대해 최대 엔트로피 확률 분포(maximum entropy probability distribution)입니다.[3]

Definitions

Probability density function

연속 균등 분포의 확률 밀도 함수(probability density function)는 다음입니다:

두 경계 ab에서 f(x)의 값은 보통 중요하지 않은데 왜냐하면 그것들은 임의의 구간에 걸쳐 f(xdx, 또는 x f(xdx 또는 임의의 더 높은 모멘트의 적분 값을 변경하지 않기 때문입니다. 때때로 그것들은 영으로 선택되고, 때때로 1/b − a로 선택됩니다. 후자는 최대 가능도(maximum likelihood)의 방법에 의해 추정의 문맥에서 적절합니다. 푸리에 해석(Fourier analysis)의 문맥에서, 우리는 1/2(b − a)가 되도록 f(a) 또는 f(b)의 값을 취할 수 있는데, 왜냐하면 그때에 이 균등 함수의 많은 적분 변환(integral transform)의 역 변환이 "거의 모든 곳(almost everywhere)"과 같은, 즉, 영 측정(measure)을 갖는 점의 집합을 제외한 함수가 아닌 함수 자체를 반환할 것이기 때문입니다. 역시, 그것은 그러한 모호성을 가지지 않는 부호 함수(sign function)와 일치합니다.

그래픽적으로, 확률 밀도 함수(probability density function)가 밑변이고 가 높이인 직사각형으로 묘사됩니다. a와 b 사이의 거리가 증가함에 따라, 그 분포 경계 내의 임의의 특정 값에서 밀도가 감소합니다.[4] 확률 밀도 함수는 1에 적분하므로, 확률 밀도 함수의 높이는 밑변 길이가 증가함에 따라 감소합니다.[4]

평균 μ와 분산 σ2의 관점에서, 확률 밀도는 다음으로 쓸 수 있습니다:

Cumulative distribution function

누적 분포 함수(cumulative distribution function)는 다음입니다:

그것의 역은 다음입니다:

평균과 분산 표기법에서, 누적 분포 함수는 다음입니다:

그리고 분산은 다음입니다:

Example 1. Using the Uniform Cumulative Distribution Function[5]

확률 변수 X에 대해

확률 을 구합니다:

.

균등 분포 함수 [f(x) vs x]의 그래픽 표현에서, 지정된 경계 내의 곡선 아래의 넓이는 확률을 표시합니다 (음영-처리된 넓이는 직사각형으로 표시됩니다). 위의 특정 예제에 대해, 밑변은 일 것이고 높이는 일 것입니다.[5]

Example 2. Using the Uniform Cumulative Distribution Function (Conditional)[5]

확률 변수 X에 대해

확률 을 구합니다:

.

위의 예제는 균등 분포에 대해 조건부 확률 경우에 대한 것입니다: 주어진 가 참일 때, 인 확률은 무엇입니까? 조건부 확률은 표본 공간을 변경하므로 새로운 구간 길이 가 계산되어야 하며, 여기서 b는 23이고 a는 8입니다.[5] 그래픽 표현은 여전히 예제 1을 따르며, 여기서 지정된 경계 내의 곡선 아래 넓이는 확률을 표시하고 사각형의 밑면은 일 것이고 높이는 일 것입니다.[5]

Generating functions

Moment-generating function

모멘트 생성 함수(moment-generating function)는 다음입니다:[6]

[7]

이것으로부터 우리는 원시 모멘트(raw moments) m k를 계산할 수 있습니다:

특별한 경우 a = –b에 대해, 즉 다음에 대해,

모멘트-생성 함수는 다음 간단한 형식으로 줄어듭니다:

이 분포를 따르는 확률 변수(random variable)에 대해, 기댓값(expected value)은 그때에 m1 = (a + b)/2이고 분산(variance)m2 − m12 = (b − a)2/12입니다.

Cumulant-generating function

n ≥ 2에 대해, 구간 [−1/2, 1/2]에 대한 균등 분포의 n번째 누적(cumulant)Bn/n이며, 여기서 Bnn번째 베르누이 숫자(Bernoulli number)입니다.[8]

Standard uniform

로 제한하면, 결과 분포 U(0,1)는 표준 균등 분포(standard uniform distribution)입니다.

표준 균등 분포의 한 가지 흥미로운 속성은 만약 u1이 표준 균등 분포를 가지면, 1-u1도 마찬가지라는 것입니다. 이 속성은 무엇보다도 정반대 변이(antithetic variates)를 생성하는 데 사용될 수 있습니다. 다시 말해서, 이 속성은 연속 표준 균등 분포가 임의의 다른 연속 분포에 대해 무작위 숫자(random numbers)를 생성하기 위해 사용될 수 있는 역 방법(inversion method)으로 알려져 있습니다.[4] 만약 u가 표준 균등 분포 (0,1)를 갖는 균등 무작위 숫자이면, 는 지정된 누적 분포 함수 F를 갖는 임의의 연속 분포에서 무작위 숫자 x를 생성합니다.[4]

Relationship to other functions

평행이동 점에서 같은 규칙을 따르는 한, 확률 밀도 함수는 역시 헤비사이드 계단 함수(Heaviside step function)의 관점에서 표현될 수 있습니다:

또는 직사각형 함수(rectangle function)의 관점에서 표현될 수 있습니다:

부호 함수(sign function)의 평행이동 점에서 모호함이 없습니다. 평행이동 점에서 반-최대 규칙을 사용하여, 균등 분포는 다음과 같이 부호 함수의 관점에서 표현될 수 있습니다:

Properties

Moments

그 분포의 평균 (첫 번째 모멘트(moment))은 다음입니다:

그 분포의 두 번째 모멘트는 다음입니다:

일반적으로, 균등 분포의 n-번째 모멘트는 다음입니다:

분산은 (두 번째 중심 모멘트(central moment))는 다음입니다:

Order statistics

X1, ..., XnU(0,1)에서 i.i.d. 표본이라고 놓습니다. X(k)를 이 표본에서 k번째 순서 통계량(order statistic)으로 놓습니다. 그런-다음 X(k)의 확률 분포는 매개변수 knk + 1를 갖는 베타 분포(Beta distribution)입니다. 기댓값은 다음입니다:

이 사실은 Q–Q 플롯(Q–Q plot)을 만들 때 유용합니다.

분산은 다음입니다:

역시 참조하십시오: Order statistic § Probability distributions of order statistics

Uniformity

균등하게 분포된 화률 변수가 고정된 길이의 임의의 구간 내에 떨어질 확률은 그 구간이 분포의 지원에 포함되는 한 구간 자체의 위치와 무관합니다 (그러나, 그것이 구간 크기에 따라 달라집니다).

이것을 알기 위해, 만약 X ~ U(a,b) 및 [x, x+d]가 고정된 d > 0를 갖는 부분구간이면, 다음입니다:

이것은 x와 독립입니다. 이 사실은 그 분포의 이름에 동기를 부여합니다.

Generalization to Borel sets

이 분포는 구간보다 더 복잡한 집합으로 일반화될 수 있습니다. 만약 S가 양의 유한 측정의 보렐 집합(Borel set)이면, S에 대한 균등 확률 분포는 pdf를 S 외부에서 0으로 정의하고 S에서 1/K와 상수적으로 같음을 정의함으로써 지정될 수 있으며, 여기서 KS르베그 측정(Lebesgue measure)입니다.

Related distributions

Statistical inference

Estimation of parameters

Estimation of maximum

Minimum-variance unbiased estimator

미지수 b를 갖는 [0, b] 위에 균등 분포가 주어지면, 최댓값에 대해 최소-분산 불편향 추정량(minimum-variance unbiased estimator, UMVUE)은 다음에 의해 제공됩니다:

여기서 m표본 최댓값(sample maximum)이고 k는 대체없이 표본화에서 표본 크기(sample size)입니다 (비록 이 구별이 거의 확실하게 연속 분포에 대해 차이를 만들지 않지만). 이것은 이산분포에 대해 추정과 같은 이유에서 따르고, 최대 간격 추정(maximum spacing estimation)의 아주 단순한 경우라고 보일 수 있습니다. 이 문제는 제2차 세계 대전 중 독일 탱크 생산량 추정치에 대한 최대 추정의 응용으로 인해 공통적으로 독일 탱크 문제(German tank problem)로 알려져 있습니다.

Maximum likelihood estimator

최대 가능도(maximum likelihood) 추정량은 다음에 의해 제공됩니다:

여기서 m표본 최댓값(sample maximum)이고, 역시 표본의 최대 순서 통계량(order statistic) 으로 표시됩니다.

Method of moment estimator

모멘트의 방법(method of moments) 추정량은 다음에 의해 제공됩니다:

여기서 는 표본 평균입니다.

Estimation of midpoint

분포 (a + b) / 2의 중간점은 균등 분포의 평균이자 중앙값입니다. 비록 표본 평균과 표본 중앙값 둘 다가 중간점의 불편향된 추정량(unbiased estimator)이지만, 어느 쪽도 표본 중간-범위(mid-range), 즉, 중간점의 UMVU 추정량 (및 역시 최대 가능도 추정(maximum likelihood estimate))인 표본 최댓값과 표본 최솟값의 산술 평균만큼 효율적(efficient)이지 않습니다.

Confidence interval

For the maximum

X1, X2, X3, ..., Xn에서 표본으로 놓으며, 여기서 L은 모집단 최댓값입니다. 그런-다음 X(n) = max( X1, X2, X3, ..., Xn )은 르베그-보렐-밀도 를 가집니다:[9]

이전에 제공된 신뢰 구간은 수학적으로 부정확한데, 왜냐하면 의 지식없이 에 대해 해결될 수 없기 때문입니다. 어쨌든, 우리는 다음과 같이 풀 수 있습니다:

 for   for any unknown but valid ,

우리는 그런-다음 위의 조건을 만족시키는 가능한 가장 작은 을 선택합니다. 구간 길이는 확률 변수 에 의존함을 주목하십시오.

Occurrence and applications

균등 분포 함수에 대해 확률은 함수 형식의 단순성으로 인해 계산하기 쉽습니다.[2] 그러므로, 이 분포가 아래 보이는 것: 가설 테스트 상황, 무작위 표본화 경우, 재정 등에 대해 사용될 수 있는 다양한 응용이 있습니다. 게다가, 일반적으로, 물리적 기원의 실험은 균등 분포(예를 들어, 방사성 입자(particles)의 방출)를 따릅니다.[1] 어쨌든, 임의의 응용에서, 고정된 길이의 구간에 떨어질 확률이 일정하다는 변하지 않는 가정이 있다는 점에 유의하는 것이 중요합니다.[2]

Economics example for uniform distribution

경제학 분야에서, 보통 수요(demand)보충(replenishment)이 예상된 정규 분포를 따르지 않을 수 있습니다. 결과로써, 다른 분포 모델이 베르누이 프로세스(Bernoulli process)와 같은 확률과 추세를 더 잘 예측하기 위해 사용됩니다.[10] 그러나 Wanke (2008)에 따르면, 완전하게 새로운 제품이 분석될 때, 수명 주기(life cycle)의 시작 부분에서 재고 관리에 대해 인도-시간(lead-time)을 조사하는 특별한 경우에서, 균등 분포가 더 유용한 것으로 입증되었습니다.[10] 이 상황에서, 다른 분포가 실행 가능하지 않는데 왜냐하면 새로운 제품에 대한 기존 데이터가 없거나 수요 내역이 사용될 수 없으므로 실제로 적절하거나 알려진 배포가 없기 때문입니다.[10] 균등 분포가 이 상황에서 이상적인데 왜냐하면 (수요와 관련된) 인도-시간의 확률 변수는 신제품에 대해 알려지지 않았지만 그 결과는 두 값의 그럴듯한 범위 사이일 가능성이 높기 때문입니다.[10] 인도-시간(lead-time)은 따라서 확률 변수를 나타냅니다. 균등 분포 모델에서, 인도-시간과 관련된 다른 요소는 주기 서비스 수준(cycle service level)과 및 주기당 부족(shortage per cycle)과 같이 계산될 수 있습니다. 균등 분포는 역시 계산의 단순성으로 인해 사용되었음을 역시 주목합니다.[10]

Sampling from an arbitrary distribution

균등 분포는 임의적인 분포에서 표본화하는 데 유용합니다. 일반적인 방법은 목표 랜덤 변수의 누적 분포 함수(cumulative distribution function, CDF)를 사용하는 역 변환 표본화 방법입니다. 이 방법은 이론적 연구에서 매우 유용합니다. 이 방법을 사용하는 모의실험은 목표 변수의 CDF를 반전해야 하므로, 대안적인 방법이 CDF가 닫힌 형식에서 알려지지 않은 경우에 대해 고안되어 왔습니다. 그러한 방법 중 하나는 거부 표본화(rejection sampling)입니다.

정규 분포(normal distribution)는 역 변환 방법이 효율적이지 않은 중요한 예제입니다. 어쨌든, 정확한 방법, 역변환을 둘의 독립적인 균등 확률 변수(random variable)를 둘의 독립적인 정규적으로 분포된(normally distributed) 확률 변수로 변환하기 위해 사용하는 박스–뮬러 변환(Box–Muller transformation)이 있습니다.

Quantization error

아날로그-에서-디지털 변환에서, 수량화 오류가 발생합니다. 이 오류는 반올림 또는 잘림에 의해 기인합니다. 원래 신호가 하나의 최소 유효 비트 (LSB)보다 훨씬 더 클 때, 수량화 오류는 신호와 크게 상관되지 않고, 근사적으로 균등 분포를 가집니다. RMS 오류(RMS error)는 따라서 이 분포의 분산에서 따릅니다.

Computational methods

Sampling from a uniform distribution

모의실험을 실행하기에 유용한 많은 응용 프로그램이 있습니다. 많은 프로그래밍 언어는 표준 균등 분포에 따라 효과적으로 분포되는 유사-무작위 숫자(pseudo-random numbers)를 생성하기 위해 구현과 함께 제공됩니다.

만약 u가 표준 균등 분포에서 표본화된 값이면, 값 a + (ba)u는 위에 설명된 것처럼 ab에 의해 매개변수화된 균등 분포를 따릅니다.

History

균등 분포 개념의 역사적 기원은 결정적이지 않지만, 용어 '균등'은 주사위 게임에서 동일-확률(equiprobability)의 개념에서 비롯된 것으로 추측됩니다 (주사위 게임은 연속이 아닌 이산(discrete) 균등 표본 공간을 가짐에 주목하십시오). 동일-확률은 제롤라모 카르다노(Gerolamo Cardano)Liber de Ludo Aleae, 16세기에 작성되었고 주사위와 관련된 고급 확률 계산에 대해 자세히 설명된 매뉴얼에 언급되었습니다.[11]

See also

References

  1. ^ a b c Dekking, Michel (2005). A modern introduction to probability and statistics : understanding why and how. London, UK: Springer. pp. 60–61. ISBN 978-1-85233-896-1.
  2. ^ a b c Walpole, Ronald; et al. (2012). Probability & Statistics for Engineers and Scientists. Boston, USA: Prentice Hall. pp. 171–172. ISBN 978-0-321-62911-1.
  3. ^ Park, Sung Y.; Bera, Anil K. (2009). "Maximum entropy autoregressive conditional heteroskedasticity model". Journal of Econometrics. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. doi:10.1016/j.jeconom.2008.12.014.
  4. ^ a b c d "Uniform Distribution (Continuous)". MathWorks. 2019. Retrieved November 22, 2019.
  5. ^ a b c d e Illowsky, Barbara; et al. (2013). Introductory Statistics. Rice University, Houston, Texas, USA: OpenStax College. pp. 296–304. ISBN 978-1-938168-20-8.
  6. ^ Casella & Berger 2001, p. 626
  7. ^ https://www.stat.washington.edu/~nehemyl/files/UW_MATH-STAT395_moment-functions.pdf
  8. ^ https://galton.uchicago.edu/~wichura/Stat304/Handouts/L18.cumulants.pdf
  9. ^ Nechval KN, Nechval NA, Vasermanis EK, Makeev VY (2002) Constructing shortest-length confidence intervals. Transport and Telecommunication 3 (1) 95-103
  10. ^ a b c d e Wanke, Peter (2008). "The uniform distribution as a first practical approach to new product inventory management". International Journal of Production Economics. 114 (2): 811–819. doi:10.1016/j.ijpe.2008.04.004 – via Research Gate.
  11. ^ Bellhouse, David (May 2005). "Decoding Cardano's Liber de Ludo". Historia Mathematica. 32: 180–202. doi:10.1016/j.hm.2004.04.001.

Further reading

External links