Mathematics(수학)/Probability and Statistics (확률과통계)

[확률과통계] 확률변수의 정의

Aumada 2023. 6. 15. 23:08

Random Variables

Definition of Random Variable

우리는 일상에서 발생하는 수 많은 사건들을 예시로 들어 확률 및 통계학을 공부한다. 동전 던지기, 주사위, 공 꺼내기, 등등 사실 미래를 예측한다는 것은 사실상 확률 싸움과도 같다.

'내일 논문 리뷰를 포스팅할 경우의 확률은?' 라는 것을 다뤄보자. 경우의 수는 당연히 두 가지이다. 하느냐 마느냐.

자 그럼, 위의 문장을 수학적으로 풀어보자. 그러기 위해서는 단순히 생각해보면 크게 두 가지가 필요하다.

인풋, 아웃풋 정도이다. 여기서 인풋은 내일 논문을 포스팅할 경우이고 아웃풋은 내일의 결과이다.

이것을 수학적으로 해석하기 위해서는 인풋에 해당하는 것을 변수로 설정하는 것이 계산하는 데 유용하다. 즉, 하나의 실수(Real Number)로 설정해야 한다. 그것이 바로 확률 변수(Random Variable)라고 한다.

구체적인 정의는 임의의 사건들에서 추출되는 각각의 outcome들을 어떠한 실제적인 값으로 매핑하는 것을 말한다.

통상적으로 RV는 대문자를 사용하며, X, Y, Z 가 있다.

Event Defined by RV

A_x를 하나의 사건이라고 해보자. 그렇다면 아래의 식으로 나타낼 수 있다.

w라는 outcome에 해당하는 RV가 x일 때, w는 A라는 집합의 원소로 나타낼 수 있다. 그렇다면 RV로써 사건의 확률을 정의해보면

로 나타낼 수 있다. A_x Event 집합이 확률 변수 x로 대응하는 outcome의 집합이라고 한다면, 그러한 집합이 나올 확률은 X가 될 확률과 같다.

Distribution Functions

확률 변수 X에 대해서, 실제 값 x는 CDF(Cumulative Distribution Function) 로 나타낼 수 있다.

CDF는 확률 값을 누적하여 나타내는 것이다. 식으로는 다음과 같이 나타낸다.

CDF는 대문자를 사용해서 함수로 나타내며 어떤 특정 value까지 누적되는 확률과 같다.

또한, CDF는 다음과 같은 성질을 가진다.

Discrete RV (=Non-continuous, integer)

간단히 말해, 확률 변수가 연속적이지 않다(non-continuous)는 것이다.

 

반응형