Mathematics(수학)/Probability and Statistics (확률과통계)

[확률과통계] 이산확률변수와 연속확률변수

Aumada 2023. 6. 15. 23:17

Continuous Random Variable

앞선 포스팅에서는 이산확률변수에 대해서 알아보았다. RV를 discrete하게 지정을 하는 것이다.

하지만 우리가 살고 있는 세상은 변수가 굉장히 많다.

인구, 동물 수, 극단적으로 나노미터 크기의 분자까지.

이러한 outcome들은 정확한 RV로써 정의내리기란 불가능할 것이다. 그래서 나온것이 Continuous RV이다.

이것은 어떠한 outcome들을 모든 Real number에 대응시키는 것이다.

이때 Sample Space와 Real number는 셀 수 없이 무한 해야 한다.

그렇다면 0과 1 사이의 연속확률변수 x를 생각해보자.

0과 1사이에는 무수히 많은 실수가 존재한다. 그중에서 딱 0.5에 해당하는, 0.50000000...에 해당할 확률은 어떻게 될까?

정답은 0이다. 물론 완전한 0은 아니지만, 극한의 개념으로 0에 수렴할 것이다. 그래서 연속확률변수에서 어느 특정한 값이 나올 확률은 정의할 수 없으며, 0이다.

그렇다면 연속확률변수에서 어떻게 확률을 표현할 수 있을까? 정말 작은 구간을 생각해보자.

특정한 구간 x부터 x + delta x  까지 해당하는 확률 값을 CDF의 성질을 이용해서 대체하고 그 값을 구간의 길이인 delta x론 나눈다. 식을 좀더 이해해보면,

분자는 확률을 의미하고 분모는 x축에서 구간의 길이를 해당한다. 이 식을 말로 풀어서 쓰면 ''구간의 길이당 해당하는 확률은 어떻게 되느냐?" 이다. 결국 확률의 밀도라는 말이된다.

이것이 바로 확률밀도함수f_X(x)에 해당하는 Probability Density Function이다.

pdf는 cdf의 적분으로 구할수도 있다. (정적분과 비슷)

주어진 범위 내에서는 cdf나 pdf는 Continuous하다. 특히 cdf는 미분가능하다. 미분이 불가능하다면 discrete한 함수처럼 특정한 함수나 값을 필요로 한다.

확률밀도함수의 성질

 

확률밀도함수는 1과 2를 반드시 만족해야한다.

반응형