Mathematics(수학)/Probability and Statistics (확률과통계)

[확률과통계] 상관계수와 연합정규분포

Aumada 2023. 6. 16. 00:40

Correlation Coefficient

이전 포스팅에서 상관계수에 대해서 알아보았다. 상관계수는 두 확률변수에 대한 확률이 얼마나 유사한지 일정한 값으로 비교하기 위함이다. 수식만으로는 잘 이해가 안갔는데 그래프를 보고 이해하기 시작했다.

단순히 생각해보자. X라는 확률변수가 정해지면 자동으로 결정되는 확률변수 Y가 있다고 해보자. 만약 두 확률 변수를 함수화 하고 그래프로 나타냈을 때 단조 증가 함수 꼴의 형태를 보이게 된다면 두 확률 변수는 상관관계가 있다고 한다. 그래도 이해가 되지 않는다면…. 두 확률 변수를 키와 몸무게로 나타내보자.

더 단순하게 얘기하자면, 직관적으로 그래프를 봤을 때 확률 변수의 값들이 일정한 구간에 모여있거나 어떠한 경향을 보인다면 상관성이 있다고 말할 수 있다.

Many joint RVs

만약 확률 변수가 처럼 충분히 많은 확률변수들의 연합분포를 나타내본다고 해보자 그럼 각각의 확률과 확률밀도함수는 다음과 같다.

Joint Gaussian (Bivariate) RVs

두 확률변수가 Gaussian dist를 따를 때, 연합정규분포는 다음과 같다.

식만 보면 기겁할 수 있다. 그래서 직관적인 그래프로 살펴보자.

확률 변수가 두 개이므로 x와 y 평면에서 분포가 나타내어 진다. 또한 임의의 값(파란색)을 기준으로 단면을 본다면 타원이 된다.

반응형