Correlation Coefficient
이전 포스팅에서 상관계수에 대해서 알아보았다. 상관계수는 두 확률변수에 대한 확률이 얼마나 유사한지 일정한 값으로 비교하기 위함이다. 수식만으로는 잘 이해가 안갔는데 그래프를 보고 이해하기 시작했다.

단순히 생각해보자. X라는 확률변수가 정해지면 자동으로 결정되는 확률변수 Y가 있다고 해보자. 만약 두 확률 변수를 함수화 하고 그래프로 나타냈을 때 단조 증가 함수 꼴의 형태를 보이게 된다면 두 확률 변수는 상관관계가 있다고 한다. 그래도 이해가 되지 않는다면…. 두 확률 변수를 키와 몸무게로 나타내보자.

더 단순하게 얘기하자면, 직관적으로 그래프를 봤을 때 확률 변수의 값들이 일정한 구간에 모여있거나 어떠한 경향을 보인다면 상관성이 있다고 말할 수 있다.
Many joint RVs
만약 확률 변수가 처럼 충분히 많은 확률변수들의 연합분포를 나타내본다고 해보자 그럼 각각의 확률과 확률밀도함수는 다음과 같다.

Joint Gaussian (Bivariate) RVs
두 확률변수가 Gaussian dist를 따를 때, 연합정규분포는 다음과 같다.

식만 보면 기겁할 수 있다. 그래서 직관적인 그래프로 살펴보자.

확률 변수가 두 개이므로 x와 y 평면에서 분포가 나타내어 진다. 또한 임의의 값(파란색)을 기준으로 단면을 본다면 타원이 된다.
반응형
'Mathematics(수학) > Probability and Statistics (확률과통계)' 카테고리의 다른 글
[확률과통계] 연속확률변수의 합과 컨볼루션 (0) | 2023.06.16 |
---|---|
[확률과통계] 확률변수의 변환 함수 (0) | 2023.06.16 |
[확률과통계] 조건부 평균과 공분산 (0) | 2023.06.16 |
[확률과통계] 연합확률밀도함수와 조건부확률밀도함수 (0) | 2023.06.16 |
[확률과통계] 다중분포 및 연합분포 (1) | 2023.06.16 |