상관분석
연속형 변수들 간의 관계를 파악할 때 사용상관관계
원인과 결과가 불분명한 관계로 순서가 없다.- ex) 키와 몸무게
인과관계
선행하는 변수의 변화가 다른 변수의 원인으로 작용하는 관계로 성립하기 위해서는 3가지 조건을 만족해야 한다.- 1) 상관관계가 존재
2) 순서가 존재(원인->결과)
3) 제 3의 변수가 존재하지 않음 - ex) 열을 가하면 물이 끓는다.
- 인과관계의 오류 : 아이스크림의 판매량이 증가하면 익사자가 증가한다.
- 기온과 익사자가 서로 인과관계이다.
공분산
두 변수가 함께 변하는 정도를 나타내는 지표- = 0 이면 두 변수가 독립이다.
- 단위에 따라 크기가 달라져 판단이 어렵다.
상관계수
두 변수간의 관계를 나타내는 수치- 공분산을 -1 ~ 1 범위로 표준화 시킨 것이다.
- 값의 범위에 따라 양의 상관관계와 음의 상관관계가 정해진다.
