데이터 분석가
Published 2023. 7. 21. 17:36
상관분석 Statistics

상관분석

연속형 변수들 간의 관계를 파악할 때 사용

상관관계

원인과 결과가 불분명한 관계로 순서가 없다.
  • ex) 키와 몸무게

인과관계

선행하는 변수의 변화가 다른 변수의 원인으로 작용하는 관계로 성립하기 위해서는 3가지 조건을 만족해야 한다.
  • 1) 상관관계가 존재
    2) 순서가 존재(원인->결과)
    3) 제 3의 변수가 존재하지 않음
  • ex) 열을 가하면 물이 끓는다.
  • 인과관계의 오류 : 아이스크림의 판매량이 증가하면 익사자가 증가한다.
    • 기온과 익사자가 서로 인과관계이다.

공분산

두 변수가 함께 변하는 정도를 나타내는 지표
  • = 0 이면 두 변수가 독립이다.
  • 단위에 따라 크기가 달라져 판단이 어렵다.

상관계수

두 변수간의 관계를 나타내는 수치
  • 공분산을 -1 ~ 1 범위로 표준화 시킨 것이다.
  • 값의 범위에 따라 양의 상관관계와 음의 상관관계가 정해진다.
profile

데이터 분석가

@이꾹꾹

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!