상관 계수 와 상관 관계와 공분산 은 무엇인가요? 100 만원 짜리 지식

2022. 8. 29. 20:11빅데이터 파이썬 기반

728x90

안녕하세요 오늘은 상관계수와 공분산 상관관계에 대해서 설명하려고 하는데요

이건뭐 거의 아주 간단하고 명료하게 통계학 또는 파이썬 R을 통해서 통계 데이터 사이언티스 등 을

하실 때는 무조권 중요하죠 결측치랑 상관계수를 나타내는 것이요 그래서 저도 오늘 배웠는데

혹시 까먹을까 봐 정리해둡니다 도움이 되었으면 좋겠네요

 

 

 

1. 상관계수

상관계수란  시작점과 끝을 나누자면  -1  ~~ 0 ~~ 1 이 있는데요 이것은 상관관계를 나타내기 위한

수인데요 상관관계의 수에는 -1 0 1 이 있습니다

 

 

2. 상관관계

상관관계는 상관계수를 사용하여 두 그룹 또는 여러 그룹 들을 상관관계를 상관계수를 사용하여 나타

낸 데이터라고 보시면 됩니다.

말씀드렸다시피 상관 계수는 약 2가지 형태로 분리할 수 있습니다 즉 양의 상관 계수와 음의 상관계수

로 말이죠 이제 상관관계의 상관계수를 수치로 나타낸 값들을 어떻게 해석하는지 알려드리겠습니다

1 양의 상관계수(0 ~ 1)

상관관계에는 상관계수를 사용하여 나타내는 값으로 말씀드렸는데요 0 ~ 1의 값을 보시면 뭔가 느낌이

팍오 실 것 같은데요 상관관계를 나타낼 따 1에 가까우면 가까울수록 비례하다는 뜻입니다

이렇게 하면 0 은 똑같은 건가라고 생각하실 수 있는데 상관관계 표를 봤을 때 상관계수가 1 이면 완전 정비례

한다는 뜻입니다 0 거의 다른 거나 마찬가지 즉 두 그룹에게 어떠한 영향을 주어도 영향이 단 0.001 도 미치지

않는 뜻을 말합니다 

2 음의 상관계수 (-1~ 0)

위에 글을 읽어 보신 분들을 뭔가 팍 느낌이 오셨을 텐데요 음의 상관계수는 정비례 즉 한 그룹이 값이 올라가면

한 그룹은 마이너스로 영향을 미치는 것을 말합니다 0 은 양의 상관계수 똑같이 그냥 아무 영향이 없다는 뜻 

이고요 -1에 가까우면 가까울수록  한 그룹이값이 올라가면 올라갈수록 한그룹이 마이너스되는 값을 상관계수

공식을 사용했더니 -1에 점점 가까워지는 수치입니다

 

 

3 공분산

공분산 값으로는 상관관계의 계수를 알 수 없습니다 공분산을 사용하여 상관계수를 나타내는데 아주 어려운 수식이

사용되기 때문에 여기서 설명드리지 않겠습니다

하지만 공분산으로 상관계수를 나타내는 것은 그다지 큰 의미는 없습니다 좋은 경험이겠지만 지금 이 글을 보실 분들은

데이터 사이언티스트로 Python이나 R 언어를 사용하실 분이나 사용하시는 분일 테고 공분산 값을 하나하나 

상관계수로 나타내자면 현업에서는 수만 개의 데이터를 구하는데 상관계수 구하다가 제가 보기에는 10년은 후딱

지나갈 테니까요 하지만 공분산은 양수 음수로 상관관계가 있는지 없는지 단지 수치는 모르고 그냥 

상관관계 가있다면 True(0~1) 없다면 false(-1~0) 나타내는 것입니다 그냥 단지  " 음수인지 양수인지 판별하여 상관

관계가 있는지 나타내는 것"이라고 생각하시면 될 것 같습니다

 

도움이 되셨기를 빕니다 ㅎㅎ

 

728x90