평균, 분산, 표준 편차, 공분산, 상관 계수 의 개념

2022. 10. 27. 01:23재무 관리

728x90

안녕하세요 인공지능 데이터 분석 데이터 시각화 재무관리 경영 경제학 등에서 평균 분산 표준편차 공분산 상관계수는

아무리 분리해놓고 싶어도 분리를 해둘 순 없습니다 꼭 필요한 수학적 지식입니다 엄청 쉬우니까 수학이라고 겁먹지 말고

꼭 한번 봐주세요 

 

저위에 여러 분야에서 는 평균 분산 표준편차 공분산 상관계수의 개념은 꼭 필요합니다 제가 위에 과목들을 하기 위해서

필요한 저 6가지의 수학 지식들을 알려드리겠습니다 여러 자료 찾아보지 말고 여기서 딱 개념만 잡으면 다시는 알아보시고

나 다시 알아야 할 필요가 없는 개념을 정리해두었습니다

 

평균 : 간단하게 평균이라는 것은 전체 수중 딱 중간이 되는 값은 무엇인가? 위에 문제를 계산해보면 (175 + 165+ 180 + 160 )/ 4 하여 계산하는데요 사실 평균을 구하는 것은 어렵지 않습니다 식을 풀어보면  175 * 1/4 + 165 * 1/4 + 180* 1/4 + 160* 1/4입니다 즉 약간 어렵게 말하면  가중치의 값을 계산하여 다 더한 값입니다 그리고 하나의 특징은 각각의 가중치가 갑이 똑같이 1/4라는 것입니다 우리는이겠을 단순 평균이라고  부릅니다

( 이해가 어렵다면 우리가 아는 그것을 그냥 또 다른 이름으로 단순 평균이라고 부른다 이 정도만 아셔도 돼요)

 

분산분산은 원래의 값과 평균을 뺀 것을 곱한 것입니다 더쉽게 말하면 편차를 뺀 값을 곱한것 입니다 더더 쉽게말하면 위에 (170+165+180+160)/4 = 170입니다 즉 평균이 170인데요 175(A의 키 ) - 170(평균) = 5 <- 이 5 값이 편차입니다 즉 평균에서 떨어져 있는 값입니다 이것을 다제곱해서 더한 값이 분산입니다  왜 제곱을 하냐고요? 만약 두 명에 JON과 SON이 있다고 가정해보겠습니다 JON은 175이고 SON의 키는 165입니다 둘의 평균은 170입니다 JON의 편차는 5이고 SON의 편차는 -5입니다 그러면 둘이 더하면 0 이 됩니다 그래서 정상적인 식이 나올 수 없어 음수를 없애기 위해 제곱을 해주는 것입니다 

 

표준편차표준편차는 아주 쉽습니다 그냥 " 분산에 루트"를 씌워준 것입니다 즉 제곱근을 구해준 것입니다 , 분산에 루트를 씌워 값을 계산하는 이유는 분산은 말했다시피 제곱을 하여 음수를 없애준다고 하였습니다 하지만 제곱을 하면 값이 엄청 커지는데요 그래서 루트를 씌워 평균에서 얼마 정도 떨어져 있나? 를 확인하여보는 것입니다 

 

공분산:  만약 식이 A와 B 두 개라면 A 식의 편차 * B 식의 편차를 곱하고 인원수대로 나눠주는 것인데요 좀 더 쉽게 설명하겠습니다

 

* 만약 1반에 A라는 친구의 키는 170이고 B 친구는 190입니다 하지만 A의 몸무게는 60이고 B의 몸무게는 85입니다

1반의 키의 평균은 180cm이고 몸무게의 평균은 72.5kg입니다 

A친구의 키와 몸무게의 각각 편차는 ( 키: - 10cm , 몸무게 : -12.5 kg)

B친구의 키와 몸무게의 각각 편차는 ( 키: 10cm , 몸무게 : 12.5 kg)입니다 

그러면 A의 편차곱: -10 * -12.5  +  B의 편차곱: 10 *  12.5  =  250입니다 여기에 250/2(인원수) =125  즉 1반의 공분산은 125입니다  그럼 여기서 질문 하나가 생길 것 같습니다 그래서 공분산이 뭔가요 ? 라는 물음이 생길것 같습니다 공분산에 대해서 알아봤는데 그래서 공분산이 뭐지? 배웠는데 배우지 않은 그런  사실 공분산 은 한눈에 직관적으로 보기 어렵습니다 공분산은 식의 상관관계를 알아보려고 하는데 직관적으로 알기 어렵습니다 그래서 사실 그냥 상관계수를 만들기 위한식으로 보시면 될 것 같습니다 이름은 왜 공분산이냐 ? 그냥 수학자들이 만든것 이니 공분산은 저렇게 구하는것이고 상관계수를 만들기위해서 사용하는구나 정도만 아시면 될것같습니다 

 

상관계수상관계수는 공분산 /( 1번 표준 편차 + 2번 표준 편차 )입니다 상관계수는 -1 ~ 1 사이 값으로 올가가 거나 떨어지지 않는 갑입니다 상관계수로 알아볼 수 있는 것은 위에 식을 예로 들겠습니다 아까 말했듯이 공분산은 125 입니다

125 ( 공분산) /( 14.14xx( 1반의 키의 표준편차) *  17.67 XXX( 1반 몸무게의 표준편차 )) = 0.5인데요 그러면 상관계수는 양수는 1반에 있는 사람이 키가 크면 클수록 몸무게도 영향받는다는 것입니다  만약 음수면 키가 크면 몸무게는 작아지는 그런 상관관계를 볼 수 있습니다

 

조금 쉽게 말해보자면 상관계수가 1에 가깝다면 한쪽이커지면다면 다른 한쪽도 커지는다는 뜻이고 만약 상관계수가 음수라면 즉 -1에 가까우면 가까워질수록  다른 한쪽이 작아지면 똑같이 작아진다는 것입니다 

 

728x90