- 세상의 모든 계산기 수학, 과학, 공학 이야기 수학 ()
공분산 & 상관계수 예시
DATA 출처 : http://blog.naver.com/leerider/100189040284
1. DATA
| x | y |
|---|---|
| 1 | 11 |
| 2 | 12 |
| 3 | 13 |
| 4 | 14 |
| 5 | 15 |
2. 모 분석
| x | y | |
|---|---|---|
| 평균 | 3 | 13 |
| 분산 | 2 | 2 |
| 표준편차 | 1.414... | 1.414... |
(x,y) 공분산 = 2
(x,y) 상관계수 = 2 / (1.414×1.414) = 1
3. 표본 분석
| x | y | |
|---|---|---|
| 평균 | ||
| (표본) 분산 | 2.5 | 2.5 |
| (표본) 표준편차 | sqrt(2.5) | sqrt(2.5) |
(x,y) 표본 공분산 = 2.5
(x,y) 표본 상관계수 = 2.5 / (sqrt(2.5)*sqrt(2.5)) = 1
댓글1
-
세상의모든계산기
상관계수 vs 결정계수
상관계수와 결정계수는 모두 데이터 간 관계를 설명하는 중요한 통계적 지표이지만, 그 의미와 계산 방식, 해석에 차이가 있습니다.
1. 상관계수 (Correlation Coefficient, \( r \))
- 의미: 두 변수 간의 선형 관계의 강도와 방향을 나타내는 값입니다.
- 범위: -1에서 +1 사이의 값을 가집니다.
- +1에 가까울수록 두 변수는 강한 양의 선형 관계를 가지고, -1에 가까울수록 강한 음의 선형 관계를 가집니다.
- 0에 가까울수록 관계가 약하다는 의미입니다.
- 해석: 예를 들어, 상관계수 \( r = 0.8 \)이라면 두 변수는 강한 양의 선형 관계가 있다고 볼 수 있습니다.2. 결정계수 (Coefficient of Determination, \( R^2 \))
- 의미: 회귀분석에서 종속변수의 변동 중에서 설명변수가 설명할 수 있는 비율을 나타냅니다.
- 범위: 0에서 1 사이의 값을 가집니다.
- 1에 가까울수록 회귀 모델이 데이터를 잘 설명하고 있다는 뜻입니다.
- 0에 가까울수록 설명력이 낮다는 의미입니다.
- 해석: 예를 들어 \( R^2 = 0.64 \)라면, 회귀 모델이 종속변수의 변동성 중 64%를 설명한다고 해석할 수 있습니다.
주요 차이점- 용도: 상관계수는 두 변수 간 선형 관계의 강도를 파악하는 데 사용되며, 결정계수는 회귀 모델의 설명력을 평가하는 데 사용됩니다.
- 계산: 상관계수 \( r \)을 제곱하면 결정계수 \( R^2 \)이 나오므로 \( R^2 = r^2 \) 관계가 성립합니다.
기타 참고 : https://adnoctum.tistory.com/188
세상의모든계산기 님의 최근 댓글
감사합니다. 주말 잘 보내세요. 2026 03.06 [fx-570 ES] 과학 상수를 이용한 계산에서 에러 발생 상황 https://kin.naver.com/qna/detail.naver?d1id=11&dirId=1118&docId=492235162&page=1&answerNo=1 vs 2026 03.01 과학상수를 이용한 계산 중 자릿수 한계로 인한 에러 발생 가능성 https://allcalc.org:443/board_calculators/6925#comment_57029 2026 03.01 기본 어댑터 MODEL : AD0301-1202500GB INPUT : 100~240V, 50~60Hz, 0.8A Max OUTPUT : 12.0V, 2.5A, 30.0W ㄴ 측정시 플러그 외경/내경 : 5.5mm / 2mm 2026 02.15 엑셀 파일로 만드니 전체 160~200MB 정도 나옵니다. 읽고 / 저장하는데 한참 걸리네요. 컴 사양을 좀 탈 것 같습니다. -> 엑셀/한셀에서 읽히지만, 구글 스프레드시트에서는 열리지 않네요. 100만 개 단위로 끊어서 20MB 정도로 분할해 저장하는 편이 오히려 속 편할 것 같습니다. -> 이건 구글 스프레드시트에서도 열리긴 하네요. (약간 버퍼링?이 있습니다) 2026 02.10