- 세상의 모든 계산기 수학, 과학, 공학 이야기 수학 ()
공분산 & 상관계수 예시
DATA 출처 : http://blog.naver.com/leerider/100189040284
1. DATA
| x | y |
|---|---|
| 1 | 11 |
| 2 | 12 |
| 3 | 13 |
| 4 | 14 |
| 5 | 15 |
2. 모 분석
| x | y | |
|---|---|---|
| 평균 | 3 | 13 |
| 분산 | 2 | 2 |
| 표준편차 | 1.414... | 1.414... |
(x,y) 공분산 = 2
(x,y) 상관계수 = 2 / (1.414×1.414) = 1
3. 표본 분석
| x | y | |
|---|---|---|
| 평균 | ||
| (표본) 분산 | 2.5 | 2.5 |
| (표본) 표준편차 | sqrt(2.5) | sqrt(2.5) |
(x,y) 표본 공분산 = 2.5
(x,y) 표본 상관계수 = 2.5 / (sqrt(2.5)*sqrt(2.5)) = 1
댓글1
-
세상의모든계산기
상관계수 vs 결정계수
상관계수와 결정계수는 모두 데이터 간 관계를 설명하는 중요한 통계적 지표이지만, 그 의미와 계산 방식, 해석에 차이가 있습니다.
1. 상관계수 (Correlation Coefficient, \( r \))
- 의미: 두 변수 간의 선형 관계의 강도와 방향을 나타내는 값입니다.
- 범위: -1에서 +1 사이의 값을 가집니다.
- +1에 가까울수록 두 변수는 강한 양의 선형 관계를 가지고, -1에 가까울수록 강한 음의 선형 관계를 가집니다.
- 0에 가까울수록 관계가 약하다는 의미입니다.
- 해석: 예를 들어, 상관계수 \( r = 0.8 \)이라면 두 변수는 강한 양의 선형 관계가 있다고 볼 수 있습니다.2. 결정계수 (Coefficient of Determination, \( R^2 \))
- 의미: 회귀분석에서 종속변수의 변동 중에서 설명변수가 설명할 수 있는 비율을 나타냅니다.
- 범위: 0에서 1 사이의 값을 가집니다.
- 1에 가까울수록 회귀 모델이 데이터를 잘 설명하고 있다는 뜻입니다.
- 0에 가까울수록 설명력이 낮다는 의미입니다.
- 해석: 예를 들어 \( R^2 = 0.64 \)라면, 회귀 모델이 종속변수의 변동성 중 64%를 설명한다고 해석할 수 있습니다.
주요 차이점- 용도: 상관계수는 두 변수 간 선형 관계의 강도를 파악하는 데 사용되며, 결정계수는 회귀 모델의 설명력을 평가하는 데 사용됩니다.
- 계산: 상관계수 \( r \)을 제곱하면 결정계수 \( R^2 \)이 나오므로 \( R^2 = r^2 \) 관계가 성립합니다.
기타 참고 : https://adnoctum.tistory.com/188
세상의모든계산기 님의 최근 댓글
기본 어댑터 MODEL : AD0301-1202500GB INPUT : 100~240V, 50~60Hz, 0.8A Max OUTPUT : 12.0V, 2.5A, 30.0W ㄴ 측정시 플러그 외경/내경 : 5.5mm / 2mm 2026 02.15 엑셀 파일로 만드니 전체 160~200MB 정도 나옵니다. 읽고 / 저장하는데 한참 걸리네요. 컴 사양을 좀 탈 것 같습니다. -> 엑셀/한셀에서 읽히지만, 구글 스프레드시트에서는 열리지 않네요. 100만 개 단위로 끊어서 20MB 정도로 분할해 저장하는 편이 오히려 속 편할 것 같습니다. -> 이건 구글 스프레드시트에서도 열리긴 하네요. (약간 버퍼링?이 있습니다) 2026 02.10 엑셀 / 행의 최대 개수, 열의 최대 개수, 셀의 최대 개수 엑셀의 행 개수 제한은 파일 형식에 따라 다르며, 최신 .xlsx 파일 형식은 시트당 최대 1,048,576행까지 지원하지만, 구형 .xls 파일은 65,536행으로 제한됩니다. 따라서 대용량 데이터를 다룰 때는 반드시 최신 파일 형식(.)으로 저장해야 하며, 행과 열의 총 수는 1,048,576행 x 16,384열이 최대입니다. 주요 행 개수 제한 사항: 최신 파일 형식 (.xlsx, .xlsm, .xlsb 등): 시트당 1,048,576행 (2^20). 구형 파일 형식 (.xls): 시트당 65,536행 (2^16). 그 외 알아두면 좋은 점: 최대 행 수: 1,048,576행 (100만여개) 최대 열 수: 16,384열 (XFD) 대용량 데이터 처리: 65,536행을 초과하는 데이터를 다루려면 반드시 .xlsx 형식으로 저장하고 사용해야 합니다. 문제 해결: 데이터가 많아 엑셀이 멈추거나 오류가 발생하면, 불필요한 빈 행을 정리하거나 Inquire 추가 기능을 활용하여 파일을 최적화할 수 있습니다. 2026 02.10 [일반계산기] 매출액 / 원가 / 마진율(=이익율)의 계산. https://allcalc.org/20806 2026 02.08 V2 갱신 (nonK / K-Type 통합형) 예전에는 직접 코드작성 + AI 보조 하여 프로그램 만들었었는데, 갈수록 복잡해져서 손 놓고 있었습니다. 이번에 antigravity 설치하고, 테스트 겸 새로 V2를 올렸습니다. 직접 코드작성하는 일은 전혀 없었고, 바이브 코딩으로 전체 작성했습니다. "잘 했다 / 틀렸다 / 계산기와 다르다." "어떤 방향에서 코드 수정해 봐라." AI가 실물 계산기 각정 버튼의 작동 방식에 대한 정확한 이해는 없는 상태라서, V1을 바탕으로 여러차례 수정해야 했습니다만, 예전과 비교하면 일취월장 했고, 훨씬 쉬워졌습니다. 2026 02.04