- 세상의 모든 계산기 수학, 과학, 공학 이야기 수학 ()
공분산 & 상관계수 예시
DATA 출처 : http://blog.naver.com/leerider/100189040284
1. DATA
| x | y |
|---|---|
| 1 | 11 |
| 2 | 12 |
| 3 | 13 |
| 4 | 14 |
| 5 | 15 |
2. 모 분석
| x | y | |
|---|---|---|
| 평균 | 3 | 13 |
| 분산 | 2 | 2 |
| 표준편차 | 1.414... | 1.414... |
(x,y) 공분산 = 2
(x,y) 상관계수 = 2 / (1.414×1.414) = 1
3. 표본 분석
| x | y | |
|---|---|---|
| 평균 | ||
| (표본) 분산 | 2.5 | 2.5 |
| (표본) 표준편차 | sqrt(2.5) | sqrt(2.5) |
(x,y) 표본 공분산 = 2.5
(x,y) 표본 상관계수 = 2.5 / (sqrt(2.5)*sqrt(2.5)) = 1
댓글1
-
세상의모든계산기
상관계수 vs 결정계수
상관계수와 결정계수는 모두 데이터 간 관계를 설명하는 중요한 통계적 지표이지만, 그 의미와 계산 방식, 해석에 차이가 있습니다.
1. 상관계수 (Correlation Coefficient, \( r \))
- 의미: 두 변수 간의 선형 관계의 강도와 방향을 나타내는 값입니다.
- 범위: -1에서 +1 사이의 값을 가집니다.
- +1에 가까울수록 두 변수는 강한 양의 선형 관계를 가지고, -1에 가까울수록 강한 음의 선형 관계를 가집니다.
- 0에 가까울수록 관계가 약하다는 의미입니다.
- 해석: 예를 들어, 상관계수 \( r = 0.8 \)이라면 두 변수는 강한 양의 선형 관계가 있다고 볼 수 있습니다.2. 결정계수 (Coefficient of Determination, \( R^2 \))
- 의미: 회귀분석에서 종속변수의 변동 중에서 설명변수가 설명할 수 있는 비율을 나타냅니다.
- 범위: 0에서 1 사이의 값을 가집니다.
- 1에 가까울수록 회귀 모델이 데이터를 잘 설명하고 있다는 뜻입니다.
- 0에 가까울수록 설명력이 낮다는 의미입니다.
- 해석: 예를 들어 \( R^2 = 0.64 \)라면, 회귀 모델이 종속변수의 변동성 중 64%를 설명한다고 해석할 수 있습니다.
주요 차이점- 용도: 상관계수는 두 변수 간 선형 관계의 강도를 파악하는 데 사용되며, 결정계수는 회귀 모델의 설명력을 평가하는 데 사용됩니다.
- 계산: 상관계수 \( r \)을 제곱하면 결정계수 \( R^2 \)이 나오므로 \( R^2 = r^2 \) 관계가 성립합니다.
기타 참고 : https://adnoctum.tistory.com/188
세상의모든계산기 님의 최근 댓글
V2 갱신 (nonK / K-Type 통합형) 예전에는 직접 코드작성 + AI 보조 하여 프로그램 만들었었는데, 갈수록 복잡해져서 손 놓고 있었습니다. 이번에 antigravity 설치하고, 테스트 겸 새로 V2를 올렸습니다. 직접 코드작성하는 일은 전혀 없었고, 바이브 코딩으로 전체 작성했습니다. "잘 했다 / 틀렸다 / 계산기와 다르다." "어떤 방향에서 코드 수정해 봐라." AI가 실물 계산기 각정 버튼의 작동 방식에 대한 정확한 이해는 없는 상태라서, V1을 바탕으로 여러차례 수정해야 했습니다만, 예전과 비교하면 일취월장 했고, 훨씬 쉬워졌습니다. 2026 02.04 A) 1*3*5*7*9 = 계산 945 B) √ 12번 누름 ㄴ 12회 해도 되고, 14회 해도 되는데, 횟수 기억해야 함. ㄴ 횟수가 너무 적으면 오차가 커짐 ㄴ 결과가 1에 매우 가까운 숫자라면 된 겁니다. 1.0016740522338 C) - 1 ÷ 5 + 1 = 1.0003348104468 D) × = 을 (n세트) 반복해 입력 ㄴ 여기서 n세트는, B에서 '루트버튼 누른 횟수' 3.9398949655688 빨간 부분 숫자에 오차 있음. (소숫점 둘째 자리 정도까지만 반올림 해서 답안 작성) 참 값 = 3.9362834270354... 2026 02.04 1. 분모 먼저 계산 400 × 10000 = 100 × 6000 = GT 결과값 4,600,000 역수 처리 ÷÷== 결과값 0.00000021739 2. 분자 곱하기 ×3 00 00 00 ×4 00 ×1 00 00 최종 결과 = 2,608,695.65217 2026 02.04 해결 방법 1. t=-1 을 기준으로 그래프를 2개로 나누어 표현 ㄴ 근데 이것도 tstep을 맞추지 않으면 문제가 발생할 것기도 하고, 상관이 없을 것 같기도 하고... 모르겠네요. 2. t=-1 이 직접 계산되도록 tstep을 적절하게 조정 tstep=0.1 tstep=0.01 도 해 보고 싶지만, 구간 크기에 따라 최소 tstep 이 변하는지 여기서는 0.01로 설정해도 0.015로 바뀌어버립니다. 그래서 tstep=0.02 로 하는게 최대한 긴 그래프를 얻을 수 있습니다. 2026 02.02 불연속 그래프 ti-nspire는 수학자처럼 연속적인 선을 그리는 것이 아니라, 정해진 `tstep` 간격으로 점을 찍고 그 점들을 직선으로 연결하는 'connect-the-dots' 방식으로 그래프를 그립니다. 여기에 tstep 간격에 따라 특이점(분모=0)이 제외되어 문제가 나타난 것입니다. seq(−2+0.13*t,t,0,23) {−2.,−1.87,−1.74,−1.61,−1.48,−1.35,−1.22,−1.09,−0.96,−0.83,−0.7,−0.57,−0.44,−0.31,−0.18,−0.05,0.08,0.21,0.34,0.47,0.6,0.73,0.86,0.99} t=-1 에서 그래프를 찾지 않습니다. 그 좌우 값인 −1.09, −0.96 두 값의 그래프값을 찾고, Window 범위를 보고 적당히 (연속되도록) 이어서 그래프를 완성하는 방식입니다. 그래서 t=-1에서도 그래프 값이 존재하는 것입니다. 2026 02.02