- 세상의 모든 계산기 수학, 과학, 공학 이야기 확률통계 ()
마르코프 체인, 마코브 체인, 마르코프 연쇄
위키피디아 펌 및 AI 설명 추가
https://ko.wikipedia.org/wiki/%EB%A7%88%EB%A5%B4%EC%BD%94%ED%94%84_%EC%97%B0%EC%87%84
확률론에서 마르코프 연쇄(Марков 連鎖, 영어: Markov chain)는 이산 시간 확률 과정이다.
마르코프 연쇄는 시간에 따른 계의 상태의 변화를 나타낸다. 매 시간마다 계는 상태를 바꾸거나 같은 상태를 유지한다. 상태의 변화를 전이라 한다. 마르코프 성질은 과거와 현재 상태가 주어졌을 때의 미래 상태의 조건부 확률 분포가 과거 상태와는 독립적으로 현재 상태에 의해서만 결정된다는 것을 뜻한다
정의
확률 공간(Probability Space) \( \Omega \)와 모든 집합이 가측 집합인 가측 공간(Measurable Space) \( E \)가 주어졌다고 하자.
그렇다면, 메모리(Memory) \( k \)의 마르코프 연쇄는 다음 성질을 만족시키는 일련의 확률 변수 \( X_1, X_2, \dots \colon \Omega \to E \)이다.
(가측공간은 주로 상태공간의 부분집합임)
만약 다음 식의 양변이 존재한다면,
\[
\Pr(X_{n} = x_{n} \mid X_{n-1} = x_{n-1}, \ldots, X_{1} = x_{1}) = \\
\Pr(X_{n} = x_{n} \mid X_{n-1} = x_{n-1}, \ldots, X_{n-K} = x_{n-K})
\]
이 경우, \( E \)를 메모리 \( k \)의 마르코프 연쇄 \( \{X_i\} \)의 상태 공간이라고 한다. 만약 메모리가 주어져 있지 않는 마르코프 연쇄는 메모리가 1인 마르코프 연쇄이다.
메모리가 1인 마르코프 연쇄는 과거의 상태가 알려져 있더라도 미래 상태의 조건부 기댓값에 영향을 미치지 않는 과정을 나타낸다. 이러한 성질을 마르코프 성질이라고 한다.
다음 성질을 만족시키는 마르코프 연쇄 \( X_i \colon \Omega \to E \)를 시간 동질 마르코프 연쇄라고 한다. 모든 \( i \in \mathbb{N} \), \( x, y \in E \)에 대하여,
\[
\Pr(X_{i+1} = x \mid X_{i} = y) = \Pr(X_{i} = x \mid X_{i-1} = y)
\]
다시 말해, 시간에 따라서 전이 확률은 변하지 않는다.
이와 유사하게, \( i \in \mathbb{N} \) 대신 실변수 \( t \in \mathbb{R} \)에 의존하는 경우도 정의할 수 있다. 이 경우를 연속 마르코프 과정이라고 한다.
예

ㄴ 유향 그래프로 나타낸 시간 동질 마르코프 연쇄의 예
상태 공간이 (모든 부분집합이 측도 가능한) 유한 집합이라고 하자. 이 경우, 시간 동질 마르코프 연쇄는 각 변에 0과 1 사이의 실수가 붙어 있는 유향 그래프로 표현된다. 이 경우 그래프는 다음과 같이 해석된다.
- 각 꼭짓점은 상태 공간의 원소에 대응된다.
- 상태 \( x_1 \in E \)에서 다른 상태 \( x_2 \in E \)로 가는 변은 정확히 하나가 있으며, 이 변에 붙어 있는 값은 \( \Pr(X_{n+1} = x_2 \mid X_n = x_1) \)이다. 만약 이 확률이 0이라면 변을 생략할 수 있다.
이러한 그래프를 상태 다이어그램 (영어: *state diagram*)이라고 한다.
행의 합이 1인 체인 vs 열의 합이 1인 체인?
일반적인 마르코프 체인 설명을 보면 열(세로축)의 합이 1인 것으로 설명합니다.
중고등학교 때 배웠던 행렬의 계산 과정과도 일치하구요.
그런데 아래 링크의 설명에서는 행(가로축)의 합이 1인 것을 설명합니다.
$$
Q=\left[\begin{array}{ccc}
1 / 3 & 2 / 3 & 0 \\
0 & 0 & 1 \\
1 / 4 & 1 / 2 & 1 / 4
\end{array}\right]
$$
전이 행렬 $Q$ 의 직관적인 의미는 '전체 마르코프 체인의 변화 추이'입니다. 쉽게 말해 전체 시스템이 어떤 상태로 존재할 확률에 대한 표현이라는 의미입니다. 따라서 전이 행렬의 각 row(혹은 col)의 합은 반드시 1이고, 모든 element는 0이상 1이하의 값을 갖습니다.
전이 행렬과 현재 상태를 안다면 전체 마르코프 체인의 상태값을 구할 수 있습니다.
현재 시점을 $n$, 상태 $X_n$ 이 분포 $s$ (1xM 행렬) 를 따른다고 하면,
$$
\begin{gathered}
P\left(X_{n+1}=j\right)=\sum_i P\left(X_{n+1}=j \mid X_n=i\right) P\left(X_n=i\right) \\
=\sum_i s_i \times q_{i j}=s Q
\end{gathered}
$$
$s_i$ 는 ( 1 xM ) 행렬이고, $q_{i j}$ 는 ( MxM ) 행렬이므로 위 연산의 결과는 ( 1 xM ) 행렬이 됩니다. 즉, $\mathrm{n}+1$ 시점의 전이 행렬은 $(1 \mathrm{xM})$ 크기의 $s Q$ 가 되는 것입니다. 그렇다면 $\mathrm{n}+2$ 시점은 어떨까요?
Claude 3.5 Sonnet
네, 전이 행렬에서 행(row)의 합이 1인 것과 열(column)의 합이 1인 것은 중요한 차이가 있습니다. 이 차이를 설명해 드리겠습니다:
- 행(Row)의 합이 1인 경우:
- 이는 일반적인 마르코프 체인의 전이 행렬을 나타냅니다.
- 각 행은 현재 상태에서 다른 모든 가능한 상태로 전이할 확률을 나타냅니다.
- 모든 가능한 전이의 확률 합은 1이어야 하므로, 각 행의 합이 1이 됩니다.
- 이를 "행 확률적(row stochastic)" 행렬이라고 합니다.
- 열(Column)의 합이 1인 경우:
- 이는 역방향 전이를 나타내는 행렬입니다.
- 각 열은 다른 모든 상태에서 현재 상태로 전이해 올 확률을 나타냅니다.
- 이를 "열 확률적(column stochastic)" 또는 "좌 확률적(left stochastic)" 행렬이라고 합니다.
- 이러한 행렬은 일부 특수한 경우에 사용됩니다 (예: 역방향 마르코프 과정).
주요 차이점:
- 해석: 행의 합이 1인 경우는 "현재 상태에서 다음 상태로의 전이"를 나타내고, 열의 합이 1인 경우는 "이전 상태에서 현재 상태로의 전이"를 나타냅니다.
- 사용: 일반적인 마르코프 체인에서는 행의 합이 1인 행렬을 주로 사용합니다.
- 계산: 행의 합이 1인 경우, 상태 벡터를 행렬의 왼쪽에 곱하여 다음 상태를 계산합니다. 열의 합이 1인 경우, 상태 벡터를 행렬의 오른쪽에 곱합니다.
결론적으로, 주어진 설명에서 "전이 행렬의 각 row의 합은 반드시 1"이라는 부분이 일반적인 마르코프 체인의 전이 행렬을 더 정확하게 설명하고 있습니다.
열이든 행이든 한쪽만 일관적으로 사용하면 문제가 없는데,
AI의 경우 두개를 짬뽕시켜서 답변하는 경우가 있습니다.
주의하세요.
기타 참고
https://www.puzzledata.com/blog190423/
댓글2
-
세상의모든계산기
A -> B -> C 단계로의 아이템 강화 설명
A상태에서 강화 시도
- A 유지 : A 70%
- B로 상승: B 30%B상태에서 강화 시도
- A로 하락 : 50%
- B 유지 : 30%
- C로 상승 : 20%C상태에서 강화 불가 : 흡수상태초기에 A상태=90개, B상태=10개 를 모두 강화할 때
다음상태는 A상태=68개, B상태=30개, C상태=2개 가 될 것으로 예측.
주어진 정보를 마르코프 체인의 관점에서 해석해보겠습니다.
- 상태 (States):
- A, B, C 세 가지 상태가 있습니다.
- 전이 행렬 (Transition Matrix): 첨부된 이미지의 왼쪽 행렬이 전이 행렬입니다.
\[
P = \begin{bmatrix}
0.7 & 0.5 & 0 \\
0.3 & 0.3 & 0 \\
0 & 0.2 & 1
\end{bmatrix} \]- $ P_{\textit{ij}} $는 상태 j에서 상태 i로 전이할 확률을 나타냅니다.
- 예: $ P_{\textit{11}} =0.7$ 은 A상태에서 A상태로 남을 확률이 70%임을 의미합니다.
- 초기 상태 벡터 (Initial State Vector):
\[
I_0 = \begin{bmatrix}
90 \\
10 \\
0
\end{bmatrix}
\]
90개가 A상태, 10개가 B상태에 있음을 나타냅니다. - 다음 상태 계산:
I₁ = P * I₀\[
I_1 = \begin{bmatrix}
0.70 & 0.50 & 0.00 \\
0.30 & 0.30 & 0.00 \\
0.00 & 0.20 & 1.00
\end{bmatrix}
\times
\begin{bmatrix}
90 \\
10 \\
0
\end{bmatrix}
\]계산해 보면:
\[
\begin{aligned}
I_1[1행] &= (0.70 \times 90) + (0.50 \times 10) + (0.00 \times 0) \\
&= 63 + 5 \\
&= 68 \\
\\
I_1[2행] &= (0.30 \times 90) + (0.30 \times 10) + (0.00 \times 0) \\
&= 27 + 3 \\
&= 30 \\
\\
I_1[3행] &= (0.00 \times 90) + (0.20 \times 10) + (1.00 \times 0) \\
&= 0 + 2 \\
&= 2
\end{aligned}
\] - 해석:
- 한 번의 전이 후, 68%가 A상태, 30%가 B상태, 2%가 C상태에 있게 됩니다.
- 이는 초기 100개 중 68개가 A상태, 30개가 B상태, 2개가 C상태가 될 것이라는 예측과 일치합니다.
- 특징:
- C상태는 흡수 상태(absorbing state)입니다. 한 번 C에 도달하면 빠져나올 수 없습니다.
- 시간이 지남에 따라 더 많은 항목들이 C상태로 이동할 것입니다.
이 마르코프 체인 모델은 각 강화 시도가 독립적이며, 다음 상태가 오직 현재 상태에만 의존한다는 가정을 바탕으로 합니다. 이를 통해 시스템의 미래 상태를 예측하고 분석할 수 있습니다.
- 상태 (States):
세상의모든계산기 님의 최근 댓글
현재로서는 잭 규격을 알 수 없습니다. 2026 02.15 엑셀 파일로 만드니 전체 160~200MB 정도 나옵니다. 읽고 / 저장하는데 한참 걸리네요. 컴 사양을 좀 탈 것 같습니다. -> 엑셀/한셀에서 읽히지만, 구글 스프레드시트에서는 열리지 않네요. 100만 개 단위로 끊어서 20MB 정도로 분할해 저장하는 편이 오히려 속 편할 것 같습니다. -> 이건 구글 스프레드시트에서도 열리긴 하네요. (약간 버퍼링?이 있습니다) 2026 02.10 엑셀 / 행의 최대 개수, 열의 최대 개수, 셀의 최대 개수 엑셀의 행 개수 제한은 파일 형식에 따라 다르며, 최신 .xlsx 파일 형식은 시트당 최대 1,048,576행까지 지원하지만, 구형 .xls 파일은 65,536행으로 제한됩니다. 따라서 대용량 데이터를 다룰 때는 반드시 최신 파일 형식(.)으로 저장해야 하며, 행과 열의 총 수는 1,048,576행 x 16,384열이 최대입니다. 주요 행 개수 제한 사항: 최신 파일 형식 (.xlsx, .xlsm, .xlsb 등): 시트당 1,048,576행 (2^20). 구형 파일 형식 (.xls): 시트당 65,536행 (2^16). 그 외 알아두면 좋은 점: 최대 행 수: 1,048,576행 (100만여개) 최대 열 수: 16,384열 (XFD) 대용량 데이터 처리: 65,536행을 초과하는 데이터를 다루려면 반드시 .xlsx 형식으로 저장하고 사용해야 합니다. 문제 해결: 데이터가 많아 엑셀이 멈추거나 오류가 발생하면, 불필요한 빈 행을 정리하거나 Inquire 추가 기능을 활용하여 파일을 최적화할 수 있습니다. 2026 02.10 [일반계산기] 매출액 / 원가 / 마진율(=이익율)의 계산. https://allcalc.org/20806 2026 02.08 V2 갱신 (nonK / K-Type 통합형) 예전에는 직접 코드작성 + AI 보조 하여 프로그램 만들었었는데, 갈수록 복잡해져서 손 놓고 있었습니다. 이번에 antigravity 설치하고, 테스트 겸 새로 V2를 올렸습니다. 직접 코드작성하는 일은 전혀 없었고, 바이브 코딩으로 전체 작성했습니다. "잘 했다 / 틀렸다 / 계산기와 다르다." "어떤 방향에서 코드 수정해 봐라." AI가 실물 계산기 각정 버튼의 작동 방식에 대한 정확한 이해는 없는 상태라서, V1을 바탕으로 여러차례 수정해야 했습니다만, 예전과 비교하면 일취월장 했고, 훨씬 쉬워졌습니다. 2026 02.04