Search
Duplicate

수학/ 행렬의 극한, 확률 행렬

행렬의 극한

복소수 성분을 가지는 n×pn \times p 행렬 L,A1,A2,...\bold{L}, \bold{A}_1, \bold{A}_2,...을 생각하자. 모든 1in1 \leq i \leq n1jp1 \leq j \leq p에 대해 다음을 만족할 때 행렬열 A1,A2,...\bold{A}_1, \bold{A}_2,...n×pn \times p 행렬 L\bold{L}로 수렴(converge)한다고 하고, 이때 행렬 L\bold{L}을 행렬열의 극한(limit)이라 한다.
limm(Am)ij=Lij\lim_{m \to \infty} (A_{m})_{ij} = L_{ij}
행렬열의 극한을 L\bold{L}로 표기하면 간단히 다음처럼 나타내기도 한다.
limmAm=L\lim_{m \to \infty} \bold{A}_{m} = \bold{L}
복소수 성분을 가지는 n×pn \times p 행렬열 A1,A2,...\bold{A}_1, \bold{A}_2,... 이 행렬 L\bold{L} 로 수렴한다고 하자. 임의의 PMr×n(C)\bold{P} \in M_{r \times n}(C)QMp×s(C)\bold{Q} \in M_{p \times s}(C) 에 대해 다음이 성립한다.
limmPAm=PLlimmAmQ=LQ\lim_{m \to \infty} \bold{PA}_m = \bold{PL} \\ \lim_{m \to \infty} \bold{A}_m\bold{Q} = \bold{LQ}
limmAm=L\lim_{m \to \infty} \bold{A}^m = \bold{L}인 행렬 AMn×n(C)\bold{A} \in M_{n \times n}(C)와 임의의 가역행렬 QMn×n(C)\bold{Q} \in M_{n \times n}(C)에 대해 다음이 성립한다.
limm(QAQ1)m=QLQ1\lim_{m \to \infty} (\bold{QAQ}^{-1})^m = \bold{QLQ}^{-1}
기하학적으로 복소수 11과 단위원의 내부로 이루어진 집합 S={λC:λ<1λ=1}S = \{ \lambda \in C : |\lambda| < 1 \vee \lambda = 1\}와 복소수 성분을 가지는 정사각행렬 A\bold{A}에 대해 limmAm\lim_{m \to \infty}\bold{A}^m이 존재하기 위한 필요충분조건은 다음 두 조건을 모두 만족하는 것이다.
1.
A\bold{A}의 모든 고윳값은 S\bold{S}의 원소이다.
2.
11A\bold{A}의 고윳값이면 11에 대응하는 고유공간의 차원은 A\bold{A}의 고윳값 11의 중복도와 같다.
위의 집합 SS와 행렬 A\bold{A}에 대해 다음 두 조건이 만족되면 limmAm\lim_{m \to \infty}\bold{A}^m이 존재한다.
1.
A\bold{A}의 모든 고윳값은 SS에 속한다.
2.
A\bold{A}는 대각화 가능하다.

전이 행렬(transition matrix)

음이 아닌 성분을 가지고 각 열의 합이 1인 행렬을 확률 행렬(stochastic matrix) 또는 전이 행렬(transition matrix) 이라 한다.
일반적으로 음이 아닌 성분을 가지고 열의 합이 1인 행렬은 right stochastic matrix라 하고, 행의 합이 1인 행렬은 left stochastic 행렬이라 한다. 벡터는 열벡터를 기본으로 사용하는게 관례이기 때문에 확률 행렬은 right stochastic matrix를 기본으로 생각한다.
열의 합이 1이 되기 때문에 확률 행렬의 열 벡터를 확률 벡터(probability vector)라 한다.
임의의 n×nn \times n 전이 행렬(transition matrix) A\bold{A}에 대해 각 행과 열은 nn 가지 상태(state)에 대응한다. Aij\bold{A}_{ij} 성분은 한 단계에의해 상태 jj에서 상태 ii로 이동할 확률을 나타낸다.
음이 아닌 실수 성분을 가지는 n×nn \times n 행렬 A\bold{A}와 음이 아닌 성분을 가지는 열벡터 vRn\bold{v} \in \mathbb{R}^n, 각 성분이 11인 열벡터 uRn\bold{u} \in \mathbb{R}^n에 대해 다음이 성립한다.
1.
A\bold{A}이 확률행렬이기 위한 필요충분조건은 uA=u\bold{u}^\top \bold{A} = \bold{u}^\top이다.
2.
v\bold{v}가 확률벡터이기 위한 필요충분조건은 uv=(1)\bold{u}^\top\bold{v} = (1)이다.
n×nn \times n 확률 행렬의 곱은 n×nn \times n 확률 행렬이다. 특히 확률 행렬의 거듭제곱은 확률 행렬이다.
확률 행렬과 확률 벡터의 곱은 확률 벡터이다.
성분이 모두 양수인 전이행렬 AMn×n(C)\bold{A} \in M_{n \times n}(C)11이 아닌 고윳값 λ\lambda에 대하여 λ1|\lambda|\le 1이다. 고윳값 11에 대응하는 고유공간의 차원은 11이다.
전이 행렬 A\bold{A}의 어떤 거듭제곱이 0이 아닌 양수만 가지면 전이 행렬 A\bold{A}를 regular라고 한다.
Regular 전이행렬 A\bold{A}와 고윳값 λ\lambda에 대해 다음이 성립한다.
1.
λ1|\lambda| \le 1
2.
λ=1|\lambda| = 1이면 λ=1\lambda = 1이다. 또한 dim(Eλ)=1\dim(E_\lambda) = 1이다.
전이 행렬 A\bold{A}에 대해 다음이 성립한다.
1.
A\bold{A}의 고윳값 11의 중복도는 11이다.
2.
limmAm\lim_{m \to \infty} \bold{A}^m이 존재한다.
3.
L=limmAm\bold{L} = \lim_{m \to \infty} \bold{A}^m은 전이행렬이다.
4.
AL=LA=L\bold{AL} = \bold{LA} = \bold{L}
5.
L\bold{L}의 모든 열은 동일하다. L\bold{L}의 각 열 v\bold{v}는 고윳값 11에 대응하는 고유벡터이자 확률벡터로 유일하게 결정된다. (이 벡터 v\bold{v}를 regular 전이 행렬 A\bold{A}의 고정확률벡터(fixed probability vector 또는 stationary vector)라 한다.)
6.
임의의 확률 ww에 대하여 limm(Amw)=v\lim_{m \to \infty} (\bold{A}^m w) = \bold{v}이다.

마르코프 과정(Markov process), 마르코프 연쇄(Markov chain)

시간이 지남에 따라 다른 상태로 바뀌는 과정을 확률 과정(stochastic process)라 한다. 각 상태가 바뀌는 과정은 확률로 기술된다.
일반적으로 이 확률은 묻는 시점의 상태, 묻는 시점의 시간, 대상의 과거와 지금을 종합한 상태의 일부 또는 전부, 다른 대상의 과거와 지금을 종합한 상태의 일부 또는 전부에 영향을 받는다.
시간이 고정되어 있고 대상이 한 상태에서 다른 상태로 바뀌는 확률이 시간, 이전 상태 혹은 다른 요소에 무관하게 오직 두 상태에 의해서만 결저오딜 떄, 이 확률 과정을 마르코프 과정(Markov process)라 한다. 가능한 상태의 경우의 수가 유한한 마르코프 과정을 마르코프 연쇄(Markov chain)이라 한다.

정사각행렬의 고윳값의 상한(bound)

정사각행렬 AMn×n(C)\bold{A} \in M_{n \times n}(C)를 생각하자. 1i,jn1 \leq i, j \leq n에 대해 A\bold{A}ii행 성분의 절댓값의 합을 ρi(A)\rho_i(\bold{A})라 하고, jj열 성분의 절대값을 νj(A)\nu_j(\bold{A})라 하자. 즉 다음과 같다.
ρi(A)=j=1nAij (i=1,2,...,n)νj(A)=i=1nAij (j=1,2,...,n)\rho_i(\bold{A}) = \sum_{j=1}^n |A_{ij}| \ (i = 1,2,...,n) \\ \nu_j(\bold{A}) = \sum_{i=1}^n |A_{ij}| \ (j = 1,2,...,n)
A\bold{A}의 행 합(row sum) ρ(A)\rho(\bold{A})와 열 합(column sum) ν(A)\nu(\bold{A})는 다음과 같이 정의한다.
ρ(A)=max{ρi(A):1in}ν(A)=max{νj(A):1jn}\rho(\bold{A}) = \max \{ \rho_i(\bold{A}) : 1 \leq i \leq n\} \\ \nu(\bold{A}) = \max \{ \nu_j (\bold{A}) : 1 \leq j \leq n\}
n×nn \times n 행렬 A\bold{A}에 대하여 복소평면에서 Aii\bold{A}_{ii}를 중심으로 하고 반지름이 ri=ρi(A)Aiir_i = \rho_i(\bold{A}) - |\bold{A}_{ii}|인 원판을 ii번째 게르시고린 원판(Gershgorin disk) CiC_i이라 한다. 즉 CiC_i는 다음과 같이 정의된 집합이다.
Ci={zC:zAiiri}C_i = \{ z \in C : |z - \bold{A}_{ii}| \leq r_i \}
행렬 AMn×n(C)\bold{A} \in M_{n \times n}(C)의 모든 고윳값은 게르시고린 원판에 속한다. 이것을 게르시고린의 원 정리(Gershgorin’s circle theorem)이라한다.
이는 당연히 실수에 대해서도 성립한다.
행렬 AMn×n(C)\bold{A} \in M_{n \times n}(C)의 임의의 고윳값 λ\lambda에 대하여 λAkkρ(A)|\lambda-\bold{A}_{kk}|\leq \rho(\bold{A})이다.
행렬 AMn×n(C)\bold{A} \in M_{n \times n}(C)의 임의의 고윳값 λ\lambda에 대하여 λmin{ρ(A),ν(A)}|\lambda| \leq \min \{\rho(\bold{A}), \nu(\bold{A})\}이다.
모든 성분이 양수인 정사각 행렬 AMn×n(C)\bold{A} \in M_{n\times n}(C)를 생각하자. λ\lambdaλ=ρ(A)|\lambda| = \rho(\bold{A})A\bold{A}의 복소수 고윳값이면 λ=ρ(A)\lambda = \rho(\bold{A})이고 {u}\{\bold{u}\}EλE_\lambda의 기저이다. 이때 u\bold{u}는 각 성분이 11인 복소수 열벡터 uCn\bold{u} \in C^n이다.
여기서 EλE_\lambda는 행렬 A\bold{A}의 고윳값 λ\lambda에 대응하는 고유공간(eigenspace)를 의미한다.
모든 성분이 양수인 정사각 행렬 AMn×n(C)\bold{A} \in M_{n \times n}(C)λ=ν(A)|\lambda| = \nu(\bold{A})A\bold{A}의 고윳값 λ\lambda에 대하여 λ=ν(A)\lambda = \nu(\bold{A})이고 EλE_\lambda의 차원은 11이다.

참조