Linear Gaussian systems
•
다음의 결합 분포를 갖는 결합 가우시안인 2개 확률 벡터 을 고려하자. 이것은 선형 가우시안 시스템의 예이다.
◦
여기서 는 크기의 행렬이다.
•
(위의 식을 포함해서 이하의 식에서 나오는 표기에 대해)
◦
위첨자는 prior를 의미한다. 고로 는 prior 가 됨.
◦
위첨자는 posterior를 의미한다. 고로 는 posterior 가 됨.
Joint distribution
•
해당하는 결합 분포 는 그 자체로 차원 가우시안이고 평균과 공분산 행렬은 다음과 같이 주어진다. (이 결과는 moment 매칭으로 얻을 수 있음)
Posterior distribution (Bayes’ rule for Gaussians)
•
선형 가우시안 시스템으로부터 posterior 를 계산하는 것을 고려하자. 결합 가우시안을 조건화하기 위한 방정식을 사용하면 다음과 같이 주어지는 posterior를 찾을 수 있다.
•
이것은 가우시안에 대한 베이즈룰이라고 한다.
•
prior 가 가우시안이면 likelihood 도 가우시안이고 posterior 도 가우시안임을 볼 수 있다.
◦
posterior 분포가 prior와 같은 형식을 갖기 때문에 가우시안 prior는 가우시안 likelihood와 conjugate prior라고 할 수 있다. 즉 가우시안은 베이지안 업데이트에 닫혀 있다.
•
을 정의하여 이 방정식들을 단순화 할 수 있다.
•
또한 Kalman gain matrix를 정의할 수 있다.
•
이것으로부터 posterior를 얻을 수 있다.
•
다음에 유의하라.
•
따라서 posterior 공분산을 다음과 같이 작성할 수 있다.
•
행렬 역 lemma를 사용하여 다음 형식으로 posterior를 재작성할 수 있다.
◦
이것은 시간이 걸리는 대신 시간이 걸린다.
•
마지막으로 posterior에 대해 해당하는 정규화 상수는 관찰된 값에서 평가된 의 marginal이다.
•
이것으로부터 log marginal likelihood를 쉽게 계산할 수있다.
A general calculus for linear Gaussian systems
Moment and canonical parameterization
•
moment 형식이나 canonical (information) 형식에서 가우시안 분포를 표현할 수 있다. moment 형식에서 다음을 갖는다.
•
여기서 는 를 보장하는 정규화 상수이다.(은 의 차원이다.)
•
2차 형식을 펼치고 항목을 모아서 canonical 형식을 얻을 수 있다.
•
여기서
•
는 정밀도 행렬이라 부른다.
•
potential이 확률 분포일 필요는 없다는 것에 유의하라. 그리고 정규화(적분이 1이 되도록)가 가능하지 않아도 된다. 증거의 likelihood를 계산할 수 있도록 상수 항( 또는 )을 추적한다.
Multiplication and division
•
가우시안의 경우에 곱셈과 나눗셈을 canonical 형식을 사용하여 다음처럼 정의한다.
◦
과 를 곱하려면 적절한 차원을 추가하여 둘을 동일한 영역 까지 확장한 다음 적절한 차원에 0을 추가하여 다음을 계산한다.
•
나눗셈은 다음처럼 정의한다.
Marginalization
•
를 변수의 집합 에 대해 potential로 둔다. 변수들의 부분집합 에 대한 potential을 marginalizing을 통해 계산할 수 있다. 라 표기하고
•
차원의 과 차원의 에 대해 다음을 보일 수 있다.
•
여기서
Conditioning on evidence
•
에 정의된 potential을 고려하자. 값 를 관찰한다고 가정하자. 새로운 potential은 다음의 차원이 축소된 객체로 주어진다.
Converting a linear-Gaussian CPD to a canonical potential
•
마지막으로 초기 potential을 어떻게 만드는지를 논의한다. 방향성(directed) 가우시안 graphical 모델로 시작한다고 가정한다. 특히 선형 가우시안 conditional probability distribution(CPD)를 가진 노드를 고려한다.
•
여기서 이다. 따라서 canonical(표준) 파라미터를 다음과 같이 설정할 수 있다.
•
특히 이면 위의 결과는 다음과 같다.
Example: Product of Gaussians
•
위의 결과의 응용으로 두 가우시안의 (비정규화된) 곱을 다음처럼 유도할 수 있다.
•
여기서
•
posterior 정밀도는 개별 정밀도의 합이고 posterior 평균은 개별 평균의 정밀도-가중 결합임을 볼 수 있다. 또한 이 결과를 하나의 행렬 역만 요구하는 다음과 같은 방법으로 재작성할 수 있다.
•
스칼라의 경우에 다음이 된다.