서로 다른 가우시안의 혼합
•
만일 가우시안 분포를 따르는 2개의 센서가 존재하고, 이 2개의 센서를 조합하여 관측 결과를 얻으려고 한다면, 두 관측 결과를 가중치를 이용하여 선형 결합해서 최종 결과를 얻을 수 있다. 아래 흐름을 확장하면 2개가 아니라 개의 결과에 대한 조합도 가능함을 알 수 있다.
•
우선 두 센서의 정밀도에 차이가 있을 수 있으므로, 그 정밀도를 기준으로 가중 평균을 내는 것이 합리적이다. 정밀도는 분산의 역수이므로, 두 센서의 정밀도는 다음과 같이 정의할 수 있다. (센서의 분산은 제조사에서 알려준다고 가정하자)
•
보통 1번의 측정 결과만 이용하지 않고, 번의 측정 결과를 이용하게 되는데, 두 센서가 각각 다른 측정 횟수를 가질 수 있다고 한다면, 정밀도는 다음과 같이 정의될 수 있다.
•
두 센서의 측정 결과는 각 센서의 측정 결과에 대한 평균으로 정의할 수 있다.
•
각 센서의 결과에 각 센서의 정밀도를 가중치로 곱하고, 그것을 각 센서의 정밀도의 합으로 나눠서 전체 측정 결과의 평균을 얻는다. (각 센서 정밀도의 합으로 나누는 것은 가중 평균을 계산할 때, 가중치의 합으로 결과를 나눔으로써 가중치의 합이 1이 되도록 조정하는 것을 의미한다.)
•
분산은 정밀도의 역수이고, 전체 정밀도는 각 센서의 정밀도의 합으로 정의할 수 있다.
•
전체 평균과 분산을 구했으므로, 전체에 대한 가우시안 분포를 정의할 수 있다.
노이즈에 대한 가우시안
•
만일 어떤 가우시안 분포를 따르는 측정 결과에 노이즈가 끼어 있다면, 그 측정 결과에 대한 분포를 로 놓고, 노이즈가 없었을 경우의 분포를 가우시안 잠재 분포 로 두면, 두 분포가 노이즈에 의해 선형 관계를 갖는다고 할 수 있고, 이를 바탕으로 측정 결과에 대해 노이즈가 제거된 결과를 얻을 수 있다.
•
일반적으로 노이즈가 낀 분포 와 잠재 분포 에 대해 다음과 같은 관계를 정의한다.
◦
여기서 는 평균 , 분산 인 노이즈가 없는 분포를 의미하고,
◦
측정된 결과 는 에 노이즈텀 이 낀 것으로 정의한다.
◦
노이즈텀 은 가우시안 분포를 따르며, 평균이 0이고 분산이 인 것으로 정의한다.
•
위와 같이 정의하면, 는 에 대해 노이즈가 추가된 것이므로 다음과 같이 조건부 분포를 정의할 수 있다.
◦
여기서 는 정밀도로
•
이를 이용하여 사전 분포 는 다음과 같이 정의할 수 있다.
◦
여기서 는 알려진 값이 아니기 때문에 임의로 조정하는 값이다.
•
번의 측정을 하고, 그 결과 —평균과 분산— 를 바탕으로 노이즈 없는 분포 를 계산하기 위해, 측정 결과에 대한 조건부 분포 를 다음처럼 정의할 수 있다.
•
이 분포의 분산은 정밀도의 역수로 표현됐는데, 정밀도 은 다음과 같이 잠재분포 의 정밀도 에 번 측정 결과의 정밀도를 더한 것으로 정의된다.
•
위 분포의 평균은 비슷하게 잠재분포 의 평균과 측정 결과의 평균에 정밀도를 가중치로 적용하여 합한 후, 전체 정밀도로 나눈 것으로 정의된다.
◦
이는 가중 평균을 계산할 때, 가중치의 합으로 나눔으로써 가중치가 1이 되도록 하는 효과를 갖게 하기 위함이다.
•
이 수식에 대해 인 경우 은 관측된 데이터에 가까워지고, 이면 은 에 가까워지게 된다. 고로 의 값을 적절하게 조절하여 사용한다.
•
사후 정밀도가 아닌 사후 분산의 관점에서 결과를 다음과 같이 다시 작성할 수 있다.
◦
여기서 는 관찰된 데이터 포인트 모음을 나타내고,
◦
는 사전 분산이고, 는 사후 분산이다.
◦
이 식에서 가 아니라 를 썼는데, 둘다 표준편차의 기호로 사용한다고 함
신호 대 잡음비
•
Signal-to-Noise Ratio(SNR)로써 신호의 강도에 대한 잡음의 강도의 비율을 나타내는 지표가 있다. SNR은 다음과 같이 정의 된다.
◦
는 모두 사용자가 사전에 설정해야 하는 값이다.