Search
Duplicate

수학/ Maximum A Posterior (MAP)

MAP(Maximum A Posterior)

베이즈 통계에서 MAP은 posterior를 최대화 하는 것으로 MAP 추정은 posterior를 최대화하는 파라미터를 찾는 것을 의미한다.
확률 함수를 최대화 하는 파라미터를 찾는 것은 분포의 mode를 찾는 것과 연결되어 있기 때문에, MAP 추정은 posterior의 mode를 찾는 것이라고도 할 수 있다.
θ^maparg maxθlogp(θD)=arg maxθ(logp(Dθ)+logp(θ))\hat{\boldsymbol{\theta}}_{\text{map}} \triangleq \argmax_{\boldsymbol{\theta}} \log p(\boldsymbol{\theta}|\mathcal{D}) = \argmax_{\boldsymbol{\theta}} (\log p(\mathcal{D}|\boldsymbol{\theta}) + \log p(\boldsymbol{\theta}))
가우시안 분포에서 Likelihood의 평균과 분산을 μL,σL2\mu_L, \sigma_L^2, prior의 평균과 분산을μP,σP2\mu_P, \sigma_P^2라 할 때, posterior의 평균 μ^map\hat{\mu}_{\text{map}}은 다음처럼 정의 된다.
이것은 서로 다른 두 가우시안의 혼합을 이용한 형태이다.
μ^map=λLμL+λPμPλL+μP\hat{\mu}_{\text{map}} = {\lambda_L \cdot \mu_L + \lambda_P \cdot \mu_P \over \lambda_L + \mu_P}
같은 식으로 Likelihood의 정밀도와 prior의 정밀도를 합하면 posterior의 정밀도가 된다.
λpost=λL+λP\lambda_{\text{post}} = \lambda_L + \lambda_P
분산은 정밀도의 역수이므로 posterior 분산은 다음과 같다.
σpost2=1λL+λP=11σL2+1σP2=σL2σP2σL2+σP2\sigma_{\text{post}}^2 = {1 \over \lambda_L + \lambda_P} = {1 \over {1 \over \sigma_L^2} + {1 \over \sigma_P^2}} = {\sigma_L^2 \sigma_P^2 \over \sigma_L^2 + \sigma_P^2}

참고