AI/ Reparameterization Trick

Reparameterization Trick

Reparameterization Trick은 확률 변수를 기대값과 표준편차를 이용하여 재매개변수화 하는 방법을 말한다.

예컨대 다음과 같이 평균

\mu

, 표준편차

\sigma

인 가우시안 분포

z

가 존재한다고 하자.

z \sim \mathcal{N}(\mu, \sigma^2)

이 분포는 다음과 같이 평균 0, 표준편차 1인 가우시안 노이즈 항

\epsilon

을 이용하여 정의할 수 있다.

z = \mu + \epsilon \sigma \\ \epsilon \sim \mathcal{N}(0, 1)

이 방법은 분포

z

에서 직접 샘플링 하기 어렵거나,

z

의 샘플링 과정을 다른 파라미터와 분리할 필요가 있는 경우 사용할 수 있다. (

z = \mu + \sigma^2

으로 표현되지 않는 것에 유의하라. 분산은 분포의 폭을 나타내는 값일 뿐 확률 변수에 직접 더해지는 값이 아니다.)

위의 분포는 단변량 가우시안을 예로 하였지만, 당연히 다변량 가우시안 분포인 경우에도 사용가능하다. 아래와 같이 평균

\boldsymbol{\mu}

, 공분산 행렬

\text{diag}(\boldsymbol{\sigma})

인 다변량 가우시안

\bold{z}

가 존재한다고 하자.

\bold{z} \sim \mathcal{N}(\boldsymbol{\mu},\text{diag}(\boldsymbol{\sigma}))

앞서와 같은 방식으로 다음과 같이 Reparameterization 할 수 있다. 아래 식에서

\odot

은 element-wise product를 의미한다.

\begin{aligned} \bold{z} &= \boldsymbol{\mu}+\boldsymbol{\epsilon}\odot\boldsymbol{\sigma} \\ \boldsymbol{\epsilon} &\sim \mathcal{N}(\bold{0},\bold{I}) \end{aligned}

위 개념을 이해하면, 이것이 비단 가우시안 분포에만 적용 가능한 것이 아님을 알 수 있다. 베타나 감마 분포 같은 연속 확률 분포도 적절한 변환을 이용하여 재매개변수화 할 수 있다.

다만 베르누이나 다항 분포 같은 이산 확률 분포의 경우 직접적인 재매개변수화가 어렵기 때문에 Gumbel-Softmax trick 같은 방법으로 연속 확률 변수로 근사한 다음 재매개변수화를 적용할 수 있다.

•

Probabilistic Machine Learning: Advanced Topics