Search
Duplicate

AI/ Reparameterization Trick

Reparameterization Trick

Reparameterization Trick은 확률 변수를 기대값과 표준편차를 이용하여 재매개변수화 하는 방법을 말한다.
예컨대 다음과 같이 평균 μ\mu, 표준편차 σ\sigma인 가우시안 분포 zz가 존재한다고 하자.
zN(μ,σ2)z \sim \mathcal{N}(\mu, \sigma^2)
이 분포는 다음과 같이 평균 0, 표준편차 1인 가우시안 노이즈 항 ϵ\epsilon을 이용하여 정의할 수 있다.
z=μ+ϵσϵN(0,1)z = \mu + \epsilon \sigma \\ \epsilon \sim \mathcal{N}(0, 1)
이 방법은 분포 zz에서 직접 샘플링 하기 어렵거나, zz의 샘플링 과정을 다른 파라미터와 분리할 필요가 있는 경우 사용할 수 있다. (z=μ+σ2z = \mu + \sigma^2으로 표현되지 않는 것에 유의하라. 분산은 분포의 폭을 나타내는 값일 뿐 확률 변수에 직접 더해지는 값이 아니다.)
위의 분포는 단변량 가우시안을 예로 하였지만, 당연히 다변량 가우시안 분포인 경우에도 사용가능하다. 아래와 같이 평균 μ\boldsymbol{\mu}, 공분산 행렬 diag(σ)\text{diag}(\boldsymbol{\sigma})인 다변량 가우시안 z\bold{z}가 존재한다고 하자.
zN(μ,diag(σ))\bold{z} \sim \mathcal{N}(\boldsymbol{\mu},\text{diag}(\boldsymbol{\sigma}))
앞서와 같은 방식으로 다음과 같이 Reparameterization 할 수 있다. 아래 식에서 \odot은 element-wise product를 의미한다.
z=μ+ϵσϵN(0,I)\begin{aligned} \bold{z} &= \boldsymbol{\mu}+\boldsymbol{\epsilon}\odot\boldsymbol{\sigma} \\ \boldsymbol{\epsilon} &\sim \mathcal{N}(\bold{0},\bold{I}) \end{aligned}
위 개념을 이해하면, 이것이 비단 가우시안 분포에만 적용 가능한 것이 아님을 알 수 있다. 베타나 감마 분포 같은 연속 확률 분포도 적절한 변환을 이용하여 재매개변수화 할 수 있다.
다만 베르누이나 다항 분포 같은 이산 확률 분포의 경우 직접적인 재매개변수화가 어렵기 때문에 Gumbel-Softmax trick 같은 방법으로 연속 확률 변수로 근사한 다음 재매개변수화를 적용할 수 있다.

참고