Search
Duplicate

수학/ Total Variation Distance

Total Variation Distance

두 확률 분포 사이의 total variation distance는 다음과 같이 정의된다.
DTV(p,q)12pq1=12p(x)q(x)dxD_\text{TV}(p,q) \triangleq{1\over2}\|\bold{p}-\bold{q}\|_1 = {1\over2} \int |p(\bold{x}) - q(\bold{x})|d\bold{x}
이것은 f(r)=r1/2f(r) = |r-1|/2ff-divergence와 동등하다.
12q(x)p(x)q(x)1dx=12q(x)p(x)q(x)q(x)dx=12p(x)q(x)dx\begin{aligned} {1\over2} \int q(\bold{x})|{p(\bold{x}) \over q(\bold{x})} - 1|d\bold{x} &= {1\over2}\int q(\bold{x})|{p(\bold{x}) - q(\bold{x}) \over q(\bold{x})}|d\bold{x} \\&= {1\over2} \int|p(\bold{x})-q(\bold{x})|d\bold{x} \end{aligned}
TV 거리가 적분 확률 측정(integral probability measure)임을 보일 수 있다. 따라서 Total Variation Distance는 IPM이면서 ff-divergence인 유일한 divergence이다.

참고