Density ratio estimation using binary classifiers
•
에서의 점이 라벨 을 갖고, 에서의 점이 라벨 을 갖는 이진 분류 문제를 고려하자. 즉 이고 .
◦
를 클래스 prior라 하면, 베이즈 룰에 의해 밀도 비율 은 다음과 같이 주어진다.
•
라 가정하면
◦
이진 분류기(binary classifier)나 판별기(discriminator) 를 fitting하고 를 계산해서 비율 을 추정할 수 있다.
◦
이것을 density ratio estimation(DRE) 트릭이라 한다.
•
위험(기대 손실)을 최소화하여 분류기 를 최적화 할 수 있다. 예컨대 log-loss를 사용하면 다음을 얻을 수 있다.
•
다른 손실 함수 를 사용할 수 있다.
◦
를 손실 함수 에 대해 달성할 수 있는 최소 위험이라 하자. 여기서 어떤 함수 클래스 에 대해 최소화한다.
•
모든 -divergence에 대해 와 같은 손실 함수 가 있음이 증명되었다.
◦
예컨대 ( 대신 표기를 사용하여) total-vairation 거리는 hinge loss 에 해당하고
◦
Hellinger 거리는 exponential loss 에 해당하고,
◦
divergence는 logistic loss 에 해당한다.
•
또한 이진 분류기와 IPM 사이의 연결을 설정할 수 있다. 특히 와 라 하면 다음을 얻을 수 있다.
◦
(여기서 은 supremum의 약자로 집합의 상한(upper bound)의 최소값을 나타낸다. 이것의 반대는 infimum의 약자인 가 있다. 이것은 집합의 하한(lower bound)의 최대값을 나타낸다.)
•
이것은 IPM 방정식과 매치된다. 따라서 분류기는 witness 함수와 같은 역할을 수행한다.