Definition
•
에 대한 고정 support와 로 파라미터화 된 확률 분포의 family를 고려하자. 분포 의 밀도를 다음과 같이 쓸 수 있으면 지수족이라고 한다.
•
여기서 는 scaling 상수(기저 측정값(base measure)라고도 한다. 종종 1)이고
◦
는 충분 통계량(sufficient statistics)이고,
◦
는 자연 파라미터(natural parameter) 또는 표준 파라미터(canonical parameter)라고 하고,
◦
는 정규화 상수(normalization constant) 또는 분할 함수(partition function)이라고 하고,
◦
는 log 분할 함수라고 한다. 는 볼록 집합 에 대한 볼록 함수임을 보인다.
•
자연파라미터가 서로 독립이면 편리하다. 형식적으로 이 되는 이 없는 경우 지수족이 최소라고 한다.
◦
이 마지막 조건은 multinomial 분포의 경우에 파라미터의 합이 1이라는 제약 조건 때문에 위반될 수 있다. 그러나 독립 파라미터를 사용하여 분포를 재파라미터화하면 쉽게 해결할 수 있다.
•
위 방정식은 를 정의하여 일반화할 수 있다. 여기서 는 어떤 다른, 가능한 작은 파라미터의 집합이다. 이 경우에 분포는 다음의 형식을 갖는다.
•
에서 로의 매핑이 비선형이면 curved exponential family라고 한다.
◦
이면 모델은 표준 형식(canonical form)이라고 한다.
◦
추가로 면 natural exponential family(NEF)라고 한다. 이 경우에 다음처럼 작성할 수 있다.
•
충분 통계 벡터의 평균으로 moment 파라미터를 정의한다.
Exponential Family Examples
•
아래의 예는 각 분포를 지수족 형식에 맞게 식을 변형하고 를 정의한다.
Bernoulli distribution
•
베르누이 분포는 다음과 같이 지수족 형식으로 작성할 수 있다.
•
여기서 이고
◦
◦
는 평균 파라미터이다.
•
그러나 이것은 feature 사이의 선형 종속이기 때문에 over-complete representation이다. 이것을 다음처럼 볼 수 있다.
•
표현이 overcomplete 하면 는 고유하게 식별가능하지 않다. 최소 표현(minimal representation)을 사용하는 것이 일반적이며, 이는 분포와 연관된 고유한 가 있다는 뜻이다. 이 경우에 다음과 같이 정의할 수 있다.
•
이것을 다음과 같이 정의하여 지수족 형식으로 넣을 수 있다.
•
다음과 같이 canonical 파라미터 에서 평균 파라미터 를 복구할 수 있다.
•
이것은 logistic (sigmoid) 함수로 볼 수 있다.
Categorical distribution
•
카테고리의 이산 분포를 다음처럼 표현할 수 있다. (여기서 )
•
여기서 이다.
•
이것을 다음과 같이 지수족 형식으로 작성할 수 있다.
•
다음을 사용하여 canonical 파라미터에서 평균 파라미터를 복구할 수 있다.
•
을 정의하면 이것을 다음과 같이 작성할 수 있다.
•
에 대해 . 여기서 softmax는 softmax나 multinomial logit 함수이다.
•
이것으로부터 다음을 발견할 수 있다.
•
따라서
Univariate Gaussian
•
단변량 가우시안은 대개 다음처럼 작성된다.
•
다음을 정의하여 이것을 지수족 형식에 넣을 수 있다.
•
moment 파라미터는 다음과 같다.
Univariate Gaussian with fixed variance
•
로 고정하면 다음을 정의하여 가우시안을 natural exponential family로 작성할 수 있다.
•
이 예제에서 base measure 는 상수가 아님에 유의하라.
Multivariate Gaussian
•
평균 벡터 와 공분산 행렬 로 다변량 가우시안(MVN)을 파라미터화하는 것이 일반적이다. 해당하는 pdf는 다음과 같이 주어진다.
•
그러나 information form이라 부르는 canonical 파라미터나 natural parameter를 사용해서 가우시안을 표현할 수 있다.
•
여기서 표기 는 표준 파라미터 와 구분하기 위해 사용했다.
◦
여기서 는 정밀도 행렬(precision matrix)라고 부르고 는 정밀도-가중 평균 벡터이다.
•
이것을 다음과 같이 지수족 표기로 변환할 수 있다.
•
여기서
•
이것으로부터 평균 (moment) 파라미터가 다음처럼 주어짐을 볼 수 있다.
•
위는 가 대칭 행렬이므로 최소 표현이 아님에 유의하라. 각 행렬의 위쪽이나 아래쪽 절반으로 작업하면 최소 형식(minimal form)으로 변환할 수 있다.
Non-examples
•
흥미로운 모든 분포가 지수족에 속하지는 않는다. 예를 들어 student 분포은 pdf가 필요한 형식을 갖지 않기 때문에 속하지 않는다.
◦
그러나 student 분포를 포함할 수 있는 -exponential family라고 불리는 일반화가 있다.
•
더 미묘한 예로 균등 분포 를 고려하자. pdf는 다음의 형식을 갖는다.
•
이것이 의 지수족이라는 생각은 솔깃하다.
◦
그러나 이것의 분포의 support (즉 값들의 집합 )가 파라미터 에 의존하며 이는 지수족의 가정을 위반한다.