베르누이 분포, 이항 분포, 카테고리 분포, 다항 분포는 모두 이산 확률 분포이며 확률 질량 함수(PMF)로 정의된다.
베르누이 분포
•
베르누이 분포는 0, 1의 값을 갖는 확률 분포. 1이 나올 확률을 의미하는 매개 변수 를 이용하여 다음과 같이 정의한다.
•
이 식을 하나로 합치면 다음과 같이 정의할 수 있다.
•
만약 베르누이 확률변수의 표본값이 1과 0이 아니라 1과 -1이라는 값을 가진다면 다음과 같은 수식으로 써야 한다.
•
베르누이 분포의 기댓값과 분산은 다음과 같이 정의 된다.
베르누이 분포의 Maximum Likelihood Estimation
•
베르누이 분포의 Likelihood 함수는 다음과 같이 정의 됨.
•
Log를 씌우면 다음과 같이 된다.
•
위 식에 대해 로 편미분하고 그 식을 0으로 만드는 값을 찾으면 다음과 같이 의 MLE가 구해진다.
이항 분포
•
베르누이 분포를 번 시행해서 번 성공한 분포로 다음과 같이 정의 된다.
◦
베르누이 분포는 시행 횟수가 1인 이항 분포의 특수한 경우이다.
•
이 식에서 기호는 개 원소 중에 개 원소를 순서와 상관없이 선택할 수 있는 경우의 수를 뜻한다. 조합은 다음 공식으로 계산할 수 있다.
•
이항 분포의 기댓값과 분산은 다음과 같이 정의 된다.
이항 분포의 Maximum Likelihood Estimation
•
이항 분포는 베르누이 분포를 번 시행에 대한 것으로 MLE는 베르누이 분포와 같다.
카테고리 분포
•
카테고리 분포는 0, 1이 아닌 개의 class를 가질 수 있는 분포로 다음과 같이 정의 된다.
◦
베르누이 분포는 클래스가 1인 카테고리 분포의 특수한 경우이다.
◦
아래 식에서 는 일 때 1, 아니면 0을 반환하는 함수이다.
◦
이 식에서 파라미터 는 과 이 되도록 제한된다.
•
카테고리 분포는 원-핫 인코딩을 이용해서 정의가 가능한데, 이 경우 다음처럼 정의할 수 있다.
◦
아래 식에서 는 길이가 인 원-핫 인코딩 —1개만 1이고 나머지는 모두 0인— 벡터이다.
•
참고) 벡터가 지수로 올라가면, 벡터의 각 요소만큼 반복된다. 예컨대 위의 경우 일 때 계산은 다음과 같이 된다.
•
카테고리 분포의 기댓값과 분산은 다음과 같이 정의 된다.
카테고리 분포의 Maximum Likelihood Estimation
•
카테고리 분포는 베르누이 분포를 개의 범주에 대해 일반화한 것으로 MLE는 다음과 같이 정의된다.
◦
아래 식에서 는 번째 범주가 발생한 횟수.
다항 분포
•
다항 분포는 카테고리 분포를 번 시행한 분포로 다음과 같이 정의 된다.
◦
카테고리 분포는 시행 횟수가 1인 다항 분포의 특수한 경우이다.
◦
시행 횟수가 늘어났기 때문에, 여기서 는 원-핫 인코딩이 아니다.
•
다항 분포의 기댓값과 분산은 다음과 같이 정의 된다.
다항 분포의 Maximum Likelihood Estimation
•
다항 분포는 카테고리 분포의 번 시행에 대한 것으로 MLE는 카테고리 분포와 같다.
◦
아래 식에서 는 번째 범주가 발생한 횟수.
참고
•
•