Search
Duplicate

수학/ Student t, Laplace, Beta, Gamma 분포

Student t distribution

가우시안 분포는 outliers에 매우 민감하다. 가우시안 분포에 대한 강력한 대안은 Student t 분포이다. pdf는 다음과 같다.
여기서 μ\mu는 평균이고 σ>0\sigma > 0는 척도(scale) 매개변수(표준 편차 아님)이고, v>0v > 0는 자유도(degrees of freedom)이라고 한다.
T(xμ,σ2,v)[1+1v(xμσ)2](v+12)\mathcal{T}(x|\mu, \sigma^2, v) \propto \left[ 1 + {1 \over v} \left( {x - \mu \over \sigma} \right)^2 \right]^{-({v + 1 \over 2})}
Student t 분포의 적률은 다음과 같다.
평균은 v>1v > 1인 경우에만 정의된다. 분산은 v>2v > 2인 경우에만 정의된다. v5v \gg 5의 경우 스튜던트 분포는 가우스 분포에 빠르게 접근하고 견고성 속성을 잃는다. 다양한 문제에서 좋은 성능을 제공하는 v=4v = 4를 사용하는 것이 일반적이다.
E[X]=μV[X]=vσ2(v2)mode=μ\begin{aligned} \mathbb{E}[X] &= \mu \\ \mathbb{V}[X] &= {v \sigma^2 \over (v - 2)} \\ \text{mode} &= \mu \end{aligned}

Laplace distribution

두꺼운 꼬리를 갖는 또 다른 분포는 양면 지수(double sided exponential) 분포라고도 알려진 Laplace 분포이다. pdf는 다음과 같다.
여기서 μ\mu는 위치 매개변수이고 b>0b > 0는 scale 매개변수이다. 이 분포에는 다음과 같은 속성이 있다.
Laplace(xμ,b)12bexp(xμb)\text{Laplace}(x|\mu, b) \triangleq {1 \over 2b} \exp \left( - {|x - \mu| \over b} \right)
Laplace 분포의 적률은 다음과 같다.
E[X]=μV[X]=2b2mode=μ\begin{aligned} \mathbb{E}[X] &= \mu \\ \mathbb{V}[X] &= 2b^2 \\ \text{mode} &= \mu \end{aligned}

Beta distribution

베타 분포는 [0,1][0, 1] 구간을 지원하며 다음과 같이 정의된다.
Beta(xa,b)1B(a,b)xa1(1x)b1\text{Beta}(x|a, b) \triangleq {1 \over B(a,b)} x^{a-1} (1 - x)^{b-1}
B(a,b)B(a, b)는 다음과 같이 정의되는 베타 함수이다.
B(a,b)Γ(a)Γ(b)Γ(a+b)B(a,b) \triangleq {\Gamma(a) \Gamma(b) \over \Gamma(a + b)}
Γ(a)\Gamma(a)는 감마 함수로 다음과 같이 정의된다.
Γ(a)0xa1exdx\Gamma(a) \triangleq \int_0^\infty x^{a-1} e^{-x} dx
베타 분포의 적률은 다음과 같다.
E[X]=aa+bV[X]=ab(a+b)2(a+b+1)mode=a1a+b2\begin{aligned} \mathbb{E}[X] &= {a \over a + b} \\ \mathbb{V}[X] &= {ab \over (a+b)^2(a+b+1)} \\ \text{mode} &= {a - 1 \over a + b - 2} \end{aligned}

Gamma distribution

감마 분포는 양의 실수 값인 확률 변수에 대한 유연한 분포로, x>0x > 0이다. 감마 분포는 모양(shape) a>0a > 0과 비율(rate) b>0b > 0라는 두 가지 매개변수로 정의된다.
Ga(xshape=a,rate=b)baΓ(a)xa1ebx\text{Ga}(x|\text{shape} = a, \text{rate} = b) \triangleq {b^a \over \Gamma(a)} x^{a-1} e^{-bx}
때때로 분포는 모양 aa와 scale s=1/bs = 1 / b로 매개변수화 된다.
Ga(xshape=a,scale=s)1saΓ(a)xa1ex/sGa(x|\text{shape} = a, \text{scale} = s) \triangleq {1 \over s^a \Gamma(a)} x^{a-1} e^{-x/s}
감마 분포의 적률은 다음과 같다.
E[X]=abV[X]=ab2mode=a1b\begin{aligned} \mathbb{E}[X] &= {a \over b} \\ \mathbb{V}[X] &= {a \over b^2} \\ \text{mode} &= {a - 1 \over b} \end{aligned}
Inverse Gamma 분포는 다음과 같다.
IG(xshape=a,scale=b)baΓ(a)x(a+1)eb/x\text{IG}(x|\text{shape} = a, \text{scale} = b) \triangleq {b^a \over \Gamma(a)} x^{-(a+1)}e^{-b/x}
Inverse 감마 분포의 적률은 다음과 같다.
E[X]=ba1V[X]=b2(a1)2(a2)mode=ba+1\begin{aligned} \mathbb{E}[X] &= {b \over a-1} \\ \mathbb{V}[X] &= {b^2 \over (a-1)^2(a-2)} \\ \text{mode} &= {b \over a+1} \end{aligned}

참고