귀무가설(null hypothesis), 대립가설(alternative hypothesis)
•
귀무가설과 대립가설 중 어느 것이 사실과 가까운지 검증하는 것을 가설 검증(hypothesis testing)이라고 한다. 이것은 이진 분류 문제로 생각할 수 있다.
◦
일반적으로 귀무가설(또는 영가설)은 기각을 가정하고 세워진 가설이고, 대립가설은 연구자가 입증하려고 하는 가설을 의미한다. 이는 무엇인가가 참인 것을 입증하기는 어렵지만, 거짓인 것을 입증하기는 쉽기 때문에 만들어진 구조이다.
1.
연구자는 자신이 주장하고자 하지만 참임을 직접 증명하기는 어려운 가설을 대립가설로 설정한다.
2.
그와 반대 되면서, 거짓임을 입증하기 쉬운 가설을 귀무가설로 정의한다.
3.
우선 귀무가설이 참이라는 것에서 분석을 시작한다.
4.
검정 통계를 거쳐 귀무가설이 거짓임을 밝힌다.
5.
최종적으로 귀무가설을 기각하고, 이에 반대되는 대립가설을 채택한다.
◦
주의할 점은 귀무가설을 기각하지 못했다고, 귀무가설이 참이라는 뜻이 되는게 아니고 —참임을 증명하는 것은 어렵다— 귀무가설이 기각되었다고 대립 가설이 참이 되는 것도 아니다. —마찬가지로 참임을 증명하기는 어렵다— 다만 대립 가설이 귀무가설보다 더 가능성이 높다고 주장하는 것이다.
•
귀무 가설을 과 대립 가설을 이라 하고 0-1 손실을 사용할 때, 최적의 결정은 또는 인 대립 가설을 고르는 것이다.
◦
가설이기 때문에 귀무 가설을 , 대립 가설을 또는 이라고도 표기한다.
Type I Error
•
가설 검정에서 Type I Error는 귀무가설 이 참인데, 기각하는 것을 말한다. 이것은 False-Negative에 해당한다.
•
Type I 오류는 오류라고도 하며, 검정의 유의 수준(significance level)을 나타낸다. 다음처럼 계산한다.
◦
아래의 식에서 은 귀무가설 모집단의 평균을 나타내고,
◦
는 샘플 데이터를 의미하고, 는 샘플 데이터의 표본 평균을 나타낸다.
◦
은 샘플 데이터 가 귀무 가설 에서 왔다고 가정하는 것을 의미한다.
◦
는 모집단의 표준 편차, 은 표본의 크기로 은 표준화된 표본 평균을 나타낸다.
◦
는 임계값(critical value)로 이 임계값을 기준으로 귀무가설을 기각할지 아닐지 결정한다.
•
이 식은 결국 귀무가설이 참일 때 (즉 데이터가 에서 왔다고 가정할 때), 주어진 임계값 보다 큰 표본 평균을 관측할 확률을 나타낸다.
•
임계값은 로 주어는데, 여기서 는 표준 정규 분포의 상위 분위수이다
Type II Error
•
반면 Type II 에러는 대립가설 이 참일 때 귀무를 채택하는 것을 말한다. 이것은 False-Positive에 해당한다.
•
Type II 에러는 오류라고도 하며, 를 검정력(power of test)으로 나타낸다. 다음처럼 계산한다.
◦
아래의 식에서 은 귀무가설 모집단의 평균을 나타내고, 나머지는 Type I Error와 같다.
•
이 식은 결국 대립가설이 참일 때, (즉 데이터가 에서 왔다고 가정할 때), 주어진 임계값 보다 작은 표본 평균을 관측할 확률을 나타낸다.
•
Type II의 임계값은 Type I의 임계값과 동일하게 를 사용한다. —을 사용하지 않는다— 이는 임계값이 귀무가설을 기반으로 설정된 값이기 때문이다.