확률 공간(Probability space)
•
확률 공간을 triple 로 정의한다.
◦
여기서 는 표본 공간(sample space)라고 하며, 실험으로부터 가능한 결과의 집합을 의미하고,
◦
는 사건 공간(event space)라고 하며, 의 가능한 모든 부분집합의 집합을 의미하고,
◦
는 확률 측정(probability measure)라고 하며, 사건 을 숫자 로 매핑하는 것을 의미한다. (즉 )
이산 확률 변수
•
‘A’,’B’,’C’ 3개 면을 가진 주사위가 있다고 하자. 이 주사위의 표본 공간은 아래와 같고 모든 가능한 ‘실험’ 결과를 표현한다.
•
사건 공간은 표본 공간의 부분 집합이므로 아래와 같다.
•
사건은 사건 공간의 요소이다.
◦
예컨대 은 주사위의 면이 나 가 나타나는 결과를 표현하고 는 주사위 면이 가 나타나는 것을 표현한다.
•
확률 측정은 사건 공간에서 각 집합의 ‘크기’나 ‘가중치’를 계산하는 방법으로 정의할 수 있다. 예컨대 위 주사위에 대해 원자적 사건의 확률을 아래와 같이 정의한다고 하자.
•
그러면 다른 사건의 확률에 대한 측정을 위의 확률을 이용해서 유도할 수 있다.
◦
예컨대
•
사건 공간에서 가능한 결과에 할당되는 숫자를 확률 변수(random variable)로 정의할 수 있다. 여기서 함수 은 결과 를 실수선 위의 숫자 에 매핑한다.
◦
예컨대 3면 주사위에 대한 확률 변수 를 다음과 같이 정의할 수 있다
•
공정한 동전을 2번 던지는 실험을 가정하자. 를 동전의 앞면, 를 동전의 뒷면이라 하면 표본 공간은 다음과 같이 정의할 수 있다.
•
이때 를 앞면의 수를 나타내는 확률 변수라 하면 다음과 같이 정의된다.
•
확률변수의 가능한 값들의 집합을 상태 공간(state space)로 정의하고 로 표기한다. 다음과 같이 모든 주어진 상태의 확률을 정의할 수 있다.
•
여기서 는 의 역상(pre-image)이다.
•
는 확률 변수 에 대한 확률 질량 함수(probability mass function, pmf)라 부른다. 동전을 2번 뒤집는 예에서 pmf는 다음과 같다.
•
pmf는 histogram이나 어떤 parametric 함수로 표현할 수 있다.
•
를 확률 변수 에 대한 확률 분포(probability distribution)이라 부른다. 문맥상 분명한 경우 종종 에서 첨자를 제거한다.
연속 확률 변수
•
연속 결과의 실험의 경우 표본 공간은 실수의 부분 집합 이라 가정하고, 각 연속 확률 변수를 항등 함수(identify function) 로 정의한다.
•
예컨대 어떤 사건(초에서)의 duration을 측정하는 것을 고려하자. 샘플 공간을 다음과 같이 정의할 수 있다.
•
이것은 uncountable set으로 이산일 때와 달리 모든 가능한 부분집합을 열거하여 정의할 수 없다. 대신 이벤트 공간을 Borel sigma-field (또는 Borel sigma-algebra 라고 불리는)의 측면에서 정의해야 한다.
◦
가 다음을 만족하면 -field라고 한다.
1.
이고
2.
가 여집합에 대해 닫혀 있다. 따라서 라면
3.
는 가산 합집합과 교집합에 닫혀 있다. 즉 이고 는 .
◦
-field인 중에 형태의 반-닫힌 구간(semi closed interval)으로부터 생성된 것을 Borel -field라고 하고 라 표기한다.
•
이러한 구간들의 합집합, 교집합, 여집합을 취하여 가 다음과 같은 집합을 포함하고 있음을 알 수 있다.
•
위 예에서 사건 공간을 하한이 이고 상한이 인 구간만 포함하도록 추가로 제한할 수 있다.
•
확률 측정을 정의하기 위해 각 에 대한 가중치 함수 를 정의한다. 이것을 확률 밀도 함수(probability density function, pdf)라고 한다. 그러면 다음을 사용하여 이벤트 의 확률을 유도할 수 있다.
•
또한 다음과 같이 확률 변수 에 대한 누적 분포 함수(cumulative distribution fuction, cdf)를 정의할 수 있다.
•
이것으로부터 다음과 같이 구간의 확률을 계산할 수 있다.
•
위의 정의를 다차원 공간 뿐만 아니라 함수 같은 더 복잡한 샘플 공간으로 일반화할 수 있다.
•
‘확률 분포’라는 용어는 pdf 나 cdf 나 확률 측정 를 의미할 수 있다.
확률 공리(Probability Aximoms)
•
확률 공리는 다음의 3가지이다.
◦
음이 아님(Non-negativity): for any
◦
정규화(Normalization):
◦
가산성(Additivity): 쌍별 분리된 집합의 모든 countable 시퀀스 에 대해 다음이 성립한다.
•
2개의 분리된 집합 만 갖는 유한한 경우에 다음이 된다.
•
이것은 상호 간에 배타적이라는 가정 하에 의 확률에 해당한다.
•
이 공리로부터 여집합(complement) 규칙을 유도할 수 있다.
•
여기서 는 의 여집합이다.
◦
이것은 이기 때문이다.
◦
또한 와 임을 보일 수 있다.
•
가산 규칙(addition rule)이라 불리는 다음의 결과를 보일 수 있다.
Conditional probability
•
2개의 사건 에 대해 이면, 다음과 같이 주어진 에 대해 의 조건부 확률(conditional probability)을 정의할 수 있다.
•
이것으로부터 곱 규칙(multiplication rule)을 얻을 수 있다.
•
조건부 확률은 가 발생했을 때 가 발생할 가능성을 측정한다. 그러나 사건이 연관되어 있지 않으면 확률은 변하지 않는다. 이것을 형식적으로 와 가 독립 사건(independent event)라고 한다.
•
이고 이면 이거나 동등하게 이다.
•
유사하게 다음이 성립하면 주어진 에 대해 와 가 조건부 독립이라고 말할 수 있다.
•
조건부 확률의 정의로부터 총 확률의 법칙(law of total probability)를 유도할 수 있다. 만일 가 표본 공간 의 분할이면 모든 사건 에 대해 다음이 성립한다.
Bayes’ rule
•
조건부 확률의 정의로부터 Bayes Rule 또는 Bayes theorem을 유도할 수 있다. 이고 인 두 사건 와 에 대해 다음이 성립한다.
•
개 가능한 상태의 이산 확률 변수 에 대해 총 확률의 법칙을 사용하여 다음과 같이 베이즈 규칙을 작성할 수 있다.
•
여기서 는 prior 확률이고, 는 likelihood이고, 는 posterior 확률이고, 는 marginal likelihood라고 부르는 정규화(normalization) 상수이다.
•
유사하게 연속 확률 변수 에 대해 다음과 같이 베이즈 룰을 작성할 수 있다.