베이즈정리(Bayes Theorem)
1. 베이즈 정리의 이해
ⅰ.베이즈 정리의 식도출
만약 A1, A2 , . . . , An 까지의 표본공간의 분할이 존재할 때(따라서 각 A는 배반사건), 조건부 B에 대한 사건Ai의 사후확률 P(Ai|B)는 P(Ai)와 P(B|Ai)를 이용해서 다음과 같은 공식으로 만들 수 있다.
위식에서, P(B)가 모든 i에 대하여 P(Ai ∩ B)로 나타내어진 과정은 위의 그림을 보면 쉽게 이해할 수 있다.
ⅱ.베이즈 정리의 의의
사전확률 P(A)와 우도P(B|A)를 안다면, 사후확률 P(A|B)까지도 알 수 있다는 것이다.
이때,
사전확률(prior probability): A(원인)가 발생할 확률이 P(A)인것과 같이, 결과이전에 주어진 확률이다.
우도(likelihood probability): A(원인)가 발생하였다는 조건하에서 B(결과)가 발생활 확률 P(B | A)을 나타낸다.
사후확률(posterior probability): B(결과)가 발생하였다는 조건하에서 A(원인)가 발생할 확률을 나타낸다.
. 조건부 확률에서 문자를 수식화할때의 문제점 문제에서 여성이 기혼자일 확률이 40%라고 주어졌다면, P(여|기)=0.4 인지 P(기ㅣ여)=0.4 인지 헤깔릴때가 있다. P(여|기)는 전체를 기혼자로 한정했을 때 그중 여자일 확률을 나타내는 것이고, P(기ㅣ여)는 전체를 여자로 한정했을 때 그중 기혼자일 확률을 나타내는 것이기 때문에 이 둘은 엄연히 다르다. 다음과 같은 방법으로 문자로 주어진 확률을 수식화하면 간단하다. P(A|B)의 의미는 전체를 B로 한정했을 때의 A일 확률을 의미하는데, 어쨌든 중요한 것은 A의 확률을 구한다는 것이다. 여성이 기혼자일 확률이 40%라고 주어졌을 때도, 어쨌든 기혼자일 확률이 40%라는 말이다. 따라서, 여성이 기혼자일 확률을 수식화하면 P(기ㅣ여)=0.4인 것이 옳다. |
. P(A∩B)와 P(AlB)의 언어적 구분의 애매함 어느 나라에 남녀가 각각 5000명이 존재하고, 그 중에서 눈동자의 색깔이 청색인 사람과 녹색인 사람으로 나누어 진다고 한다.
이때 남자이고 청색 눈동자색깔을 가질 확률은 단순히 P(B∩M) = 3000/10000 이다. 그러나, 남자라고 할때 (남자 중) 청색의 눈동자를 가졌을 확률은 조건부확률이 되어 P(B|M) = P(B∩M)/P(M) =(3000/10000) / (5000/10000) = 3000/5000 이 된다. 문제에서 단순히 교집합의 확률을 묻는 것인지, 어떠한 변수로 한정을 한 상태의 확률을 묻는 조건부 확률을 묻는 것인지 잘 구분해야한다. |
2. 예시
ⅰ.예시1
은행의 조사결과 자금반환율이 우수한 경우인 사건 A, 양호한 경우인 사건Ac 에게는 자금을 빌려준다고 한다. A의 비율이 35%이고, Ac의 비율이 65%라고 한다. 또한, A중 5%, Ac중 25%가 자금지급불능 상태에 빠진다고 한다. 이때, 자금지급불능인 상태인 사건을 B라고 하면, 자금지급불능 상태인 사람이, 자금반환율이 우수하다고 판정은 사람일 확률은 얼마인가?
① 언어적으로 제시된 문제를 수식화하기
위에서 문제는 "자금지급불능 상태인 사람이, 자금반환율이 우수하다고 판정받은 사람일 확률" 이다. 이를 수식으로 나타내면 P(A|B) 이다.
②확률가지
※확률가지에서 매우 중요한 부가설명
확률가지에서는 확률가지의 2차부분을 상황에 따라 자유롭게 표시할 수 있다. 가령, 위의 확률가지에서는 B라고만 표현했지만 사실 B는 A조건부가 붙어있는 P(B|A)를 생략하여 B로 표시한 것이며 P(B ∩ A)으로 표기할 때도 있다. 가장 좋은 것은 B옆에 P(B l A)인지 P(B ∩ A)인지 구체적으로 표시해주는 것이 가장 좋으나 그림을 그릴 때 까먹어 버렸다...
③ 베이즈 이론을 통한 P(A l B)해석
ⅱ. 예시2
3개의 상자 a,b,c가 있다. 상자 a에는 하얀공이 1개, 파랑공이 2개, 빨간공이 3개, 상자b에는 하얀공이 2개, 파랑공이 1개, 빨간공이 1개, 상자 c에는 하얀공이 4개, 파랑공이 5개, 빨간공이 3개 있다. 하나의 상자에서 하나의 흰공과 하나의 빨간공을 꺼냈을 때, 그 상자가 a일 확률을 구하라.
①언어적으로 제시된 문제를 수식화하기
상자 a에서 공을 꺼낸 사건을 A라하면 그 확률은 P(A)
상자 b에서 공을 꺼낸 사건을 A라하면 그 확률은 P(B)
상자 c에서 공을 꺼낸 사건을 A라하면 그 확률은 P(C)
하나의 상자에서 하나의 흰공과 하나의 빨간공을 꺼내는 사건을 K라하면 그 확률은 P(K) 로 정의할 수 있다.
이때 문제는, "하나의 상자에서 하나의 흰공과 하나의 빨간공을 꺼냈을 때, 그 상자가 a일 확률" 이므로
P(A l K)로 나타낼 수 있다.
②확률가지
③
풀이1) 베이즈 이론을 통한 P(A|K)해석
풀이2)
'지식 > 경제수학' 카테고리의 다른 글
[경제통계]헷갈리는 통계 기본 용어 사전 (0) | 2017.12.19 |
---|---|
[수학논리]귀류법, 귀류법의 예, 귀류법은 항상 옳은가? (0) | 2017.12.19 |
[경제통계]도수분포표, 히스토그램, 로렌츠곡선, 지니계수 (0) | 2017.12.19 |
[경제통계] 상관관계 (0) | 2017.12.19 |
[경제통계]확률변수의 표준화,정규분포,표본평균들의 평균, 표본평균들의 분산, 표본평균들의 표준편차,모평균의 추정 (0) | 2017.12.19 |