1. 확률변수의 표준화 

 확률변수의 표준화는 다음과 같은 경우 사용된다. 한국의 한 대학교에서 경제학과목 90점을 받은 A학생과 일본의 한 대학교에서 경제학과목 90점을 받은 B학생이 있다. 이둘은 경제학과목에서 같은 90점을 받았지만, 각각 시험에 응시한 학생들의 수준이나 시험의 난이도에 따라 같은 90점이 아닐 수 있다. 한 학교는 시험이 어려워서 90점이 최고점수인 반면 다른학교는 시험이 쉬워서 90점을 득점한 학생이 많을 수도 있기 때문이다. 따라서, 이러한 경우에는 90점이라는 점수가 각각의 시험에서 상위 몇 %에 해당하는지에 대한 "상대값"을 통하여만 비교가 가능하다. 이때 각각의 시험은 모두 평균, 분산, 표준편차 등이 다른데 서로 다른 대상을 표준화하여 비교를 용이하게 하기 위해 고안한 방법의 「확률변수의 표준화」이다.


%ED%99%95%EB%A5%A0%EB%B3%80%EC%88%98%5Cquad%20X%EC%9D%98%5Cquad%20%ED%8F%89%EA%B7%A0%EC%9D%B4%5Cquad%20m%2C%5Cquad%20%ED%91%9C%EC%A4%80%ED%8E%B8%EC%B0%A8%EA%B0%80%5Cquad%20%5Csigma%20%EC%9D%BC%5Cquad%20%EB%95%8C%2C%5Cquad%20%5C%5C%20E(aX%2Bb)%5Cquad%20%3D%5Cquad%20aE(X)%2Bb%2C%5Cquad%20%5Cquad%20V(aX%2Bb)%5Cquad%20%3D%5Cquad%20%5Ccombi%20%5E%7B%202%20%7D%7B%20a%20%7DV(X)%2C%5Cquad%20%5Cquad%20%5Csigma%20(aX%2Bb)%5Cquad%20%3D%5Cquad%20%5Cleft%7C%20a%20%5Cright%7C%20%5Csigma%20(X)%EC%97%90%5Cquad%20%EC%9D%98%ED%95%B4%5C%5C%20E(%5Cfrac%20%7B%20X-m%20%7D%7B%20%5Csigma%20%20%7D)%5Cquad%20%3D%5Cquad%20%5Cfrac%20%7B%201%20%7D%7B%20%5Csigma%20%20%7DE(X)-%5Cfrac%20%7B%201%20%7D%7B%20%5Csigma%20%20%7Dm%5Cquad%20%3D%5Cquad%200%2C%5Cquad%20%5Cquad%20%5Cquad%20%5Csigma%20(%5Cfrac%20%7B%20X-m%20%7D%7B%20%5Csigma%20%20%7D)%5Cquad%20%3D%5Cquad%20%5Cleft%7C%20%5Cfrac%20%7B%201%20%7D%7B%20%5Csigma%20%20%7D%20%5Cright%7C%20%5Csigma%20(X)%5Cquad%20%3D%5Cquad%201%5Cquad%20%EC%9D%B4%EB%AF%80%EB%A1%9C%5C%5C%20%ED%99%95%EB%A5%A0%EB%B2%88%EC%88%98%5Cquad%20%5Cfrac%20%7B%20X-m%20%7D%7B%20%5Csigma%20%20%7D%EC%9D%98%5Cquad%20%ED%8F%89%EA%B7%A0%EC%9D%80%5Cquad%200%2C%5Cquad%20%ED%91%9C%EC%A4%80%ED%8E%B8%EC%B0%A8%EB%8A%94%5Cquad%201%EC%9D%B4%EB%8B%A4.%5C%5C%20%5C%5C%20%EB%94%B0%EB%9D%BC%EC%84%9C%5Cquad%20%ED%99%95%EB%A5%A0%EB%B3%80%EC%88%98%5Cquad%20X%5Cquad%20%EA%B0%80%5Cquad%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%5Cquad%20N(m%2C%5Cquad%20%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D)%EC%9D%84%5Cquad%20%EB%94%B0%EB%A5%BC%5Cquad%20%EB%95%8C%2C%5Cquad%20%ED%99%95%EB%A5%A0%EB%B2%88%EC%88%98%5C%5C%20Z%5Cquad%20%3D%5Cquad%20%5Cfrac%20%7B%20X-m%20%7D%7B%20%5Csigma%20%20%7D%EB%8A%94%5Cquad%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%5Cquad%20N(0%2C%5Ccombi%20%5E%7B%202%20%7D%7B%201%20%7D)%EC%9D%84%5Cquad%20%EB%94%B0%EB%A5%B8%EB%8B%A4.%5C%5C%20%20

-----------------------------------------------------------------------------

※정규분포란

%ED%99%95%EB%A5%A0%EB%B3%80%EC%88%98%5Cquad%20X%EC%9D%98%5Cquad%20%ED%98%B8%EA%B0%80%EB%A5%A0%EB%B0%80%EB%8F%84%ED%95%A8%EC%88%98%5Cquad%20f(x)%EA%B0%80%5Cquad%20%5C%5C%20f(x)%3D%5Cfrac%20%7B%201%20%7D%7B%20%5Csqrt%20%7B%202%5Cpi%20%20%7D%5Csigma%20%20%7D%5Ccdot%20%5Ccombi%20%5E%7B%20-%5Cfrac%20%7B%20(x-m%5Ccombi%20%5E%7B%202%20%7D%7B%20)%20%7D%20%7D%7B%202%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%20%7D%20%7D%7B%20e%20%7D%5Cquad%20(%EB%8B%A8%2C%5Cquad%20-%5Cinfty%20%5Cquad%20%3C%5Cquad%20x%5Cquad%20%3C%5Cquad%20%5Cinfty%20)%5C%5C%20%EB%A1%9C%5Cquad%20%EC%A3%BC%EC%96%B4%EC%A7%88%5Cquad%20%EB%95%8C%2C%5Cquad%20X%5Cquad%20%EC%9D%98%5Cquad%20%ED%99%95%EB%A5%A0%EB%B6%84%ED%8F%AC%EB%A5%BC%5Cquad%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%EB%9D%BC%EA%B3%A0%5Cquad%20%ED%95%98%EA%B3%A0%2C%5Cquad%20N(m%2C%5Cquad%20%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D)%EC%9C%BC%EB%A1%9C%5Cquad%20%EB%82%98%ED%83%80%EB%82%B8%EB%8B%A4.%5C%5C%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%EB%8A%94%5Cquad%20%EB%8B%A4%EC%9D%8C%EA%B3%BC%5Cquad%20%EA%B0%99%EC%9D%80%5Cquad%20%EC%84%B1%EC%A7%88%EC%9D%84%5Cquad%20%EA%B0%80%EC%A7%80%EA%B3%A0%5Cquad%20%EC%9E%88%EB%8B%A4.%5C%5C%201.%5Cquad%20%EC%9E%84%EC%9D%98%EC%9D%98%5Cquad%20%EC%8B%A4%EC%88%98%5Cquad%20x%5Cquad%20%EC%97%90%5Cquad%20%EB%8C%80%ED%95%B4%5Cquad%20f(x)%5Cquad%20%3E0%5Cquad%20%EC%9D%B4%EB%8B%A4.%5C%5C%202.%5Cquad%20%EA%B3%A1%EC%84%A0%EC%9D%80%5Cquad%20%EC%A7%81%EC%84%A0%5Cquad%20x%5Cquad%20%3D%5Cquad%20m%5Cquad%20%EC%97%90%5Cquad%20%EA%B4%80%ED%95%B4%5Cquad%20%EB%8C%80%EC%B9%AD%EC%9D%B4%EB%8B%A4.%5C%5C%203.%5Cquad%20%EA%B3%A1%EC%84%A0%EA%B3%BC%5Cquad%20x%EC%B6%95%5Cquad%20%EC%82%AC%EC%9D%B4%EC%9D%98%5Cquad%20%EB%84%93%EC%9D%B4%EB%8A%94%5Cquad%201%EC%9D%B4%EB%8B%A4.%5C%5C%204.%5Cquad%20%ED%99%95%EB%A5%A0%EB%B6%84%ED%8F%AC%5Cquad%20X%EC%9D%98%5Cquad%20%ED%8F%89%EA%B7%A0%EC%9D%80%5Cquad%20m%EC%9D%B4%EA%B3%A0%2C%5Cquad%20%EB%B6%84%EC%82%B0%EC%9D%80%5Cquad%20%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%EC%9D%B4%EB%8B%A4.%5C%5C%205.%5Cquad%20X%EA%B0%80%5Cquad%20%EA%B5%AC%EA%B0%84%5Cquad%20%5C%5B%20a%2Cb%5C%5D%20%EC%97%90%5Cquad%20%EC%86%8D%ED%95%A0%5Cquad%20%ED%99%95%EB%A5%A0%5Cquad%20P(a%5Cle%20X%5Cle%20b)%EB%8A%94%5Cquad%20%EA%B5%AC%EA%B0%84%5Cquad%20%5C%5B%20a%2Cb%5C%5D%20%EC%97%90%EC%84%9C%5Cquad%20%EA%B3%A1%EC%84%A0%EA%B3%BC%5Cquad%20x%EC%B6%95%EC%82%AC%EC%9D%B4%EC%9D%98%5Cquad%20%EB%84%93%EC%9D%B4%EC%99%80%5Cquad%20%EA%B0%99%EB%8B%A4.%20

 

------------------------------------------------------------------------------

ⅰ. 확률변수의 표준화의 예

한국, 일본의 평균 초봉은 각각 250만원, 23만엔이고, 표준편차가 각각 15만원, 3만엔인 정규분포를 따른다고한다. 이때 한국에서 280만원을 받는 사람과 일본에서 26만엔을 받는 사람중 어느 사람이 상대적으로 더 많은 월급을 받는다고 할 수 있는가?


2. 표본평균의 평균과 분산

ⅰ.모평균과 모표본평균

보통 모평균과 모표본평균을 평균, 표본평균으로 부르지만 여기서는 표본평균의 평균, 표준편차와 구별하기 위해 엄격한 언어를 사용하기로 한다. 모집단의 분포에서 확률변수 X의 평균, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차라고 한다. 

ⅱ. 표본평균sample mean

%EB%98%90%5Cquad%20%EC%96%B4%EB%96%A4%5Cquad%20%ED%99%95%EB%A5%A0%EB%B3%80%EC%88%98%5Cquad%20X%EC%9D%98%5Cquad%20%EB%AA%A8%EC%A7%91%EB%8B%A8%EC%97%90%EC%84%9C%5Cquad%20%ED%81%AC%EA%B8%B0n%EC%9D%B8%5Cquad%20%ED%91%9C%EB%B3%B8%EC%9D%84%5Cquad%20%EC%B6%94%EC%B6%9C%ED%95%98%EB%8A%94%5Cquad%20%EA%B2%BD%EC%9A%B0%2C%5Cquad%20%EC%B6%94%EC%B6%9C%EB%90%9Cn%EA%B0%9C%EC%9D%98%5Cquad%20%EB%B3%80%EB%9F%89%EC%9D%98%5Cquad%20%ED%8F%89%EA%B7%A0%EC%9D%84%5Cquad%20%5Cbar%20%7B%20X%20%7D%EB%A1%9C%5Cquad%20%ED%91%9C%EC%8B%9C%ED%95%98%EA%B3%A0%5C%5C%20%5Cbar%20%7B%20X%20%7D%EB%A5%BC%5Cquad%20%ED%91%9C%EB%B3%B8%ED%8F%89%EA%B7%A0%EC%9D%B4%EB%9D%BC%EA%B3%A0%5Cquad%20%EB%B6%80%EB%A5%B8%EB%8B%A4.%20 


ⅲ.표본평균의 평균, 표본평균의 분산, 표본평균의 표준편차

 해운대의 해변에 있는 모래알의 크기를 측정한다고 할 때, 해변대 해변에 있는 모든 모래알을 모집단이라고 부른다. 이때 이중 100개만 뽑아서 그 표본들의 표본평균, 표본분산, 표본표준편차를 구할 때, 100개를 뽑는 방법은 매우 여러가지 이다. 그 자리에서 100개를 뽑을 수도 있고, 앞으로 네발자국 가서 100개를 뽑을 수도 있고, 뒤로 두발자국 가서 100개를 뽑을  수있다. 이때 100개씩 샘플링sampling을 한 여러 표본들의 각 표본평균을 측정할 수 있는데, 이 표본평균들의 평균과, 표본평균들의 분산과, 표본평균들의 표준편차가 다음과 같이 "알려져 "있다.

%5CRalign%20E(%5Cbar%20%7B%20X%20%7D)%5Cquad%20%3D%5Cquad%20m%2C%5Cquad%20%5Cquad%20%5Cquad%20%5Cquad%20%5Cquad%20%5Cquad%20V(%5Cbar%20%7B%20X%20%7D)%5Cquad%20%3D%5Cquad%20%5Cfrac%20%7B%20%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%20%7D%7B%20n%20%7D%2C%5Cquad%20%5Cquad%20%5Cquad%20%5Cquad%20%5Cquad%20%5Cquad%20%5Csigma%20(%5Cbar%20%7B%20X%20%7D)%5Cquad%20%3D%5Cquad%20%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%5C%5C%20%5C%5C%20%EB%98%90%ED%95%9C%2C%5C%5C%201)%EB%AA%A8%EC%A7%91%EB%8B%A8%EC%9D%98%5Cquad%20%EB%B6%84%ED%8F%AC%EA%B0%80%5Cquad%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%5Cquad%20%EC%9D%B4%EB%A9%B4%2C%5Cquad%20%ED%91%9C%EB%B3%B8%ED%8F%89%EA%B7%A0%5Cquad%20%5Cbar%20%7B%20X%20%7D%EB%8A%94%5Cquad%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%5Cquad%20N(m%2C%5Cquad%20%5Cfrac%20%7B%20%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%20%7D%7B%20n%20%7D)%EB%A5%BC%5Cquad%20%EB%94%B0%EB%A5%B4%EA%B3%A0%5C%5C%202)%EB%AA%A8%EC%A7%91%EB%8B%A8%EC%9D%98%5Cquad%20%EB%B6%84%ED%8F%AC%EA%B0%80%5Cquad%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%EA%B0%80%5Cquad%20%EC%95%84%EB%8B%90%5Cquad%20%EB%95%8C%EC%97%90%EB%8F%84%5Cquad%20n%EC%9D%B4%5Cquad%20%EC%B6%A9%EB%B6%84%ED%9E%88%5Cquad%20%ED%81%AC%EB%A9%B4%5Cquad%20%ED%91%9C%EB%B3%B8%ED%8F%89%EA%B7%A0%5Cquad%20%5Cbar%20%7B%20X%20%7D%EB%8A%94%5Cquad%20%EA%B7%BC%EC%82%AC%EC%A0%81%EC%9C%BC%EB%A1%9C%5C%5C%20%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC%5Cquad%20N(m%2C%5Cquad%20%5Cfrac%20%7B%20%5Ccombi%20%5E%7B%202%20%7D%7B%20%5Csigma%20%20%7D%20%7D%7B%20n%20%7D)%EB%A5%BC%5Cquad%20%EB%94%B0%EB%A5%B8%EB%8B%A4.%5C%5C%20%20


-----------------------------------------------------------------------------

모평균, 모분산, 모표준편차 표본평균, 표본분산, 표본표준편차 /표본평균의  평균, 표본평균의 분산, 표본평균의 표준편차 를 구분할 것. 참고로 표본분산, 표본표준편차는 전 포스트에서 소개한 바가 있으므로 참고.

------------------------------------------------------------------------------


3. 모평균의 추정

모평균의 추정이란, 표본sample으로 부터 얻은 자료 (평균, 분산 등)을 통해 모집단의 특성을 추측해보는 것이다. 예를 들어, 전에 있는 김밥값의 평균과 분산 등의 통계적 자료를 알아내고자 하는 경우, 서울에 있는 김밥집 약 30,000 여 곳의 가격을 일일이 조사하는 것은 무리가 있을 것이다. 따라서, 전국에서 난수를 통한 무작의 선별로 100곳을 선정해 표본의 통계적 자료만을 알아낸 후에 이 부분적인 표본(100개의 김밥집)을 통해 모평균(전국김밥집)의 통계적 자료를 알아내는 것의 모평균 추정의 목표이다. 신문등의 조사기관에서 여론조사 결과에 대해 이야기할 때 '신뢰도95%'니 '99%'니  하는 말들은 통계적 추정에 대한 말이다. 

ⅰ.신뢰도 95%와 신뢰도 99%에 해당하는 확률변수값을 표준정규분포표를 통해 찾기.

표준정규분포표(보통 수학교과서 뒤에 참고로 실려있음)에서 95%에 해당되는 확률변수값을 찾아보면,

P(-z≤Z≤z)=0.95

2P(0≤Z≤z)=0.95

P(0≤Z≤z)=0.475

z=1.96

이고 마찬가지로 99%에 대한 확률변수값 z=2.58이다. 

ⅱ. 모평균의 추정에 관한 이해

위 그림에 세 개의 표본에 대한 표본평균 %5Cbar%20%7B%20%5Ccombi%20_%7B%201%20%7D%7B%20x%20%7D%20%7D%2C%5Cquad%20%5Cbar%20%7B%20%5Ccombi%20_%7B%202%20%7D%7B%20x%20%7D%20%7D%2C%5Cquad%20%5Cbar%20%7B%20%5Ccombi%20_%7B%203%20%7D%7B%20x%20%7D%20%7D%20와 신뢰도95%의 신뢰구간이 나타나있다. A,B의 경우에는 신뢰구간에 모평균m이 들어있지만 C의 신뢰구간에는 m이 들어있지 않다. 신뢰도 95%라는 것은 표본에 따라 달라지는 신뢰구간에 모평균m이 들어있을 가능성이 95% 라는 것이다.


ⅲ. 신뢰구간을 구성하는 식의 이해

모집단이 정규분포 N(m,σ²)을 따를 때, 크기가 n인 표본은 정규분포 N(m,(σ²/n)을 따른다고 알려져 있다. 이를 표준화하는 과정을 거치면, 신뢰구간을 구성하는 식이 등장한다.


크기가 n인 표본은 정규분포 N(m,(σ²/n)을 표준화하면,

Z%3D%5Cfrac%20%7B%20%5Cbar%20%7B%20X%20%7D-m%20%7D%7B%20%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%20%7D%20 일때,


Z%3D%5Cfrac%20%7B%20%5Cbar%20%7B%20X%20%7D-m%20%7D%7B%20%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%20%7D%3D%5Cpm%201.96%5C%5C%20%5Cbar%20%7B%20X%20%7D-m%3D%5Cpm%201.96%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%5C%5C%20m%3D%5Cbar%20%7B%20X%20%7D%5Cmp%201.96%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%20

(이때, 99%신뢰구간의 경우 1.96대신 2.58을 사용)

%EC%8B%A0%EB%A2%B0%EB%8F%84%5Cquad%2095%25%EC%9D%98%5Cquad%20%EC%8B%A0%EB%A2%B0%EA%B5%AC%EA%B0%84%5Cquad%20%3A%5Cquad%20%5Cbar%20%7B%20X%20%7D-1.96%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%5Cquad%20%5Cle%20%5Cquad%20m%5Cquad%20%5Cle%20%5Cquad%20%5Cbar%20%7B%20X%20%7D%2B1.96%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%5Cquad%20%5C%5C%20%EC%8B%A0%EB%A2%B0%EB%8F%84%5Cquad%2099%25%EC%9D%98%5Cquad%20%EC%8B%A0%EB%A2%B0%EA%B5%AC%EA%B0%84%5Cquad%20%3A%5Cquad%20%5Cbar%20%7B%20X%20%7D-2.58%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%5Cquad%20%5Cle%20%5Cquad%20m%5Cquad%20%5Cle%20%5Cquad%20%5Cbar%20%7B%20X%20%7D%2B2.58%5Cfrac%20%7B%20%5Csigma%20%20%7D%7B%20%5Csqrt%20%7B%20n%20%7D%20%7D%5Cquad%20%20








+ Recent posts