두 모집단의 비교(표본이 클 때)

2020. 8. 20. 20:19데이터 분석 기본

반응형

지금까지는 하나의 표본에 대해서 가설검정, 신뢰구간을 추정했습니다. 이번 포스팅에서는 두 표본집단에 대해서 비교를 하는 통계추론 방안에 대해서 정리해보도록 하겠습니다.

예를 들어 A지역 사람들의 평균소득과 B지역 사람들의 평균소득을 비교하는 문제와 같은 것입니다.

아래는 두 모집단으로부터 추출된 두 개의 표본과 그로부터 계산되는 통계량을 정리한 것입니다.(이전에 했던 하나의 표본으로 할때와 같습니다. 다만 그것을 두 번하는 것 뿐입니다.)

평균이 μ1이고 분산이 σ1인 모집단으로부터 추출된 표본(표본의 개수 n1):

평균이 μ2이고 분산이 σ2인 모집단으로부터 추출된 표본(표본의 개수 n2):

여기서 우리의 관심사는 μ1-μ2에 대한 추론입니다.

[두 모평균의 차이 추론(표본의 크기가 충분할 때)]

두 모평균의 차 (μ1-μ2)에 대한 추론을 위해서 두 표본평균의 차를 활용하는 것이 일반적입니다. 두 표본의 크기 n1, n2가 충분히 클 때 두 표본평균은 아래와 같이 정규분포로 근사되게 됩니다.

그렇다면, 정규분포의 성질에 따라 표본평균의 차이는 다음과 같은 정규분포를 따르게 됩니다.

표본평균의 차이도 정규분포를 따른다면, 정규화를 시켜줄 수 있습니다. 이 때 표본이 크기가 충분히 클때 모표준편차 σ는 표본표준편차 s로 대체하여 표현할 수 있습니다.

위와같이 정규화한뒤 표준정규분포를 활용하면, 앞서 단독 표본일 때 신뢰구간을 추정하는 방법과 동일하게 두 표본의 표본평균차이에 대한 신뢰구간을 추정할 수 있습니다.

최종적으로, (μ1-μ2)에 대한 신뢰구간 및 검정은 아래와 같이 정리 할 수 있습니다

(1) 표본의 크기 n1, n2가 모두 30보다 클 때 100(1-α)% 신뢰구간:

(2) 표본의 크기 n1, n2가 모두 30보다 클 때 H0: (μ1-μ2)=δ0에 대한 검정:

 

반응형