2020. 8. 20. 20:19ㆍ데이터 분석 기본
지금까지는 하나의 표본에 대해서 가설검정, 신뢰구간을 추정했습니다. 이번 포스팅에서는 두 표본집단에 대해서 비교를 하는 통계추론 방안에 대해서 정리해보도록 하겠습니다.
예를 들어 A지역 사람들의 평균소득과 B지역 사람들의 평균소득을 비교하는 문제와 같은 것입니다.
아래는 두 모집단으로부터 추출된 두 개의 표본과 그로부터 계산되는 통계량을 정리한 것입니다.(이전에 했던 하나의 표본으로 할때와 같습니다. 다만 그것을 두 번하는 것 뿐입니다.)
평균이 μ1이고 분산이 σ1인 모집단으로부터 추출된 표본(표본의 개수 n1):
평균이 μ2이고 분산이 σ2인 모집단으로부터 추출된 표본(표본의 개수 n2):
여기서 우리의 관심사는 μ1-μ2에 대한 추론입니다.
[두 모평균의 차이 추론(표본의 크기가 충분할 때)]
두 모평균의 차 (μ1-μ2)에 대한 추론을 위해서 두 표본평균의 차를 활용하는 것이 일반적입니다. 두 표본의 크기 n1, n2가 충분히 클 때 두 표본평균은 아래와 같이 정규분포로 근사되게 됩니다.
그렇다면, 정규분포의 성질에 따라 표본평균의 차이는 다음과 같은 정규분포를 따르게 됩니다.
표본평균의 차이도 정규분포를 따른다면, 정규화를 시켜줄 수 있습니다. 이 때 표본이 크기가 충분히 클때 모표준편차 σ는 표본표준편차 s로 대체하여 표현할 수 있습니다.
위와같이 정규화한뒤 표준정규분포를 활용하면, 앞서 단독 표본일 때 신뢰구간을 추정하는 방법과 동일하게 두 표본의 표본평균차이에 대한 신뢰구간을 추정할 수 있습니다.
최종적으로, (μ1-μ2)에 대한 신뢰구간 및 검정은 아래와 같이 정리 할 수 있습니다
(1) 표본의 크기 n1, n2가 모두 30보다 클 때 100(1-α)% 신뢰구간:
(2) 표본의 크기 n1, n2가 모두 30보다 클 때 H0: (μ1-μ2)=δ0에 대한 검정:
'데이터 분석 기본' 카테고리의 다른 글
단순회귀분석 (0) | 2020.08.24 |
---|---|
두 모집단의 비교(표본이 작을 때, T-Test) (0) | 2020.08.20 |
가설검정 > P-value(유의확률) (0) | 2020.08.13 |
가설검정 > 검정통계량과 기각역 (0) | 2020.08.12 |
가설검정 > 가설, 검정통계량 (0) | 2020.08.09 |