2020. 8. 3. 21:40ㆍ데이터 분석 기본
통계적 추론이란 우리가 가지고 있는 표본으로부터 모집단의 특성을 추론하는 것을 말합니다. 다시 말하면, 통계적 추론은 표본으로부터 모집단의 특성을 유도하고 그 특성이 옳은지 그른지를 판단하는 것입니다.
모집단의 특성을 추정하는 것에는 점 추정(Point Estimiation)과 구간 추정(Interval Estimation)이 있습니다. 점추정은 모집단의 특성을 나타내리라 생각하는 하나의 값을 추정하는 것이고, 구간 추정은 하나의 값만을 추정하는 것이 아니라 모수를 포함하리라 생각하는 적절한 구간을 추정하는 것입니다.
[점 추정]
모수를 추정하기 위해 모집단에서 크기가 n인 표본을 추출한다고 가정해보겠습니다. 그렇다면, 표본의 평균은 아래와 같을 것입니다.
이때 표본의 평균은 추정량(estimator)가 됩니다. 즉, 표본이 어떻게 구성되었는지에 따라서 값이 달라지는 것입니다. 이제 추정량을 이용하여 추론한 모집단 특성값을 추정치(estimate)라고 합니다.
위에서 말한 것처럼 추정량은 표본에 따라 변하는 값입니다. 이러한 수치들의 변화의 정도는 추정량의 정확도와 관련이 있는데, 이 정확도를 추정하는 하나의 도구로 표준오차(standard error)라는 것을 활용합니다.
표준오차(standard error)는 추정량의 표준편차 입니다.
전 포스팅(https://direction-f.tistory.com/21)에서 표본평균의 표준편차는 평균이 μ이고 표준편차가 σ인 모집단이 주어졌을 때 아래와 같았습니다.
표준오차는 표본평균의 표준편차와 같습니다. 다만 모집단의 표준편차 σ가 주어지지 않은 경우가 대부분이기 때문에 이때는 표본자료의 표준편차를 σ대신하여 활용합니다. 표본자료의 표준편차(s)는 아래와 같이 도출했습니다.(https://direction-f.tistory.com/2)
(표본자료의 표준편차와 표본평균의 표준편차는 다른 것임을 유의해야 합니다.)
예제를 통해 확인해보겠습니다.
{2,3,4}라는 표본이 주어졌다고 가정해보겠습니다. 그렇다면 표본의 평균은 3이고 표본의 표준편차는 아래와 같은 계산을 통해 1이 됩니다.
이제 이 값을 모집단의 표준편차를 대신하여 표준오차를 계산합니다, 그렇다면 표준오차는 표본의크기의 제곱근을 나눠 1/√3 이 됩니다.
(만약 모집단의 표준편차 σ를 알고 있다면 모집단의 표준편차를 활용하여 계산하면 됩니다.)
'데이터 분석 기본' 카테고리의 다른 글
가설검정 (0) | 2020.08.06 |
---|---|
통계적 추론(구간 추정) (0) | 2020.08.04 |
표본평균의 분포와 중심극한 정리 (0) | 2020.07.31 |
정규점수, 정규확률그림 (0) | 2020.07.30 |
연속확률분포, 정규분포, 표준정규분포 (0) | 2020.07.26 |