단순회귀분석에서의 추론

2020. 8. 25. 22:37데이터 분석 기본

반응형

우리는 이전 포스팅(https://direction-f.tistory.com/37)에서 단순회귀모형에서 기울기(β1)와 절편(β0)을 최소제곱추정법을 활용하여 추정했습니다.

다만, 기울기(β1)와 절편(β0)은 관측값에 의해 값이 달라지는 확률변수입니다. 그러므로 기울기(β1)와 절편(β0)은 분포를 가지고 있습니다.

따라서 우리는 신뢰구간, 기각역등을 이용하여 단순회귀분석모형에서 기울기(β1)가 0이 아닌지를 통계적으로 검증하여, 실제로 x와 y가 통계적으로 유의한 관계를 가지는지를 알 수 있습니다.

예를 들어 아래와 같은 데이터가 있다고 가정해보겠습니다.

  체중
A 170 70
B 180 80
C 165 65
D 150 55

4개의 데이터를 가지고 회귀분석을 해보면 아래와 같은 결과를 확인할 수 있습니다.

우리는 회귀계수의 추론을 통해서 체중의 계수인 1.2가 실제로 1.2인지 0인지를 통계적으로 검증할 수 있습니다.

[기울기 β1에 대한 추론]

기울기 β1에 대한 추론은 추정량 를 바탕으로 이루어집니다. 이 때 추정량 은 평균은 β1, 분산은 로 알려져 있습니다. 따라서 β1에 대한 추론은 앞서 했던 모평균에 관한 추론과 흡사하게 이루어집니다.

표준오차는 분산에 제곱근 하면 되며, 오차의 분산이 주어지지 않았을 때는 를 이용하면 되며, SSE는 잔체제곱합입니다. (참고:https://allo-ew.tistory.com/19)

추정량 은 표본분포의 확률변수는 아래와 같습니다.

즉, 자유도가 n-2인 t분포를 따르게 됩니다. 따라서, β1의 100(1-α)% 신뢰구간은 아래와 같습니다.

기각역 추정을 위한 검정통계량은 아래와 같습니다.(H0: β1=βx, 유의수준 α)

기각역은 아래와 같습니다.

반응형