회귀분석(9)
-
단순회귀분석에서의 추론
우리는 이전 포스팅(https://direction-f.tistory.com/37)에서 단순회귀모형에서 기울기(β1)와 절편(β0)을 최소제곱추정법을 활용하여 추정했습니다. 다만, 기울기(β1)와 절편(β0)은 관측값에 의해 값이 달라지는 확률변수입니다. 그러므로 기울기(β1)와 절편(β0)은 분포를 가지고 있습니다. 따라서 우리는 신뢰구간, 기각역등을 이용하여 단순회귀분석모형에서 기울기(β1)가 0이 아닌지를 통계적으로 검증하여, 실제로 x와 y가 통계적으로 유의한 관계를 가지는지를 알 수 있습니다. 예를 들어 아래와 같은 데이터가 있다고 가정해보겠습니다. 키 체중 A 170 70 B 180 80 C 165 65 D 150 55 4개의 데이터를 가지고 회귀분석을 해보면 아래와 같은 결과를 확인할 수 있..
2020.08.25 -
단순회귀분석
우리는 회귀분석을 활용하여, 아래와 같은 질문에 답을 할 수 있습니다. (1) 변수들은 서로 관련이 있는가? (2) 얼마나 밀접하게 관련이 있는가? (3) 관련이 있다면, 다른 변수를 가지고 관심있는 변수를 예측할 수 있는가? 위와 같이 회귀분석은 변수들의 관계를 규명하는데 활용되며, 회귀분석에 활용되는 변수는 독립변수(Independent variable)과 종속변수(dependent variable)가 있습니다. 독립변수는 설명변수(explanatory variable)이라고도 불리며, 연구자가 통제하는 변수입니다. 종속변수는 독립변수에 의해 결정/변화되는 변수로 주로 연구자가 관심을 가지는 변수입니다. [단순회귀분석] 단순회귀분석은 종속변수가 1개이고, 독립변수도 1개인 가장 간단한 회귀분석입니다...
2020.08.24 -
단순회귀모형을 이용한 주가 예측
앞의 글(https://direction-f.tistory.com/6)에서 어떻게 하면 주가 데이터를 수집할지에 대해서 정리하였습니다. 이번에는 수집한 데이터를 활용하는 방법에 대해서 정리하도록 하겠습니다. 먼저 기본적인 모형인 단순회귀모형을 이용하여 주가를 예측하는 모델을 구성해보겠습니다. 사실 단순회귀모형은 주가를 예측하는데 탁월한 예측력을 제공해주는 모형은 아닙니다. 왜냐하면 주가는 변동성이 심해, 올라갔다 내려갔다를 반복하는데, 회귀모형은 이러한 변동성을 잡아내기 어렵기 때문입니다. 그래서 정확한 예측을 위해선 변동성을 일부 반영 할 수 있는 ARIMA/ARIMAX같은 시계열 모형이나, RNN/LSTM과 같은 딥러닝 모형이 활발히 적용되고 있습니다. 그럼에도 불구하고, 전문적인 분석모델링을 하는 ..
2020.07.13