Python(71)
-
단순회귀모형을 이용한 주가 예측
앞의 글(https://direction-f.tistory.com/6)에서 어떻게 하면 주가 데이터를 수집할지에 대해서 정리하였습니다. 이번에는 수집한 데이터를 활용하는 방법에 대해서 정리하도록 하겠습니다. 먼저 기본적인 모형인 단순회귀모형을 이용하여 주가를 예측하는 모델을 구성해보겠습니다. 사실 단순회귀모형은 주가를 예측하는데 탁월한 예측력을 제공해주는 모형은 아닙니다. 왜냐하면 주가는 변동성이 심해, 올라갔다 내려갔다를 반복하는데, 회귀모형은 이러한 변동성을 잡아내기 어렵기 때문입니다. 그래서 정확한 예측을 위해선 변동성을 일부 반영 할 수 있는 ARIMA/ARIMAX같은 시계열 모형이나, RNN/LSTM과 같은 딥러닝 모형이 활발히 적용되고 있습니다. 그럼에도 불구하고, 전문적인 분석모델링을 하는 ..
2020.07.13 -
금융 데이터 수집
금융 분석을 하기 위해서 주가 데이터를 가져오는 방안에 대해서 정리해보려고 합니다. 주가 데이터를 가져오는 방안으로는 크게 3가지가 있는 것 같습니다. 1) 수동으로 주가 데이터를 다운로드 받는 방법 2) 증권사 API를 통해 수집하는 방법 3) 웹 크롤링(네이버 금융)을 통해 수집하는 방법입니다. 저의 경우에는 키움증권 API를 통해 데이터를 수집하기도 하지만 효율이 떨어지는 것 같습니다. 단순히 분석을 위해서는 주로 1)수동 다운로드 2) 웹 크롤링을 주로 활용하고 있습니다. 따라서 이 두가지 방안에 대해서 간략히 정리하도록 하겠습니다. 먼저 수동으로 다운로드 받는 경우입니다. 저의 경우에는 이 때는 Yahoo Finance(https://finance.yahoo.com/)를 자주 활용하는데요, Ya..
2020.07.12 -
확률의 기본 연산
우리가 실제 어떤 사건의 확률을 계산할 때는 여러 관계 있는 사건들을 활용하는 것이 효율적인 경우가 많습니다. 예를 들어 주사위를 한 번 던졌을 때, 짝수면서 3보다 이하인 숫자가 나올 확률을 구해보는 문제가 있다고 해보겠습니다. 위의 문제는 "짝수인 사건" 과 "3보다 이하인 숫자가 나온 사건"을 활용하여 쉽게 확률을 도출해 볼 수 있습니다. 이러한 효율적인 계산을 위해서 사건들의 기본 연산인 여사건, 합사건, 곱사건에 대해서 살펴보겠습니다. [여사건, 합사건, 곱사건] 여사건은 특정 사건 A가 있을 때 A에 포함되지 않은 근원사건들의 모임으로 나타냅니다. 따라서 특정 사건 A와 특정 사건 A의 여집합의 확률의 합은 1이 됩니다. 따라서 여사건의 확률법칙은 아래와 같습니다. 곱사건은 사건 A와 사건 B..
2020.07.12 -
확률의 이해
일반적으로 우리는 어떤 일이 일어날 가능성를 나타내는데 확률의 개념을 활용합니다. 확률의 개념은 저희가 무언가를 판단할 때 중요한 기준으로 작용하고 있습니다. 쉬운 예로 투자를 하는데, 돈을 잃을 확률이 높다고 여겨지면 투자를 하지 않을 것입니다. 그렇다면 통계학에서 확률은 어떻게 이야기 되고 있을까요? 통계적으로 확률을 정의하는데 앞서, 먼저 실험, 표본 공간(Sample space), 사건(event)을 먼저 정리하도록 하겠습니다. [실험, 표본공간, 사건] 여기에서의 실험은 우리가 그 실험의 결과를 사전에 정확하게 예측할 수 없는 확률실험(Random experiment)를 뜻합니다. 실험을 다시 정의해보면, 어떤 결과 나올지 모르는 상황에서 어떤 결과를 유발하는 과정을 말합니다. 표본공간은 실험에..
2020.07.11 -
평균과 표준편차
자료를 다룸에 있어, 몇몇 대표 지표를 통해 자료를 해석하고 설명하는 것이 도움이 될 때가 많습니다. 특히 이러한 대표 지표 중에서도 가장 대표적으로 활용 되는 것들이 바로 평균과 표준편차 이며, 평균과 표준편차는 단순 실무에서도 많이 적용되고 있는 지표입니다. 해당 글에서는 표본의 평균, 표준편차에 대해서 설명하도록 하겠습니다. [평균] 평균은 자료의 중심위치를 나타내는 지표중에서도 가장 많이 활용되고 있는 지표입니다. 평균도 산술평균, 기하평균, 조화평균 등 평균도 다양하게 나뉘어질 수 있지만, 우리가 흔히 알고 가장 많이 활용하고 있는 평균은 산술평균입니다. 어떤 표본들의 분포가 정규분포라고 가정해보면, 평균과 가까운 표본이 나올 가능성이 평균과 먼 표본이 나올 가능성보다 높다는 것을 유추해볼 수 ..
2020.07.08