금융 데이터 분석(19)
-
CNN을 활용한 주가 방향 예측
이번 포스팅에서는 시계열 데이터에 Convolutional neural network을 적용하여 주가 방향을 예측해보도록 하겠습니다. Convolutional neural network은 주로 이미지 분석에 많이 활용되지만, 간간히 주가를 예측하기 위해도 활용되는 것 같습니다. Research paper들을 참조하여 모델을 구성한 것은 아니고, CNN을 활용해보는 정도에 의의를 두고자 합니다. 향후 시간을 내서 paper들을 읽고 체계적으로 구성해보는 것도 좋을 것 같습니다. 이번에는 삼성전자 대신, SKT주가를 활용하고자 합니다. 좀 더 긴 기간의 가격 정보를 활용하고자 하는데, 삼성전자의 경우 액면분할이 이루어진지 꽤 최근이라고 볼 수 있기 때문에 긴 기간의 주가를 활용하기는 부적절하다고 판단했습니다..
2020.07.30 -
SVM(서포트 벡터 머신)을 활용한 주가 방향 예측
이번 포스팅에서는 SVM을 활용하여 주가의 방향을 예측해보도록 하겠습니다. 추가적으로, 삼성전자 주가를 예측하기 위해 삼성전자 주가 정보만 이용하는 것이 아니라 KOSPI 지수 정보도 함께 활용하여 주가의 방향을 예측해보겠습니다. 이번 포스팅에서 활용하는 변수는 아래의 자료를 참조하여 만들었습니다. 아래 자료에서 활용한 정보와 완전히 일치하진 않지만, 아이디어를 차용하여 단순 가격 데이터가 아니라 가격데이터를 활용하여 예측에 활용할 변수를 만들었습니다. Madge, Saahil, and Swati Bhatt. "Predicting stock price direction using support vector machines." Independent work report spring (2015).(https..
2020.07.28 -
랜덤 포레스트(Random Forest)를 활용한 주가 방향 예측
주가를 예측하는데 있어 시계열 분석 방법론이 활발히 적용되나, 의사결정나무, 랜덤 포레스트와 같은 Classification 모형도 주가 방향을 예측하는데 활용되고 있습니다. 이번에는 랜덤 포레스트 모형을 이용하여 주가가 오를지 안오를지 방향성에 대해 예측해 보겠습니다. 이번도 마찬가지로 아주 예측력이 뛰어난 모델을 만들다기 보다는 기본적인 모형을 활용하여 주가를 예측하는데 적용하는데 의의를 두고 있습니다. 코드에 들어가기 앞서 먼저 방향 예측에 대한 구현 아이디어를 먼저 정리해보도록 하겠습니다. 여기서는 앞선 7일치 정보를 이용하여 8일째에 주가가 전일보다 오를지 떨어질지 예측해보도록 하겠습니다. 먼저 필요한 Module을 Import하고 크롤링을 통해 수집했던 주가 데이터를 불러옵니다. import ..
2020.07.27 -
RNN을 이용한 주가 예측
시계열 자료를 분석하기 위해서 딥러닝이 최근에는 활발히 적용되고 있습니다. 시계열 정보를 다루는 딥러닝 중에가서 가장 기본적인 RNN을 활용해 주가를 예측(Fitting)해보도록 하겠습니다. 지난번에 했던 단순/다항 회귀분석이나 이번에 작성할 RNN 모형 모두 정확한 예측보다는, 적용될 수 있는 예측방법들이 이러한 것들이 있다는 것을 정리하고자 합니다. 따라서 각 모형에 대한 자세한 이론이나 설명보다는 간단한 모델들을 직접 구현하면서 정리하는데 주안점을 두고 있습니다. 먼저 필요한 Module을 Import하고 크롤링을 통해 수집했던 주가 데이터를 불러옵니다 import pandas as pd import numpy as np import torch import torch.nn as nn import o..
2020.07.22 -
다항회귀모형을 이용한 주가 예측
지난번 포스팅에서 단순 회귀를 이용하여 주가의 추세를 분석해 보았습니다. 하지만 단순 회귀는 선형적으로만 추세를 추정하기 때문에 비선형성을 전혀 반영할 수 없었습니다. 그렇기 때문에 이번에는 비선형성을 반영할 수 있는 다항회귀모형(Polynomial Regression)을 활용하여 주가를 분석해 보도록 하겠습니다. 기본 단순 회귀 모형이 Y= αX+β의 모습을 가졌다면 다항회귀모형은 아래와 같은 모습을 가졌습니다. 기존의 독립변수 X를 제곱한 값을 또 하나의 독립 변수로 활용하는 것입니다. 이렇게 되면 독립변수 X와 종속변수 y간의 비선형적인 관계도 분석할 수 있게 됩니다. 단순회귀모형 포스팅(https://direction-f.tistory.com/8)에서와 마찬가지로 필요한 Module과 수집한 삼성..
2020.07.15 -
단순회귀모형을 이용한 주가 예측
앞의 글(https://direction-f.tistory.com/6)에서 어떻게 하면 주가 데이터를 수집할지에 대해서 정리하였습니다. 이번에는 수집한 데이터를 활용하는 방법에 대해서 정리하도록 하겠습니다. 먼저 기본적인 모형인 단순회귀모형을 이용하여 주가를 예측하는 모델을 구성해보겠습니다. 사실 단순회귀모형은 주가를 예측하는데 탁월한 예측력을 제공해주는 모형은 아닙니다. 왜냐하면 주가는 변동성이 심해, 올라갔다 내려갔다를 반복하는데, 회귀모형은 이러한 변동성을 잡아내기 어렵기 때문입니다. 그래서 정확한 예측을 위해선 변동성을 일부 반영 할 수 있는 ARIMA/ARIMAX같은 시계열 모형이나, RNN/LSTM과 같은 딥러닝 모형이 활발히 적용되고 있습니다. 그럼에도 불구하고, 전문적인 분석모델링을 하는 ..
2020.07.13