분류 전체보기(106)
-
SVM(서포트 벡터 머신)을 활용한 주가 방향 예측
이번 포스팅에서는 SVM을 활용하여 주가의 방향을 예측해보도록 하겠습니다. 추가적으로, 삼성전자 주가를 예측하기 위해 삼성전자 주가 정보만 이용하는 것이 아니라 KOSPI 지수 정보도 함께 활용하여 주가의 방향을 예측해보겠습니다. 이번 포스팅에서 활용하는 변수는 아래의 자료를 참조하여 만들었습니다. 아래 자료에서 활용한 정보와 완전히 일치하진 않지만, 아이디어를 차용하여 단순 가격 데이터가 아니라 가격데이터를 활용하여 예측에 활용할 변수를 만들었습니다. Madge, Saahil, and Swati Bhatt. "Predicting stock price direction using support vector machines." Independent work report spring (2015).(https..
2020.07.28 -
랜덤 포레스트(Random Forest)를 활용한 주가 방향 예측
주가를 예측하는데 있어 시계열 분석 방법론이 활발히 적용되나, 의사결정나무, 랜덤 포레스트와 같은 Classification 모형도 주가 방향을 예측하는데 활용되고 있습니다. 이번에는 랜덤 포레스트 모형을 이용하여 주가가 오를지 안오를지 방향성에 대해 예측해 보겠습니다. 이번도 마찬가지로 아주 예측력이 뛰어난 모델을 만들다기 보다는 기본적인 모형을 활용하여 주가를 예측하는데 적용하는데 의의를 두고 있습니다. 코드에 들어가기 앞서 먼저 방향 예측에 대한 구현 아이디어를 먼저 정리해보도록 하겠습니다. 여기서는 앞선 7일치 정보를 이용하여 8일째에 주가가 전일보다 오를지 떨어질지 예측해보도록 하겠습니다. 먼저 필요한 Module을 Import하고 크롤링을 통해 수집했던 주가 데이터를 불러옵니다. import ..
2020.07.27 -
연속확률분포, 정규분포, 표준정규분포
우리가 셀 수 있는 확률변수들의 분포를 이산확률분포라고 불렀습니다. 이러한 이상확률분포 중에는 대표적으로 이항분포와 포아송 분포가 있었습니다. 이산확률분포와는 다르게, 정규분포는 0과 1사이의 임의의 실수처럼 셀 수 없는 연속적인 값을 가지는 연속확률분포입니다. 정규분포는 연속적인 값을 가지는 확률변수의 분포를 나타내는데 가장 많이 적용되고 있는 분포입니다. 정규분포 외에도 데이터에 따라 더 적합한 분포들도 많이 제안되어 왔지만, 여전히 가장 강력하고 일상적으로 적용되고 있는 분포입니다. [연속활률분포] 본격적으로 정규분포에 대해서 알아보기 전에, 연속확률분포에 대해서 알아보겠습니다. 연속확률분포는 이산확률분포처럼 발생가능한 모든 값에 확률을 대응/나열하여 표현하기가 어렵습니다. 발생 가능한 값이 무한대..
2020.07.26 -
포아송 분포
만약 우리가 금은방을 운영하고 있다고 가정해보겠습니다. 퇴근 후 한 시간에 도둑이이 10명 올 확률은 어떻게 될까요? 100명이 올 확률은 어떻게 될까요?(도둑이 오면 안되겠지만요...) 이와 같이 일정 기간 동안에 확률이 낮은 특정 사건이 일어날 확률을 나타내기 위해 활용하는 것이 포아송 분포입니다. 다시 위의 예를 좀 더 깊게 들여보다면 저 확률을 이항분포로 나타낼 수 있지 않을까? 하는 생각이 드실 수도 있습니다. 다시 말하면 1분에 도둑이 올 확률이 0.01 오지 않을 확률이 0.99라면 이는 결과가 두 가지 뿐인 베르누이 시행으로 간주할 수 있습니다. 따라서 한 시간(60분)은 베르누이 시행을 60번 시행했다고 볼 수 있을 것입니다. 하지만 도둑이 1분에 한명만 오는 것이라고 한정할 수 없습니다..
2020.07.23 -
RNN을 이용한 주가 예측
시계열 자료를 분석하기 위해서 딥러닝이 최근에는 활발히 적용되고 있습니다. 시계열 정보를 다루는 딥러닝 중에가서 가장 기본적인 RNN을 활용해 주가를 예측(Fitting)해보도록 하겠습니다. 지난번에 했던 단순/다항 회귀분석이나 이번에 작성할 RNN 모형 모두 정확한 예측보다는, 적용될 수 있는 예측방법들이 이러한 것들이 있다는 것을 정리하고자 합니다. 따라서 각 모형에 대한 자세한 이론이나 설명보다는 간단한 모델들을 직접 구현하면서 정리하는데 주안점을 두고 있습니다. 먼저 필요한 Module을 Import하고 크롤링을 통해 수집했던 주가 데이터를 불러옵니다 import pandas as pd import numpy as np import torch import torch.nn as nn import o..
2020.07.22 -
베르누이 시행과 이항 분포
[베르누이 시행] 실험을 통해 얻을 수 있는 결과가 두 가지만 있다고 생각해보겠습니다. 예를 들어 동전을 던지는 실험을 했을 때 우리가 얻을 수 있는 결과는 앞면(H)와 뒷면(T) 두 가지 뿐입니다. 예와 같이 두 가지의 결과만 반복해서 나오며, 아래와 같은 조건을 만족하는 경우 이를 베르누이 시행이라고 부릅니다. 1) 각 시행은 성공(S), 실패(F)의 두 결과만을 갖는다(우리가 흔히 사용하는 성공의, 실패의 의미와는 무관, 결과가 두 개 뿐임을 강조) 2) 각 시행에서 성공할 확률 P(S)=p, 실패활 확률 P(F)=q(=1-p)로 그 값이 일정함 3) 각 시행은 서로 독립으로 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않음 [이항분포(Binomial distribution)] 위와 같은 조..
2020.07.20