금융(9)
-
TA-Lib을 활용한 기술적 분석 (1/2)
TA-Lib은 기술적 분석을 위해, 주요 지표들을 쉽게 다룰수 있도록 지원해주는 Python 패키지입니다. 이 패키지에 대해서 간략하게 소개한적이 있지만( https://direction-f.tistory.com/110) 구체적인 활용예시들에 대해서는 다루지 않아, 이번 포스팅에서 주요 지표들과 함께 TA-Lib 활용 방법에 대해서 한번 정리해보겠습니다. TA-lib의 설치는 일반적으로 pip install을 활용하여 설치하기가 어렵습니다. 제가 앞서 정리하면서 활용했던 사이트도 사라지고, 조금씩 설치방법이 변경되는 것으로 보입니다. 따라서 Ta-lib 공식 페이지에서 어떻게 설치하는지 확인하시어 진행하는것이 좋을 것 같습니다. https://pypi.org/project/TA-Lib/ [이동평균선(SM..
2024.04.23 -
시계열 데이터 Trend 감지
앞선 포스팅에서 시계열 데이터에서 변하는 지점을 식별하는 알고리즘을 다뤘다면, 이번 포스팅에서는 시계열 데이터의 트렌드를 감지할 수 있는 방법에 대해서 다뤄보겠습니다. 트렌드는 증가/감소/방향없음으로 나타낼 수 있을 것입니다. Kat 패키지에서는 Mann-Kendall test라는 알고리즘을 활용하여, 현재 시계열 데이터가 어떤 트렌드를 가지고 있는지를 감지합니다. Mann-Kendall test는 시계열 기간에 있는 모든 지점에 대해서 이원비교를 수행하고 데이터 지점이 n개라고 한다면 총 비교 수는 n(n-1)/2가 됩니다. 모든 쌍을 대상으로 아래와 같이 indicator function을 활용하여 0인지 1인지 -1인지를 결정합니다. 그 후 indicator function들의 값을 합합니다. 활용..
2024.04.01 -
시계열 데이터에서 변화점 찾기(change point detection)
시계열 데이터에서 change point는 시계열 데이터의 추세나 분포가 변화하는 지점을 뜻합니다. 따라서 변화점을 감지한다는 것은 어느 특정 지점에서 시계열 데이터의 평균이나 분포가 변화하였는지를 감지하는 것입니다. 이러한 시계열 데이터의 변화점을 감지하는 대표적인 알고리즘과 쉽게 적용할 수 있는 Python 라이브러리를 정리해보겠습니다. [CUSUM (cumulative sum) 방법] 해당 방법론은 change point 전,후로 평균이 변화한다고 가정하고 그 변화가 일어난 지점을 찾는 방법입니다. 이번 포스팅에서는 Facebook에서 제공한 시계열 분석 패키지 Kats 패키지를 활용하고자 하며, 해당 패키지에서 변화점을 감지하는 순서는 다음과 같습니다. 1) 초기 initial change poi..
2024.03.18 -
Outlier 식별
금융시장에서 Outlier는 그 자체로 중요한 의미를 가질 수도 있고, 어떤 주식에서는 변곡점을 나타낼 수도 있습니다. 또는 그냥 이상현상일 수도 있습니다. 따라서 Outlier처리를 어떻게 할지는 또 다른 어려운 과제지만 먼저 Outlier을 어떻게 식별할지에 대해서 다루어 보도록 하겠습니다. 이번 포스팅에서는 Outlier 식별을 하는데 있어서 고전적인 방법을 다루도록 하겠습니다. 간단하지만 직관적이고 여전히 많이 활용되고 있는 방법입니다. [평균과 표준편차 활용] 시계열 데이터의 경우 rolling할 window를 정하고 해당 window에서 평균과 표준편차를 활용해서 얼마만큼 평균과 차이가 나는지를 확인하는 것입니다. 일반적으로 정규분포를 생각하면 "평균 + 3*표준편차"보다 특정값이 클 확률은 ..
2024.03.13 -
Sharpe ratio, CAPM
주식을 하다보면, 하나의 종목만을 사고 팔고하는 경우가 없고 여러 종목을 선정하고 비중을 조정하는 경우가 많습니다. 이런 여러 종목들을 섞는 것을 포트폴리오를 구성한다고 하는 것이고, 포트폴리오의 성과와 위험을 관리하는 것은 중요 합니다. 이번 포스팅에서는 포트폴리오의 성과를 측정하기 위한 가장 기본적인 숫자들을 다뤄보도록 하겠습니다. [Sharpe Ratio] Sharpe Ratio는 포트폴리오 위험성 대비 수익성이 어떠한지를 나타내는 것으로, 값이 클수록 좋습니다. Sharpe Ratio가 크다는 것은 포포트폴리오 위험성(표준편차)가 낮고 수익성이 높다는 것입니다. 결국 변동(위험)대비 수익률이 어떠한지를 보는 것입니다. $R_p$는 포트폴리의 수익률, $R_f$는 무위험 수익률, $\sigma_p$..
2023.10.09 -
금융 데이터 다루기 > 노이즈 제거(이동평균, 칼만필터(Kalman-filter))
금융 데이터에는 많은 경우 시계열성을 가지고 있고 주가와 같이 하루하루 변동성이 큰 데이터들이 있습니다. 이러한 데이터들을 효과적으로 분석하기 위해서는 Noise를 제거하고 실제로 이 데이터가 가지고 있는 진짜 정보를 추출하는 방법에 대한 기본적인 이해가 필요합니다. [이동평균] 이동평균은 우리가 잘 알고 있는 방법론이고 실제로 주가의 추세를 볼때 활용하는 20일 이동평균선도 이 이동평균의 개념을 활용한 것입니다. 이동평균은 말그대로 시계열 데이터를 3일, 5일, 10일 등 우리가 정한 집합으로 나누고 해당 집합에서의 평균을 이어서 활용하는 것입니다. Pandas를 활용해서 너무나도 쉽게 구할 수 있지만, For loop을 활용해서 구하는 방법도 구현을 해보도록 하겠습니다. import FinanceDa..
2023.08.05