Python(81)
-
시계열 데이터에서 변화점 찾기(change point detection)
시계열 데이터에서 change point는 시계열 데이터의 추세나 분포가 변화하는 지점을 뜻합니다. 따라서 변화점을 감지한다는 것은 어느 특정 지점에서 시계열 데이터의 평균이나 분포가 변화하였는지를 감지하는 것입니다. 이러한 시계열 데이터의 변화점을 감지하는 대표적인 알고리즘과 쉽게 적용할 수 있는 Python 라이브러리를 정리해보겠습니다. [CUSUM (cumulative sum) 방법] 해당 방법론은 change point 전,후로 평균이 변화한다고 가정하고 그 변화가 일어난 지점을 찾는 방법입니다. 이번 포스팅에서는 Facebook에서 제공한 시계열 분석 패키지 Kats 패키지를 활용하고자 하며, 해당 패키지에서 변화점을 감지하는 순서는 다음과 같습니다. 1) 초기 initial change poi..
2024.03.18 -
Outlier 식별
금융시장에서 Outlier는 그 자체로 중요한 의미를 가질 수도 있고, 어떤 주식에서는 변곡점을 나타낼 수도 있습니다. 또는 그냥 이상현상일 수도 있습니다. 따라서 Outlier처리를 어떻게 할지는 또 다른 어려운 과제지만 먼저 Outlier을 어떻게 식별할지에 대해서 다루어 보도록 하겠습니다. 이번 포스팅에서는 Outlier 식별을 하는데 있어서 고전적인 방법을 다루도록 하겠습니다. 간단하지만 직관적이고 여전히 많이 활용되고 있는 방법입니다. [평균과 표준편차 활용] 시계열 데이터의 경우 rolling할 window를 정하고 해당 window에서 평균과 표준편차를 활용해서 얼마만큼 평균과 차이가 나는지를 확인하는 것입니다. 일반적으로 정규분포를 생각하면 "평균 + 3*표준편차"보다 특정값이 클 확률은 ..
2024.03.13 -
Portfolio optimization(포트폴리오 최적화)
이번 포스팅에서는 시뮬레이션과 최적화를 활용하여 포트폴리오의 종목 비중을 최적화 할 수 있는 방법에 대해서 작성해보겠습니다. Sharpe ratio 개념에서 엿볼 수 있듯이 변동성을 최소화하면서 수익률을 극대화하는 것이 좋은 포트폴리오를 구성하는 방법일 것입니다. 물론 미래를 알 수 있다면 수익률이 가장 좋은 단일 종목을 선택하여 가지고 가는 것이 좋겠지만, 미래는 불확실하기 때문에 우리가 선정한 후보 종목들 중에서 어떻게 비중을 가져가는 것이 좋은 포트폴리오를 구성하는 것인지 선택하는 기준에 대해서 살펴보겠습니다. [시뮬레이션] 시뮬레이션 방법은 종목을 구성하고자 한 비중들을 무작위로 생성하고, 생성한 비중일 때의 수익률과 변동성을 계산하여 Plotting 해보는 방법입니다. 예를 들어 삼성전자/네이버..
2023.10.10 -
Sharpe ratio, CAPM
주식을 하다보면, 하나의 종목만을 사고 팔고하는 경우가 없고 여러 종목을 선정하고 비중을 조정하는 경우가 많습니다. 이런 여러 종목들을 섞는 것을 포트폴리오를 구성한다고 하는 것이고, 포트폴리오의 성과와 위험을 관리하는 것은 중요 합니다. 이번 포스팅에서는 포트폴리오의 성과를 측정하기 위한 가장 기본적인 숫자들을 다뤄보도록 하겠습니다. [Sharpe Ratio] Sharpe Ratio는 포트폴리오 위험성 대비 수익성이 어떠한지를 나타내는 것으로, 값이 클수록 좋습니다. Sharpe Ratio가 크다는 것은 포포트폴리오 위험성(표준편차)가 낮고 수익성이 높다는 것입니다. 결국 변동(위험)대비 수익률이 어떠한지를 보는 것입니다. $R_p$는 포트폴리의 수익률, $R_f$는 무위험 수익률, $\sigma_p$..
2023.10.09 -
금융 데이터 다루기 > 노이즈 제거(이동평균, 칼만필터(Kalman-filter))
금융 데이터에는 많은 경우 시계열성을 가지고 있고 주가와 같이 하루하루 변동성이 큰 데이터들이 있습니다. 이러한 데이터들을 효과적으로 분석하기 위해서는 Noise를 제거하고 실제로 이 데이터가 가지고 있는 진짜 정보를 추출하는 방법에 대한 기본적인 이해가 필요합니다. [이동평균] 이동평균은 우리가 잘 알고 있는 방법론이고 실제로 주가의 추세를 볼때 활용하는 20일 이동평균선도 이 이동평균의 개념을 활용한 것입니다. 이동평균은 말그대로 시계열 데이터를 3일, 5일, 10일 등 우리가 정한 집합으로 나누고 해당 집합에서의 평균을 이어서 활용하는 것입니다. Pandas를 활용해서 너무나도 쉽게 구할 수 있지만, For loop을 활용해서 구하는 방법도 구현을 해보도록 하겠습니다. import FinanceDa..
2023.08.05 -
Alpha Factor 탐색 > Value Factor
Value Factor를 활용하여 투자를 하는 사람들은 결국 기업이 가친 가치만큼 주가가 올라가거나 또는 내려간다고 생각을 합니다. 주요한 Value Factor로는 Cash flow yield, Free Cash flow yield, 배당율, Earning yield(주가대비 수익) 등이 있습니다. 정말 많은 Value Factor들이 있기 때문에 무엇을 적용할지를 결정하는 것부터가 중요한 일이라고 볼 수 있을 것입니다. 일단 여기서는 Python을 활용해서 Free Cash flow yield를 계산하는 방법을 다루어보겠습니다. 이 방법을 이용해서 재무정보와 주가 정보를 불러와서 자신이 활용하고 싶은 Factor들을 만들어서 활용하시면 좋을 것 같습니다. [Free Cash flow yield] Ca..
2023.07.20