전체 글(106)
-
Alpha를 찾아서 > 금융 데이터 불러오기
취미로, 재미로 금융 데이터를 분석한다고 해도 금융 데이터를 기반으로 무언가를 예측하고 분석한다는 것은 결국 시장의 움직임을 이겨내 수익을 창출할 수 있는 그 무언가를 찾아 내고자 하는 것이라고 생각합니다. 그 중에서 어떻게 보면 기술적으로는 누구나 할 수 있는 것이 Alpha Factor를 찾아내는 과정일 것입니다. 기업가치를 측정할 때 PER, PBR, EV/EBITDA와 같은 재무지표를 활용하는 것도 어떻게 보면 Alpha Factor을 찾아서 활용하는 것으로 볼 수 있을 것 같습니다. 이런관점에서 보면 결국 Alpha Factor를 찾아내는 과정은 Feature Engineering과 흡사할 것이고 가설과 검증을 통해서 어떤 요소가 Alpha Factor인지 판단해 볼 수 있을 것입니다. 물론 제..
2023.06.27 -
경영과학 - 수송계획법(Transportation Problem)
해당 글에서는 선형계획법의 응용으로써 수송문제를 다루어보고자 합니다. 수송문제란 다수의 공급지와 다수의 수요지가 존재하는 상황에서 어떤 공급지에서 어떤 수요지로 얼마만큼의 물량이 가야하는지를 결정하는 문제입니다. 일반적으로 수송문제는 3가지 상황에 대한 이해가 필요합니다. 첫 번째로는 공급지에서 수요지로 물량을 이동할 때 발생하는 비용입니다. 두 번째는 공급지에서 공급가능한 양(Capacity), 마지막으로는 수요지에서 필요로 하는 수요량입니다. 위의 3가지 상황을 활용하여 목적함수, 의사결정변수 등을 정의하게 됩니다. 예시를 통해 수송계획문제 해결방안에 대해서 정리해보도록 하겠습니다. 장난감을 생산하는 한 회사가 3개의 공장(공장 1, 공장 2, 공장3)을 보유하고 있고, 해당 장난감을 받을 도시가 4..
2022.06.06 -
경영과학 - 선형계획법(Linear Programming)
선형계획법은 현재 최적화 방법론중에서 가장 대중적인 방법이라고 할 수 있습니다. 우리가 선택해야 하는 대안(의사결정 변수)들을 선형의 등식이나 부등식으로 표현하여 최적화를 수행하는 것을 뜻합니다. 선형계획법은 유한한 자원을 효율적으로 분배할 때도 많이 활용되며 예시적으로 장난감회사에서 매출과 비용을 고려할 때 A장난감을 많이 생산할지 B장난감을 많이 생산할지 등과 같은 상황에 대한 답을 찾는 경우에도 적용할 수 있습니다. 선형계획법은 크게 의사결정변수(Decision Variable), 목적함수(Objective Function), 제약조건(Constraints), 부호제약(Sign Restrictions)로 이루어져 있습니다. 해당 블로그에서는 장난감 회사의 생산문제를 기반으로 위에서 언급한 의사결정변..
2022.05.19 -
경영과학 - Google OR-tools
일반적으로 경영과학이라고 하는 분야는 계량적 접근법 활용하여 의사결정을 하는 방법론을 총칭하는 것입니다. 애매한 정의와 같이 경영과학이란 분야는 광범위한 주제들을 포함하고 있습니다. 실제로 Management Science, Operations Research 서적을 보면 Linear Programming 부터 Integer Programmin, Dynamic Programming, Stochastinc Process, Simulation 등 다양한 내용을 다루고 있습니다. 이렇게 다양한 방법론 중 하나를 선택하여 깊게 들어가는 것도 어렵지만 중요한 일임에는 틀림이 없지만 "경영과학"이라는 용어에서 느낄 수 있듯이 경영과학에서 말하는 방법론들을 실제 의사결정에 활용하는 것이 더 의미가 있다고 생각합니다...
2022.05.09 -
Decision Tree - Boosting
Boosting은 용어에서 느껴지듯이 점점 강력한(예측력, 정확도가 높은) 모델을 만들어가는 알고리즘입니다. Weak learner에서 Strong learner로 발전하게 되는데, parallel하게 모형을 학습하여 조합하는 bagging과 다르게 sequential하게 만들어진 모델들을 조합하는 방식입니다. Boosting 모델 중에서 gradient boosting model - 2tree을 예시로 Boosting concept를 정리해보겠습니다. 1) 실제값에 적합,
2022.01.02 2) 첫번째 모형의 오차에 적합, 3) 최종 예측값 결정, 위에서 확인하는 것처럼, 첫번째 모형의 결과가 두번째 모형에도.. -
Decision Tree - Bagging
Bagging은 Bootstrap방법을 활용하는 방법으로, Decision Tree 모델의 최적의 성능을 이끌어내는데 많은 기여를 하고 있는 개념입니다. 앞서 정리한 것 처럼 Decision Tree는 상당히 과적합 문제에 취약하게 됩니다. Bagging을 활용하면 이와 같은 문제점을 다소 감소시킬 수 있습니다. Bagging은 Bootstrap aggregation의 약자인데, 이름에서 보는 것과 같이 Bootstrpa을 통해 Sample들을 만들고 여러 모델들의 결과 값을 집계하는 것입니다. 이를 통해 결과값의 안정성 확보를 도모합니다. 예시적으로, n개의 독립된 Sample들
2021.10.19 ,..., 이 있다고 했을 때 이 Sample들의 평균의 Varicance는 이 되면서..