분류 전체보기(106)
-
Experiments and Quasi-Experiments(실험/준실험 연구)
이번 포스팅에서는, 특정 prgramm이나 정책을 평가하기 위해 많이 활용되고 있는 계량경제 방법론을 정리해보도록 하겠습니다. 기본적인 Concept는 두 그룹을 Random으로 Assign하고, 한 그룹에는 특정 Treatment를 하고(Treatment 그룹), 한 그룹에는 Treatment를 하지 않고(Control group), 두 그룹을 비교하는 것입니다. 이 비교를 통해서 특정 Treatment가 가지는 효과를 분석할 수 있습니다. 사실 현실에서 Random한 그룹에 Treatment를 수행한 데이터를 수집하는 것이 쉽지는 않습니다. 예를 들어 학생의 성적과 한 반의 학생수의 관련성에 대해서 분석을 해본다고 가정하겠습니다. 한 Class의 학생 수는 Random하게 결정되기보다는, 해당 동네의..
2020.11.15 -
Instrumental Variable Regression(도구변수를 활용한 회귀분석)3
이전 포스팅(direction-f.tistory.com/57, direction-f.tistory.com/58)에서 도구변수의 개념 및 일반화된 도구변수를 활용한 회귀분석과 도구변수의 Validity를 검증할 수 있는 방안에 대해서 간략히 정리하였습니다. 이번 포스팅에서는, 예제를 통해 도구변수를 활용한 회귀분석을 수행하고 타당성 검증을 수행해보겠습니다. 우리는 위와 같은 모형을 추정해보겠습니다. 먼저 필요한 데이터를 만들고 모형을 추정해보겠습니다. 여기서 내생변수는 pricediff(코드상 endog)입니다. import pandas as pd import numpy as np import statsmodels.api as sm import statsmodels.formula.api as smf imp..
2020.11.15 -
Instrumental Variable Regression(도구변수를 활용한 회귀분석)2
앞선 포스팅(direction-f.tistory.com/57)에서 간단히 도구변수와 2SLS(Two-Stage Least Squares)의 추정방법에 대해서 정리하였습니다. 이번에는 일반화된 도구변수를 활용한 회귀 분석에 대해서 살펴보겠습니다. $$ Y_i =\beta_0 + \beta_1X_{1i} + \cdots + \beta_kX_{ki}+\beta_{k+1}W_{1i}+\cdots+\beta_{k+r}W_{ri}+\mu_i $$ 위와 같은 모형이 있다고 가정해보겠습니다. $Y_i$는 종속변수이며, $X_{ki}$는 내생변수, $W_{ri}$는 외생변수($\mu_i$와 uncorrelated)를 나타냅니다. 이 때 도구변수는 $Z_{mi}$ 이며 $m>k$라면 overidentified이고 $m=k..
2020.11.10 -
Instrumental Variable Regression(도구변수를 활용한 회귀분석)
회귀모형은 Omitted variable, measurement error 등과 같은 요인에 의해 모형 추정이 잘 못 될 수 있습니다. 만약 Omitted variable을 측정하기 어렵거나, 활용할 수 없다면 추정된 회귀모형은 오류를 가지고 있을 수 밖에 없습니다.(추정된 계수의 일치성을 보장할 수 없습니다.) 이런 이슈를 해결하기 위해서 Instrumental variable이라고 불리는 도구변수를 활용하여 회귀모형을 추정하는 것입니다. 아래와 같은 회귀모형이 있다고 가정해보겠습니다 $$ Y_i = \beta_0 +\beta_1X_i+\mu_i $$ 만약 $\mu_i$이 $X_i$관련이 있다면($X_i$가 내생성을 가짐(endogenous), OLS로 추정된 $\beta_1$은 일치성을 가지고 있지 ..
2020.11.08 -
Binary 변수를 가지는 회귀분석(로짓 모형)
이번 포스팅에서는 Probit 모형과 마찬가지로 Binary(0 or 1 값을 가지는) 종속변수를 예측 및 추정할 때 사용하는 Logit 모형에 대해서 정리해보겠습니다. Logit 모형은 아래와 같이 표현할 수 있습니다. Python statsmodels를 활용하여 Logit 모형을 추정해보겠습니다. 활용한 데이터는 이전 포스팅(Probit 모형)에서 활용한 데이터와 동일합니다. from statsmodels.discrete.discrete_model import Logit X = HMDA["pirat"] X = sm.add_constant(X) Y = HMDA["deny_binary"] denylogit = Logit(Y, X).fit() denylogit.summary() ''' ===========..
2020.11.02 -
Binary 변수를 가지는 회귀분석(프로빗 모형)
이번 포스팅에서는 Binary(0 or 1 값을 가지는) 종속변수를 예측 및 추정할 때 사용하는 회귀분석을 정리해보도록 하겠습니다. 종속변수가 Binary일 때 주로 로짓(Logit) 회귀모형과 프로빗(Probit)회귀모형을 많이 활용합니다. 아래와 같은 선형 회귀모형이 있다고 해보겠습니다. 종속변수 $Y_i$가 binary변수 일 때 위 선형 모형은 선형 확률 모형(Linear probability model)로 아래와 같이 표현될 수 있습니다. 여기서 계수 $\beta_j$는 다른 $X$값들이 변화하지 않을 때, $Y_i=1$일 확률의 변화로 해석될 수 있습니다. $\beta_j$는 다른 회귀분석과 마찬가지로 OLS를 활용하여 추정될 수 있습니다. HMDA 데이터를 활용하여, 선형 확률 모형을 Fit..
2020.11.01