계량경제학(32)
-
Instrumental Variable Regression(도구변수를 활용한 회귀분석)3
이전 포스팅(direction-f.tistory.com/57, direction-f.tistory.com/58)에서 도구변수의 개념 및 일반화된 도구변수를 활용한 회귀분석과 도구변수의 Validity를 검증할 수 있는 방안에 대해서 간략히 정리하였습니다. 이번 포스팅에서는, 예제를 통해 도구변수를 활용한 회귀분석을 수행하고 타당성 검증을 수행해보겠습니다. 우리는 위와 같은 모형을 추정해보겠습니다. 먼저 필요한 데이터를 만들고 모형을 추정해보겠습니다. 여기서 내생변수는 pricediff(코드상 endog)입니다. import pandas as pd import numpy as np import statsmodels.api as sm import statsmodels.formula.api as smf imp..
2020.11.15 -
Instrumental Variable Regression(도구변수를 활용한 회귀분석)2
앞선 포스팅(direction-f.tistory.com/57)에서 간단히 도구변수와 2SLS(Two-Stage Least Squares)의 추정방법에 대해서 정리하였습니다. 이번에는 일반화된 도구변수를 활용한 회귀 분석에 대해서 살펴보겠습니다. $$ Y_i =\beta_0 + \beta_1X_{1i} + \cdots + \beta_kX_{ki}+\beta_{k+1}W_{1i}+\cdots+\beta_{k+r}W_{ri}+\mu_i $$ 위와 같은 모형이 있다고 가정해보겠습니다. $Y_i$는 종속변수이며, $X_{ki}$는 내생변수, $W_{ri}$는 외생변수($\mu_i$와 uncorrelated)를 나타냅니다. 이 때 도구변수는 $Z_{mi}$ 이며 $m>k$라면 overidentified이고 $m=k..
2020.11.10 -
Instrumental Variable Regression(도구변수를 활용한 회귀분석)
회귀모형은 Omitted variable, measurement error 등과 같은 요인에 의해 모형 추정이 잘 못 될 수 있습니다. 만약 Omitted variable을 측정하기 어렵거나, 활용할 수 없다면 추정된 회귀모형은 오류를 가지고 있을 수 밖에 없습니다.(추정된 계수의 일치성을 보장할 수 없습니다.) 이런 이슈를 해결하기 위해서 Instrumental variable이라고 불리는 도구변수를 활용하여 회귀모형을 추정하는 것입니다. 아래와 같은 회귀모형이 있다고 가정해보겠습니다 $$ Y_i = \beta_0 +\beta_1X_i+\mu_i $$ 만약 $\mu_i$이 $X_i$관련이 있다면($X_i$가 내생성을 가짐(endogenous), OLS로 추정된 $\beta_1$은 일치성을 가지고 있지 ..
2020.11.08 -
Binary 변수를 가지는 회귀분석(로짓 모형)
이번 포스팅에서는 Probit 모형과 마찬가지로 Binary(0 or 1 값을 가지는) 종속변수를 예측 및 추정할 때 사용하는 Logit 모형에 대해서 정리해보겠습니다. Logit 모형은 아래와 같이 표현할 수 있습니다. Python statsmodels를 활용하여 Logit 모형을 추정해보겠습니다. 활용한 데이터는 이전 포스팅(Probit 모형)에서 활용한 데이터와 동일합니다. from statsmodels.discrete.discrete_model import Logit X = HMDA["pirat"] X = sm.add_constant(X) Y = HMDA["deny_binary"] denylogit = Logit(Y, X).fit() denylogit.summary() ''' ===========..
2020.11.02 -
Binary 변수를 가지는 회귀분석(프로빗 모형)
이번 포스팅에서는 Binary(0 or 1 값을 가지는) 종속변수를 예측 및 추정할 때 사용하는 회귀분석을 정리해보도록 하겠습니다. 종속변수가 Binary일 때 주로 로짓(Logit) 회귀모형과 프로빗(Probit)회귀모형을 많이 활용합니다. 아래와 같은 선형 회귀모형이 있다고 해보겠습니다. 종속변수 $Y_i$가 binary변수 일 때 위 선형 모형은 선형 확률 모형(Linear probability model)로 아래와 같이 표현될 수 있습니다. 여기서 계수 $\beta_j$는 다른 $X$값들이 변화하지 않을 때, $Y_i=1$일 확률의 변화로 해석될 수 있습니다. $\beta_j$는 다른 회귀분석과 마찬가지로 OLS를 활용하여 추정될 수 있습니다. HMDA 데이터를 활용하여, 선형 확률 모형을 Fit..
2020.11.01 -
Panel 회귀모형
Panel 회귀모형을 활용하면, 이전 포스팅에서 언급했던 Omitted variable과 같은 이슈를 일부 해소할 수 있습니다. 만약 Omitted variable이 있고 해당 Omitted variable이 무엇인지 정확히 알기 어려울 때, Panel 회귀모형을 활용하면 시간 또는 그룹차원에서 Parameter 추정에 왜곡을 주는 요소를 회귀분석에 포함하여 분석할 수 있습니다. 먼저 Panel 데이터는 $n$개의 entities로만 구성되어 있는 Cross-section 데이터와 다르게, $n$개의 entities와 시간 T로 구성되어 있습니다. $$(X_{it}, Y_{it}), i=1,\cdots ,n \,\,and\,\, t =1,\cdots,T $$ 예시를 통해, Panel 데이터 및 상이한 시..
2020.10.24