Stata에서 내생성 문제를 해결하기 위한 새로운 명령어 소개

기존의 도구변수 방식 말고 통제함수 접근을 통한 새로운 명령어 𝗰𝗳𝗿𝗲𝗴𝗿𝗲𝘀𝘀 와 𝗰𝗳𝗽𝗿𝗼𝗯𝗶𝘁를 소개합니다.

 

  • 내생적 변수가 연속형·이진형·비율형·카운트형 등 무엇이든 모델링 가능
  • 통제함수를 회귀식에 자유롭게 결합해 내생성 구조를 유연하게 표현
  • 내생성 검정도 자동으로 가능

 

1. 문제 배경: 내생성(Endogeneity)

 

  • 경제·사회과학 데이터는 변수들이 서로 영향을 주고받는 경우가 많음
  • 이런 상황에서 설명변수가 오차항과 상관될 경우 → 내생성(endogeneity) 발생
  • 내생성이 있으면 OLS, Probit 등 일반 추정 결과는 **편향(bias)**됨

 

전통적 해결책: IV(Instrumental Variables)

→ 하지만 적절한 도구변수를 찾기 어렵거나 약한 IV 문제가 자주 발생

 

2. 새로운 Stata 명령어: cfregrеss & cfprobit

 

Stata는 도구변수 대신 통제함수 접근을 간단히 구현할 수 있는 명령어 제공:

  • cfregrеss : 선형 회귀모형에 통제함수 적용
  • cfprobit : 프로빗모형에 통제함수 적용

 

3. 통제함수 접근의 개념

 

1단계에서 내생변수의 오차항(잔차)을 추정

2단계에서 이 “오차항의 추정치”를 원래 모형에 추가하여 내생성 제거

→ “오차항을 직접 통제”해서 편향 문제를 해결하는 방식

 

장점:

  • 도구변수 방식보다 유연함
  • 내생적 변수가 연속형, 이진형, 비율형, 카운트형 모두 가능
  • 통제함수와 기존 변수들을 상호작용시켜 비선형 내생성 구조도 모형화 가능

 

4. 왜 유용한가?

 

  • 도구변수 도입이 어려울 때 대안
  • 특히 비선형 모델(Probit 등)에서 IV는 복잡하거나 부적합한 경우 많음
  • 통제함수는 구현도 쉽고 해석도 명확함
  • Stata의 새로운 명령어는 이 과정을 자동화 → 실무적인 사용성 매우 높음