new stata 19

More


우리는 stata19의 새로운 기능을 여러분께 소개하게 되어 기쁩니다.
주요한 새 기능은 아래와 같습니다.
우리는 현재 및 잠재적인 Stata 사용자들에게 이러한 새로운 기능을 소개하는데 도움이 되도록 분야와 설명을 포함했습니다

새 버전에서 주목할 만한 새로운 기능

New Stata 19

100
FAST
100
ACCURATE
100
EASY

  • H2O를 통한 기계학습 : 앙상블 결정나무
  • 조건부 평균처치효과(CATE)
  • 고차원 고정효과 (HDFE)
  • 선형회귀를 위한 베이지안 변수 선택
  • 구간절단 다중 사건 데이터에 대한 주변 Cox 비례 위험 모델
  • 상관계수 메타분석
  • 상관 확률효과(CRE) 모형
  • 패널벡터자기회귀(VAR) 모형
  • 베이지안 부트스트랩 및 복원추출가중치
  • 통제함수 선형, 프로빗 모형
  • 베이지안 분위회귀 비대칭 라플라스 우도 추정
  • 약한 도구변수 강건 추론
  • 도구변수 SVAR 모형
  • 도구변수 국지-투영 IRFs
  • Mundlak 검정
  • 잠재그룹 모형 비교 통계량
  • Do-file 편집기 : 자동완성, 템플릿 등
  • 그래프 : 막대 그래프 Cis, 히트맵 등
  • 표 : 쉬운 표작성, 내보내기 등
  • 프랑스어 지원

주요한 기능과 더불어, 우리는 다음과 같은 새로운 기능을 추가하였습니다.

  • 저장된 프레임셋 수정
  • 비대칭 라플라스 우도 베이지안 모형추정
  • 생존 그래프를 위한 대체 위험표
  • Pystata 개선
  • VAR 모형 강건표준오차
  • 베이지안 분석을 위한 Half-Cauchy 및 Rayleigh 사전 분포
  • 사용자 평가 정의 베이지안 예측
  • 그리고 더 많은 기능들



Stata 19의 모든 새로운 기능을 요약 정리했습니다.
각 항목을 선택하여 자세한 내용을 확인하세요!

어떤 기능일까요?

기계 학습 방법은 선형 또는 일반화 선형 모델보다 더 고급 모델링이 필요한 예측에 초점을 맞춘 연구 및 비즈니스 문제를 해결하는 데 자주 사용됩니다. 여러 트리를 결합하여 더 나은 예측을 제공하는 앙상블 의사결정 트리 방법은 이러한 작업에서 인기가 많습니다. H2O는 데이터 분석과 기계 학습을 지원하는 확장 가능한 기계 학습 플랫폼으로, 랜덤 포레스트와 그래디언트 부스팅 머신(GBM)과 같은 앙상블 의사결정 트리 방법을 포함합니다.


Stata의 새로운 h2oml 명령어는 H2O를 Stata에서 직접사용 접근하는 명령어로, 앙상블 의사결정 트리 방법을 사용한 H2O 기계 학습 분석에 대한 종단간 지원을 제공합니다. h2o 명령어를 사용하여 기존 H2O 클러스터를 시작하거나 연결한 후, h2oml 명령어를 사용하여 회귀 및 분류 문제에 대해 GBM과 랜덤 포레스트를 수행할 수 있습니다. h2oml 명령어는 하이퍼파라미터 튜닝, 검증, 교차 검증, 모델 성능 평가, 예측 획득, 그리고 이러한 예측을 설명하기 위한 도구를 제공합니다. 예를 들어,


Stata에서 H2O를 초기화합니다.

. h20 init

Stata 자료를 H2O에 불러들입니다.

. _h20frame put, into(dataframe) current

그래디언트 부스팅 이진 분류를 수행하고, 트리의 수와 하이퍼파라미터를 튜닝합니다.

. h2oml gbbinclass response predictors, ntrees(20(10)200) lrate(0.1(0.1)1)

변수 중요도를 확인입니다.

. h2omlgraph varimp

예측치를 생성합니다.

. _h2oframe change newdata
. h20mlpredict outcome_pred

이 밖에 더 많은 기능이 있습니다.

어떤 점이 독특하고 흥미롭나요?

h2oml명령어는 친숙한 Stata 구문 또는 포인트-앤-클릭 인터페이스를 사용하여 앙상블 의사결정 트리 방법을 쉽게 접근할 수 있는 방식으로 제공합니다.


Shapley 가산적 설명력 값(SHAP), 부분 의존도 플롯, 변수 중요도 순위와 같은 예측 설명 가능성 도구를 통해 GBM과 랜덤 포레스트는 설명 가능성을 유지하면서도 강력한 예측을 제공합니다.

어떤 분야의 사람들이 사용할까요?

모든 분야; 분류및 회귀를 위한 해결하고자 하는 기계학습에 관심있는 누구나

어떤 기능일까요?

처치 효과는 처치(treatment)가 결과(outcome)에 미치는 인과적 효과를 추정합니다. 이 효과는 일정할 수도 있고, 서로 다른 하위 집단에 따라 달라질 수도 있습니다. 연구자들은 종종 처치 효과가 어떻게 다른지, 그리고 그 차이가 있는지에 관심을 가집니다.


노동 경제학자는 직업 훈련 프로그램이 프로그램에 참여한 사람들의 소득에 미치는 효과를 알고 싶어할 수 있습니다.


온라인 쇼핑 회사는 연령과 소득과 같은 다양한 인구통계적 특성을 가진 고객들에 대해 가격 할인이 구매 행동에 미치는 효과를 알고 싶어할 수 있습니다.


의료 팀은 서로 다른 연령 그룹의 개인들에 대해 흡연이 스트레스 수준에 미치는 효과를 측정하고 싶어할 수 있습니다.


새로운 cate 명령어를 사용하면 전체 처치 효과를 추정하는 것을 넘어, 이러한 유형의 연구 질문을 다루는 개체 및 그룹별 처치 효과를 추정할 수 있습니다.


cate 명령어는 세 가지 유형의 CATE(조건부 평균 처리 효과)를 추정할 수 있습니다: 개체 평균 처치 효과, 그룹 평균 처치 효과, 그리고 정렬된 그룹 평균 처치 효과입니다. 추정 외에도 cate 명령어는 CATEs에 대해 예측하고, 시각화하며, 추론할 수 있는 기능을 제공합니다.


어떤 점이 독특하고 흥미롭나요?

cate 명령어는 강력하고 유연하며 강건합니다. 이 명령어는 처치모형 및 성과모형을 정의하는 라쏘(lasso), 일반화된 랜덤 포레스트(때로는 honest forest라고도 함), 그리고 모수적 모델에서 지원합니다. 기계 학습 오류를 방지하기 위해 두 가지 강건한 추정(부분제거 방법과 증강 역확률 가중치)를 제공하며, 과적합을 피하기 위해 교차 적합(cross-fitting)을 사용합니다.

어떤 분야의 사람들이 사용할까요?

모든 분야. 인과추론에 관심있는 누구나

어떤 기능일까요?

이제 선형 회귀 및 2단계 최소제곱법을 사용하여 내생성을 고려한 선형 모델에서 단일 고차원 범주형 변수뿐만 아니라 여러 고차원 범주형 변수를 흡수(absorb)할 수 있습니다. 이는 모델이 이러한 변수를 통제하기 원하지만, 그 효과를 추정하는 데 관심이 없고 계산 비용이 많이 들 때 유용합니다.


areg, xtreg, fe, 그리고 ivregress 2sls 명령어는 이제 absorb() 옵션을 여러 범주형 변수와 함께 지정할 수 있도록 허용합니다. 이전에는 areg가 absorb()에 단일 변수만 허용했으며, xtreg, fe, 그리고 ivregress 2sls는 이 옵션을 허용하지 않았습니다.

예를 들어, 세 가지 고차원 범주형 예측 변수 c1, c2, c3를 통제하는 회귀 모델을 적합시키기 위해 다음과 같이 입력할 수 있습니다.

. areg y x, absorb(c1 c2 c3)

만약 우리가 고정 효과 모델에서 이러한 변수를 흡수하고 싶다면, 그것도 가능합니다:

. xtset panelvar
. xtreg y x, fe absorb(c1 c2 c3)

그리고 도구변수 회귀모형에서도 아래와 같이 입력할 수 있습니다.

. ivregress 2sls y1 x1 (y2 x2), absorb(c1 c2 c3)

어떤 점이 독특하고 흥미롭나요?

모형에 고차원 범주형변수를 포함하기 보다 으를 흡수하는 방식으로 추정하면 놀라운 속도 향상을 가져옵니다.

어떤 분야의 사람들이 사용할까요?

모든 분야. 거의 모든 사람이 어느 시점에서 선형 회귀를 사용합니다. 패널 데이터를 다루는 경제학자와 정치학자들은 이 새로운 기능에 특히 흥분할 것입니다.

어떤 기능일까요?

새로운 bayesselect 명령어는 결과변수와 가장 관련 있는 예측 변수의 하위 집합을 식별을 위한 유연한 베이지안 접근 방식을 제공합니다. 이 명령어는 모델 모수를 추정할 때 모델 불확실성을 고려하며 회귀 계수에 대한 베이지안 추론을 수행합니다. 익숙한 구문을 사용합니다,

. bayesselect y x1-x100

Stata의 다른 베이지안 회귀모형을 수행하는 절차와 마찬가지로, 각 예측 변수의 사후 평균, 사후 표준 편차, 몬테카를로 표준 오차, 그리고 신용 구간이 보고되어 쉽게 해석할 수 있습니다. 또한, 선택된 사전 분포에 따라 포함할 계수 또는 포함 확률을 통해 각 예측 변수가 결과변수를 예측하는 데 얼마나 중요한지를 나타냅니다.


bayesselect는 Stata의 베이지안 명령어에 완전히 통합되어 있으며, 예측을 포함한 모든 베이지안 사후 추정 명령어와 원활하게 작동합니다,

. bayesselect pmean, mean

어떤 점이 독특하고 흥미롭나요?

이러한 변수 선택 접근 방식은 직관적인 해석과 안정적인 추론을 제공합니다.

어떤 분야의 사람들이 사용할까요?

큰 자료를 다루는 사회과학자

어떤 기능일까요?

구간 중도절단된 다중 이벤트 데이터는 종단 연구에서 흔히 발생합니다. 왜냐하면 각 연구 대상자가 여러 유형의 이벤트를 경험할 수 있으며, 이러한 이벤트는 직접 관찰되지 않지만 특정 시간 구간 내에서 발생한 것으로 알려져 있기 때문입니다. 예를 들어, 만성 질환을 연구하는 역학자는 심장 질환과 대사 질환과 같은 여러 상태를 가진 환자 데이터를 서로 다른 의사 방문 시점에서 수집할 수 있습니다. 마찬가지로, 사회학자는 직업 변경이나 결혼과 같은 주요 삶의 이벤트를 정기적인 간격으로 설문 조사를 통해 기록할 수 있습니다.


이제 이러한 데이터에 대해 주변 비례 위험 모델을 추정할 수 있습니다. 새로운 stmgintcox 명령어는 단일 및 이벤트별 다중 레코드 데이터를 적용할 수 있으며, 모든 이벤트 또는 특정 이벤트에 대해 시간에 따라 변하는 공변량을 지원합니다.

예를 들어, 이벤트 변수에 코딩된 다중 이벤트 데이터가 있고, ltime과 rtime에 기록된 시간 사이에 발생하며, 공변량 x1-x3이 있다고 가정해 봅시다. 우리는 다음 명령어를 사용하여 각 이벤트까지의 시간에 대한 공변량의 영향을 동시에 모델링할 수 있습니다.

. stmgintcox x1 x2 x3, id(id) event(event) interval(ltime rtime)

여기서부터, 우리는 다음과 같이 입력하여 이벤트 전반에 걸친 x1의 평균 효과를 검정할 수 있습니다.

. estat common x1

우리는 또한 두 이벤트 모두에 대해 생존함수 및 기타 함수를 그래프로 나타낼 수 있습니다,

. stcurve, survival

각각의 이벤트에 대한 적합도를 평가할 수 있습니다.

. estat gofplot

그리고 더 많은 기능이 있습니다.

어떤 점이 독특하고 흥미롭나요?

다른 어떤 상용 소프트웨어도 다변량 구간 중도절단 데이터에 대해 주변 비례 위험 모델을 추정할 수 있는 패키지를 제공하지 않습니다.

어떤 분야의 사람들이 사용할까요?

모든 분야, 특히 의학, 역학, 생물학, 그리고 사회학.

어떤 기능일까요?

meta 명령어는 이제 상관계수에 대한 메타분석을 지원하여 여러 연구에 걸쳐 변수 간 관계의 강도와 방향을 연구할 수 있게 합니다. 예를 들어, 교육 수준과 소득 수준 간의 상관관계 또는 신체 활동과 정신 건강 개선 간의 상관관계를 보고하는 연구들이 있고, 이에 대해 메타분석을 수행하고 싶을 수 있습니다.


변수 corr과 ntotal이 각 연구에서의 상관관계와 총 개체 수를 나타낸다고 가정합시다. 우리는 이제 meta esize 명령어를 사용하여 이러한 변수가 포함된 데이터를 선언할 수 있습니다.

. meta esize corr ntotal, correlation studylabel(studylbl)

변환되지 않은 상관계수의 분산은 상관계수 자체에 의존하기 때문에, 우리는 Fisher의 z-변환된 상관계수를 사용하는 것을 선호할 수 있습니다. 이는 분산을 안정화하는 변환으로, 특히 상관계수가 -1 또는 1에 가까울 때 바람직합니다.

. meta esize corr ntotal, fisherz studylabel(studylbl)

포레스트 플롯과 하위 그룹 분석과 같은 모든 표준 메타분석 기능이 지원됩니다.

. meta forestplot, correlation

어떤 점이 독특하고 흥미롭나요?

상관관계 연구는 많은 연구 분야에서 초석입니다. 이 기능을 추가함으로써 meta esize는 사용 가능한 메타분석 도구 중 가장 유연한 도구 중 하나가 되었습니다.

어떤 분야의 사람들이 사용할까요?

모든 분야. 어떤 학문 분야의 연구자라도 이전 연구 결과를 결합하여 전체 효과를 추정하고 싶어할 수 있습니다.

어떤 기능일까요?

xtreg 명령어의 새로운 cre 옵션을 사용하여 패널 데이터에 CRE 모델을 쉽게 추정할 수 있습니다.
시간에 따라 변하는 변수 x와 시간에 불변인 변수 z를 포함한 CRE 모델을 추정하기 위해 다음 명령어를 고려해 할 수 있습니다.:

. xtset panelvar
. xtreg y x z, cre vce(cluster panelvar)

공변량과 관찰되지 않은 패널 수준 효과 간에 상관관계가 있는 경우, 확률효과 모형은 일치추정량을 추정하지 못합니다. 고정 효과 모델은 시간에 불변인 변수 z의 계수를 추정할 수 없습니다. CRE 모델은 두 가지 장점을 모두 제공합니다.

어떤 점이 독특하고 흥미롭나요?

xtreg, fe와 동일하게 시간에 따라 변하는 변수의 계수를 얻으면서, 시간에 불변인 변수에 대한 계수를 추정하세요.

어떤 분야의 사람들이 사용할까요?

패널자료를 사용하는 사회과학 및 보건 연구자

어떤 기능일까요?

패널 데이터에 벡터 자기회귀(VAR) 모델을 추정할 수 있습니다! 충격-반응 함수를 계산하고, Granger 인과성 테스트와 안정성 테스트를 수행하며, 추가 공변량을 포함하는 등 다양한 기능을 제공합니다. 새로운 xtvar 명령어는 var와 유사한 구문과 사후 추정 절차를 가지고 있지만, 시계열 데이터가 아닌 패널 데이터를 위한 명령어 입니다.

예를 들어, 관심 있는 세 가지 종속변수를 가진 패널 데이터에 VAR 모델을 추정하기 위해 다음과 같이 입력할 수 있습니다.

. xtset panelvar
. xtvar y1 y2 y3, lags(2)

그런 다음, Granger 인과성 테스트를 수행할 수 있습니다.

. vargranger

또는 충격-반응 함수를 그래프로 나타낼 수 있습니다.

. irf create baseline, set(irfs)
. irf graph irf

어떤 점이 독특하고 흥미롭나요?

패널 데이터 VAR 모델은 커뮤니티-기여 외부명령어를 통해 사용 가능했지만, 우리 사용자들로부터 매우 요청이 많았던 기능이었습니다.

어떤 분야의 사람들이 사용할까요?

모든 분야. 패널 데이터를 다루는 사회과학자들은 이 새로운 기능에 특히 흥분할 것입니다.

어떤 기능일까요?

새로운 bayesboot 명령어를 사용하여 공식 및 커뮤니티-기여 외부 명령어에서 생성된 통계에 대한 베이지안 부트스트랩을 수행할 수 있습니다.

summarize 명령어에서 r(mean)으로 반환되는 x의 평균에 대한 베이지안 부트스트랩 추정치를 계산하기 위해 다음과 같이 입력합니다.

. bayesboot r(mean): summarize x

또한 새로운 rwgen 명령어와 bootstrap 명령어 대한 새로운 옵션을 사용하여 특수한 부트스트랩 방식을 구현할 수 있습니다. rwgen은 표준 복원추출 및 베이지안 부트스트랩 가중치를 생성합니다. bootstrap에는 사용자 지정 가중치를 사용하여 부트스트랩 복원추출을 수행하기 위한 새로운 fweights()와 iweights() 옵션을 제공합니다. fweights()는 사용자가 재추출을 위한 빈도 가중치 변수를 지정할 수 있게 하며, iweights()는 사용자가 중요도 가중치 변수를 적용할 수 있도록 합니다.

이러한 옵션은 내부 재추출 대신 사용자가 제공한 가중치를 허용함으로써 bootstrap의 유연성을 확장하여 특수한 부트스트랩 방식을 더 쉽게 구현하고 재현성을 향상시킵니다. bayesboot는 rwgen과 bootstrap을 위한 명령어로, Dirichlet분포를 사용하여 중요도 가중치를 생성하고 부트스트랩 시 이러한 가중치를 적용합니다.

어떤 점이 독특하고 흥미롭나요?

베이지안 부트스트랩은 소규모 표본에서 더 정확한 모수 추정치를 얻고, 관측치를 추출 시 사전 정보를 통합하는 데 사용할 수 있습니다.

어떤 분야의 사람들이 사용할까요?

모든 분야, 특히 통계학, 생물통계학, 그리고 건강 분야의 연구자들.

어떤 기능일까요?

새로운 cfregress와 cfprobit 명령어를 사용하여 통제 함수 선형 및 프로빗 모델을 추정할 수 있습니다. 통제 함수 모델은 내생 변수 자와 그 1단계 잔차를 주 회귀에 포함함으로써 전통적인 도구변수(IV) 방법에 비해 더 유연한 접근 방식을 제공합니다; 이 잔차 항은 통제 함수라고 불립니다.


예를 들어, 우리는 이 방법을 통해 2SLS IV 회귀의 추정치와 동일한 결과를 재현할 수 있습니다.

. cfregress y1 x (y2 = z1 z2)

하지만 우리는 또한 이진 내생 변수를 사용하고 통제 함수와 z1 간의 상호작용을 포함할 수 있습니다.

. cfregress y1 x (y2bin = z1 z2, probit interact(z1))

이후, 우리는 통제 함수와 상호작용을 함께 테스트함으로써 내생성을 검정할 수 있습니다.

. estat endogenous

어떤 점이 독특하고 흥미롭나요?

1단계 모델은 선형, 프로빗, 비율 프로빗, 또는 포아송 모델일 수 있으며, 통제 함수는 다른 변수들과 또는 서로 간에 상호작용할 수 있습니다. 또한 강건, 클러스터-강건, 그리고 이분산성 및 자기상관을 고려한 VCE가 허용됩니다.

어떤 분야의 사람들이 사용할까요?

사회과학 분야의 연구자들, 특히 경제학, 공공정책, 정치학, 공중보건, 그리고 경영학 연구자들

어떤 기능일까요?

분위 회귀를 위한 qreg 명령어가 이제 bayes 명령어와 호환됩니다. 베이지안 프레임워크에서 우리는 비대칭 라플라스 우도 함수를 사전 분포와 결합하여 분위 회귀 계수의 완전한 사후 분포를 제공합니다.

. bayes: qreg y x1 x2

결과적으로, 비대칭 라플라스 분포는 bayesmh에서 사용 가능한 새로운 우도 함수입니다.

. bayesmh y x1 x2, likelihood(asymlaplaceq({scale},0.5))
prior({y:}, normal(0,10000)) block({y:})
prior({scale}, igamma(0.01,0.01)) block({scale})

또한 bayesmh에서 비대칭 라플라스 우도를 사용하여 확률 효과 분위 회귀, 동시 분위 회귀, 또는 뚜렷한 왜도와 첨도를 가진 종속변수를 모델링할 수 있습니다. 모든 방식에서 MCMC 진단, 가설 검정, 예측과 같은 표준 베이지안 사후 기능을 지원합니다.

. bayesgraph diagnostics

어떤 점이 독특하고 흥미롭나요?

고전적인 분위 회귀에서는 표준 오차가 부트스트랩 또는 커널 기반 방법을 사용하여 계산됩니다. 베이지안 프레임워크에서는 사후 표준 편차가 모델을 기반으로 추정되며, 더 효율적일 수 있습니다.

어떤 분야의 사람들이 사용할까요?

모든 분야. 어떤 학문 분야의 연구자라도 베이지안 분석에 관심을 가질 수 있습니다.

어떤 기능일까요?

y1를 종속변수로 하고 x1과 도구변수 z1을 사용해 내생 회귀 변수 y2에 대한 선형 회귀를 2SLS를 통해 추정하고자 한다면, 우리는 다음과 같이 입력할 것입니다.

. ivregress 2sls y1 x1 (y2 = z1)

도구 변수 z1이 내생 회귀 변수 y2와 약한 상관관계가 있을 때, 비교적 큰 표본에서도 추론이 신뢰할 수 없게 될 수 있습니다. ivregress 이후 새로운 estat weakrobust 사후 추정 명령어는 내생 회귀 변수에 대해 Anderson–Rubin 또는 조건부 우도 비율(CLR) 검정을 수행합니다. 이러한 검정은 도구 변수가 약한 경우에도 강건합니다.

. estat weakrobust

이 사후 추정 명령어는 모든 ivregress 추정방법을 지원합니다: 2sls, liml, gmm.

어떤 점이 독특하고 흥미롭나요?

estat weakrobust가 보고하는 검정과 신뢰 구간은 약한 도구 변수에 강건할 뿐만 아니라 ivregress에서 사용된 강건, 클러스터-강건, 또는 이분산성과 자기상관을 고려한 분산-공분산 추정치를 고려합니다.

어떤 분야의 사람들이 사용할까요?

사회과학 분야의 연구자들, 특히 경제학, 공공정책, 정치학, 공중보건, 그리고 경영학 연구자들.

어떤 기능일까요?

새로운 ivsvar 명령어는 도구 변수를 사용하여 SVAR 모형을 추정합니다.

. ivsvar gmm y1 y2 (shock = z1 z2)

이렇게 추정된 모수는 익숙한 irf 명령어를 사용하여 구조적 충격-반응 함수(IRFs)로 알려진 동적 인과 효과를 추적하는 데 사용할 수 있습니다.

. irf set ivsvar.irf
. irf create model1
. irf graph sirf, impulse(shock)

여러 도구 변수를 사용할 경우, ivsvar mdist와 함께 최소 거리 추정법을 사용하고, 도구 변수가 목표 충격과 어떻게 관련되어 있는지 설정합니다.

어떤 점이 독특하고 흥미롭나요?

도구 변수에 의존함으로써, 전통적인 SVAR 모델처럼 충격이 내생 변수에 미치는 효과에 제약을 둘 필요가 없습니다.

어떤 분야의 사람들이 사용할까요?

시계열 데이터를 다루는 모든 분야, 특히 경제학, 정치학, 금융, 그리고 공공정책 분야의 연구자들

어떤 기능일까요?

새로운 ivlpirf 명령어를 사용하면 국지-투영을 통한 동적 인과 효과를 추정할 때 내생성을 설명할 수 있습니다.


국지-투영은 충격이 결과 변수에 미치는 효과를 추정하는 데 사용됩니다. 관심 있는 충격이 내생적 충격 변수에 일 때, ivlpirf를 사용하여 IRFs를 추정할 수 있으며, 충격 변수는 하나 이상의 외생 변수를 도구변수로 사용할 수 있습니다.


예를 들어, 내생적 충격 변수 x에 대한 도구변수 iv를 사용하여 x의 증가가 y에 미치는 효과에 대한 구조적 IRFs를 추정하는 데 관심이 있다고 가정해 봅시다:

. ivlpirf y, endogenous(x = iv)

그런 다음 irf 명령어를 사용하여 이러한 IRFs를 그래프로 나타낼 수 있습니다:

. irf set ivlp.irf, replace
. irf create ivlp
. irf graph csirf

어떤 점이 독특하고 흥미롭나요?

내생성을 고려한 동적 인과 효과를 추정할 수 있습니다.

어떤 분야의 사람들이 사용할까요?

시계열 데이터를 다루는 모든 사람, 특히 경제학, 정치학, 금융, 그리고 공공정책 분야의 연구자들.

어떤 기능일까요?

새로운 estat mundlak 사후 추정 명령어는 xtreg 명령어를 통해 추정된 확률 효과(RE)와 고정 효과(FE) 또는 상관된 확률 효과(CRE)에서 사용할 수 있습니다. Hausman 테스트와 달리 Mundlak 테스트를 수행하기 위해 RE와 FE 모델을 모두 추정할 필요는 없습니다 - 단 한 개의 모형만 있으면 됩니다!

다시말해, 시간에 따라 변하는 변수 x와 시간에 불변인 변수 z를 포함한 다음 모델을 고려해 보세요:

. xtreg y x z, vce(cluster clustvar)
. estat mundlak

estat mundlak 명령어는 x가 관찰되지 않은 패널 수준 효과와 상관관계가 없다는 귀무가설을 검정합니다. 이 가설을 기각하는 것은 시간에 불변인 관찰되지 않은 이질성을 고려하는 FE 또는 CRE 모델을 추정하는 것이 RE 모델보다 더 적절하다는 것을 의미합니다.

어떤 점이 독특하고 흥미롭나요?

FE와 RE를 비교하는 Hausman 검정과 달리, Mundlak 검정은 클러스터-강건, 부트스트랩, 그리고 잭나이프 표준 오차와 함께 타당한 추론을 제공합니다.

어떤 분야의 사람들이 사용할까요?

패널 데이터를 다루는 사회과학자 및 건강 연구자들, 특히 경제학자와 정치학자들.

어떤 기능일까요?

잠재 그룹 분석 또는 유한 혼합 모형을 추정할 때, 데이터에 가장 적합한 잠재 그룹 수를 결정하는 것이 기본적입니다. 새로운 lcstats 명령어를 사용하면 엔트로피와 다양한 정보 기준 통계량, 그리고 Lo-Mendell-Rubin(LMR) 조정 우도비 검정과 Vuong-Lo-Mendell-Rubin(VLMR) 우도비 검정과 같은 방법을 사용하여 적절한 그룹 수를 결정하는 데 도움을 받을 수 있습니다.

예를 들어, 1-그룹, 2-그룹, 3-그룹 모델을 추정 그 결과를 저장하기 위해 다음과 같이 입력합니다.

. gsem (y1 y2 y3 y4 <- ), logit lclass(C 1)
. estimates store oneclass
. gsem (y1 y2 y3 y4 <- ), logit lclass(C 2)
. estimates store twoclass
. gsem (y1 y2 y3 y4 <- ), logit lclass(C 3)
. estimates store threeclass

그런 다음 다음과 같이 입력하여 모델 비교 통계량과 검정결과를 얻을 수 있습니다.

. lcstats

lcstats 명령어는 보고할 통계량과 검정결과를 지정하고 표의 모양을 사용자 정의할 수 있는 옵션을 제공합니다.

어떤 점이 독특하고 흥미롭나요?

이 기능은 잠재 그룹 분석 기능이 처음 출시된 이후 가장 많이 요청된 추가 기능이었습니다. lcstats에 의해 생성된 표는 자동으로 컬렉션에 저장되므로, collect 명령어를 사용하여 추가로 사용자가 편집하거나 다양한 파일 형식으로 내보내기가 매우 쉽습니다.

어떤 분야의 사람들이 사용할까요?

행동 과학, 건강, 그리고 비즈니스 분야의 연구자들은 종종 잠재 그룹 분석을 사용하며, 사회과학자와 통계학자들은 유한 혼합 모델링을 사용합니다. 이 기능은 이러한 유형의 분석을 수행하는 모든 사람에게 유용할 것입니다.

어떤 기능일까요?

Do-file 편집기에 다음과 같은 추가 기능이 포함되었습니다:
변수 이름, 매크로, 저장 결과 자동 완성: 입력 중 잠시 멈추면 데이터의 변수 이름, 매크로, 저장 결과에 대한 제안이 명령어와 이전에 사용한 기존 단어와 함께 표시됩니다.

Do-file Editor 템플릿: 이제 Do-file Editor에서 새로운 문서를 만들 때 Stata 템플릿과 사용자 정의 템플릿을 사용하여 시간 절약과 일관성을 보장할 수 있습니다.

Do-file 편집기 현재 단어 및 선택 항목 강조: Do-file 편집기에서 이제 커서 아래의 현재 단어는 대소문자 구분 없이 입력된 부분을 강조하며, 선택항목은 대소문자를 구분하여 입력된 부분을 강조합니다.
괄호 강조: Do-file Editor는 이제 문서 내에서 커서를 이동할 때 현재 커서 위치를 기준으로 둘러싼 괄호를 강조합니다.

코드 접기 기능 개선: 이제 '모두 접기' 메뉴 항목을 사용하여 do-file에서 접을 수 있는 모든 코드 블록을 빠르게 접을 수 있습니다. 그런 다음 코드의 중요한 부분을 표시하기 위해 한 번에 하나의 접기 지점을 선택적으로 펼치거나, Do-file 편집기의 '모두 펼치기' 메뉴 항목을 사용하여 모든 접어진 코드블록을 펼칠 수 있습니다. 또한 코드 줄을 선택하고 '선택 항목 접기' 메뉴 항목을 사용하여 접을 수 있는 코드 블록으로 변환할 수 있습니다. 이는 코드를 깔끔하게 정리하고 코드의 가독성을 높일 수 있습니다. 또한, 코드 접기 기능은 코드 접기 리본에서 화살표 마커를 사용하여 코드 접기가 펼쳐졌는지 접혔는지를 표시하고, 사용자가 코드 접기 리본 위에 마우스를 올리지 않는 한 펼쳐진 코드 접기 마커를 숨김으로써 시각적으로 덜 산만하게 변경되었습니다.

Do-file Editor 임시 및 영구 북마크: Do-file Editor는 이제 영구 북마크 외에 임시 북마크를 지원합니다. 기존의 영구 북마크는 do-file의 일부로 저장됩니다. 새로운 임시 북마크를 사용하면 do-file의 내용을 변경하지 않고 즉시 탐색할 수 있습니다.

공백 및 탭 표시: Do-file Editor는 이제 공백 문자를 항상 표시하거나 전혀 표시하지 않는 대신 선택 항목 내에서만 공백 문자를 표시할 수 있습니다.

Navigator 패널: 이전 Stata 버전의 탐색기능이 탐색패널로 대체되었습니다. 이 패널은 do-file에 있는 영구 북마크와 프로그램 목록을 표시합니다. Navigator 패널에서 항목을 더블 클릭하여 프로그램이나 북마크의 위치로 빠르게 이동할 수 있습니다. 또한 Navigator 패널에서 북마크를 삭제하고 들여쓰기를 할 수 있습니다.

어떤 점이 독특하고 흥미롭나요?

Do-file 편집기는 Stata 명령어를 포함하는 스크립트나 새로운 명령어를 정의하는 ado-file을 작성하는 데 많이 사용되는 도구입니다. Do-file 편집기의 새로운 기능들은 Stata 코딩을 더 효율적으로 만들고 사용자가 코드를 작성하는 경험을 더 좋게 만듭니다.

어떤 분야의 사람들이 사용할까요?

모든 Stata 사용자들

어떤 기능일까요?

Stata 19에는 많은 새로운 그래프 기능이 포함되었습니다.


히트맵: 새로운 twoway heatmap 명령어는 숫자 변수 z의 값을 y와 x 값에 따라 색상이 있는 직사각형 격자로 표시하는 히트맵을 생성합니다.


캡이 있는 스파이크를 포함한 범위 및 점도표: 새로운 twoway rpcap 명령어는 캡이 있는 스파이크로 표시된 점의 범위를 표시합니다. 이러한 도표는 평균과 같은 관심 값을 표시하고 해당 신뢰 구간을 나타내는 데 유용합니다.


스파이크를 포함한 범위 및 점도표: 새로운 twoway rpspike 명령어는 스파이크로 표시된 점과 범위를 표시합니다. 이러한 도표는 평균과 같은 관심 값을 표시하고 해당 신뢰 구간을 나타내는 데 유용합니다.


신뢰 구간, 개선된 라벨링, 막대 그룹 설정를 포함한 막대 그래프: graph bar는 이제 평균과 해당 신뢰 구간을 그래프로 표시할 수 있게 합니다. 또한 새로운 groupyvars 옵션을 사용하여 동일한 y 변수에 대한 막대를 함께 그룹화할 수 있습니다. graph bar에는 범주 축의 눈금과 라벨을 설정하고 막대 라벨에 접두사 또는 접미사를 추가하는 새로운 옵션도 있습니다.


신뢰 구간, 개선된 라벨링, 점 그룹 설정을 포함한 점도표: graph dot은 이제 평균과 해당 신뢰 구간을 그래프로 표시할 수 있게 합니다. 또한 새로운 groupyvars 옵션을 사용하여 동일한 y 변수에 대한 점을 함께 그룹화할 수 있습니다. graph dot에는 범주 축의 눈금과 라벨을 제어하는 새로운 옵션도 있습니다.


개선된 라벨링과 상자 그룹 제어를 포함한 상자 도표: 새로운 groupyvars 옵션을 사용하여 동일한 y 변수에 대한 상자를 함께 그룹화할 수 있습니다. graph box에는 범주 축의 눈금과 라벨을 설정하는 새로운 옵션도 있습니다.


더 많은 그래프에서 변수별 색상 지원: colorvar() 옵션은 이제 더 많은 twoway 그래프(line, connected, tsline, rline, rconnected, tsrline)에서 사용 가능합니다. 이 옵션을 사용하면 지정된 변수의 값에 따라 선, 마커 등의 색상을 다양하게 설정할 수 있습니다.

어떤 점이 독특하고 흥미롭나요?

이것들은 그래프 기능에 대한 가장 많이 요청된 추가 사항들 중 일부입니다. 특히, 막대 그래프에 대한 신뢰 구간과 새로운 막대 그룹화 옵션은 반복적으로 요청되어 왔습니다. 히트맵도 인기가 많습니다.

어떤 분야의 사람들이 사용할까요?

거의 모든 연구자가 그래프를 생성합니다. 이러한 새로운 기능은 모든 학문 분야에 매력적일 것입니다

어떤 기능일까요?

Stata 19에는 사용자가 표를 더 쉽게 생성하고 사용자가 정의할 수 있도록 하는 많은 추가 기능이 포함되어 있습니다.


표 제목, 메모, 내보내기: table 명령어는 표, 요약 통계표, 회귀 결과표 등을 생성하는 유연한 도구입니다. 이제 새로운 title() 옵션으로 제목을 추가하고, 새로운 note() 옵션으로 메모를 추가하며, 새로운 titlestyles()와 notestyles() 옵션으로 제목과 메모의 모양을 설정할 수 있습니다. 또한 새로운 export() 옵션을 사용하여 표를 원하는 문서 유형(Word, LaTeX, Excel 등)으로 내보낼 수 있습니다.


더 쉬운 ANOVA 표작성: 이제 anova와 oneway 이후 새로운 저장된 행렬 r(ANOVA)를 수집하여 ANOVA 표를 더 쉽게 생성하고 사용자가 정의할 수 있습니다. 새로운 anova 컬렉션 스타일을 사용하여 이러한 결과를 표준 ANOVA 스타일 레이아웃으로 쉽게 작성할 수 있습니다.


collect get으로 더 나은 라벨정의: collect get 명령어의 새로운 옵션 commands()를 사용하면 결과를 수집한 명령어 이름을 지정할 수 있습니다. 이를 통해 collect get 명령어별 결과 라벨을 검색할 수 있습니다. 컬렉션의 결과는 collect get 명령어 대신 collect 명령어를 사용했을 때와 같이 더 나은 라벨을 가질 것입니다.


컬렉션의 레이아웃 결정: 새로운 collect query layout 명령어를 사용하면 컬렉션의 레이아웃 정의를 조회할 수 있습니다. 이전에는 사용자가 collect layout을 입력하여 레이아웃과 표를 모두 표시했습니다. 이제 레이아웃을 볼 때마다 전체 표를 볼 필요가 없습니다.


표 머리말에서 범주형 변수 설정: collect style header의 새로운 옵션 fvlevels()를 사용하면 표에 범주형 변수가 표시되는 방식을 더 세밀하게 제어할 수 있습니다. 행과 열 머리말에서 범주형 변수 수준을 숨기거나 표시할지 지정할 수 있습니다.


컬렉션에서 결과 제거: 새로운 collect unget 명령어를 사용하면 컬렉션에서 선택한 결과를 제거할 수 있습니다. 이를 통해 이러한 결과를 포함하지 않는 표를 더 쉽게 작성할 수 있습니다.


표 메모: collect notes 명령어는 새로운 fortags() 옵션을 제공하여 지정된 메모가 표시될 표를 설정할 수 있습니다.


연관성 측정 및 검정을 포함한 표 작성: 이제 tabulate와 svy: tabulate의 결과를 사용하여 사용자 정의 표를 쉽게 생성할 수 있습니다. 새로운 collect() 옵션을 사용하면 표로 작성된 통계가 자체 레이아웃과 스타일을 가진 컬렉션에 저장되며, 이를 추가로 사용자 정의하고 다양한 파일 형식으로 내보낼 수 있습니다. 이는 tabulate에서 누적 백분율이나 연관성 측정, svy: tabulate의 검정결과를 포함하고자 할 때 특히 유용합니다.


어떤 점이 독특하고 흥미롭나요?

이 기능들은 표 생성 기능에 대해 가장 많이 요청된 추가 사항들 중 일부입니다.

어떤 분야의 사람들이 사용할까요?

거의 모든 연구자가 결과를 표를 통해 명확하게 제시해야 합니다. 이러한 새로운 기능은 모든 학문 분야에 매력적일 것입니다.

어떤 기능일까요?

Stata의 메뉴, 대화 상자 등이 이제 프랑스어로 표시될 수 있습니다.

컴퓨터 언어가 프랑스어(fr)로 설정되어 있으면 Stata는 자동으로 프랑스어 설정을 사용합니다.

Windows나 Unix에서 언어를 수동으로 변경하려면 편집 > 환경설정 > 사용자 인터페이스 언어...를 선택하세요. MacOS를 사용하는 경우 Stata 19 > 환경설정 > 사용자 인터페이스 언어...를 선택하세요.

또는 명령줄에서 set locale_ui 명령어를 사용하여 언어를 변경할 수 있습니다.

어떤 분야의 사람들이 사용할까요?

프랑스어를 사용하는 모든 연구자들

어떤 기능일까요?

  • 저장된 프레임셋 수정
  • 비대칭 라플라스 우도 베이지안 모형추정
  • 생존 그래프를 위한 대체 위험표
  • Pystata 개선
  • VAR 모형 강건표준오차
  • 베이지안 분석을 위한 Half-Cauchy 및 Rayleigh 사전 분포
  • 사용자 평가 정의 베이지안 예측
  • 그리고 훨씬 더 많은 기능들