머신러닝에 관심이 있습니까?
라쏘? 서포트 벡터 머신? 부스트 회귀? 기타 알고리즘?
Stata의 사용자 커뮤니티에서는 다양한 머신러닝을 위한 패키지를 제공하고 있습니다.

아래 목록은 머신러닝 패키지를 알고리즘 유형별로 정리했습니다. 자세한 내용은 패키지 또는 명령어 이름을 클릭하십시오.
Stata 명령문창에 해당 명령문을 클릭하면 됩니다.

1. Lasso, elastic net regression, and ridge regression:

  lassopack
  이 명령어 패키지는 Achim Arhens, Christian Hansen 및 Mark Schaffer에 의해 개발된 프로그램 모음으로 lasso2, cvlasso 및 rasso 명령을 포함합니다. 이 명령어는 lasso, square-root lasso, elastic net, ridge regression, adaptive lasso 추정 및 교차 검증을 포함하는 기능을 제공합니다.
    . ssc describe lassopack

  pdslasso
  이 명령어는 Achim Arhens, Christian Hansen 및 Mark Schaffer에 의해 개발되었습니다. 내생성이 있는 모형에서 추정 및 인과 추론을 위한 psdlasso 명령어과 ivlasso 명령어가 포함되어 있습니다. 사후 이중선택과 사후 정규화의 두 가지 추정 방법이 제공됩니다.
    . ssc describe pdslasso

  elasticregress
  이 명령어는 Wilbur Townsend에 의해 개발되었습니다. 이 명령어는 lasso와 ridge 회귀를 포함한 엘라스틱 넷정규화 회귀를 수행합니다.
    . ssc describe elasticregress

  sivreg
  Helmut Farbmacher가 개발한 이 명령어는 일부 유효하지 않은 도구변수를 가진  선형 도구변수 회귀에 대한 적응형 lasso를 수행합니다.
    . ssc describe sivreg

  krls
  이 명령어는 Jeremy Ferwerda, Jens Hainmuller 및 Chad Hazlett에 의해 개발되었습니다. 이 명령어는  커널기반 정규화 최소제곱을 수행합니다.
  여기에 자세히 설명이 있습니다.
    . ssc describe krls

  plogit
  Tony Brady와 Gareth Ambler가 개발한 이 명령어는 lasso를 포함한 패널티가 있는 로지스틱 회귀 분석을 수행합니다.
    . net describe plogit, from(http://www.homepages.ucl.ac.uk/~ucakgam/stata)

  lars
  이 명령어는 Adrian Mander에 의해 개발되었으며 최소 각도 회귀(LARS) 모델 알고리즘을 제공합니다.
    . ssc describe lars


2. Support vector machines:
  svmachines
  이 명령어는 Nick Guenther와 Matthias Schonlau에 의해 개발되었습니다. 이 명령어는 SVM(Support Vector Machine) 알고리즘을 제공하며 연속, 이진, 범주형 결과모형에 적용할 수 있습니다.
    . net sj 16-4  st0461


3. Boosted regression:
  boost
  Matthias Schonlau가 개발한 이 플러그인은 boost 회귀분석을 수행합니다.
  . net sj 12-2 st0087_1


4. Regression trees:
  chaid
  Joseph Luchman에 의해 개발된 이 명령어는 카이제곱 자동 상호작용 탐지(CHAID)와 포괄적인 CHAID 알고리즘을 제공합니다.
    . ssc describe chaid

  cart
  Wim van Putten이 개발한 이 명령어는 고장시간 데이터에 대한 분류 및 회귀 트리 분석을 수행합니다.
    . ssc describe cart


5. Random decision forests:
  chaidforest
  Joseph Luchman이 개발한 이 명령어는 CHAID를 기본 학습자로 사용하여 무작위 결정 포레스트 앙상블 분류를 수행합니다.
    . ssc describe chaidforest


6. Latent Dirichlet allocation:
  ldagibbs
  Carlo Schwarz에 의해 개발된 이 명령어는 텍스트 문자열의 클러스터링을 위한 잠재 LDA(latent Dirichlet allocation)을 위한 Gibbs 샘플링 알고리즘을 제공합니다.
    . net sj 18-1 st0515

그리고 Stata의 기본 명령어 중 선형회귀, 로지스틱회귀, 판별분석, 군집분석, 주성분분석 명령어도 머신러닝의 도구로 사용할 수 있습니다.

Stata 버전 16부터 Python과 연동할 수 있는 기능이 계속 업데이트되고 있습니다.


버전 17에서는 PyStata를 통해 Stata와 Python 양쪽에서 각각 서로를 호출할 수 있게 되었습니다.

또한 Jupyter Notebook을 통해 웹 환경에서의 연동 성능도 강화되었습니다.


이와 관련하여 Stata에서 Python을 사용하기 위해 기본적으로 알아야 하는 내용에 대해 요약한 자료가 있어 공유합니다.

  Stata에서 Python 사용하기 다운로드

Stata에서 데이터 파일에 있는 날짜시간 변수를 지정하는 부분은 많은 고민을 필요로 할 수 있습니다. 

이것과 관련하여 어떻게 처리하면 되는지에 대한 가이드 파일이 있어 올려봅니다.

가이드 파일 다운로드(영문)

Stata 제품을 사용하는 도중에 어려움이 있어 기술지원을 받고자하면 아래와 같은 절차를 진행해 주시기 바랍니다.

    문의 전화: 02-470-4143


1. 회사에 전화를 걸어서 기술지원이 가능한지 문의한다.


2. 엔지니어가 문제점을 사전에 파악할 수 있도록 이메일에  현재 어려움을 겪는 부분에 대해 설명하여 보낸다.


3. 원격지원을 받을 수 있는 프로그램을 다운로드하여 실행한다.(설치방식이 아닌 포터블 방식이라 간편)

    >>>  원격지원 프로그램 다운로드  <<< Windows 사용자만 가능

    >>>  원격지원 프로그램 다운로드  <<< Mac 사용자 지원 준비 중


4. 회사에 전화를 걸어 "귀하의 ID"와 "비밀번호"를 알려주고 원격지원을 기다린다.

안녕하세요.

 

인터넷 속도가 느리거나 인터넷을 사용할 수 없는 환경에서 Stata를 업데이트 해야 할 경우

아래 링크를 이용해서 업데이트 가능합니다. (단, 네트워크 버전은 해당사항 없음 - 별도 연락요망)

 

<업데이트 프로그램 다운로드>

 Windows(64bit): 다운로드 클릭

 Mac(64bit): 다운로드 클릭

 

<설치순서>

 1. 인터넷이 연결된 컴퓨터에서 해당 업데이트 파일 다운로드

 2. 프로그램이 설치된 컴퓨터에 파일 이동하여 압축해제

 3. Stata 프로그램 실행

    명령문 창에서 db update 입력후 실행

    압축이 해제된 폴더를 지정하여 OK 선택

 끝.

Stata는 64비트의 모든 OS 플랫폼을 지원합니다.


BE, SE 및 MP 모두 데이터 관리 및 통계분석에 필요한 기능은 모두 동일합니다.
그러나 분석할 소스 데이터의 사이즈 및 분석기법에 따라 Stata 프로그램의 성능이 달라집니다.
자세한 프로그램 타입별 차이는 여기에서 확인할 수 있습니다.


Stata/MP를 사용하기 위해서는 2코어나 4코어 프로세서를 가진 컴퓨터를 사용하거나 멀티 프로세서를 가진 서버 컴퓨터가 필요할 수도 있습니다.

컴퓨터가 여러 개의 프로세서로 되어 있던지 한 개의 프로세서에 멀티코어로 이루어져 있던지는 차이가 없습니다. MP뒤에 붙는 숫자가 높을수록 더 많은 프로세서와 더 많은 코어가 필요하며 이것은 Stata/MP 프로그램의 성능을 더 빠르게 만듭니다.

Stata/MP는 2부터 64까지 다양하게 제품군이 있습니다. (Stata/MP2, Stata/MP4, Stata/MP6, ..., Stata/MP64)


머신러닝 및 AI와 같이 탐색적으로 데이터를 분석하거나 빅데이터와 같이 자체적으로 사이즈가 큰 데이터는 확실한 차이를 발생시킬 수 있습니다.
다년간의 패널데이터 분석 및 멀티레벨(위계선형)과 같은 데이터 역시  각 차수간, 각 그룹간 상관에 대한 정의 및 가중치 부여에 있어 이러한 부분은 더욱 눈에 띄게 향상된 차이를 느낄 수 있습니다.

Stata/MP에 대한 자세한 정보는 *Stata/MP 성능평가 보고서 (2023판)를 참고하시기 바랍니다.

아래와 같이 Stata Cheat Sheets를 다운로드 할 수 있도록 제공합니다.

이것은 모두 6페이지로 아래와 같이 구성되어 있습니다.

Stata를 사용하기 편하게 요약한 A4사이즈의 간단설명서로 생각하시면 됩니다.

  • Data Analysis
  • Programming
  • Data Processing
  • Data Transfomation
  • Data Visualization
  • Plotting in Stata 


Stata Cheat Sheets 다운로드 < 클릭하기 (PDF)

안녕하세요.

 

인터넷 속도가 느리거나 인터넷을 사용할 수 없는 환경에서 Stata를 업데이트 해야 할 경우

아래 링크를 이용해서 업데이트 가능합니다. (단, 네트워크 버전은 해당사항 없음 - 별도 연락요망)

 

<업데이트 프로그램 다운로드>

 Windows(64bit): 다운로드 클릭

 Mac(64bit): 다운로드 클릭

 

<설치순서>

 1. 인터넷이 연결된 컴퓨터에서 해당 업데이트 파일 다운로드

 2. 프로그램이 설치된 컴퓨터에 파일 이동하여 압축해제

 3. Stata 프로그램 실행

    명령문 창에서 db update 입력후 실행

    압축이 해제된 폴더를 지정하여 OK 선택

 끝.

 

안녕하세요.

 

인터넷 속도가 느리거나 인터넷을 사용할 수 없는 환경에서 Stata를 업데이트 해야 할 경우

아래 링크를 이용해서 업데이트 가능합니다. (단, 네트워크 버전은 해당사항 없음 - 별도 연락요망)

 

<업데이트 프로그램 다운로드>

 Windows(64bit): 다운로드 클릭

 Mac(64bit): 다운로드 클릭

 

<설치순서>

 1. 인터넷이 연결된 컴퓨터에서 해당 업데이트 파일 다운로드

 2. 프로그램이 설치된 컴퓨터에 파일 이동하여 압축해제

 3. Stata 프로그램 실행

    명령문 창에서 db update 입력후 실행

    압축이 해제된 폴더를 지정하여 OK 선택

 끝.