Stata
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
Stata는 통계 분석, 데이터 관리 및 그래픽 기능을 제공하는 통계 소프트웨어 패키지이다. 1985년 첫 버전 출시 이후 지속적으로 업데이트되어 2023년 4월 기준 최신 버전은 18.0이다. Stata는 사용자 친화적인 인터페이스, 빠른 데이터 처리 속도, 다양한 플랫폼 호환성을 제공하며, 사용자 커뮤니티가 활발하여 다양한 확장 기능을 활용할 수 있다. Stata는 유료 소프트웨어 중 비교적 저렴한 편이며, Stata/MP, Stata/SE, Stata/BE 등 여러 버전으로 제공되어 데이터 처리 능력과 속도에 차이를 보인다.
더 읽어볼만한 페이지
- 통계 소프트웨어 - SAS (소프트웨어)
SAS는 통계 분석, 데이터 마이닝, 예측 모델링 기능을 제공하는 소프트웨어 제품군으로, 농업 데이터 분석을 위해 개발되어 다양한 산업 분야에서 활용되고 있으며 인공지능 및 머신러닝 분야로 투자를 확대하고 있다. - 통계 소프트웨어 - SPSS
SPSS는 1968년 개발된 사회 과학용 통계 패키지로, PC 버전으로 확장되고 기능이 강화되어 IBM에 인수된 후 데이터 마이닝 기능 등이 추가되었으나 높은 가격으로 비판받기도 한다. - 통계 프로그래밍 언어 - 줄리아 (프로그래밍 언어)
줄리아는 2012년에 공개된 고수준 프로그래밍 언어로, 다중 디스패치, 동적 타입 시스템, C와 유사한 성능을 제공하며, 수치 계산, 과학 기술 계산 등에 활용된다. - 통계 프로그래밍 언어 - SPSS
SPSS는 1968년 개발된 사회 과학용 통계 패키지로, PC 버전으로 확장되고 기능이 강화되어 IBM에 인수된 후 데이터 마이닝 기능 등이 추가되었으나 높은 가격으로 비판받기도 한다. - 시계열 소프트웨어 - 시계열 데이터베이스
시계열 데이터베이스는 시간 순서에 따라 기록된 데이터를 효율적으로 저장, 관리, 분석하기 위해 설계된 데이터베이스 시스템으로, 시간 기반 인덱싱, 높은 데이터 압축률, 데이터 보존 정책 등의 특징을 가지며 다양한 분야에서 활용된다. - 시계열 소프트웨어 - 메이플 (소프트웨어)
메이플은 Maplesoft에서 개발한 컴퓨터 대수 시스템 소프트웨어로, 기호 및 수치 계산, 시각화, 프로그래밍 기능을 제공하며 수학적 모델링, 시뮬레이션, 데이터 분석 등에 활용되어 교육 및 연구 개발 분야에서 널리 사용된다.
| Stata - [IT 관련 정보]에 관한 문서 | |
|---|---|
| 기본 정보 | |
![]() | |
| 개발자 | StataCorp |
| 최초 출시일 | 1985년 |
| 최신 버전 | 18.0 |
| 최신 릴리스 날짜 | 2023년 4월 25일 |
| 프로그래밍 언어 | C |
| 운영 체제 | 윈도우, macOS, 리눅스 |
| 장르 | 통계 분석 |
| 라이선스 | 사유 |
| 웹사이트 | Stata 공식 웹사이트 |
2. 특징
Stata는 통계학의 전 분야에서 사용될 수 있도록 설계되었으며, 통계 패키지로서의 기능뿐만 아니라 데이터 관리 시스템으로서의 역할도 수행한다. Stata는 초보 사용자도 쉽게 접근할 수 있으며, 자료 처리 속도가 빠르고 정확한 데이터 값을 얻을 수 있다는 장점이 있다. 또한, 호환성이 뛰어나 모든 시스템에서 사용 가능하며, Stata에서 사용되는 Dataset는 여러 플랫폼에서 변환 없이 공유될 수 있다.
Stata는 사용자가 새로운 명령어를 추가할 수 있는 프로그래밍 환경을 제공하며, 인터넷을 통해 한 번의 클릭만으로 웹 상의 데이터를 공유하고 수시로 추가되는 새로운 기능을 자동으로 업데이트할 수 있다. 경제적인 면에서도 다른 프로그램에 비해 가격이 저렴한 편이다. 버전 14부터는 유니코드를 지원하여 일본어 텍스트 처리도 자유롭게 할 수 있게 되었다. 헬프 기능이 뛰어나 명령어 이름으로 명령어의 샘플 스크립트를 포함한 상세한 해설을 볼 수 있으며, R과 마찬가지로 사용자 커뮤니티가 활발하여 사용자가 직접 개발한 통계 분석 패키지를 쉽게 이용할 수 있다.
2. 1. 사용자 인터페이스
Stata는 처음부터 통합된 명령줄 인터페이스를 사용해 왔다. 버전 8.0부터 Stata는 많은 내장 명령에 접근할 수 있도록 그래픽 사용자 인터페이스를 포함했으며, 이 인터페이스는 메뉴와 대화 상자를 사용한다. 데이터 세트는 스프레드시트 형식으로 보거나 편집할 수 있다. 버전 11부터는 데이터 브라우저 또는 편집기가 열려 있는 동안 다른 명령을 실행할 수 있다.Stata는 그래프 작성의 일부를 제외한 거의 모든 부분에서 명령줄 인터페이스([CUI](CLI))와 그래픽 사용자 인터페이스(GUI)를 모두 지원한다. 따라서 초보자나 아직 익숙하지 않은 명령은 메뉴에서 조작하는 GUI가 사용하기 쉽다. 또한 GUI로 조작하면, 이에 대응하는 CUI용 명령이 출력되므로, CUI 조작도 자연스럽게 학습할 수 있으며 익숙해지면 대부분의 조작을 CUI로 수행할 수 있게 된다.
2. 2. 데이터 구조 및 저장
Stata는 한 번에 하나의 데이터 집합만 열 수 있다.[9] Stata는 데이터에 데이터 유형을 할당하는 데 유연성을 제공한다. `compress` 명령은 정보 손실 없이 데이터를 더 적은 메모리를 차지하는 데이터 유형으로 자동으로 다시 할당한다. Stata는 4바이트가 아닌 1바이트 또는 2바이트만 차지하는 정수 저장 유형을 사용하며, 부동 소수점 숫자의 기본값은 배정밀도(8바이트)가 아닌 단정밀도(4바이트)이다.Stata의 데이터 형식은 항상 표 형식이다. Stata는 표 형식 데이터의 열을 변수라고 부른다.
2. 3. 데이터 형식 호환성
Stata는 아스키 데이터 형식(예: CSV 또는 데이터뱅크)과 엑셀 형식 등 다양한 형식의 데이터를 가져올 수 있다.[11] Stata는 'fdause' 및 'fdasave' 명령을 사용하여 SAS XPORT 형식 데이터세트를 기본적으로 읽고 쓸 수 있다.[11]gretl을 포함한 일부 다른 계량 경제학 응용 프로그램은 Stata 파일 형식을 직접 가져올 수 있다.[11]
2. 4. 확장성
Stata 1.2 버전에서는 `program` 명령을 통해 사용자가 직접 명령어를 추가할 수 있게 되었다.[6][14] Stata 2.1 버전에서는 ado 파일이 도입되어 사용자가 작성한 프로그램을 자동으로 메모리에 로드할 수 있게 되었다. 많은 사용자가 작성한 ado 파일은 보스턴 칼리지에서 운영하는 통계 소프트웨어 구성 요소 아카이브(Statistical Software Components Archive)에 제출된다. StataCorp는 커뮤니티에서 개발한 프로그램을 Stata 내에서 직접 추가할 수 있도록 `ssc` 명령을 추가했다.[15] 최신 Stata 버전에서는 명령을 사용하여 Python 스크립트를 호출할 수 있으며, Jupyter Notebooks와 같은 Python IDE에서 Stata 명령을 가져올 수 있다.[16] Stata는 R을 기본적으로 지원하지 않지만, Stata에서 R 스크립트를 사용하기 위한 사용자 작성 확장 기능이 존재한다.[17]3. 장점
Stata는 통계학의 전 분야에서 사용될 수 있도록 만들어졌으며, 통계 패키지일 뿐만 아니라 통계적 능력을 갖춘 완전한 데이터 관리 시스템이다. Stata는 다음과 같은 장점을 바탕으로 현재 129개국에서 사용되고 있다.[1]
- 통계 분석은 물론 데이터 관리(Data managment)와 그래픽(Graphic)에서도 탁월한 능력을 발휘한다.[1]
- 광범위한 내용의 통계 분석이 가능하여 매우 다양한 분야의 사용자들의 요구에 부합한다.[1]
- 인터넷과의 상호작용을 통하여 다양한 부가적인 기능을 발휘한다.[1]
- 프로그램이 가벼워 시작 속도가 매우 빠르고 저사양 컴퓨터에서 사용하기에도 무리가 없다.[1]
- 가격과 유지 비용이 타 통계 프로그램에 비하여 저렴하다.[1]
Stata는 초보 사용자도 접근이 어렵지 않으며, 자료를 처리하는 데 있어 속도가 빠를 뿐만 아니라 정확한 데이터 값을 얻을 수 있다. 또한, 호환성이 뛰어나 모든 시스템에서 사용이 가능하며, Stata에서 사용되는 Dataset는 여러 플랫폼에서 변환하지 않고 공유될 수 있다.[1] Stata는 유료 통계 소프트웨어 중 비교적 저렴하며, 버전 14부터 유니코드(Unicode)를 지원하여 일본어 텍스트 처리도 자유롭게 할 수 있게 되었다.[1] R과 마찬가지로 사용자 커뮤니티가 활발하여 사용자가 직접 개발한 통계 분석 패키지를 쉽게 이용할 수 있다.[1]
4. 버전
Stata는 1985년 버전 1.0 출시 이후 지속적으로 업데이트되고 있다. 평균적으로 2년 내지 2년 6개월마다 업그레이드가 이루어지고 있다.
Stata는 데이터 처리 능력과 속도에 따라 여러 버전으로 제공된다. 초창기에는 Stata SE, Stata IC, Stata Small 등의 세 가지 종류로 판매되었으나, 현재는 Stata/MP, Stata/SE, Stata/BE, Numerics by Stata 버전으로 제공된다. Stata Small은 사용 용량에 제한이 많아 거의 사용되지 않는다.
| 발표 연도 | 명칭 | 버전 | 비고 |
|---|---|---|---|
| 2017.06 | Stata 15.0 | 15.0 | 그래프 투명화 지원 |
| 2019.06 | Stata 16.0 | 16.0 | 파이썬 연동 |
4. 1. 개발 역사
Stata의 개발은 1984년 윌리엄 (빌) 굴드(William (Bill) Gould)에 의해 시작되었고, 이후 션 베케티(Sean Becketti)가 참여했다. 이 소프트웨어는 원래 SYSTAT 및 EViews와 같은 개인용 컴퓨터용 통계 프로그램과 경쟁하기 위해 개발되었다.[6] Stata는 C 프로그래밍 언어로 작성되었으며, 초기에는 PC에서 DOS 운영 체제를 실행하도록 설계되었다. 첫 번째 버전은 1985년에 44개의 명령어로 출시되었다.[6]| append | dir | infile | plot | spool |
| beep | do | input | query | summarize |
| by | drop | label | regress | tabulate |
| capture | erase | list | rename | test |
| confirm | exit | macro | replace | type |
| convert | expand | merge | run | use |
| correlate | format | modify | save | style="padding-left:1.0em;" | |
| count | generate | more | set | style="padding-left:1.0em;" | |
| describe | help | outfile | sort | style="padding-left:1.0em;" | |
1985년부터 2024년까지 총 18번의 주요 버전의 Stata가 출시되었으며, 주요 릴리스 사이에 추가적인 코드 및 문서 업데이트가 이루어졌다.[7] 초기에는 Stata 프로그램의 추가 세트가 때때로 "키트"로 판매되거나 지원 디스크로 배포되었다. 1999년 Stata 6 버전 출시와 함께 `update`가 웹을 통해 사용자에게 제공되기 시작했다.[6] Stata의 초기 버전은 DOS 운영 체제를 위해 출시되었다. 이후 리눅스 배포판, 윈도우, MacOS를 실행하는 시스템용 Stata 버전이 출시되었다.[6] 모든 Stata 파일은 플랫폼 독립적이다.
Stata는 37년의 역사 동안 수백 개의 명령어가 추가되었다.[12][13] 확장성, 플랫폼 독립성, 그리고 활발한 사용자 커뮤니티는 Stata의 중요한 개발 사항이며, 오늘날까지도 사용자 경험을 형성하는 데 기여하고 있다.[6]
4. 2. 사용자 커뮤니티
Stata는 활발한 사용자 커뮤니티를 가지고 있으며, 이는 여러 중요한 개발을 이끌었다.[6] 1991년 사용자 제작 명령어를 주로 다루는 ''Stata Technical Bulletin''이 창간되어 연 6회 발행되었다. 2001년에는 동료 심사를 거치는 분기별 간행물인 ''Stata Journal''로 재출시되어, 커뮤니티에서 기여한 명령어에 대한 설명과 Stata의 효과적인 사용을 위한 팁을 제공했다.[6]1994년에는 사용자들이 코딩 및 기술적 문제를 협력하여 해결하기 위한 리스트서버가 시작되었으며, 2014년에는 웹 포럼으로 전환되었다.[6] 1995년부터 Statacorp는 매년 사용자 및 개발자 컨퍼런스를 조직하기 시작했다. 미국에서 개최되는 연례 Stata 컨퍼런스는 StataCorp에서 주최한다. 다른 사용자 그룹 회의는 미국(Stata Conference), 영국, 독일, 이탈리아에서 매년 개최되며, 다른 여러 국가에서도 더 드물게 개최된다. 현지 Stata 배포업체는 자체 국가에서 사용자 그룹 회의를 주최한다.[6]
R과 마찬가지로 사용자 커뮤니티가 활발하여 사용자가 직접 개발한 통계 분석 패키지를 쉽게 이용할 수 있다.
4. 3. 종류
Stata는 처리 속도와 기능에 따라 여러 버전으로 제공된다.
Stata의 가격 및 라이선스는 사용 목적(비즈니스, 정부/비영리, 교육, 학생)에 따라 다르다. 단일 사용자 라이선스는 연간 또는 영구 갱신이 가능하다. 다른 라이선스 유형으로는 동시 사용자가 사용할 수 있는 단일 라이선스, 사이트 라이선스, 대량 구매를 위한 볼륨 단일 사용자 또는 학생 랩 라이선스가 있다.[20]
5. 관련 서적
- 민인식, 최필선, ''Stata 기초적 이해와 활용'', 한국Stata학회, 2008.
- 츠츠이 준야 (저), 미즈오치 마사아키 (저), 아키요시 미토 (저), 사카모토 카즈야스 (저), 「Stata로 계량경제학 입문 제2판」, 미네르바 서방, 2011년 5월 30일.
- 우라시마 미츠요시 (저), 「Stata를 이용한 의료 데이터 분석 입문」, 도쿄 서적, 2014년 5월 10일.
- 이시구로 카쿠 (저), 「개정 Stata에 의한 사회 조사 데이터의 분석: 입문에서 응용까지」, 키타오지 서방, 2014년 5월 13일.
- 마츠우라 토시유키 (저), 「Stata에 의한 데이터 분석 입문 제3판 ~경제 분석의 기초부터 인과 추론까지」, 도쿄 서적, 2021년 12월 11일.
참조
[1]
논문
A conversation with William Gould
2005
[2]
웹사이트
Statalist FAQ
https://www.statalis[...]
2021-04-24
[3]
웹사이트
STATA Data Manipulation: Basics and Applications 7
https://www.iuj.ac.j[...]
2022-01-27
[4]
서적
biostatistics-in-public-health-using-stata
https://www.stata.co[...]
[5]
웹사이트
Disciplines
https://www.stata.co[...]
2021-04-21
[6]
논문
A brief history of Stata on its 20th anniversary
2005
[7]
웹사이트
When was Stata first released? When were later versions released?
https://www.stata.co[...]
2021-04-22
[8]
웹사이트
What's new in Stata?
https://www.stata.co[...]
StataCorp
2023-04-25
[9]
웹사이트
Data frames: multiple datasets in memory
https://www.stata.co[...]
2020-08-13
[10]
서적
Stata 18 Base Reference Manual
Stata Press
2023
[11]
웹사이트
Stata 16 help for save
https://www.stata.co[...]
[12]
서적
Stata Glossary and Index: Release 17
https://www.stata.co[...]
Stata Press
[13]
웹사이트
Stata features
https://www.stata.co[...]
StataCorp
2021-04-24
[14]
웹사이트
program - Define and manipulate programs
https://www.stata.co[...]
Stata Press
2021-04-24
[15]
웹사이트
ssc - Install and uninstall packages from SSC
https://www.stata.co[...]
Stata Press
2021-04-24
[16]
웹사이트
Use Python and Stata together {{!}} Stata
https://www.stata.co[...]
[17]
웹사이트
How to Switch Your Workflow from Stata to R, One Bit at a Time · Frederick Solt
https://fsolt.org/bl[...]
2022-01-27
[18]
웹사이트
Which Stata is right for me?
https://www.stata.co[...]
2021-04-23
[19]
웹사이트
Parallel Stata
https://grid.rcs.hbs[...]
Harvard Business School
[20]
웹사이트
Order Stata software
https://www.stata.co[...]
StataCorp
2021-04-25
[21]
서적
Getting Started with Stata for Windows
https://www.stata.co[...]
Stata Press
2021-04-25
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com
