SPSS
1. 개요
SPSS는 사회 과학 분야의 통계 분석을 위해 개발된 소프트웨어 패키지로, 1968년 노먼 H. 니 등에 의해 처음 출시되었다. 펀칭 카드와 메인프레임을 사용하던 초기 형태에서 PC, Mac, Linux 등 다양한 운영체제를 지원하는 프로그램으로 발전했다. 2009년 IBM에 인수되었으며, 현재는 IBM SPSS Statistics를 비롯한 다양한 제품군을 통해 데이터 마이닝, 텍스트 분석, 빅데이터 관리 등의 기능을 제공한다.
이미지 준비중입니다.
| 스크린샷 | SPSS v27 running on 윈도우 7에서 실행 중 |
|---|
| 개발자 | 노먼 H. 니, 데일 H. 벤트, C. 하다이 헐 |
|---|---|
| 출시일 | 1968년 |
| 최신 버전 | 30 |
| 최신 출시일 | 2024년 9월 30일 |
| 운영체제 | 윈도우 (x86-64) macOS (x86-64) 리눅스 (x86-64, ppc64le, IBM Z) |
| 플랫폼 | Java |
| 크기 | ~1.2 GB |
| 장르 | 통계 분석 수치 분석 |
| 라이선스 | 구독 또는 엔터프라이즈 라이선싱 |
| 웹사이트 | IBM SPSS Statistics |
| 회사명 | IBM SPSS |
|---|---|
| 로고 | |
| 시장 정보 | NASDAQ | SPSS |
| 본사 위치 | 일리노이주시카고 |
| 설립일 | 1988년10월 |
| 업종 | 5250 |
| 사업 내용 | 컴퓨터 소프트웨어의 개발, 판매, 임대, 수출입 |
| 대표자 | 잭 누넌 |
| 자본금 | 11,200,000엔 |
| 외부 링크 | IBM SPSS Statistics |
| 특기 사항 | 2009년에 IBM에 의해 인수됨 |
| 이름 | IBM SPSS |
|---|---|
| 화면 | Mean median mode SPSS Syntax.JPG |
| 원저자 | SPSS Inc. |
| 출시일 (소프트웨어 정보) | 1968년 |
| 최신 버전 (소프트웨어 정보) | 29 |
| 최신 출시일 (소프트웨어 정보) | 2022년 9월 13일 |
| 운영체제 (소프트웨어 정보) | Microsoft Windows, macOS 등 |
| 종류 (소프트웨어 정보) | 통계 분석 소프트웨어 |
| 라이선스 (소프트웨어 정보) | IBM SPSS |
| 웹사이트 (소프트웨어 정보) | IBM SPSS |
-
통계 소프트웨어 -
SAS (소프트웨어)
SAS는 통계 분석, 데이터 마이닝, 예측 모델링 기능을 제공하는 소프트웨어 제품군으로, 농업 데이터 분석을 위해 개발되어 다양한 산업 분야에서 활용되고 있으며 인공지능 및 머신러닝 분야로 투자를 확대하고 있다. -
통계 소프트웨어 -
Stata
Stata는 통계 분석, 데이터 관리, 그래프 작성 기능을 제공하는 통계 소프트웨어 패키지로, 다양한 운영체제 지원, 명령줄 및 그래픽 사용자 인터페이스 제공, 사회과학 및 자연과학 분야에서의 폭넓은 활용, 사용자 커뮤니티를 통한 확장 기능 지원 및 파이썬 연동을 특징으로 한다. -
통계 프로그래밍 언어 -
줄리아 (프로그래밍 언어)
줄리아는 2012년에 공개된 고수준 프로그래밍 언어로, 다중 디스패치, 동적 타입 시스템, C와 유사한 성능을 제공하며, 수치 계산, 과학 기술 계산 등에 활용된다. -
통계 프로그래밍 언어 -
Stata
Stata는 통계 분석, 데이터 관리, 그래프 작성 기능을 제공하는 통계 소프트웨어 패키지로, 다양한 운영체제 지원, 명령줄 및 그래픽 사용자 인터페이스 제공, 사회과학 및 자연과학 분야에서의 폭넓은 활용, 사용자 커뮤니티를 통한 확장 기능 지원 및 파이썬 연동을 특징으로 한다. -
기계 학습 및 데이터 마이닝 소프트웨어 -
GNU 옥타브
GNU 옥타브는 MATLAB과 높은 호환성을 가지며 수치 해석 계산을 위해 사용되는 자유-오픈 소스 소프트웨어이다. -
기계 학습 및 데이터 마이닝 소프트웨어 -
SAS (소프트웨어)
SAS는 통계 분석, 데이터 마이닝, 예측 모델링 기능을 제공하는 소프트웨어 제품군으로, 농업 데이터 분석을 위해 개발되어 다양한 산업 분야에서 활용되고 있으며 인공지능 및 머신러닝 분야로 투자를 확대하고 있다.
2. 역사 및 발전
SPSS는 1968년 스탠퍼드 대학교 정치학 박사 과정이었던 노먼 니(Norman H. Nie)와 컴퓨터 공학자 데일 벤트(Dale H. Bent), 해들레이 헐(C. Hadlai Hull)이 개발하였다. 초기에는 펀칭카드를 이용한 데이터 관리 방식을 사용하였으며, 메인프레임 환경에서 명령어 입력을 통해 사용되었다.
1975년 노먼 니는 대학교에서 연구교수로 재직하며 개발자들과 함께 SPSS 주식회사를 설립하여 운영하였고, 지속적인 기능 향상과 통계적 기법을 개량하였다. 1983년 SPSS-X (10판)부터는 여러 레코드 유형을 포함하는 데이터 파일을 처리할 수 있게 되었다.
2009년 IBM이 12억 달러에 SPSS를 인수하면서, IBM의 기업 관리 운영 컨설팅 소프트웨어로 자리매김하였다. 인수 과정에서 2009년과 2010년 사이에는 제품명이 PASW(Predictive Analytics SoftWare)로 변경되었다가, 이후 SPSS: An IBM Company로 변경되었으며, 2010년 IBM에 완전히 통합되었다. 현재 판매되는 기업용 SPSS는 데이터 마이닝과 텍스트 분석, 빅데이터 관리, 조사 기법 개발 방법 기능까지 갖추고 있다.
2.1. 버전 역사
3. 기능
SPSS는 풀다운 메뉴 또는 명령 구문 언어를 사용하여 통계 분석을 수행할 수 있다. 풀다운 메뉴를 통해 대부분의 기능을 사용할 수 있지만, 독점적인 4GL 명령 구문 언어를 사용하면 재현 가능한 출력, 반복 작업 단순화, 복잡한 데이터 조작 및 분석 처리가 가능하다는 장점이 있다. 일부 복잡한 응용 프로그램은 명령 구문으로만 프로그래밍할 수 있다. 풀다운 메뉴 인터페이스는 명령 구문을 생성하며, 기본 설정을 변경하면 출력에 표시할 수 있다. 또한 각 메뉴의 "붙여넣기" 버튼을 사용하여 구문 파일에 붙여넣을 수도 있다.
파이썬 프로그래밍 가능 확장 기능은 데이터 사전 및 데이터의 정보에 접근하여 명령 구문 프로그램을 동적으로 구축할 수 있게 해준다. 이 기능은 SPSS 14에 도입되었으며, SAX Basic "스크립트"를 대체했지만, SaxBasic은 여전히 사용할 수 있다. 또한 파이썬 확장을 통해 SPSS는 무료 소프트웨어 패키지 R의 모든 통계를 실행할 수 있다. 버전 14부터 SPSS는 제공된 "플러그인"을 사용하여 파이썬 또는 VB.NET 프로그램에 의해 외부적으로 구동될 수 있다.
3.1. 주요 기능
SPSS의 주요 기능은 다음과 같다.
* 기술 통계: 교차표, 빈도, 기술 자료, 탐색, 기술 비율 통계
* 이변량 통계: 평균, t-검정, 분산 분석, 상관 관계(이변량, 부분, 거리), 비모수 검정, 베이지안 분석
* 수치 결과 예측: 선형 회귀 분석
* 집단 식별 예측: 요인 분석, 클러스터 분석(단계, K-평균, 위계적), 차별성 예측
* 지리적 공간분석, 시뮬레이션
* R 확장(GUI), 파이썬(Python)
3.2. 데이터 처리
SPSS 데이터 세트는 2차원 테이블 구조를 가지며, 행은 케이스(개인 또는 가구 등), 열은 측정값(나이, 성별, 가구 소득 등)을 나타낸다. 데이터 유형으로는 숫자 및 텍스트 두 가지만 정의된다. 모든 데이터 처리는 파일(데이터 세트)을 통해 케이스별로 순차적으로 발생하며, 파일은 일대일 및 일대다로 일치시킬 수 있지만, 다대다로는 일치시킬 수 없다.
3.3. 사용자 인터페이스
SPSS의 그래픽 사용자 인터페이스는 '데이터 보기'와 '변수 보기' 두 가지 보기를 제공한다. '데이터 보기'는 케이스(행)와 변수(열)의 스프레드시트 보기를 보여준다. 스프레드시트와 달리 데이터 셀은 숫자 또는 텍스트만 포함할 수 있으며, 수식을 이러한 셀에 저장할 수 없다. '변수 보기'는 각 행이 변수를 나타내고 변수 이름, 변수 레이블, 값 레이블, 인쇄 너비, 측정 유형 및 다양한 기타 특성을 표시하는 메타데이터 사전을 표시한다. 두 보기의 셀은 모두 수동으로 편집하여 파일 구조를 정의하고 명령 구문을 사용하지 않고도 데이터 입력을 허용할 수 있다. 이는 소규모 데이터 세트에 충분할 수 있다. 통계 설문 조사와 같은 더 큰 데이터 세트는 데이터 입력 소프트웨어에서 더 자주 생성되거나, 컴퓨터 보조 대인 면접 중 스캔 및 광학 문자 인식, 광학 마크 인식 소프트웨어를 사용하거나 온라인 설문지에서 직접 캡처하여 입력된다. 이러한 데이터 세트는 SPSS에 읽혀진다.
4. 확장성 및 연동
SPSS는 기본 통계 기능 외에 IBM SPSS Modeler를 통해 데이터 마이닝 및 텍스트 마이닝 기능을 확장할 수 있으며, AMOS와 연동하여 구조방정식 모형을 사용할 수 있다. 과거에는 대용량 데이터 분석이 어렵다는 단점이 있었으나, AMOS와의 연동으로 이 문제는 해결되었다.
2009년 4월 7일부터 PASW Statistic으로 제품명이 변경되었고, 버전 18부터 R 언어와 Python 및 이들과 SPSS의 연결 모듈을 함께 제공했다. IBM에 인수된 후에는 IBM 브랜드의 IBM SPSS Statistics가 되었다. 2016년 4월 기준으로 IBM SPSS Statistics 24.0이 최신 버전이다. 지리적 공간분석, 시뮬레이션 기능과 R 확장(GUI), 파이썬(Python)도 지원한다.
4.1. IBM SPSS 제품군
* 통계 분석 소프트웨어 IBM SPSS Statistics
* 데이터 마이닝 도구 IBM SPSS Modeler
* 공분산 구조 분석 소프트웨어 AMOS
* 텍스트 마이닝 소프트웨어 IBM SPSS Text Analytics for Surveys
* PASW Collection
* PASW Data Collection Reporter
* PASW Collaboration and Deployment Services
5. 프로젝트 NX
2020년 10월, IBM은 코드명 '프로젝트 NX'로 명명된 "새로운 SPSS Statistics"의 얼리 액세스 프로그램 시작을 발표했다. 이 프로그램은 새롭고 사용하기 쉬운 인터페이스, 통합된 안내, 여러 탭, 향상된 그래프 등을 제공한다.
6. 기타
과거 시카고 대학교의 전미 여론 연구 센터(NORC)에서 개발한 IDA (대화형 데이터 분석) 소프트웨어 패키지는 회귀 분석에 강점을 가졌다. SCSS (Conversational / Columnar SPSS)는 IBM 메인프레임을 온라인으로 사용하기 위한 소프트웨어 제품으로, 열 지향 방식을 사용하여 교차분석에 강점을 보였다.