모집단
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
모집단은 통계적 관찰 대상이 되는 전체 집단을 의미하며, 표본은 모집단의 부분 집합을 가리킨다. 모집단은 유한모집단과 무한모집단으로 구분되며, 전수조사는 모집단 전체를 조사하는 방법이지만, 비용과 시간, 오류 발생 가능성으로 인해 표본 조사를 통해 모집단을 추론하는 경우가 많다. 모집단의 특성을 나타내는 지표로 모평균과 모분산이 있으며, 추론 통계학은 표본을 통해 모집단의 성질을 추론하는 데 사용된다.
더 읽어볼만한 페이지
| 모집단 |
|---|
2. 모집단의 정의 및 종류
모집단은 통계적 관찰 대상이 되는 전체 집단을 의미하며, 그 부분 집단을 표본이라고 한다. 모집단은 구성 요소의 수에 따라 유한 모집단과 무한 모집단으로 나뉜다.[13]
- 유한 모집단: 구성 요소의 수가 유한한 경우이다. 한국 국민 전체의 집단이 그 예시이다. 요소의 수가 매우 많을 때는 무한 모집단으로 간주하기도 한다.[13]
- 무한 모집단: 구성 요소의 수가 무한한 경우이다. 주사위를 무한히 던졌을 때 나오는 눈의 수의 집단이 그 예시이다.[13]
모집단 전체를 조사하는 전수 조사는 비용이 많이 들고, 조사 과정에서 오류가 발생할 가능성이 높으며, 전구 수명 검사와 같이 실행 불가능한 경우도 있다.[13] 따라서 표본 조사를 통해 모집단의 특성을 추론하는 경우가 많다.
2. 1. 모집단과 조사 대상
모집단은 조사 대상과 혼용되기도 하지만, 엄밀하게는 구별되어야 한다. 조사 대상은 관찰 대상(요소) 자체의 전체 집단을 의미하지만, 통계적 관찰은 그 요소의 어떤 특성에 관한 것이며, 그 특성을 나타내는 값(표지)의 전체 집합이 엄밀한 의미의 모집단이다.[13] 예를 들어, 한국 국민의 키(신장)를 통계적으로 관찰할 때, 한국 국민 전체는 조사 대상이고, 한국 국민 각 개인의 키 값 전체가 모집단이 된다. 그러나 이러한 엄밀한 구별 없이 모집단(population)과 조사 대상(universe)을 동의어로 사용하는 경우도 많다.[13]3. 모집단의 특성
통계학의 목적 중 하나는 실험이나 관측으로 얻은 데이터를 요약하는 것이다.[11] 이때 사용되는 수치적 척도는 데이터의 중심 위치를 나타내는 중심 척도(평균, 중앙값 등)와 데이터의 흩어진 정도를 나타내는 산포 척도(분산 등)로 나눌 수 있다.
대부분의 경우, 관측 현상의 모집단은 실제로 존재하지 않는 관념적인 개념이다. 따라서 현실에서 얻는 데이터 집합인 표본과는 달리, 모집단의 수치적 척도를 실제로 계산하는 것은 불가능하다. 하지만 모집단의 존재를 가정하면, 이를 정량화할 수 있다. 이러한 수치적 척도는 모집단의 분포가 존재할 때, 그 분포의 모수가 된다.
3. 1. 모평균
데이터의 집합이 모집단일 때, 해당 데이터 집합의 평균을 모평균이라고 부른다. 모평균은 확률 분포 또는 해당 분포를 특징으로 하는 확률 변수의 중심 경향에 대한 척도이다.[5] 이산 확률 분포에서 확률 변수 의 평균은 가능한 모든 값에 대한 합계에 해당 값의 확률을 가중하여 구한다. 즉, 의 각 가능한 값 와 그 확률 의 곱을 구한 다음, 이 모든 곱을 더하여 를 구한다.[6][7] 연속 확률 분포의 경우에도 유사한 공식이 적용된다. 모든 확률 분포가 정의된 평균을 갖는 것은 아니다(예를 들어 코시 분포 참조). 또한, 일부 분포의 경우 평균이 무한대가 될 수도 있다.유한 모집단의 경우, 속성의 모평균은 모집단의 모든 구성원을 고려하여 해당 속성의 산술 평균과 같다. 예를 들어, 모집단 평균 키는 모든 개인의 키의 합을 총 개인 수로 나눈 값과 같다. ''표본 평균''은 특히 작은 표본의 경우 모집단 평균과 다를 수 있다. 큰 수의 법칙은 표본의 크기가 클수록 표본 평균이 모집단 평균에 가까워질 가능성이 더 높다고 명시한다.[8]
3. 2. 모분산
데이터의 집합이 모집단일 때, 해당 데이터 집합의 분산을 모분산이라고 부른다.[11]population variance영어 한편, 관측 현상의 어떤 표본의 표본 분산을 어떤 참값의 근사값으로 볼 때, 그 참값은 모분산을 가리킨다.4. 전수 조사와 표본 조사
모집단 전체를 조사하는 것을 전수 조사라고 한다. 하지만 전수 조사는 비용이 많이 들고, 많은 조사원을 동원해야 하므로 예상치 못한 오류가 발생하여 조사의 정확성을 해칠 수 있다.[13] 전구 수명 검사와 같이 전수 조사가 불가능한 경우도 있다.[13]
이러한 이유로 모집단의 일부인 표본을 추출하여 조사하는 표본 조사를 하는 경우가 많다.[13] 기술 통계학에서는 다수의 요소를 포함한 표본을 전제로 하기에, 표본과 모집단의 구분이 불분명한 경우도 있다.[9] 하지만 대부분의 경우 모집단을 완전히 파악하는 것은 불가능하다.[10] 예를 들어 일본인 전체를 대상으로 하는 조사, 제품 파괴 강도 검사와 같이 전수 조사가 불가능한 경우, 미래에 발생할 일이라 현재 측정이 불가능한 경우가 있다.[10] 이럴 때에는 적은 수의 표본을 추출하여 분석하고, 이를 바탕으로 모집단을 추론하는 추론 통계학 기법이 사용된다.
4. 1. 표본 평균과 모평균
표본 평균은 모집단 평균과 다를 수 있지만, 큰 수의 법칙에 따라 표본의 크기가 클수록 모평균에 가까워질 가능성이 더 높다.[8]5. 추론 통계학
기술 통계학이 대표본의 존재를 전제로 하여 표본과 모집단을 거의 동일시하는 반면, 추론 통계학은 소표본을 바탕으로 모집단의 성질을 추론한다.[9][10]
일본 산업 규격(JIS)에서는 모집단을 "고찰의 대상이 되는 특성을 가진 모든 것의 집단"으로 정의한다.[10]
대부분의 경우 모집단을 완전히 파악하는 것은 불가능하므로, 소표본을 추출하여 분석하고 모집단을 추론하는 기법이 사용된다.[10]
모집단을 완전히 파악하는 것이 불가능한 경우는 다음과 같다.
| 경우 | 설명 |
|---|---|
| 모집단이 매우 많은 요소 또는 무한대의 요소로 구성된 경우 | 예: 일본인 전체가 조사 대상인 경우 |
| 모집단 자체는 그다지 많은 요소를 포함하지 않지만, 전체 조사가 의미가 없거나 불가능한 경우 | 예: 제품의 파괴 강도 검사 (전체 조사가 의미 없음), 개별 조사가 고가여서 예산상의 제약으로 전체 조사가 불가능한 경우 |
| 미래에 발생하기 때문에 현재 측정이 불가능한 요소를 포함하는 경우 | 예: 내년의 경제 성장률 |
참조
[1]
웹사이트
Glossary of statistical terms: Population
http://www.statistic[...]
2016-02-22
[2]
MathWorld
Population
[3]
서적
The Practice of Statistics
http://bcs.whfreeman[...]
Freeman
[4]
웹사이트
Glossary of statistical terms: Sample
http://www.statistic[...]
2016-02-22
[5]
서적
Introduction to Probability Theory and its Applications, Vol I
Wiley
[6]
서적
Elementary Statistics
https://books.google[...]
[7]
웹사이트
Population Mean
https://mathworld.wo[...]
2020-08-21
[8]
서적
Schaum's Outline of Theory and Problems of Probability
https://books.google[...]
[9]
문서
蓑谷(1988)
[10]
문서
統計学教室(1991)
[11]
문서
蓑谷(1994)
[12]
서적
수리통계학 입문
1995-03-10
[13]
글로벌2
모집단·표본
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com