맨위로가기

표본

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

표본은 통계학에서 어떠한 특성을 공유하는 집단으로, 모집단으로부터 추출된 부분 집합을 의미한다. 표본 추출에는 의도적 추출법과 무작위 추출법이 있으며, 통계적 추정을 위해 표본을 선발하는 확률을 알아야 한다. 표본을 표현하는 수치를 통계량이라고 하며, 모수를 추정하기 위해 사용되는 통계량을 추정량이라고 한다. 표본은 무작위 추출을 통해 얻어지며, 표본의 크기는 추출된 확률 변수열의 길이를 의미한다.

더 읽어볼만한 페이지

  • 통계학 용어 - 퍼센트 포인트
    퍼센트포인트는 전체 비율을 나타내는 퍼센트와 달리 두 퍼센트 값의 차이를 나타내는 단위로, 경제 지표나 여론조사 등에서 명확한 정보 전달을 위해 중요하며 절대적 변화량을 나타낸다.
  • 통계학 용어 - 편차
    편차는 관측값과 참값의 차이인 오차를 의미하며 통계적 분산 측정에 중요하고, 데이터 분석, 과학 실험, 무선 공학 등에서 활용된다.
표본

2. 표본집단의 정의

통계학에서 표본집단(標本集團, sample)은 표본 조사에서 선정된, 어떠한 특성을 공유한 집단이다. 줄여서 표집이라고도 할 수 있으나 표집(sampling)은 모집단에서 표본을 추출하는 일 또는 방법을 가리키는 용어이기도 하다.

모집단을 완전히 조사하는 것이 불가능한 경우, 표본으로부터 모집단의 특성을 추정해야 한다. 이 표본 추출에는 의도적 추출법과 무작위 추출법의 두 가지 추출 방법이 있다. 통계학에서는 무작위 추출법만을 논하는 것은 아니다. 무작위 추출법에서는 모집단의 어떤 요소도 동일한 확률로 표본으로 선택될 필요가 있다. 그러나 실제 모집단을 알 수 없는 상태에서 추출한 방법이 무작위임을 보장할 수 없다. 따라서 이상적으로는 무작위 추출을 가정하지만, 추출 방법의 타당성을 확인할 필요가 있으며, 통계학의 대상을 무작위 추출에 한정하는 것은 불가능하다.

또한 통계적 추정(표본으로부터 모집단의 성질을 추정하는 것)을 수행하려면 각 표본에 대해 그것을 선발하는 확률을 알아야 한다. 이 때문에 다양한 표본 추출법이 개발되어 있다. 예를 들어 서로 다른 표본을 선발하는 확률이 모두 같다면, 그 추출법을 단순 임의(무작위) 추출이라고 한다.

일본 산업 규격에서는, 표본(sample)을 하나 이상의 추출 단위로 구성된 모집단의 부분 집합으로 정의하고 있다.

3. 표본 추출 방법

표본 추출 방법에는 의도적 추출법과 무작위 추출법이 있다. 통계학에서는 주로 무작위 추출법을 사용하며, 무작위 추출은 모집단의 모든 요소가 표본으로 선택될 확률이 동일해야 함을 의미한다. 실제로는 무작위 추출을 완전히 보장하기 어려우므로, 추출 방법의 타당성을 확인하는 것이 중요하다.

3. 1. 다양한 표본 추출법

무작위 추출법에서는 모집단의 각 요소가 동일한 확률로 표본으로 선택되어야 한다. 그러나 실제 모집단을 알 수 없는 상태에서 추출한 방법이 무작위임을 보장하기는 어렵다. 따라서 이상적으로는 무작위 추출을 가정하지만, 추출 방법의 타당성을 확인할 필요가 있으며, 통계학의 대상을 무작위 추출에 한정하는 것은 불가능하다.

통계적 추정 (표본으로부터 모집단의 성질을 추정하는 것)을 수행하려면 각 표본을 선택하는 확률을 알아야 한다. 이 때문에 다양한 표본 추출법이 개발되었다. 예를 들어 서로 다른 표본을 선택하는 확률이 모두 같다면, 그 추출법을 단순 임의(무작위) 추출이라고 한다.

4. 통계량과 추정량

모집단을 나타내는 수치를 '''모수'''라고 하고, 표본을 나타내는 수치를 '''통계량'''이라고 한다. 통계량은 표본으로부터 계산되는 값이며, 모수를 추정하기 위해 사용되는 통계량을 추정량이라고 한다.

모집단 분포를 ''F''라고 할 때, 모집단에서 추출된 ('''무작위''') '''표본''' random sample영어은 분포 ''F''를 따르는 독립 동일 분포확률 변수열 ''x''1, ''x''2, ..., ''x''''n''을 말한다. 이 확률 변수열의 길이 ''n''을 표본의 크기(샘플 사이즈)라고 한다. 취할 수 있는 표본 전체가 이루는 집합 Ω, 확률을 정할 수 있는 집합 전체 '''M''' (⊂ 2^Ω), 분포를 나타내는 확률 측도 ''P''로 이루어진 확률 공간 (Ω, '''M''', ''P'')을 '''표본 공간'''이라고 한다.

예를 들어 모집단의 분포 ''F''가 모평균 E[''X''] = ''m'', 모분산 V[''X''] = σ2을 가진다면, 표본 ''x''1, ''x''2, ...는 ''i''를 임의의 번호로 하여 평균 E[''x''''i''] = ''m'', 분산 V[''x''''i''] = σ2을 만족한다.

4. 1. 표본 분포

통계량은 (같은 양이라도) 표본을 어떻게 추출하는지에 따라 달라지며, 일반적으로 모집단의 분포와는 다른 분포를 따른다. 이러한 통계량이 따르는 분포를 표본 분포라고 한다.

예를 들어 표본 '''x''' = (''x''1, ''x''2, ..., ''x''''n'')의 평균

: \bar{\mathbf{x}} := \frac{x_1+x_2+\cdots+x_n}{n}

을 구하는 경우, '''x''' (표본 '''x'''를 다양하게 취하는 방법)를 통해 얻을 수 있는 확률 변수는 통계량이다. 이 통계량은 표본 평균이라고 하며, ''X'' 등으로 표시한다. 모집단의 분포 ''F''가 모평균 E[''X''] = ''m'', 모분산 V[''X''] = σ2을 갖는다면, 표본 평균 ''X''의 표본 분포는 평균 E[''X''] = ''m'', 분산 V[''X''] = σ2/''n''을 갖는다.

5. 표본의 형식적 정의

통계학에서 모집단 분포가 ''F''일 때, 모집단에서 추출된 (무작위) 표본은 분포 ''F''를 따르는 독립 동일 분포확률 변수열 ''x''1, ''x''2, ..., ''x''''n''으로 정의된다. 이 확률 변수열의 길이 ''n''을 표본의 크기(샘플 사이즈)라고 한다. 취할 수 있는 모든 표본이 이루는 집합 Ω, 확률을 정할 수 있는 집합 전체 '''M''' (⊂ 2^Ω), 분포를 나타내는 확률 측도 ''P''로 이루어진 확률 공간 (Ω, '''M''', ''P'')을 표본 공간이라고 한다.

예를 들어 모집단의 분포 ''F''가 모평균 E[''X''] = ''m'', 모분산 V[''X''] = σ2을 가진다면, 표본 ''x''1, ''x''2, ...는 임의의 번호 ''i''에 대해 평균 E[''x''''i''] = ''m'', 분산 V[''x''''i''] = σ2을 만족한다.

5. 1. 표본 평균

모집단 분포를 ''F''라고 할 때, 모집단에서 추출된 ('''무작위''') '''표본''' random sample영어은 분포 ''F''를 따르는 독립 동일 분포확률 변수열 ''x''1, ''x''2, ..., ''x''''n''을 말한다. 이 확률 변수열의 길이 ''n''을 표본의 크기(샘플 사이즈)라고 한다.

표본에서 적절한 조작을 하여 새롭게 만들어지는 확률 변수를 통계량이라고 부른다.

예를 들어 표본 '''x''' = (''x''1, ''x''2, ..., ''x''''n'')에 대해, 그 평균

:\bar{\mathbf{x}} := \frac{x_1+x_2+\cdots+x_n}{n}

을 취하는 조작을 생각할 때, '''x'''의 표본 '''x'''의 취하는 방법을 다양하게 고려하여 얻을 수 있는 확률 변수는 통계량이다. 이 통계량은 표본 평균이라고 불리며, ''X'' 등으로 나타낸다. 모집단의 분포 ''F''가 모평균 E[''X''] = ''m'', 모분산 V[''X''] = σ2을 가진다면, 표본 평균 ''X''가 따르는 표본 분포에 대해, 평균 E[''X''] = ''m'', 분산 V[''X''] = σ2/''n''을 얻는다.

6. 한국 사회와 표본 조사

한국 사회에서 표본 조사는 여론 조사, 인구 조사, 경제 조사 등 다양한 분야에서 활용된다. 특히, 정치, 사회, 경제 현상에 대한 국민들의 의견을 파악하고 정책 결정에 반영하기 위해 표본 조사가 중요한 역할을 한다. 표본 조사의 결과는 사회 현상에 대한 이해를 높이고, 정책 결정의 근거 자료로 활용될 수 있다. 하지만, 표본 조사의 설계 및 실행 과정에서 발생할 수 있는 오류와 편향에 대한 주의가 필요하며, 표본 조사 결과를 해석할 때 신중한 접근이 요구된다.



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com