통계량
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
통계량은 표본에서 계산되는 값으로, 표본의 산술 평균, 설문 조사 결과의 비율, 호텔 투숙객의 평균 숙박 기간 등이 예시이다. 통계량은 사용 목적에 따라 요약 통계량, 검정 통계량, 순서 통계량 등으로 분류되며, 모수를 추정하기 위한 추정량도 통계량의 일종이다. 통계량은 관찰 가능한 랜덤 변수이며, 완비성, 일치성, 충분성, 불편성, 최소평균제곱오차, 낮은 분산, 강건성 등의 통계적 성질을 가질 수 있다. 모형 모수에 대한 통계량의 정보는 피셔 정보량이나 쿨백-라이블러 발산 척도를 통해 정의될 수 있다.
더 읽어볼만한 페이지
- 통계량 - 제곱평균제곱근
제곱평균제곱근(RMS)은 값들의 크기를 나타내는 통계량으로, 이산 데이터의 경우 각 값의 제곱의 평균의 제곱근, 연속 함수의 경우 함수 제곱의 적분 평균의 제곱근으로 정의되며, 전기공학, 물리학 등 다양한 분야에서 활용되고 표준편차와 밀접한 관련이 있다. - 통계량 - 최빈값
최빈값은 데이터 집합에서 가장 자주 나타나는 값으로, 확률 분포의 중심 경향을 나타내는 척도이며 이상치에 둔감하고 명목형 데이터에도 적용 가능하다. - 통계 이론 - 로지스틱 회귀
로지스틱 회귀는 범주형 종속 변수를 다루는 회귀 분석 기법으로, 특히 이항 종속 변수에 널리 사용되며, 오즈에 로짓 변환을 적용하여 결과값이 0과 1 사이의 값을 가지도록 하는 일반화 선형 모형의 특수한 경우이다. - 통계 이론 - 정보 엔트로피
정보 엔트로피는 확률 변수의 불확실성을 측정하는 방법으로, 사건 발생 가능성이 낮을수록 정보량이 커진다는 원리에 기반하며, 데이터 압축, 생물다양성 측정, 암호화 등 다양한 분야에서 활용된다.
통계량 | |
---|---|
통계량 | |
정의 | 표본의 속성을 단일 숫자로 나타내는 값 |
사용 예시 | 표본 평균 표본 중앙값 표본 표준 편차 |
목적 | 표본 데이터를 요약하고, 모수에 대한 추론을 하는 데 사용 |
특징 | 표본 데이터에 기반함 확률변수로 간주됨 추정량의 특정 값 |
종류 | 중심 경향 측도 (평균, 중앙값, 최빈값) 산포도 (표준편차, 분산) |
관련 개념 | 모수 |
統計量 (일본어) | |
정의 | 標本に基づいて計算される統計値 |
사용 | 母集団の特性を推定するために使用 |
종류 | 標本平均 標本分散 標本標準偏差 |
특징 | 標本から計算されるため、値は確率的に変動する 母数との関係を考察する上で重要 |
관련 개념 | 母数 |
통계량 (한국어) | |
정의 | 표본의 특성을 요약하여 나타내는 하나의 수치 값 |
사용 | 표본 자료의 특징을 파악하고, 모집단에 대한 추론을 하는 데 사용 |
종류 | 표본 평균 표본 분산 표본 표준편차 표본 중앙값 표본 최빈값 |
특징 | 표본 데이터를 기반으로 계산 확률 변수로 간주 가능 추정량의 특정 값 |
2. 정의
통계학에서 대상이 되는 데이터는 모집단에서 추출된 표본이며, 통계량은 표본에서 직접 산출되는 관측 가능한 확률변수의 일종으로, 표본의 성질을 표현하는 수치이다. 보통은 모집단을 모수(관측할 수 없음)에 의해 특징지어지는 확률분포로 가정하고, 거기에서 어떤 크기의 표본을 랜덤으로 추출한다.
모수의 값, 예를 들어 전국의 25세 남성의 키의 평균은 관측할 수 없지만, 그것에 대응하는 통계량, 예를 들어 100명의 키의 평균은 관측할 수 있다. 모수와 대응하는 통계량(예의 경우에는 모집단 평균 키와 100명의 평균 키)과의 차이(추정량의 치우침)는 확률변수이지만, 이것은 관측할 수 있는 것이 아니므로 통계량이 아니다.
2. 1. 예시
예를 들어 표본의 산술 평균은 데이터의 값을 모두 더하고 데이터의 개수로 나눠줌으로써 계산된다. 이때, 이 산술 평균은 하나의 통계량이다. 이처럼 구한 표본 평균은 주로 모평균을 추정할 때에 사용된다. 하지만 모평균은 통계량이 아니다. 왜냐하면 이는 표본으로부터 계산되는 값이 아니기 때문이다.통계량의 몇 가지 예는 다음과 같다.
- "최근 미국인을 대상으로 한 설문 조사에서 여성의 '''52%'''가 지구 온난화가 발생하고 있다고 말했습니다."
이 경우 "52%"는 통계량이다. 즉, 설문 조사 표본에 있는 지구 온난화를 믿는 여성의 비율이다. 모집단은 미국 내 모든 여성의 집합이며, 추정되는 모집단 모수는 설문 조사에 참여한 여성이 아닌 미국 내 ''모든'' 여성 중 지구 온난화를 믿는 여성의 비율이다.
- "디즈니 월드 근처에 위치한 대형 호텔의 매니저는 20명의 선택된 투숙객의 평균 숙박 기간이 '''5.6'''일이라고 밝혔습니다."
이 예에서 "5.6일"은 통계량이다. 즉, 20명의 호텔 투숙객 표본에 대한 평균 숙박 기간이다. 모집단은 이 호텔의 모든 투숙객의 집합이며, 추정되는 모집단 모수는 ''모든'' 투숙객의 평균 숙박 기간이다. 이 경우 추정량이 불편추정량인지는 표본 선택 과정에 따라 달라진다. 검사 역설을 참조한다.
통계량을 계산하는 데 사용되는 다양한 함수가 있다. 일부는 다음을 포함한다.
- 표본 평균, 표본 중앙값, 및 표본 최빈값
- 표본 분산 및 표본 표준 편차
- 사분위수와 백분위수 등 중앙값 이외의 표본 분위수
- t-통계량, 카이제곱 통계량, F 통계량과 같은 검정 통계량
- 표본 최댓값과 최솟값을 포함한 순서 통계량
- 첨도와 왜도를 포함한 표본 적률 및 그 함수
- 경험적 분포 함수의 다양한 함수형
예를 들어 간단한 통계량의 한 예로 산술평균을 계산할 때는, 모든 데이터 값을 합계하고 데이터 값의 개수로 나누는 알고리즘을 사용한다.
통계학적으로, 대상이 되는 데이터는 모집단에서 추출된 표본이며, 표본에서 직접 산출되는 통계량은 관측(관찰)할 수 있는 확률변수의 일종이며, 표본의 성질을 표현하는 수치이다. 보통은 모집단을 모수(관측할 수 없음)에 의해 특징지어지는 확률분포로 가정하고, 거기에서 어떤 크기의 표본을 랜덤으로 추출하는 것으로 한다.
모수의 값, 예를 들어 전국의 25세 남성의 키의 평균은 관측할 수 없지만, 그것에 대응하는 통계량, 예를 들어 100명의 키의 평균은 관측할 수 있다. 또 모수와 대응하는 통계량(예의 경우에는 모집단 평균 키와 100명의 평균 키)과의 차이(추정량의 치우침)도 확률변수이지만, 이것은 관측할 수 있는 것이 아니므로, 통계량이 아니다.
3. 종류
통계량은 사용 목적에 따라 이름이 붙여진다.
- 요약 통계량(기술 통계량): 표본의 특성을 요약하기 위한 통계량이다. 표본 평균, 표본 중앙값, 최빈값 등이 있다.
- 검정 통계량: 통계적 검정에 이용하기 위해 표본에서 산출하는 통계량이다.
- 순서 통계량: 표본을 값의 크기로 나열했을 때의 순서이다.
모수를 통계적으로 추정하기 위한 통계량을 특히 추정량이라고 한다.
3. 1. 요약 통계량 (기술 통계량)
표본의 특성을 요약하기 위한 통계량이다. 예를 들어, 표본의 산술 평균은 데이터의 값을 모두 더하고 데이터의 개수로 나누어 계산한다. 이렇게 계산된 표본 평균은 주로 모평균을 추정하는 데 사용된다.몇 가지 예는 다음과 같다.
- "최근 미국인을 대상으로 한 설문 조사에서 여성의 '''52%'''가 지구 온난화가 발생하고 있다고 말했습니다." 이 경우 "52%"는 설문 조사 표본에서 지구 온난화를 믿는 여성의 비율을 나타내는 통계량이다.
- "디즈니 월드 근처에 위치한 대형 호텔의 매니저는 20명의 선택된 투숙객의 평균 숙박 기간이 '''5.6'''일이라고 밝혔습니다." 이 예에서 "5.6일"은 20명의 호텔 투숙객 표본에 대한 평균 숙박 기간을 나타내는 통계량이다.
통계량을 계산하는 데 사용되는 다양한 함수는 다음과 같다.
- 표본 평균, 표본 중앙값, 및 표본 최빈값
- 표본 분산 및 표본 표준 편차
- 사분위수와 백분위수 등 중앙값 이외의 표본 분위수
- t-통계량, 카이제곱 통계량, F 통계량과 같은 검정 통계량
- 표본 최댓값과 최솟값을 포함한 순서 통계량
- 첨도와 왜도를 포함한 표본 적률 및 그 함수
- 경험적 분포 함수의 다양한 함수형
3. 2. 검정 통계량
통계적 검정에 이용하기 위해 표본에서 산출하는 통계량이다.3. 3. 순서 통계량
표본을 값의 크기로 나열했을 때의 순서이다.4. 성질
통계량은 모집단에서 추출된 표본의 성질을 나타내는 수치이다. 산술평균은 통계량의 한 예로, 모든 데이터 값을 더하고 데이터 값의 개수로 나누어 계산한다.
통계학에서 대상이 되는 데이터는 모집단에서 추출된 표본이며, 표본에서 직접 산출되는 통계량은 관측 가능한 확률변수이다. 모집단은 모수(관측할 수 없음)에 의해 특징지어지는 확률분포로 가정하며, 여기서 특정 크기의 표본을 랜덤으로 추출한다.
모수(예: 전국의 25세 남성 평균 키)는 관측할 수 없지만, 이에 대응하는 통계량(예: 100명 키의 평균)은 관측 가능하다. 모수와 통계량의 차이(추정량의 치우침)는 확률변수이지만, 관측할 수 없으므로 통계량이 아니다.
4. 1. 관찰 가능성
통계량은 관찰 가능한 랜덤 변수이다. 이는 모수와 가장 구분되는 점이다. 모수는 오로지 전체 데이터 집합이 주어졌을 때에만 계산 가능한 값이다.통계학자들은 종종 모집단의 각 구성원의 측정 가능한 속성의 분포가 될 수 있는 모수적 분포족을 고려하는데, 여기서 표본이 무작위로 추출된다. 예를 들어, 모수는 북미 25세 남성의 평균 키일 수 있다. 이때 100명의 그러한 남성 표본 구성원의 키를 측정한다. 그 100개의 숫자의 평균은 통계량이다. 모집단의 모든 구성원의 키 평균은 어떤 식으로든 확인되지 않는 한 통계량이 아니다(예: 모집단의 모든 구성원을 측정하여). 모든 25세 북미 남성의 모든 개별 키를 사용하여 계산되는 평균 키는 모수이며 통계량이 아니다.
간단한 통계량의 예로 산술평균을 계산할 때는, 모든 데이터 값을 합계하고 데이터 값의 개수로 나누는 알고리즘을 사용한다.
통계학적으로, 대상이 되는 데이터는 모집단에서 추출된 표본이며, 표본에서 직접 산출되는 통계량은 관측(관찰)할 수 있는 확률변수의 일종이며, 표본의 성질을 표현하는 수치이다. 보통은 모집단을 모수(관측할 수 없음)에 의해 특징지어지는 확률분포로 가정하고, 거기에서 어떤 크기의 표본을 랜덤으로 추출하는 것으로 한다.
모수의 값, 예를 들어 전국의 25세 남성의 키의 평균은 관측할 수 없지만, 그것에 대응하는 통계량, 예를 들어 100명의 키의 평균은 관측할 수 있다. 또 모수와 대응하는 통계량(예의 경우에는 모집단 평균 키와 100명의 평균 키)과의 차이(추정량의 치우침)도 확률변수이지만, 이것은 관측할 수 있는 것이 아니므로, 통계량이 아니다.
4. 2. 통계적 성질
통계량의 중요한 잠재적 속성에는 완비성, 일치성, 충분성, 불편성, 최소평균제곱오차, 낮은 분산, 강건성 및 계산 편의성이 포함된다. 예를 들어 간단한 통계량의 한 예로 산술평균을 계산할 때는, 모든 데이터 값을 합계하고 데이터 값의 개수로 나누는 알고리즘을 사용한다.통계학적으로, 대상이 되는 데이터는 모집단에서 추출된 표본이며, 표본에서 직접 산출되는 통계량은 관측(관찰)할 수 있는 확률변수의 일종이며, 표본의 성질을 표현하는 수치이다. 보통은 모집단을 모수(관측할 수 없음)에 의해 특징지어지는 확률분포로 가정하고, 거기에서 어떤 크기의 표본을 랜덤으로 추출하는 것으로 한다.
모수의 값(예: 전국의 25세 남성의 키의 평균)은 관측할 수 없지만, 그것에 대응하는 통계량(예: 100명의 키의 평균)은 관측할 수 있다. 또 모수와 대응하는 통계량(예의 경우에는 모집단 평균 키와 100명의 평균 키)과의 차이(추정량의 치우침)도 확률변수이지만, 이것은 관측할 수 있는 것이 아니므로, 통계량이 아니다.
4. 3. 통계량의 정보
모형 모수에 대한 통계량의 정보는 여러 가지 방법으로 정의할 수 있다. 가장 일반적인 방법은 통계량에 의해 유도된 통계적 모형에서 정의되는 피셔 정보량이다. 쿨백-라이블러 발산 척도 또한 사용될 수 있다.예를 들어, 간단한 통계량의 한 예로 산술평균을 계산할 때는, 모든 데이터 값을 합계하고 데이터 값의 개수로 나누는 알고리즘을 사용한다.
통계학적으로, 대상이 되는 데이터는 모집단에서 추출된 표본이며, 표본에서 직접 산출되는 통계량은 관측(관찰)할 수 있는 확률변수의 일종이며, 표본의 성질을 표현하는 수치이다. 보통은 모집단을 모수(관측할 수 없음)에 의해 특징지어지는 확률분포로 가정하고, 거기에서 어떤 크기의 표본을 랜덤으로 추출하는 것으로 한다.
모수의 값(예: 전국의 25세 남성의 키의 평균)은 관측할 수 없지만, 그것에 대응하는 통계량(예: 100명의 키의 평균)은 관측할 수 있다. 또 모수와 대응하는 통계량(예의 경우에는 모집단 평균 키와 100명의 평균 키)과의 차이(추정량의 치우침)도 확률변수이지만, 이것은 관측할 수 있는 것이 아니므로, 통계량이 아니다.
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com