통계적 추론
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
통계적 추론은 표본 데이터를 사용하여 모집단에 대한 결론을 도출하는 방법론으로, 추정과 가설 검정을 포함한다. 이는 통계적 모형을 선택하고, 모형을 통해 명제를 도출하는 과정으로 이루어진다. 통계적 추론은 빈도주의, 베이즈주의, 가능도주의, AIC 기반 등 다양한 접근 방식을 가지며, 통계 모델, 모델 선택, 일반화 오차 등의 개념을 기반으로 한다. 또한, 통계 분석은 기술 통계 분석과 추측 통계 분석으로 나뉘며, 상관 분석과 회귀 분석 등의 방법을 활용한다. 통계적 추론은 여론 조사, 사회 현상 분석, 경제 예측, 의학 연구 등 다양한 분야에서 활용되며, 빅데이터, 인공지능, 기계 학습, 비모수 통계, 구조적 추론 등과 연계되어 발전하고 있다.
더 읽어볼만한 페이지
- 연역 - 마음
마음은 의식, 사고, 지각, 감정, 동기, 행동, 기억, 학습 등을 포괄하는 심리적 현상과 능력의 총체이며, 다양한 분야에서 연구되고 인간 삶의 중추적인 역할을 한다. - 연역 - 타당성
타당성은 논리학에서 전제가 참일 경우 결론이 거짓이 되는 것이 모순되지 않는 논증을 의미하며, 논리적 형식의 정확성을 위반하지 않고 전제에서 결론이 도출되는 필연성을 부여한다. - 통계적 추론 - 과적합
과적합은 통계 모델이나 기계 학습 알고리즘이 훈련 데이터에 과도하게 적합되어 새로운 데이터에 대한 예측 성능이 저하되는 현상이다. - 통계적 추론 - 비모수 통계
비모수 통계는 자료의 분포에 대한 가정을 최소화하며, 명목척도나 서열척도 자료, 또는 표본 수가 적은 경우에 사용되는 통계 방법이다. - 통계학 - 확률
확률은 사건의 가능성을 수치화한 개념으로, 도박에서 시작되어 수학적으로 발전했으며, 다양한 해석과 요소, 응용 분야를 가지며 양자역학, 사회 현상 등에도 적용된다. - 통계학 - 사분위수
사분위수는 정렬된 데이터를 4등분하는 세 개의 값으로 데이터 분포 요약 및 이상치 탐지에 활용되며, 제1사분위수(Q₁)는 하위 25%, 제2사분위수(Q₂ 또는 중앙값)는 하위 50%, 제3사분위수(Q₃)는 하위 75%를 나타낸다.
통계적 추론 | |
---|---|
통계적 추론 | |
하위 분야 | 가설 검정 추정 |
유형 | 빈도주의적 추론 베이즈 추론 |
관련 주제 | 기술통계학 결정 이론 확률 귀납추론 통계 모델 지도 학습 예측적 추론 |
2. 통계적 추론의 개념 및 방법
통계적 추론은 크게 추정(estimation영어)과 가설검정(testing hypothesis영어)으로 나눌 수 있다.[68]
추정은 표본을 통해 모집단의 특성을 추측하는 과정이다. 예를 들어 표본평균을 계산하여 모집단 평균을 추측하거나, 모집단 평균에 대한 95% 신뢰 구간을 계산하는 것이 추정에 해당한다.[68]
가설검정은 모집단의 실제 값에 대한 주장과 관련하여, 표본 정보를 이용해 가설의 타당성을 판정하는 과정이다.[68]
통계분석은 통계 관찰 결과를 조사 목적에 따라 정리, 가공하고 분석하는 것이다. 통계분석 방법은 문제의 성질에 따라 적절한 방법을 선택해야 한다. 일반적으로 통계분석의 첫 단계는 집단의 양적 구조를 기술하고 분석하기 위한 기술적 분석 방법을 사용한다. 기술적 분석에서는 통계 데이터를 도수분포표나 도수분포도로 구성하여 집단의 특징을 파악하고, 평균, 산포도, 왜도 등의 집단 특성치를 산출하여 집단의 특성을 수치적으로 요약한다.
통계 집단 간의 관계를 기술하는 방법으로는 두 가지 통계 숫자의 논리적 관계를 나타내는 통계 비율이나, 같은 종류의 통계 숫자를 장소적 또는 시간적으로 배열한 통계 계열의 분석 방법이 사용된다. 또한, 통계 집단의 표지를 두 개 이상 고려할 때, 그 관계를 상호 의존적, 동시적으로 파악하여 분석하는 상관 분석과, 한쪽이 다른 쪽 표지의 변화에 의해 어느 정도 영향을 받는지 분석하는 회귀 분석이 널리 사용된다.
기술 통계적 분석 단계에서는 직접 관측된 결과를 분류, 요약, 제시, 분석하는 것을 주된 목적으로 한다. 그러나 추측적 통계 분석에서는 직접 관측된 관측치의 집단, 즉 표본 자체가 최종 목표가 아니라, 표본과 그것이 속한다고 가정되는 더 큰 관측치의 집단, 즉 모집단을 구별하고, 표본을 통해 모집단에 관한 정보를 도출하는 데에 주목표를 둔다.
표본은 모집단의 일부이므로, 표본에서 도출된 결과가 모집단의 특성치와 완전히 일치할 수도 있지만, 일반적으로 모집단의 참값과 표본 추정치 사이에는 오차(표본 오차)가 존재한다. 표본 추출이 무작위로 이루어지는 한, 확률 개념을 이용하여 표본 오차 및 표본 추정치의 분포 상태를 측정할 수 있다. 이러한 지식을 바탕으로 표본의 결과에서 모집단의 상태를 추정(통계적 추정)하거나, 모집단에 관한 가설의 타당성을 검정(통계적 가설 검정)한다.
통계적 추론은 표본 추출을 통해 모집단에서 추출한 데이터를 사용하여 모집단에 대한 명제를 만든다. 추론하려는 모집단에 대한 가설이 주어지면, 통계적 추론은 데이터를 생성하는 프로세스의 통계적 모형을 통계 모형으로 선택하고, 모형에서 명제를 도출하는 것으로 구성된다.[3]
통계적 추론의 논리적 결과는 통계적 명제이다.[6] 일반적인 형태의 통계적 명제는 다음과 같다.
- 점 추정: 관심 있는 매개변수를 가장 잘 근사하는 특정 값
- 구간 추정: 신뢰 구간 (또는 집합 추정)
- 신뢰할 수 있는 구간: 사후 신념의 일정 부분을 포함하는 값의 집합
- 가설의 기각
- 데이터 포인트를 그룹으로 군집화하거나 분류
어떤 통계적 추론이든 몇 가지 가정이 필요하다. '''통계적 모형'''은 관찰된 데이터 및 유사한 데이터의 생성에 관한 일련의 가정이다. 통계적 모형에 대한 설명은 일반적으로 우리가 추론하고자 하는 관심의 대상인 모집단 양의 역할을 강조한다.[7] 기술 통계는 일반적으로 보다 공식적인 추론을 하기 전에 예비 단계로 사용된다.[8]
19세기 후반부터 20세기 초에 걸쳐 발달한 통계학은 현재는 추계 통계학과 구별하여 "기술 통계학(descriptive statistics)"이라고 불린다.
추계 통계학은 현실 세계의 다양한 분야에서 사용되고 있는데, 알기 쉬운 예로 표본 추출 조사를 통한 품질 관리나 역학 조사가 있다. 추계 통계학은 빈도주의에 기초한 것과 베이즈주의에 기초한 것으로 나뉜다.
최근에는 불확실성을 확률 분포로 표현하는 베이즈 통계학이 주목받고 있다.
통계적 추론이란, "데이터가 주어졌을 때, 그 데이터를 발생시키고 있는 확률 분포를 추론하는 것"이다.[63] 즉, 참인 모집단에서 표본(데이터)을 얻었을 때, 그 (일반적으로 관측할 수 없는) 참인 모집단 확률 분포를 추론하는 과정이 통계적 추론이다.
2. 1. 추정
표본을 통해 모집단의 특성이 어떠한지에 대해 추측하는 과정을 '''추정'''(estimation영어)이라고 한다.[68] 예를 들어 표본평균 계산을 통해 모집단평균을 추측하거나, 모집단 평균에 대한 95% 신뢰 구간을 계산할 수 있다.[68] 추정은 크게 점 추정과 구간 추정으로 나뉜다.2. 1. 1. 점 추정
표본 추출을 통해 얻은 데이터를 활용하여 모집단에 대한 명제를 만드는 통계적 추론에서, 점 추정은 관심 있는 매개변수를 가장 잘 근사하는 특정 값을 의미한다.[6]2. 1. 2. 구간 추정
점 추정으로 추정한 파라미터의 변동이나 신뢰 구간을 나타내는 것을 구간 추정이라고 한다.정규 분포의 경우에는 표준 오차(Standard Error, SE)를 사용하는 경우가 많다. 평균값의 표준 오차를 특히 SEM(standard error of the mean)이라고 부른다. SEM은 다음 식으로 산출된다.
:
보다 구체적으로 신뢰 구간 (95% 신뢰 구간, 99% 신뢰 구간 등이 사용됨)을 표시하는 경우도 있다.[3]
신뢰 구간은 모집단에서 추출된 데이터 집합을 사용하여 구성된 구간으로, 이러한 데이터 집합을 반복적으로 표본 추출하면 이러한 구간이 지정된 신뢰 수준에서 참된 매개변수 값을 빈도 확률로 포함한다.[6]
2. 2. 가설 검정
가설검정(testing hypothesis영어)은 모집단의 실제 값이 얼마인지에 대한 주장과 관련하여, 표본의 정보를 이용해 가설의 타당성을 판정하는 과정이다.[68]구간 추정값으로 모집단이 특정 분포를 따르는지 검증한다. 즉, 데이터가 특정 분포를 따르는 모집단에서 추출되었다는 가설을 세우고 검정을 수행한다.
2. 2. 1. 귀무 가설
모집단이 특정 분포를 따르는지 여부를 구간 추정값으로부터 검증하는 것이다.구체적으로는, 데이터가 특정 분포를 따르는 모집단에서 추출되었다는 가설을 세우고, 이 가설에 대한 검정을 수행한다. 이 가설을 귀무 가설이라고 한다. 예를 들어, "추출 집단은 평균 50, 표준 편차 ○인 모집단에서 추출된 것이다.", "추출 집단 A와 추출 집단 B는 모두 평균, 표준 편차가 99% 같은 모집단에서 추출된 것이다."와 같은 가설이 귀무 가설이 된다. 이러한 귀무 가설에서 예상되는 통계량과 실제로 추출 집단의 데이터로부터 계산된 통계량이 일치할 확률 (p값이라고 함)을 구하고, 그 확률이 미리 정해진 기준 (유의 수준, 5% 또는 1%가 많이 사용됨)보다 작을 경우 (즉, "일어날 것 같지 않다") "유의차가 있다"고 판단하여, 위의 가설은 기각된다.[63]
가설 검정에는 다양한 기법이 있으며, 귀무 가설에 따라 적절하게 사용해야 한다. 통계학적 검정 기법은 데이터가 특정 확률 분포를 따른다고 가정하는 "모수적인 기법"과, 이를 가정하지 않는 "비모수 통계 기법"으로 나뉜다.
2. 2. 2. 대립 가설
통계적 가설 검정에서 귀무 가설에 대립되는 가설을 대립 가설이라고 한다. 데이터가 특정 분포를 따르는 모집단에서 추출되었다는 가설을 세우고, 이 가설에 대한 검정을 수행할 때 이 가설을 귀무 가설이라고 하며, 귀무 가설이 기각될 때 채택되는 가설이 대립 가설이다. 예를 들어, "추출 집단은 평균 50, 표준 편차 ○인 모집단에서 추출된 것이다.", "추출 집단 A와 추출 집단 B는 모두 평균, 표준 편차가 99% 같은 모집단에서 추출된 것이다."와 같은 가설이 귀무 가설이 된다. 이러한 귀무 가설에서 예상되는 통계량과 실제로 추출 집단의 데이터로부터 계산된 통계량이 일치할 확률 (p값이라고 함)을 구하고, 그 확률이 미리 정해진 기준 (유의 수준, 5% 또는 1%가 많이 사용됨)보다 작을 경우 (즉, "일어날 것 같지 않다") "유의차가 있다"고 판단하여, 귀무 가설은 기각된다.2. 2. 3. 유의 수준
모집단이 특정 분포를 따르는지 여부를 검증하기 위해, 데이터가 특정 분포를 따르는 모집단에서 추출되었다는 가설을 세우고 검정을 수행한다. 이 가설을 귀무 가설이라고 한다. 예를 들어, "추출 집단은 평균 50, 표준 편차 ○인 모집단에서 추출된 것이다.", "추출 집단 A와 추출 집단 B는 모두 평균, 표준 편차가 99% 같은 모집단에서 추출된 것이다."와 같은 가설이 귀무 가설이 된다. 이러한 귀무 가설에서 예상되는 통계량과 실제로 추출 집단의 데이터로부터 계산된 통계량이 일치할 확률(p값)을 구하고, 그 확률이 미리 정해진 기준(유의 수준, 5% 또는 1%가 많이 사용됨)보다 작을 경우(즉, "일어날 것 같지 않다") "유의차가 있다"고 판단하여, 위의 가설은 기각된다.[63]2. 2. 4. p-값
통계적 가설 검정에서 귀무 가설이 실제로 참일 때, 귀무 가설을 기각할 확률을 p값이라고 한다. p값은 표본 추출을 통해 얻은 데이터가 특정 분포를 따르는 모집단에서 추출되었다는 귀무 가설 하에서, 실제로 추출된 표본의 통계량이 귀무 가설에서 예상되는 통계량과 일치할 확률을 의미한다.p값이 미리 정해진 기준인 유의 수준(주로 5% 또는 1% 사용)보다 작으면, "유의차가 있다"고 판단하여 귀무 가설을 기각한다. 즉, p값이 작다는 것은 귀무 가설 하에서 관측된 결과가 나타날 가능성이 매우 낮다는 것을 의미하므로, 귀무 가설이 참이 아닐 가능성이 높다고 판단하는 것이다.
3. 통계적 추론의 접근 방식
통계적 추론은 표본 추출을 통해 얻은 데이터를 사용하여 모집단에 대한 명제를 만드는 과정이다.[3] 모집단에 대한 가설이 주어지면, 통계적 추론은 데이터를 생성하는 프로세스의 통계 모형을 선택하고, 그 모형에서 명제를 도출한다.[3]
코니시와 키타가와는 "통계적 추론의 대부분의 문제는 통계적 모델링과 관련된 문제로 간주될 수 있다"고 언급했다.[4] 데이비드 콕스 경은 "주어진 문제에서 통계적 모형으로의 변환이 어떻게 이루어지는가가 분석의 가장 중요한 부분인 경우가 많다"고 말했다.[5]
통계적 추론의 결과는 통계적 명제이다.[6] 일반적인 통계적 명제의 형태는 다음과 같다.
- 점 추정: 관심 있는 매개변수를 가장 잘 근사하는 특정 값
- 구간 추정: 신뢰 구간 등 모집단에서 추출된 데이터 집합을 사용하여 구성된 구간
- 신뢰할 수 있는 구간: 사후 신념의 95%를 포함하는 값의 집합
- 가설의 기각
- 데이터 포인트를 그룹으로 군집화하거나 분류
통계적 추론에는 여러 학파가 있으며, 이들은 상호 배타적이지 않다. 한 학파에서 잘 작동하는 방법이 다른 학파에서도 매력적인 해석을 갖는 경우가 많다. 반도파디야이와 포스터는 빈도주의, 베이즈주의, 가능도주의, 아카이케 정보 기준 기반의 네 가지 패러다임을 설명한다.[43]
19세기 후반~20세기 초 발달한 통계학은 현재 추계 통계학과 구별하여 "기술 통계학"이라고 불린다. 추계 통계학은 빈도주의와 베이즈주의에 기초한 것으로 나뉜다. 최근에는 불확실성을 확률 분포로 표현하는 베이즈 통계학이 주목받고 있다.
통계적 모델 선택에는 아카이케 정보 기준(AIC)과 같은 수학적 도구가 사용된다.[65]
3. 1. 빈도주의 추론
빈도주의 추론은 현재 데이터 세트와 유사한 데이터 세트를 생성하기 위해 모집단 분포의 반복적인 표본 추출을 고려하여 명제의 타당성을 측정한다. 반복적인 표본 추출 하에서 데이터 세트의 특성을 고려함으로써, 통계적 명제의 빈도주의적 속성을 정량화할 수 있다. 비록 실제에서는 이러한 정량화가 어려울 수 있지만 말이다.[43]빈도주의 추론의 예시는 다음과 같다.
- p값
- 신뢰 구간
- 귀무 가설 유의성 검정
빈도론적 추론에 대한 한 가지 해석은 빈도 확률의 관점에서만 적용 가능하다는 것이다. 즉, 모집단에서 반복적인 표집의 관점에서 그렇다. 그러나 네이만(Neyman)[44]의 접근 방식은 실험 전 확률의 관점에서 이러한 절차를 개발한다. 즉, 실험을 수행하기 전에 올바를 확률이 적절한 방식으로 제어되도록 결론에 도달하는 규칙을 결정한다. 이러한 확률은 빈도론적 또는 반복적 표집 해석을 가질 필요가 없다. 반대로, 베이즈 추론은 빈도론적 접근 방식에서 사용되는 주변 확률(알려지지 않은 매개변수에 따라 조건이 지정됨)에 비해 조건부 확률(즉, 관찰된 데이터에 대한 조건부 확률)의 관점에서 작동한다.
유의성 검정과 신뢰 구간의 빈도론적 절차는 효용 함수에 관계없이 구성될 수 있다. 그러나 통계적 결정 이론과 같은 빈도론적 통계의 일부 요소는 효용 함수를 통합한다. 특히, 최적 추론에 대한 빈도론적 개발(예: 최소 분산 불편 추정량 또는 균일하게 가장 강력한 검정)은 (음수) 효용 함수의 역할을 하는 손실 함수를 사용한다. 통계적 절차가 최적성 속성을 갖는다는 것을 증명하기 위해 통계 이론가에게 손실 함수를 명시적으로 명시할 필요는 없다.[45] 그러나 손실 함수는 최적성 속성을 설명하는 데 종종 유용하다. 예를 들어, 중앙값-불편 추정량은 기대 손실을 최소화한다는 점에서 절댓값 손실 함수에서 최적이며, 최소 제곱 추정량은 기대 손실을 최소화한다는 점에서 제곱 오차 손실 함수에서 최적이다.
빈도론적 추론을 사용하는 통계학자들은 관심 매개변수와 사용할 추정량 / 검정 통계량을 스스로 선택해야 하지만, 명백하게 명시적인 효용과 사전 분포가 없다는 점 때문에 빈도론적 절차가 '객관적'으로 널리 인식되도록 하는 데 기여했다.[46]
통계적 추론은 "데이터가 주어졌을 때, 그 데이터를 발생시키고 있는 확률 분포를 추론하는 것"이다.[63] 즉, 참인 모집단에서 표본(데이터)을 얻었을 때, 그 (일반적으로 관측할 수 없는) 참인 모집단 확률 분포를 추론하는 과정이 통계적 추론이다.
일반적인 참된 추론의 흐름은 다음과 같다.
1. 표본(데이터) 획득
2. 참인 모집단을 본뜬 통계 모델 모델링
3. 표본에 기초한 파라미터 추론 → 추정값
4. 참인 모집단의 통계적 추론 결과 제시
통계적 추론은 개별 · 구체적 사상(표본)에서 일반 · 보편적인 규칙이나 원리(모집단 모델)를 구하는 방법론이며, 귀납적 추론의 일종이다. 획득된 데이터(표본)을 기반으로 모집단 분포를 추정하는 다양한 방법론이 있으며, 각기 고유한 특징을 지닌다.
기법명 | 모수 θ | 예측 분포[66] | 개요 |
---|---|---|---|
최대 우도 추정 | 최대 우도에 의한 모수 점 추정 + 조건부 예측 분포 | ||
MAP 추정 | MAP에 의한 모수 점 추정 + 조건부 예측 분포 | ||
베이즈 추정 | 모수 사후 분포 + 사후 예측 분포 (모수에 따른 모델 생성 분포의 평균[67]) |
3. 2. 베이즈주의 추론
베이즈 추론은 확률을 사용하여 믿음의 정도를 나타낸다. 믿음은 양수이고, 하나로 통합되며, 확률 공리를 따른다. 베이즈 추론은 통계적 명제를 만드는 데 사용 가능한 사후 믿음을 사용한다.[47] 베이즈 접근 방식을 사용하는 데에는 여러 가지 정당성이 있다.- 신뢰할 수 있는 구간 (구간 추정)
- 베이즈 인자를 사용한 모델 비교
많은 비형식적 베이즈 추론은 사후 분포에 대한 "직관적으로 합리적인" 요약에 기반한다. 예를 들어, 사후 평균, 중앙값 및 최빈값, 최고 사후 밀도 구간 및 베이즈 인자는 모두 이러한 방식으로 동기를 부여받을 수 있다. 이러한 종류의 추론에서는 사용자의 효용 함수를 명시할 필요는 없지만, 이러한 요약은 모두 (어느 정도까지) 명시된 사전 신념에 의존하며 일반적으로 주관적인 결론으로 간주된다. (외부 입력을 필요로 하지 않는 사전 구성 방법이 제안되었지만 아직 완전히 개발되지 않았다.)
공식적으로 베이즈 추론은 명시적으로 언급된 효용 또는 손실 함수를 기준으로 조정된다. '베이즈 규칙'은 사후 불확실성에 대해 평균화된 기대 효용을 최대화하는 규칙이다. 따라서 공식적인 베이즈 추론은 결정 이론적 의미에서 자동으로 최적 결정을 제공한다. 가정, 데이터 및 효용이 주어지면 베이즈 추론은 본질적으로 모든 문제에 대해 수행될 수 있지만, 모든 통계적 추론이 베이즈적 해석을 가질 필요는 없다. 공식적으로 베이즈적이지 않은 분석은 (논리적으로) 비일관적일 수 있다. 적절한 사전 분포(즉, 1로 적분 가능한)를 사용하는 베이즈 절차의 특징은 일관성이 보장된다는 것이다. 베이즈 추론의 일부 옹호자들은 추론이 이러한 결정 이론적 프레임워크 내에서 ''반드시'' 이루어져야 하며, 베이즈 추론은 사후 신념의 평가 및 요약으로 결론을 내려서는 안 된다고 주장한다.
기법명 | 모수 θ | 예측 분포[66] | 개요 |
---|---|---|---|
최대 우도 추정 | 최대 우도에 의한 모수 점 추정 + 조건부 예측 분포 | ||
MAP 추정 | MAP에 의한 모수 점 추정 + 조건부 예측 분포 | ||
베이즈 추정 | 모수 사후 분포 + 사후 예측 분포 (모수에 따른 모델 생성 분포의 평균[67]) |
3. 3. 가능도주의 추론
가능도주의는 로 표시되는 가능도 함수를 사용하여 통계를 접근하는 방식이다. 가능도 함수는 특정 매개변수 값 를 가정할 때 주어진 데이터 를 관찰할 확률을 정량화한다. 가능도 기반 추론의 목표는 가능도 함수를 최대화하거나, 동등하게 주어진 데이터를 관찰할 확률을 최대화하는 매개변수 값 집합을 찾는 것이다.[43]가능도 기반 추론 과정은 일반적으로 다음 단계를 포함한다.
# 통계 모델 공식화: 문제에 따라 분포 가설과 관찰된 데이터와 알려지지 않은 매개변수 간의 관계를 지정하여 통계 모델을 정의한다.
# 가능도 함수 구성: 통계 모델이 주어지면, 알려지지 않은 매개변수의 함수로 관찰된 데이터의 결합 확률 밀도 또는 질량 함수를 평가하여 가능도 함수를 구성한다.
# 가능도 함수 최대화: 가능도 함수를 최대화하는 매개변수 값 집합을 찾는다. 이는 수치적 최적화 알고리즘과 같은 최적화 기술을 사용하여 달성할 수 있다. 추정된 매개변수 값은 일반적으로 로 표시되며, 이는 최대 가능도 추정 (MLE)이다.
# 불확실성 평가: MLE를 얻은 후, 표준 오차, 신뢰 구간을 계산하거나, 가설 검정을 수행하여 매개변수 추정과 관련된 불확실성을 정량화한다.
# 모델 검사: 통계 모델의 적절성을 평가한다. 여기에는 모델에서 가정한 가정을 확인하고 적합도 검정, 잔차 분석 또는 그래프 진단을 사용하여 데이터에 대한 모델의 적합성을 평가하는 것이 포함된다.
# 추론 및 해석: 마지막으로, 추정된 매개변수와 모델 평가를 기반으로 통계적 추론을 수행할 수 있다. 여기에는 모집단 매개변수에 대한 결론을 도출하고, 예측을 수행하거나, 추정된 모델을 기반으로 가설을 검정하는 것이 포함된다.[43]
통계적 추론은 "데이터가 주어졌을 때, 그 데이터를 발생시키고 있는 확률 분포를 추론하는 것"이다[63]。
기법명 | 모수 θ | 예측 분포 | 개요 |
---|---|---|---|
최대 우도 추정 | 최대 우도에 의한 모수 점 추정 + 조건부 예측 분포 | ||
MAP 추정 | MAP에 의한 모수 점 추정 + 조건부 예측 분포 | ||
베이즈 추정 | 모수 사후 분포 + 사후 예측 분포 (모수에 따른 모델 생성 분포의 평균) |
3. 4. AIC 기반 추론
아카이케 정보 기준(AIC)은 주어진 데이터 집합에 대한 통계적 모형의 상대적 품질을 평가하는 추정량이다. 데이터에 대한 모형 집합이 주어지면, AIC는 각 모형의 품질을 상대적으로 추정한다. 따라서 AIC는 모형 선택 수단을 제공한다.AIC는 정보 이론에 기반한다. AIC는 주어진 모형이 데이터를 생성한 과정을 나타낼 때 손실되는 상대적인 정보량을 추정한다. 이 과정에서 AIC는 모형의 적합도와 단순성 사이의 균형을 다룬다.
통계적 추론은 "데이터가 주어졌을 때, 그 데이터를 발생시킨 확률 분포를 추론하는 것"이다.[63] 즉, 참인 모집단에서 표본(데이터)을 얻었을 때, (일반적으로 관측할 수 없는) 참인 모집단 확률 분포를 추론하는 과정이다.
통계적 추론에서 어떤 통계 모델(확률 분포와 그 매개변수)을 선택해야 하는가(통계적 모델 선택)에 대한 기준으로는 아카이케 정보 기준(AIC)과 같은 수학적 도구가 사용된다.[65]
4. 통계 모델
통계적 추론은 표본 추출을 통해 모집단에서 추출한 데이터를 사용하여 모집단에 대한 명제를 만든다. 추론하려는 모집단에 대한 가설이 주어지면, 데이터를 생성하는 프로세스의 통계적 모형을 통계 모형으로 선택하고, 그 모형에서 명제를 도출한다.[3]
코니시와 키타가와는 "통계적 추론의 대부분의 문제는 통계적 모델링과 관련된 문제로 간주될 수 있다"고 말하며,[4] 데이비드 콕스 경은 "주어진 문제에서 통계적 모형으로의 변환이 어떻게 이루어지는가가 분석의 가장 중요한 부분인 경우가 많다"고 말했다.[5]
통계적 추론의 결과는 통계적 명제이다.[6] 일반적인 형태의 통계적 명제는 다음과 같다.
어떤 통계적 추론이든 몇 가지 가정이 필요하다. '''통계적 모형'''은 관찰된 데이터 및 유사한 데이터의 생성에 관한 일련의 가정이다.[7] 기술 통계는 일반적으로 보다 공식적인 추론을 하기 전에 예비 단계로 사용된다.[8]
4. 1. 통계 모델링
표본 추출을 통해 모집단에서 추출한 데이터를 사용하여 모집단에 대한 명제를 만드는 통계적 추론에서, 통계적 모델링은 중요한 과정이다. 코니시와 키타가와는 "통계적 추론의 대부분의 문제는 통계적 모델링과 관련된 문제로 간주될 수 있다"고 언급했다.[4] 또한, 데이비드 콕스 경은 "주어진 문제에서 통계적 모형으로의 변환이 어떻게 이루어지는가가 분석의 가장 중요한 부분인 경우가 많다"고 말했다.[5]통계적 모델은 관찰된 데이터 및 유사한 데이터의 생성에 관한 일련의 가정이다.[7] 통계적 모델에 대한 설명은 일반적으로 추론하고자 하는 관심 대상인 모집단 양의 역할을 강조한다.
통계학자들은 세 가지 수준의 모델링 가정을 구분한다.
- '''완전 모수적''': 데이터 생성 과정을 설명하는 확률 분포는 유한한 수의 알려지지 않은 매개변수만 포함하는 확률 분포의 집합에 의해 완전히 설명된다고 가정한다.[7]
- '''비모수적''': 데이터를 생성하는 프로세스에 대해 이루어지는 가정은 모수 통계학에서보다 훨씬 적으며 최소화될 수 있다.[9]
- '''준모수적''': 이 용어는 일반적으로 완전 모수적 접근 방식과 비모수적 접근 방식 '사이'의 가정을 의미한다.
어떤 수준의 가정을 하든, 일반적으로 올바르게 보정된 추론은 이러한 가정이 정확해야 한다. 즉, 데이터를 생성하는 메커니즘이 실제로 올바르게 지정되었어야 한다.
'단순' 무작위 추출에 대한 잘못된 가정은 통계적 추론을 무효화할 수 있다.[10]

랜덤화 실험의 데이터를 분석할 때는 선형 모델이나 로지스틱 모델과 같은 통계 모델을 참조하는 것이 일반적이다.[38] 그러나, 랜덤화 계획은 통계 모델의 선택을 안내한다. 랜덤화 계획을 알지 못하고 적절한 모델을 선택하는 것은 불가능하다.[23]
가능도 기반 추론은 관찰된 데이터를 기반으로 통계 모델의 매개변수를 추정하는 데 사용되는 패러다임이다.
가능도 기반 추론 과정은 일반적으로 다음 단계를 포함한다.
# 통계 모델 공식화
# 가능도 함수 구성
# 가능도 함수 최대화
# 불확실성 평가
# 모델 검사
# 추론 및 해석
:
통계 모델이란, 대상을 통계(모집단과 표본)의 측면에서 추상화한 것이다. 좋은 통계 모델을 설정하려는 과정 전체를 통계 모델링이라고 한다. 모델 선택은 통계 모델링의 중요한 사항 중 하나이다.
4. 2. 모델 선택
표본 추출을 통해 모집단에서 추출한 데이터를 사용하여 모집단에 대한 추론을 할 때, 데이터를 생성하는 프로세스의 통계적 모형을 선택하고 모형에서 명제를 도출한다.[3] 통계적 추론 문제의 대부분은 통계적 모델링과 관련된 문제로 간주될 수 있다.[4] 데이비드 콕스 경은 "주어진 문제에서 통계적 모형으로의 변환이 어떻게 이루어지는가가 분석의 가장 중요한 부분인 경우가 많다"고 말했다.[5]통계학자들은 모델링 가정을 세 가지 수준으로 구분한다.
- '''완전 모수적''': 데이터 생성 과정을 설명하는 확률 분포는 유한한 수의 알려지지 않은 매개변수만 포함하는 확률 분포의 집합에 의해 완전히 설명된다고 가정한다.[7] 예를 들어, 모집단 값의 분포가 알 수 없는 평균과 분산을 가진 정규 분포를 따른다고 가정할 수 있다. 일반화 선형 모형군은 널리 사용되는 유연한 범주의 모수적 모형이다.
- '''비모수적''': 데이터를 생성하는 프로세스에 대해 이루어지는 가정은 모수 통계학에서보다 훨씬 적으며 최소화될 수 있다.[9] 예를 들어, 모든 연속 확률 분포는 중앙값을 가지며, 이는 표본 중앙값 또는 호지스-레만-센 추정량을 사용하여 추정할 수 있다.
- '''준모수적''': 완전 모수적 접근 방식과 비모수적 접근 방식 '사이'의 가정을 의미한다. 예를 들어, 모집단 분포가 유한한 평균을 갖는다고 가정할 수 있다. 또한 모집단에서 평균 반응 수준이 일부 공변량에 진정으로 선형적으로 의존한다고 가정할 수 있지만(모수적 가정), 해당 평균 주변의 분산에 대해 어떠한 모수적 가정도 하지 않을 수 있다(즉, 이분산성의 존재 또는 가능한 형태에 대해). 더 일반적으로, 준모수적 모형은 종종 '구조적' 구성 요소와 '무작위 변동' 구성 요소로 분리될 수 있다. 잘 알려진 콕스 모형은 준모수적 가정의 집합이다.
어떤 수준의 가정을 하든, 올바르게 보정된 추론은 이러한 가정이 정확해야 한다. 즉, 데이터를 생성하는 메커니즘이 실제로 올바르게 지정되었어야 한다.
'단순' 무작위 추출에 대한 잘못된 가정은 통계적 추론을 무효화할 수 있다.[10] 더 복잡한 준모수 및 완전 매개변수적 가정 역시 우려의 원인이 된다. 예를 들어, 콕스 모델을 잘못 가정하면 어떤 경우에는 잘못된 결론으로 이어질 수 있다.[11] 모집단의 정규성에 대한 잘못된 가정 또한 회귀 기반 추론의 일부 형태를 무효화한다.[12]
''아카이케 정보 기준''(AIC)은 주어진 데이터 집합에 대한 통계적 모형의 상대적 품질을 추정량이다. 데이터에 대한 모형의 집합이 주어지면, AIC는 다른 각 모형에 상대적인 각 모형의 품질을 추정한다. 따라서, AIC는 모형 선택의 수단을 제공한다.
AIC는 정보 이론에 기반한다. AIC는 주어진 모형이 데이터를 생성한 과정을 나타내는 데 사용될 때 손실되는 상대적인 정보의 추정치를 제공한다.
:
통계 모델은 대상을 통계(모집단과 표본)의 측면에서 추상화한 것이다. 통계학에서는 모집단이 확률적으로 표본을 생성한다고 생각하기 때문에, 통계 모델은 확률 분포를 내포한 모델이 된다. 좋은 통계 모델을 설정하려는 과정 전체를 통계 모델링이라고 한다. 모델 선택은 통계 모델링의 중요한 사항 중 하나이다. 선택된 통계 모델은 모집단과 일치하도록, 데이터(표본)에 기초하여 그 매개변수가 추정된다(통계적 추론). 모집단과 모델의 차이는 일반화 오차로 평가되기도 한다.
4. 3. 일반화 오차
통계 모델은 모집단이 확률적으로 표본을 생성한다는 가정 하에 확률 분포를 포함한다. 좋은 통계 모델을 설정하는 과정을 통계 모델링이라고 하며, 모델 선택은 통계 모델링의 중요한 부분이다. 선택된 통계 모델은 모집단과 일치하도록 데이터(표본)에 기초하여 매개변수가 추정된다. 모집단과 모델의 차이는 일반화 오차로 평가되기도 한다.[64]통계적 기계 학습에서는 모집단이 표본을 생성하는 모델이라는 점에 주목하여 생성 모델이라고도 한다(자세한 내용은 통계적 기계 학습 참고). 통계적 추론에서는 관측된 데이터를 기반으로 '''진실 분포'''를 '''통계 모델'''로 근사하여 두 분포의 오차를 최소화한다. 관측된 데이터에서 진실 분포 전체를 추론했을 때 발생하는 오차를 일반화 오차라고 하며, 통계적 추론의 목적은 일반화 오차를 최소화하는 통계 모델을 구축하는 것이다.
하지만 실제 통계적 추론에서는 진실 분포가 불명확한 경우가 많아 일반화 오차를 직접 계산할 수 없다.[64] 이는 '''통계 모델이 올바른지 여부에 답할 수 없다'''는 것을 의미한다.
그렇지만 일반화 오차는 무의미하지 않다. 데이터(표본)는 진실 분포에서 무작위로 추출된 확률 변수이고, 통계 모델은 확률 변수인 데이터에 의해 학습되므로 일반화 오차 또한 확률 변수이다. 즉, 일반화 오차의 분포 등 통계적 성질을 파악할 수 있다.
일반화 오차의 거동을 연구하면, 어떤 분포, 어떤 데이터, 어떤 추정 방법으로 모수를 얻는지에 따라 일반화 오차가 어떻게 달라지는지 알 수 있다. 이를 통해 현재 데이터를 기반으로 학습된 모델의 올바름은 알 수 없어도 통계적 거동은 파악할 수 있다.
예를 들어 최대 우도 추정이 일반화 오차의 기댓값을 최소화하는지는 명확하지 않지만, 일반화 오차의 거동을 분석하여 이 질문에 답할 수 있다. 일반화 오차를 논의하기 위한 기초는 분포 간의 거리이며, 쿨백-라이블러 발산(KL 발산)이나 바서슈타인 거리가 그 예시이다. KL 발산을 사용하면 최대 우도 추정은 KL 발산 최소화 기법으로 볼 수 있다.
통계적 추론에서 어떤 통계 모델(확률 분포와 그 매개변수)을 선택해야 하는지에 대한 기준(통계적 모델 선택)으로는 피셔 정보량, 아카이케 정보 기준(AIC), 널리 사용 가능한 정보 기준(WAIC) 등의 수학적 도구가 사용된다.[65]
5. 통계 분석
통계 분석은 통계 관찰 결과로 얻어지는 통계 데이터를 조사 목적에 따라 정리, 가공하고 분석하는 것이다. 문제의 성질에 따라 적절한 분석 방법을 선택해야 한다. 통계 분석 방법으로는 기술 통계 분석, 추측 통계 분석, 상관 분석, 회귀 분석 등이 있다.[69]
19세기 후반부터 20세기 초에 걸쳐 발달한 통계학은 현재 추계 통계학(推計統計学)과 구별하여 "기술 통계학(descriptive statistics)"이라고 불린다. 기술 통계학에서는 대량의 표본 관찰을 통해서만 집단의 규칙성을 발견할 수 있다고 보았고, 현실적인 제약으로 소수의 표본밖에 얻을 수 없는 경우에는 모집단의 규칙성을 구하기 어려웠다. 이러한 사례에 대응하기 위해 발달한 것이 추계 통계학이다.
추계 통계학은 품질 관리나 역학 조사와 같이 현실 세계의 다양한 분야에서 사용되고 있다. 추계 통계학은 빈도주의에 기초한 것과 베이즈주의에 기초한 것으로 나뉜다.
빈도주의에서의 통계적 추론은 모집단을 규정하는 양, 즉 파라미터(모수)를 고정값으로 하여 그것을 추정하는 방법(파라메트릭 추정)에 기초하여 발전해 왔다. 기초적인 파라메트릭 추론에서의 통계적 추측은 점 추정, 구간 추정, 가설 검정으로 세분된다.
최근에는 불확실성을 확률 분포로 표현하는 베이즈 통계학이 주목받고 있다.
5. 1. 기술 통계 분석
통계 분석의 첫 단계는 집단의 양적 구조를 기술하고 분석하는 기술적 분석 방법이다. 기술적 분석에서는 우선 얻어진 통계 데이터를 도수분포표나 도수분포도로 만들어 집단의 특징을 파악한다. 동시에 평균, 산포도, 왜도 등의 집단 특성치를 계산하여 집단의 특성을 수치로 요약한다.통계 집단 사이의 관계를 나타내는 방법으로는 두 가지 통계 숫자의 논리적 관계를 보여주는 통계 비율이나, 같은 종류의 통계 숫자를 장소나 시간에 따라 배열한 통계 계열의 분석 방법이 사용된다.[69]
또한, 통계 집단의 특징을 두 개 이상 고려할 때는, 그 관계를 상호 의존적이고 동시적으로 파악하여 분석하는 상관 분석과, 한쪽이 다른 쪽 특징의 변화에 얼마나 영향을 받는지 분석하는 회귀 분석 방법이 널리 사용된다.[69]
이러한 기술 통계 분석 단계에서는 직접 관측된 결과를 분류, 요약, 제시, 분석하는 것을 주된 목적으로 한다.[69]
5. 2. 추측 통계 분석
통계분석은 통계 데이터의 조사 목적에 따른 정리, 가공, 분석을 의미한다. 문제의 성질에 따라 적절한 분석 방법을 선택해야 한다. 일반적으로 통계분석의 첫 단계는 집단의 양적 구조를 기술하고 분석하는 기술적 분석 방법이다. 기술적 분석에서는 도수분포표나 도수분포도를 통해 집단의 특징을 파악하고, 평균, 산포도, 왜도 등의 집단특성치를 산출하여 집단의 특성을 수치적으로 요약한다.통계집단 간의 관계적 기술 방법으로는 두 가지 통계숫자의 논리적 관계를 나타내는 통계비율이나, 같은 종류의 통계숫자를 장소적 또는 시간적으로 배열한 통계계열의 분석 방법이 사용된다. 또한, 통계집단의 표지를 두 개 이상 고려할 때, 그 관계를 상호의존적, 동시적으로 파악하여 분석하는 상관 분석과, 한쪽이 다른 쪽의 변화에 얼마나 영향을 받는지 분석하는 회귀 분석 방법이 널리 사용된다.
이러한 기술통계적 분석 단계에서는 직접 관측된 결과를 분류, 요약, 제시, 분석하는 것을 주된 목적으로 한다. 그러나 직접 관측된 관측치의 집단, 즉 표본 자체가 최종 목표는 아니다. 표본과 그것이 속한다고 가정되는 더 큰 관측치의 집단, 즉 모집단을 구분하고, 표본을 통해 모집단에 관한 정보를 도출하는 데에 주목표를 두는 것이 추측적 통계 분석 방법이다. 물론 추측적 통계분석을 진행할 때에도 기술적 통계분석이 기초가 된다.[69]
표본은 모집단의 일부이므로, 거기에서 도출된 결과가 모집단의 특성치와 완전히 일치할 수도 있지만, 일반적으로 모집단의 참값과 표본추정치 사이에는 오차(표본오차)가 존재한다. 표본 추출이 무작위로 이루어지는 한, 확률 개념을 이용하여 표본오차 및 표본추정치의 분포 상태를 측정할 수 있다. 이러한 지식을 바탕으로 표본의 결과에서 모집단의 상태를 추정(통계적 추정)하거나, 모집단에 관한 가설의 타당성을 검정(통계적 가설검정)한다. 또한, 추측적 통계분석에서는 실험 또는 관찰 계획을 합리적으로 하기 위한 기법과 도출된 결과를 바탕으로 결정을 내리는 방법 등도 다룬다.[69]
5. 3. 상관 분석
통계 집단의 표지(標識)를 둘 이상 고려할 때, 그 관계를 상호의존적이고 동시적으로 파악하여 분석하는 방법으로 상관분석이 있다. 또한, 한편이 다른 편의 표지의 조(組)의 변화에 따라 어느 정도 영향을 받는지 분석하는 회귀분석도 널리 사용된다.[69]5. 4. 회귀 분석
통계 집단의 표지(標識)를 두 개 이상 생각한 경우, 그러한 관계를 상호의존적, 동시적으로 포착하여 분석하는 상관분석과, 한편이 다른 편의 표지의 조(組)의 변화에 의해 어느 정도 영향을 받는가를 분석하는 회귀분석의 방법이 널리 사용되고 있다.[69]6. 한국 사회와 통계적 추론
(이전 답변에서 주어진 원본 소스가 없어 섹션 제목과 위키 페이지 제목만으로는 내용을 생성할 수 없다고 말씀드렸습니다. 따라서 수정할 내용이 없습니다.)
7. 통계적 추론의 발전과 미래
통계적 추론은 표본 통계량의 정확한 분포를 구하기 어려울 때, 이를 근사하기 위한 다양한 방법들을 발전시켜 왔다.
유한 표본의 경우, 근사 결과를 통해 극한 분포가 통계량의 표본 분포에 얼마나 가까운지를 측정한다. 예를 들어, 10,000개의 독립 표본이 있을 때 정규 분포는 베리-에센 정리에 의해 많은 모집단 분포에 대해 표본 평균의 분포를 근사한다.[14] 고급 통계학에서는 근사 이론과 함수 해석학을 사용하여 근사 오차를 정량화하며, 확률 분포의 메트릭 기하학을 연구한다. 쿨백-라이블러 발산, 브레그만 발산, 헬링거 거리 등이 근사 오차 정량화에 사용된다.[15][16][17]
무한히 큰 표본의 경우, 극한 결과는 중심 극한 정리처럼 표본 통계량의 극한 분포를 설명한다. 극한 결과는 유한 표본과는 직접적인 관련이 없지만,[18][19][20] 일반화 적률법이나 일반화 추정 방정식의 사용을 정당화하는 데 사용된다.
조지 A. 바나드는 불변 확률을 군족(群族)에 사용하는 "구조적 추론"을 개발했다.[57] 도널드 A. S. 프레이저는 이를 바탕으로 구조적 추론에 대한 일반적인 이론을 개발하고,[58] 선형 모델에 적용했다.[59] 이 이론은 의사 결정 이론 및 베이시안 통계학과 관련이 있으며, 최적의 빈도주의적 의사 결정 규칙이 존재할 경우 이를 제공한다.[60]
7. 1. 비모수 통계
표본 통계량의 정확한 분포를 구하기 어렵기 때문에, 이를 근사하기 위한 여러 방법들이 개발되었다.유한 표본의 경우, 근사 결과는 극한 분포가 통계량의 표본 분포에 얼마나 가까이 접근하는지를 측정한다. 예를 들어, 10,000개의 독립적인 표본이 있는 경우, 정규 분포는 베리-에센 정리에 의해 많은 모집단 분포에 대해 표본 평균의 분포를 (두 자리 정확도로) 근사한다.[14] 그러나 많은 실용적인 목적을 위해, 정규 근사는 시뮬레이션 연구와 통계학자들의 경험에 따르면 10개 (또는 그 이상)의 독립 표본이 있을 때 표본 평균의 분포에 대한 좋은 근사를 제공한다.[14] 1950년대 콜모고로프의 연구 이후, 고급 통계학은 근사 이론과 함수 해석학을 사용하여 근사 오차를 정량화한다. 이 접근 방식에서, 확률 분포의 메트릭 기하학이 연구된다; 이 접근 방식은 예를 들어, 쿨백-라이블러 발산, 브레그만 발산, 그리고 헬링거 거리를 사용하여 근사 오차를 정량화한다.[15][16][17]
무한히 큰 표본의 경우, 극한 결과는 중심 극한 정리와 같이 표본 통계량의 극한 분포가 존재하는 경우 이를 설명한다. 극한 결과는 유한 표본에 대한 명제가 아니며, 실제로 유한 표본과는 관련이 없다.[18][19][20] 그러나 극한 분포의 점근 이론은 유한 표본으로 작업할 때 자주 사용된다. 예를 들어, 극한 결과는 일반화 적률법과 일반화 추정 방정식의 사용을 정당화하기 위해 자주 사용되며, 이는 계량 경제학 및 생물 통계학에서 널리 사용된다. 극한 분포와 실제 분포 간의 차이의 크기 (공식적으로 근사의 '오차')는 시뮬레이션을 사용하여 평가할 수 있다.[21] 유한 표본에 대한 극한 결과의 휴리스틱 적용은 많은 응용 분야, 특히 로그 오목 가능도 함수를 갖는 저차원 통계 모형 (예: 일변수 지수족)에서 일반적인 관행이다.
7. 2. 구조적 추론
조지 A. 바나드는 1938년부터 1939년까지 피셔(Fisher)와 피트만(Pitman)의 아이디어를 발전시켜 불변 확률을 군족(群族)에 사용하는 "구조적 추론"(structural inference) 또는 "핵심 추론"(pivotal inference)을 개발했다.[57] 바나드는 "fiducial" 절차가 잘 정의되고 유용할 수 있는 제한된 모델 집합에 대한 fiducial 추론의 논리를 재구성했다. 도널드 A. S. 프레이저는 군론에 기반한 구조적 추론에 대한 일반적인 이론을 개발했으며,[58] 이를 선형 모델에 적용했다.[59] 프레이저가 정립한 이론은 의사 결정 이론 및 베이시안 통계학과 밀접한 관련이 있으며, 최적의 빈도주의적 의사 결정 규칙이 존재할 경우 이를 제공할 수 있다.[60]참조
[1]
서적
Oxford Dictionary of Statistics
OUP
[2]
웹사이트
TensorFlow Lite inference
https://www.tensorfl[...]
[3]
웹사이트
Statistical Inference
https://encyclopedia[...]
Springer: The European Mathematical Society
2022-10-26
[4]
서적
[5]
서적
[6]
웹사이트
Statistical inference - Encyclopedia of Mathematics
https://www.encyclop[...]
2019-01-23
[7]
서적
[8]
웹사이트
Probability and Statistics: The Science of Uncertainty
https://books.google[...]
Freeman and Company
[9]
서적
Asymptotic Statistics
Cambridge University Press
[10]
서적
[11]
간행물
Survival analysis: An Epidemiological hazard?
[12]
서적
Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11)
Sage Publications
[13]
서적
Combined Survey Sampling Inference: Weighing of Basu's Elephants
Hodder Arnold
[14]
서적
Probability With a View Towards Statistics, Volume I
[15]
서적
[16]
서적
Comparison of Statistical Experiments
Cambridge University Press
[17]
서적
Statistical Decision Theory: Estimation, Testing, and Selection
Springer
[18]
서적
[19]
서적
[20]
서적
[21]
서적
[22]
간행물
On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection
[23]
서적
[24]
웹사이트
ASA Guidelines for the first course in statistics for non-statisticians
[25]
서적
Statistics
[26]
서적
[27]
서적
Bayesian Data Analysis
Chapman & Hall
[28]
서적
[29]
서적
[30]
서적
Statistical Models
[31]
서적
Statistics and Truth: Putting Chance to Work
World Scientific
[32]
서적
[33]
서적
Improving Almost Anything: Ideas and Essays, Revised Edition
Wiley
[34]
서적
[35]
웹사이트
Statistics
[36]
논문
On the Application of Probability Theory to Agricultural Experiments. Essay on Principles. Section 9
[37]
서적
(서적 제목 필요)
[38]
논문
Randomization-based statistical inference: A resampling and simulation infrastructure
2018-01-01 #날짜 정보가 년도만 있음.
[39]
서적
(서적 제목 필요)
[40]
논문
Randomization-based statistical inference: A resampling and simulation infrastructure
2018-01-01 #날짜 정보가 년도만 있음.
[41]
논문
Model-Based and Model-Free Techniques for Amyotrophic Lateral Sclerosis Diagnostic Prediction and Patient Clustering
2019-01-01 #날짜 정보가 년도만 있음.
[42]
논문
Model-free inference in statistics: how and why
http://bulletin.imst[...]
2019-01-01 #날짜 정보가 년도만 있음.
[43]
서적
(서적 제목 필요)
[44]
논문
Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability
[45]
서적
Preface to Pfanzagl.
[46]
논문
Calibrated Bayes: A Bayes/Frequentist Roadmap
2006-01-01 # 날짜 정보가 년도만 있음.
[47]
논문
Gibbs sampler and coordinate ascent variational inference: A set-theoretical review
[48]
서적
(서적 제목 필요)
[49]
서적
(서적 제목 필요)
[50]
서적
(서적 제목 필요)
[51]
서적
(서적 제목 필요)
[52]
서적
(서적 제목 필요)
[53]
서적
(서적 제목 필요)
[54]
서적
(서적 제목 필요)
[55]
서적
(서적 제목 필요)
[56]
서적
(서적 제목 필요)
[57]
논문
Pivotal Models and the Fiducial Argument
[58]
서적
The structure of inference
https://www.worldcat[...]
Wiley
[59]
서적
Inference and linear models
https://www.worldcat[...]
McGraw-Hill
[60]
논문
Fiducial theory and optimal inference
https://projecteucli[...]
2013-02-01
[61]
논문
Foresight: Its Logical Laws, Its Subjective Sources
[62]
서적
Predictive Inference: An Introduction
https://books.google[...]
CRC Press
[63]
웹사이트
統計的推測と学習
http://watanabe-www.[...]
東京工業大学
[64]
논문
学習理論の基礎概念
https://doi.org/10.1[...]
計測自動制御学会
[65]
간행물
統計的モデル選択 - データが選ぶ良いモデルとは?
https://www.it.mgmt.[...]
[66]
서적
はじめての統計データ分析
朝倉書店
[67]
서적
はじめての統計データ分析
朝倉書店
[68]
서적
사회과학연구방법론
법문사
[69]
문서
통계분석
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com