맨위로가기

T 점수

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

T 점수는 표준화된 점수의 한 유형으로, z 점수를 변환하여 얻으며, 자연수와 백분위수로 나타낼 수 있다. 통계에서 t-통계량은 가설 검정에 사용되며, t-검정에서 귀무 가설을 지지하거나 기각하는 데 활용된다. z-점수와 유사하지만, 표본 크기가 작거나 모집단 표준 편차를 알 수 없는 경우에 사용된다. t-통계량은 스튜던트 t-검정과 신뢰 구간 계산에 사용되며, 잔차를 표본 표준 편차로 나누어 계산할 수 있다. t-분포는 1876년 헬메르트와 뤼로트에 의해 처음 유도되었으며, 윌리엄 고셋에 의해 널리 알려졌다.

더 읽어볼만한 페이지

  • 정규 분포 - 로그 정규 분포
    로그 정규 분포는 확률 변수 X의 로그가 정규 분포를 따르며, 양의 실수 값을 갖고 평균 μ와 표준 편차 σ를 매개변수로 갖는 확률 분포이다.
  • 정규 분포 - 카이제곱 분포
    카이제곱 분포는 k개의 독립적인 표준정규분포를 따르는 확률변수들의 제곱의 합으로 정의되는 확률분포로서, 자유도 k에 따라 형태가 결정되며 통계적 가설 검정, 분산 분석, 적합도 검정, 독립성 검정 등 다양한 통계적 추론에 응용된다.
  • 통계학 - 확률
    확률은 사건의 가능성을 수치화한 개념으로, 도박에서 시작되어 수학적으로 발전했으며, 다양한 해석과 요소, 응용 분야를 가지며 양자역학, 사회 현상 등에도 적용된다.
  • 통계학 - 사분위수
    사분위수는 정렬된 데이터를 4등분하는 세 개의 값으로 데이터 분포 요약 및 이상치 탐지에 활용되며, 제1사분위수(Q₁)는 하위 25%, 제2사분위수(Q₂ 또는 중앙값)는 하위 50%, 제3사분위수(Q₃)는 하위 75%를 나타낸다.
T 점수
T-통계량
분야통계학, 확률
정의추정된 모수의 실제 값으로부터의 표준 오차 단위의 편차
표기t
분포스튜던트 t-분포
자유도n − p (n은 샘플 크기, p는 추정된 모수의 개수)
일반적인 t-통계량
단일 샘플 t-검정$\displaystyle t = \frac{\bar{X} - \mu_0}{s/\sqrt{n}}$
쌍체 t-검정$\displaystyle t = \frac{\bar{d}}{s_d/\sqrt{n}}$
독립 2-샘플 t-검정$\displaystyle t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{s_p^2/n_1 + s_p^2/n_2}}$
선형 회귀 기울기$\displaystyle t = \frac{\hat{\beta} - \beta_0}{SE(\hat{\beta})}$
기호
$\bar{X}$샘플 평균
$\mu_0$귀무 가설 하의 모집단 평균
s샘플 표준 편차
n샘플 크기
$\bar{d}$쌍체 차이의 평균
$\hat{\beta}$추정된 기울기
$\beta_0$귀무 가설 하의 기울기
$\SE(\hat{\beta})$추정된 기울기의 표준 오차
$\bar{X}_i$그룹 i의 샘플 평균
n_i그룹 i의 샘플 크기
s_p^2합동 표본 분산

2. 공식

표준값 z는 원점수 x가 평균에서 얼마나 떨어져 있는지를 나타낸다. 음수이면 평균 이하, 양수이면 평균 이상이다.

: z = \frac{x - \mu}{\sigma}


  • 여기서 x는 정상화되는 원점수이다.
  • σ는 모집단에서의 표준편차이다.
  • μ는 모집단에서의 평균이다.


따라서 T 점수는 다음과 같이 계산된다.

:t=10z+50

소수점, 음수, 양수 값을 갖는 표준점수(z)로부터 자연수 및 백분위수로 변환하는 과정을 통해 T 점수를 구할 수 있다.

\hat\beta를 어떤 통계 모형에서 모수 ''β''의 추정량이라고 할 때, 이 모수에 대한 ''t''-통계량은 다음과 같다.

:

t_{\hat{\beta}} = \frac{\hat\beta - \beta_0}{\operatorname{s.e.}(\hat\beta)},



여기서 ''β''0는 비무작위적이고 알려진 상수이며, 실제 알려지지 않은 모수 값 ''β''와 일치할 수도 있고 그렇지 않을 수도 있으며, \operatorname{s.e.}(\hat\beta)는 ''β''의 추정량 \hat\beta표준 오차이다.

3. t-통계량의 특징 및 분포

t-통계량은 가정된 값에서 표준 오차에 대한 모수 추정값 이탈의 비율이다. 기본적으로 통계 패키지는 ''β''0 = 0 인 ''t''-통계량을 보고하는데, 이는 해당 회귀 변수의 유의성을 검정하는 데 사용된다. 그러나 ''H''0: ''β'' = ''β''0 형태의 가설을 검정하기 위해 ''t''-통계량이 필요한 경우, 0이 아닌 ''β''0를 사용할 수 있다.

\hat\beta가 고전적인 선형 회귀 모형(즉, 정규 분포를 따르고 등분산성 오차항을 갖는)에서의 최소제곱법 추정량이고, 모수 ''β''의 실제 값이 ''β''0와 같다면, ''t''-통계량의 표본 분포는 자유도가 (''n'' − ''k'')인 스튜던트 t-분포가 된다. 여기서 ''n''은 관측치 수이고, ''k''는 회귀 변수의 수이다(절편 포함).

대부분의 모형에서, 추정량 \hat\beta는 ''β''에 대해 일치 추정량이며 점근적 정규성을 따른다. 만약 모수 ''β''의 실제 값이 ''β''0와 같고, 양 \operatorname{s.e.}(\hat\beta)이 이 추정량의 점근 분산을 정확하게 추정한다면, ''t''-통계량은 점근적으로 표준 정규 분포를 갖게 된다.

어떤 모형에서는 ''t''-통계량의 분포가 정규 분포와 다르며, 심지어 점근적으로도 다르다. 예를 들어, 단위근을 가진 시계열을 확장된 디키-풀러 검정에서 회귀할 때, 검정 ''t''-통계량은 점근적으로 디키-풀러 분포 중 하나를 갖게 된다(검정 설정에 따라 다름).

4. t-통계량의 사용

t-통계량은 스튜던트 t-검정과 같은 통계적 가설 검정과 특정 신뢰 구간 계산에 사용된다. t-검정에서는 귀무 가설을 지지할지 기각할지 여부를 결정하는 데 사용된다. z점수(z score)와 매우 유사하지만, 표본 크기가 작거나 모집단 표준 편차를 알 수 없는 경우에 t-통계량이 사용된다는 차이점이 있다.

t-통계량은 피벗 수량이라는 핵심 속성을 가진다. 즉, 표본 평균으로 정의되지만, 표본 분포는 모집단 매개변수에 의존하지 않으므로 이러한 매개변수에 관계없이 사용할 수 있다.

또한 잔차를 표본 표준 편차로 나누어 계산할 수 있다.

: g(x,X) = \frac{x - \overline{X}}{s}

이는 주어진 표본이 평균으로부터 얼마나 많은 표준 편차 떨어져 있는지에 대한 추정값을 계산하기 위한 것으로, z-점수의 표본 버전이다. z-점수는 모집단 매개변수를 필요로 한다.

알 수 없는 평균과 분산을 가진 정규 분포 N(\mu, \sigma^2)가 주어졌을 때, n번의 관측을 한 후의 미래 관측값 X_{n+1}의 t-통계량은 보조 통계량이며, 이는 통계량(관측값으로부터 계산됨)인 피벗 수량(μ와 σ2의 값에 의존하지 않음)이다. 이를 통해 t-분포를 이용하여 빈도론적 예측 구간(예측 신뢰 구간)을 계산할 수 있다.

:\frac{X_{n+1} - \overline{X}_n}{s_n \sqrt{1 + n^{-1}}} \sim T^{n-1}.

X_{n+1}에 대해 풀면 예측 분포를 얻을 수 있고, 이를 통해 예측 신뢰 구간을 계산할 수 있다.

5. 역사

"t 통계량"이라는 용어는 "가설 검정 통계량"에서 축약된 것이다.[1] 통계학에서 t-분포는 1876년 헬메르트[2][3][4]와 뤼로트[5][6][7]에 의해 처음 사후 분포로 유도되었다. t-분포는 또한 칼 피어슨의 1895년 논문에서 피어슨 타입 IV 분포의 보다 일반적인 형태로 나타났다.[8] 그러나, Student's T 분포라고도 알려진 T-분포는 1908년 Biometrika에 "The Probable Error of a Mean" 논문을 "Student"라는 필명으로 발표한 윌리엄 시리 고셋의 이름을 따서 명명되었다.[9][10] 고셋의 고용주는 과학 논문을 출판할 때 본명 대신 필명을 사용하는 것을 선호했기 때문에, 그는 자신의 신분을 숨기기 위해 "Student"라는 이름을 사용했다.[11] 고셋은 아일랜드 더블린의 기네스 양조장에서 일했으며, 작은 표본의 문제에 관심이 있었다. "Student"라는 용어는 윌리엄 고셋의 필명이었지만, 이 분포가 "Student's distribution"[12][13]과 "Student's t-test"로 잘 알려지게 된 것은 실제로 로널드 피셔의 연구를 통해서였다.

6. 관련 개념


  • ''z''-점수 (표준화): 모집단 모수를 알고 있다면, t-통계량을 계산하는 대신 z-점수를 계산할 수 있다. 유사하게 ''t''-검정을 사용하는 대신 ''z''-검정을 사용한다. 이는 표준화된 시험 외에서는 드물다.
  • 스튜던트화 잔차: 회귀 분석에서, 서로 다른 데이터 지점에서의 추정치의 표준 오차는 다르다(단순 선형 회귀의 중간 지점과 끝점을 비교). 따라서 서로 다른 잔차를 오차에 대한 다른 추정치로 나누어 스튜던트화 잔차라고 한다.

참조

[1] 서적 The Microbiome in Health and Disease https://books.google[...] Academic Press 2020-05-29
[2] 서적 Einführung in die Technische Mechanik Springer Berlin Heidelberg 2003
[3] 간행물 Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit in Zusammenhang stehende Fragen 1937-10
[4] 간행물 Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit https://zenodo.org/r[...] 1876
[5] 간행물 Vergleichung von zwei Werthen des wahrscheinlichen Fehlers https://zenodo.org/r[...] 1876
[6] 간행물 Studies in the history of probability and statistics XLIV. A forerunner of the t-distribution
[7] 간행물 Helmert's work in the theory of errors 1995
[8] 간행물 X. Contributions to the mathematical theory of evolution.—II. Skew variation in homogeneous material
[9] 간행물 The Probable Error of a Mean
[10] 웹사이트 T Table History of T Table, Etymology, one-tail T Table, two-tail T Table and T-statistic https://www.tdistrib[...]
[11] 간행물 Pseudonymous fame
[12] 간행물 Subgroup Analysis of Topical Tranexamic Acid in Total Knee Arthroplasty
[13] 서적 Probability & statistics for engineers & scientists Pearson 2006



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com