투키 크레이머 방법
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
투키 크레이머 방법은 존 투키의 이름을 딴 통계적 방법으로, 모든 가능한 표본 평균 쌍을 비교하여 집단 간의 차이를 분석하는 데 사용된다. 이 방법은 studentized range 분포를 기반으로 하며, t-검정과 유사한 공식을 사용하지만, 가족별 오류율을 보정한다. 투키 크레이머 방법은 관측치의 독립성, 정규 분포, 등분산성이라는 세 가지 가정을 충족해야 하며, 검정 통계량을 studentized range 분포의 임계값과 비교하여 유의성을 판단한다. 이 방법은 모든 쌍별 비교에 대한 신뢰 구간을 제공하며, 표본 크기가 다른 경우 투키-크레이머 방법으로 불린다. 투키 크레이머 방법은 셰페 방법과 비교하여 쌍별 비교에 더 적합하며, 관련 기법으로는 스튜던트-뉴먼-컬스 방법, 투키의 WSD 검정, 댄넷의 C 방법 등이 있다.
존 투키의 이름을 따서 명명되었으며,[2] 모든 가능한 평균 쌍을 비교하며, studentized range 분포(''q'')를 기반으로 한다.[3] 이 분포는 ''t''-검정의 ''t'' 분포와 유사하다. 투키 검정은 모든 처리의 평균을 다른 모든 처리의 평균과 비교한다. 즉, 모든 쌍별 비교 집합에 동시에 적용된다.
투키-크레이머 방법을 적용하기 위해서는 다음과 같은 세 가지 가정이 충족되어야 한다.
2. 역사적 배경
: μi - μj
그리고 예상되는 표준 오차보다 큰 두 평균 간의 차이를 식별한다. 모든 표본 크기가 동일할 때, 집합에 대한 신뢰 계수는 정확히 1 - α ( 0 ≤ α ≤ 1 )이다. 불균등한 표본 크기의 경우, 신뢰 계수는 1 - α 보다 크다. 즉, 투키 방법은 불균등한 표본 크기가 있을 때 보수적이다. 이 검정은 종종 압축 문자 표시 (CLD) 통계 절차에 따라 이 검정의 출력을 비통계학자 청중에게 더 투명하게 만든다.
2. 1. 개발
투키 크레이머 방법은 존 투키의 이름을 따서 명명되었으며,[2] 모든 가능한 평균 쌍을 비교하며, studentized range 분포(''q'')를 기반으로 한다.[3] 이 분포는 ''t''-검정의 ''t'' 분포와 유사하다. 투키 검정은 모든 처리의 평균을 다른 모든 처리의 평균과 비교한다. 즉, 모든 쌍별 비교 집합에 동시에 적용된다.
: μi - μj
그리고 예상되는 표준 오차보다 큰 두 평균 간의 차이를 식별한다. 모든 표본 크기가 동일할 때, 집합에 대한 신뢰 계수는 정확히 1 - α ( 0 ≤ α ≤ 1 )이다.
3. 가정
4. 검정 통계량
투키 검정은 t-검정과 매우 유사한 공식에 기반한다. 사실, 투키 검정은 기본적으로 ''t''-검정이지만, 가족별 오류율을 보정한다는 점이 다르다.
투키 검정의 공식은 다음과 같다.
:
여기서 ''Y''A와 ''Y''B는 비교되는 두 평균이고, SE는 평균 합의 표준 오차이다. ''q''s 값은 표본의 검정 통계량이다.
이 ''q''s 검정 통계량은 선택된 유의 수준 α에 대한 ''q'' 값과 비교될 수 있으며, 이 값은 스튜던트화 범위 분포 표에서 얻는다. ''q''s 값이 분포에서 얻은 임계값 ''q''α보다 '크면', 두 평균은 유의하게 다르다고 말한다.
투키 검정의 귀무 가설은 비교되는 모든 평균이 동일한 모집단에서 나온다는 것이다.
4. 1. 공식
투키 검정은 t-검정과 매우 유사한 공식에 기반한다. 사실, 투키 검정은 기본적으로 ''t''-검정이지만, 가족별 오류율을 보정한다는 점이 다르다.[3]투키 검정의 공식은 다음과 같다.
:
여기서 와 는 비교되는 두 평균이고, SE는 평균 합의 표준 오차이다. 값은 표본의 검정 통계량이다.
이 검정 통계량은 선택된 유의 수준 에 대한 값과 비교될 수 있으며, 이 값은 스튜던트화 범위 분포 표에서 얻는다. 값이 분포에서 얻은 임계값 }}보다 '크면', 두 평균은 수준 에서 유의하게 다르다고 말한다.[3]
투키 검정의 귀무 가설은 비교되는 모든 평균이 동일한 모집단에서 나온다는 것이다(즉, ''μ'' ''μ'' ... ''μ'' }}}).
4. 2. 스튜던트화 범위 분포
투키-크레이머 방법은 스튜던트화 범위 분포()를 사용하여 유의성 검정을 수행한다. 동일한 정규 분포 }}를 갖는 개의 모집단 각각에서 크기 의 표본을 추출한다고 가정하고, 이 이러한 표본 평균 중 가장 작고, 이 가장 크다고 가정하며, 2가 이러한 표본에서 얻은 합동 표본 분산이라고 가정한다. 그러면 다음의 확률 변수는 학생화 범위 분포를 갖는다.:
분포는 통계학에 관한 많은 교과서에 수록되어 있으며, R (프로그래밍 언어) 등 통계 소프트웨어에서 제공하는 함수(
ptukey
, qtukey
)를 통해 쉽게 계산할 수 있다.''q''의 임계값은 다음 세 가지 요소를 기반으로 한다.
# 제1종 오류율, 즉 참인 귀무 가설을 기각할 확률
# 비교되는 하위 모집단의 수
# 각 평균의 자유도 수 ( }}) , 은 총 관측 수
테키의 검정은 같은 모집단으로부터의 2개의 표본의 비교에 기초한다. 첫 번째 표본으로부터, 범위 (최대 관측값에서 최소값을 빼서 계산된다: )가 계산되고, 두 번째 표본으로부터 표준 편차가 계산된다. 스튜던트화 범위의 비는 다음에 다음과 같이 계산된다 (' ''q'' = 스튜던트화 범위, ''s'' = 두 번째 표본의 표준 편차).
:
5. 신뢰 구간
모든 쌍별 비교에 대한 투키 신뢰 한계는 최소 의 신뢰 계수를 갖는다.
:
점 추정량 및 추정 분산은 단일 쌍별 비교에 대한 것과 동일하다. 동시 비교에 대한 신뢰 한계와 단일 비교에 대한 신뢰 한계 간의 유일한 차이점은 추정 표준 편차의 다중성이다.
스튜던트화된 범위 분포를 사용할 때는 표본 크기가 동일해야 한다. 는 비교하는 두 그룹만의 표준 편차가 아니라 전체 배치의 표준 편차이다. 서로 다른 표본 크기에 대한 투키-크레이머 방법은 다음과 같다.
:
''n'' ''i'' 및 ''n'' ''j''는 각각 그룹 ''i'' 및 ''j''의 크기이다. 전체 배치의 자유도도 적용된다.
5. 1. 동일한 표본 크기
모든 쌍별 비교에 대한 투키 신뢰 한계는 최소 의 신뢰 계수를 갖는다.:
점 추정량과 추정된 분산은 단일 쌍별 비교와 동일하다. 동시 비교에 대한 신뢰 한계와 단일 비교에 대한 신뢰 한계의 유일한 차이점은 추정된 표준 편차의 배수이다.
또한, 학생화된 범위 방식을 사용할 때는 표본 크기가 같아야 한다. 는 비교되는 두 그룹뿐만 아니라 전체 설계의 표준 편차이다.
5. 2. 다른 표본 크기 (투키-크레이머 방법)
모든 쌍별 비교에 대한 투키 신뢰 한계는 최소 의 신뢰 계수를 갖는다.:
점 추정량과 추정된 분산은 단일 쌍별 비교와 동일하다. 동시 비교와 단일 비교에 대한 신뢰 한계의 유일한 차이점은 추정된 표준 편차의 배수이다.
학생화된 범위 방식을 사용할 때는 표본 크기가 같아야 한다. 는 비교되는 두 그룹뿐만 아니라 전체 설계의 표준 편차이다. 불균등한 표본 크기로 작업하는 것도 가능하다. 이 경우 각 쌍별 비교에 대한 추정된 표준 편차를 계산해야 한다. 1956년 클라이드 크레이머가 공식화한 불균등한 표본 크기에 대한 절차는 다음과 같다.
:
여기서 와 는 각각 그룹 와 의 크기이다. 전체 설계에 대한 자유도도 적용된다.
표본 크기가 다른 경우의 이러한 방법은 '''투키-크레이머 방법'''이라고 불리기도 한다.
6. 비교 순서
평균 집합 ''A'', ''B'', ''C'', ''D''가 ''A'' > ''B'' > ''C'' > ''D'' 순으로 순위가 매겨졌을 때, 모든 가능한 비교를 투키 검정을 사용하여 검정할 필요는 없다.[7] 중복을 피하기 위해, 먼저 가장 큰 평균(''A'')과 가장 작은 평균(''D'')을 비교한다.[7] 평균 ''A''와 ''D''의 비교에 대한 ''q''''s'' 값이 분포의 ''q'' 값보다 작으면, 귀무 가설은 기각되지 않고, 이들 평균 사이에는 통계적으로 유의미한 차이가 없는 것으로 간주된다.[7] 가장 큰 차이가 있는 두 평균 사이에 유의미한 차이가 없으므로, 그보다 차이가 작은 두 평균을 비교해도 (표본 크기가 이상적이라면) 동일한 결론을 얻을 수 있다고 확신할 수 있다.[7] 따라서 나머지 비교는 수행할 필요가 없다.[7]
일반적으로 투키 검정은 항상 가장 큰 평균과 가장 작은 평균을 먼저 비교하고, 다음으로 가장 큰 평균과 두 번째로 작은 평균을 비교하는 식으로, 가장 큰 평균과 다른 모든 평균이 비교될 때까지 (또는 유의미한 차이가 발견되지 않을 때까지) 수행하는 것이 중요하다.[7] 이후, 두 번째로 큰 평균과 가장 작은 평균을 비교하는 방식으로 진행한다.[7]
7. 관련 기법
스튜던트-뉴먼-컬스 방법(SNK 방법)은 투키의 HSD 방법이 일률적으로 엄격한 기준을 적용하는 싱글 스텝 방법인데 반해, 평균 비교의 서로 다른 쌍에 대해 서로 다른 임계값을 사용하는 스텝다운 방법이다.[8]
투키의 WSD (wholly significant difference) 검정은 "『너무 엄격한』 투키의 HSD 방법과 『다소 관대한』 SNK 방법의 평균화를 꾀한 방법"이다.[8]
Tukey Welsch영어 (Q) 방법은 "스텝 수에 따라 시닥 부등식에 유의 수준을 조정한 q 분포의 임계값을 사용하는 방법"이다.[8]
Games-Howell영어 방법은 비등분산성을 가정하는 "웰치 검정에 의해 산출된 통계량과, 더 엄격하게 조정된 자유도를 사용한 q 분포의 임계값으로 유의성을 판단하는 기법"이다.[8]
댄넷의 C 방법은 Games-Howell영어 방법보다 엄격하게 조정된 자유도를 사용하는 기법이다.[8] 비등분산성을 가정한다.
Games-Howell영어-C 방법은 Games-Howell영어 방법과 댄넷의 C 방법을 평균화한 기법이다.[8] 비등분산성을 가정한다.
7. 1. 스튜던트-뉴먼-컬스 방법 (SNK 방법)
스튜던트-뉴먼-컬스 방법(SNK 방법)은 평균 비교의 서로 다른 쌍에 대해 서로 다른 임계값을 사용하는 스텝다운 방법이다.[8] 투키의 HSD 방법이 일률적으로 엄격한 기준을 적용하는 싱글 스텝 방법인데 반해, SNK 방법은 이러한 차이점을 보인다.[8]7. 2. 투키의 WSD (wholly significant difference) 검정
투키의 HSD 방법은 일률적으로 엄격한 기준을 적용하는 싱글 스텝 방법이지만, 스튜던트-뉴먼-컬스 방법(SNK 방법)은 평균 비교의 서로 다른 쌍에 대해 서로 다른 임계값을 사용하는 스텝다운 방법이다.[8] 투키의 WSD (wholly significant difference) 검정은 "『너무 엄격한』 투키의 HSD 방법과 『다소 관대한』 SNK 방법의 평균화를 꾀한 방법"이다.[8]7. 3. 댄넷의 C 방법
댄넷의 C 방법은 Games-Howell 방법보다 엄격하게 조정된 자유도를 사용하는 기법이다.[8] 비등분산성을 가정한다.7. 4. Games-Howell-C 방법
Games-Howell 방법과 댄넷의 C 방법을 평균화한 기법이다. 비등분산성을 가정한다.8. 셰페 방법과의 비교
셰페 방법은 모든 대비(그룹 간 비교)에 더 적합한 반면, 투키-크레이머 방법은 쌍별 비교에 더 적합하다. 쌍별 비교만 수행하는 경우 투키-크레이머 방법이 셰페 방법보다 더 좁은 신뢰 한계를 제공하여 더 높은 검정력을 가진다. 반면, 많은 또는 모든 대비에 관심이 있을 때는 셰페 방법이 더 좁은 신뢰 한계를 제공하는 경향이 있다.
참조
[1]
웹사이트
One-way ANOVA – independent samples
http://faculty.vassa[...]
2008-12-04
[1]
논문
Aging, hypertension and physiological tremor: The contribution of the cardioballistic impulse to tremorgenesis in older adults
[2]
논문
Comparing individual means in the Analysis of Variance
[3]
간행물
Lecture notes
University of Calgary
[4]
논문
Logical contradictions in the one-way ANOVA and Tukey–Kramer multiple comparisons tests with more than two groups of observations
[5]
웹사이트
One Way ANOVA – Independent Samples
http://faculty.vassa[...]
2008-12-04
[6]
논문
Comparing Individual Means in the Analysis of Variance
http://webspace.ship[...]
[7]
간행물
Biology 315 – Quantitative Biology Lecture Notes
University of Calgary
[8]
논문
厳格化の観点からの多重比較法の整理
[9]
웹인용
One Way ANOVA – Independent Samples
http://faculty.vassa[...]
2008-12-04
[9]
논문
Aging, hypertension and physiological tremor: The contribution of the cardioballistic impulse to tremorgenesis in older adults
[10]
논문
Comparing Individual Means in the Analysis of Variance
[11]
간행물
Biology 315 – Quantitative Biology Lecture Notes
University of Calgary
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com