재현성 위기
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
재현성 위기는 과학적 연구 결과의 재현 실패로 인해 발생하는 위기로, 연구 결과의 신뢰성을 저해하고 과학 전반에 대한 불신을 초래한다. 2010년대 초 사회 심리학 연구의 재현 실패, 제약 회사의 낮은 재현율 보고, 데이터 분석의 유연성으로 인한 거짓 긍정 결과 증가 등이 위기의 시작으로 지목된다. 심리학, 의학, 경제학 등 다양한 분야에서 재현성 위기가 나타나고 있으며, 특히 심리학 분야는 그 심각성이 두드러진다. 이러한 위기의 원인으로는 출판 편향, 통계적 문제, 연구 관행의 문제, 그리고 "출판 아니면 죽음"과 같은 학계 문화 등이 꼽힌다. 이에 대한 대응으로 연구 방법론 개선, 통계적 방법론 개선, 재현 연구 활성화, 그리고 오픈 사이언스 운동과 같은 과학적 접근 방식의 변화가 시도되고 있다.
더 읽어볼만한 페이지
- 윤리와 통계 - 뉘른베르크 강령
뉘른베르크 강령은 제2차 세계 대전 후 뉘른베르크 재판 중 의사 재판에서 제시된 인간 대상 의학 연구 윤리에 관한 10가지 원칙으로, 나치 독일의 비윤리적 인체 실험 반성에서 비롯되어 피험자의 자발적 동의, 사회적 유익성, 과학적 근거, 고통 및 부상 최소화 등을 주요 내용으로 하며, 법적 구속력은 없으나 임상 연구 윤리 역사상 중요한 문서로 평가받고 각국 법률 및 윤리 규범에 큰 영향을 미쳤다. - 윤리와 통계 - 메타과학
메타과학은 과학 연구의 방법론, 보고, 재현성 등을 개선하여 연구의 질을 높이고 과학적 진보를 가속화하는 것을 목표로 하는 학문 분야이다. - 과학에 대한 비판 - 백신 기피
백신 기피는 백신의 효과와 안전성에 대한 과학적 증거가 있음에도 불구하고 백신 접종을 거부하거나 꺼리는 현상이며, 개인과 사회의 건강을 위협하여 감염병 유행과 의료 시스템 과부하를 초래할 수 있다. - 과학에 대한 비판 - The Monsanto Years
《The Monsanto Years》는 닐 영이 2015년에 발표한 스튜디오 앨범으로, 유전자 변형 생물(GMO) 반대와 식품 표시 의무 부재를 비판하며 스타벅스와 같은 기업을 비판하는 내용을 담고 있고, 미국 빌보드 200 차트 16위를 기록했으며, 앨범 발매 후 몬산토의 조사로 논란이 있었다. - 메타과학 - 재현성
재현성은 과학적 연구의 신뢰성을 평가하는 요소로, 동일한 조건에서 유사한 결과를 얻을 수 있는 정도를 의미하며, 실험 방법과 데이터의 투명한 공개를 통해 확보해야 한다. - 메타과학 - 실험계획법
실험계획법은 실험의 효율성과 신뢰성을 높이기 위해 실험 전 상세 계획을 세우는 방법론이며, 비교, 무작위화, 반복 등의 원칙을 기반으로 다양한 설계 방식을 활용하여 실험을 진행한다.
재현성 위기 | |
---|---|
문제 개요 | |
이름 | 재현성 위기 |
다른 이름 | 복제 위기 재현 위기 재생산 위기 재현 불가능성 위기 |
설명 | 과학적 연구를 재현하는 데 있어 광범위한 어려움을 설명하는 용어 |
원인 | |
잠재적 요인 | 출판 편향 통계적 유의성에 대한 과도한 의존 부적절한 연구 설계 불충분한 보고 기준 과학적 부정행위 의혹 |
관련 분야 | |
주요 관련 분야 | 의학 경제학 심리학 |
추가 관련 분야 | 기타 과학 분야 |
영향 | |
주요 영향 | 과학적 결과의 신뢰성에 대한 의문 제기 연구 자금 낭비 정책 결정에 대한 잠재적 오류 유발 |
긍정적 결과 | 연구 방법론 개선 노력 촉진 투명성 및 개방 과학 장려 메타 과학 분야 발전 |
2. 배경
2016년 1,500명의 과학자를 대상으로 한 조사에 따르면, 70%의 연구자가 다른 사람의 실험을 재현하는 데 실패했고, 50%는 자신의 실험조차 재현하지 못했다.[237] 이러한 문제는 과학의 여러 분야에서 나타나고 있다.
분야 | 비율 |
---|---|
화학 | 90% (60%) |
생명 과학 | 80% (60%) |
물리학과 공학 | 70% (50%) |
의학 | 70% (60%) |
지구 과학과 환경 과학 | 60% (40%) |
2009년 조사에서는 과학자의 2%가 연구 조작을 한 적이 있으며, 14%는 그러한 조작을 한 사람을 알고 있다고 응답했다. 특히 의학 연구자들은 실험 처리 오류를 더 자주 보고했다.[238] 1990년부터 2003년까지 1,000회 이상 인용된 49개의 의학 연구 중, 16%는 후속 연구에서 부정되었고, 16%는 효과가 과장되었으며, 24%는 재현되지 않았다.[239] 미국 식품의약국은 1977년부터 1990년까지 의학 연구의 10~20%에서 결함을 발견했다.[240] 2012년 암젠의 연구에서는 암 전임상 연구의 11%만이 재현에 성공했다.[241][242]
사회 심리학 분야에서는 의심스러운 연구 관행(QRPs)이 만연하여 문제가 두드러진다. QRPs에는 선택적 보고, 부분 출판, 임의적 중단, p값 반올림, 파일 서랍 효과, 사후적 스토리 전개, 이상치 조작 등이 포함된다.[245][246][247][248] 2000명 이상의 심리학자를 대상으로 한 설문 조사에서 상당수가 QRPs를 사용한 경험이 있다고 답했다.[245] 심리학 분야에서는 데이터 조작 스캔들도 발생했는데, 대표적인 사례는 Diederik Stapel|디데릭 스타펄영어의 데이터 조작 사건이다.[250] 또한, 심리 과학의 일부 효과는 재현하기 어렵다는 사실이 밝혀지기도 했다.
이러한 문제들로 인해 다니엘 카너먼은 실험 재현에 대한 새로운 주의를 촉구했다.[251] 2015년에는 심리학 분야에서 100개의 실증 연구를 재현하는 재현성 프로젝트(Reproducibility Project)가 진행되었는데, 절반 미만의 연구만이 통계적으로 유의미한 수준으로 재현되었다.[254]
글렌 베글리(Glenn Begley)와 John Ioannidis|존 이오아니디스영어는 2015년에 발표된 논문에서 현재 과학의 어려움을 요약하기 위해 다음 5가지 요점을 제시했다.[277]
번호 | 내용 |
---|---|
1 | 새로운 데이터의 생성과 전례 없는 속도로의 출판 |
2 | 장기적으로 칭찬받기 힘든 발견의 증거 강요 |
3 | 원인: 좋은 과학적 관행 정착 실패와 출판 아니면 죽음(publish or perish)이라는 절망 |
4 | 다양한 요소와 이해 관계자가 존재하는 문제 |
5 | 한 집단만의 책임이 아니며, 하나의 해결책으로 충분하지 않음 |
scientometrics|과학 계량학영어의 아버지로 여겨지는 Derek de Solla Price|데릭 데 솔라 프라이스영어는 과학이 자체적인 지수적 성장의 결과로 '노쇠'할 것이라고 예측했다.[278] 제롬 R. 라베츠는 1971년 저서 ''Scientific knowledge and its social problems|과학적 지식과 사회적 문제영어''에서 과학이 질 관리를 위한 내부 시스템에 큰 문제에 시달릴 것이라고 예측했다. 필립 미로스키는 2011년 저서 ''Science Mart''에서 과학의 상품화를 지적하며, 기업이 자체 연구를 대학에 아웃소싱하면서 과학의 쇠퇴를 초래했다고 주장했다.[281]
2. 1. 재현성의 정의와 중요성
재현은 "과학의 초석"이라고 불려왔다.[9][10] 2009년 환경 보건 과학자 스테판 슈미트는 재현에 대해 다음과 같이 설명했다.그러나 '재현'과 관련된 개념을 정의하는 방법에 대한 합의는 제한적이다.[11][91][12] 여러 유형의 재현이 확인되었다.
# '''직접 재현''' 또는 '''정확한 재현''': 실험 절차를 가능한 한 가깝게 반복하는 경우.[12][13]
# '''체계적 재현''': 실험 절차를 대체로 반복하되, 의도적인 변화를 주는 경우.[13]
# '''개념적 재현''': 다른 절차를 사용하여 발견 또는 가설을 검증하는 경우.[12][13] 개념적 재현은 결과 또는 가설의 일반화 가능성과 진실성을 테스트할 수 있게 한다.[13]
'재현성'은 동일한 데이터 세트를 사용하여 동일한 결과를 재현하는 것을 의미하는 '재현'과 구별될 수도 있다. 이러한 유형의 재현성 때문에 많은 연구자가 검증을 위해 다른 사람들이 자신의 데이터를 사용할 수 있도록 한다.[14]
재현성 위기가 반드시 해당 분야가 비과학적임을 의미하는 것은 아니다.[15][16][17] 오히려, 이 과정은 오래된 아이디어나 면밀한 조사를 견딜 수 없는 아이디어를 제거하는 과학적 과정의 일부이며,[18][19] 이 제거 과정이 항상 효과적인 것은 아니다.[20][21]
2. 2. 통계학적 배경
통계적 가설 검정에서 '''귀무 가설'''()은 일반적으로 "X와 Y는 통계적으로 독립"이라는 형태를 취하며, 예를 들어 "약물 X를 복용해도 질병 Y의 1년 회복률이 변하지 않는다"와 같이 표현될 수 있다. 이와 반대로, '''대립 가설'''()은 회복률이 변한다는 내용을 담는다.완전한 통계적 독립성을 테스트하기는 어렵기 때문에, 귀무 가설은 종종 "효과 크기는 0이다"라는 ''단순화된'' 형태로 축소된다. 여기서 '''효과 크기'''는 ''완전한'' 귀무 가설이 참일 때 0이 되는 값이며, 효과 크기가 클수록 귀무 가설이 거짓일 가능성이 커진다.[23] 예를 들어, 이진 변수 X에 대해 효과 크기는 X의 변화에 따른 Y의 기댓값 변화로 정의될 수 있다.
:
효과 크기는 직접 관찰할 수 없으므로, 통계적 추정량을 통해 측정해야 한다. 예를 들어, 위에서 정의된 효과 크기는 코헨의 d 추정량을 사용하여 측정할 수 있다. 동일한 효과 크기에 대해 효율성, 편향, 분산 등에서 상충 관계를 가지는 여러 추정량이 존재할 수 있다. 효과 크기 추정량이 통계적 검정에 사용될 때, 이를 '''검정 통계량'''이라고 한다.
귀무 가설 '''검정'''은 데이터를 입력받아 또는 을 출력하는 결정 절차이다. 을 출력하는 경우 "통계적으로 유의미한 효과가 있다" 또는 "귀무 가설이 기각되었다"라고 한다.
일반적으로 통계적 검정은 (단측) '''임계값 검정'''으로, 다음과 같이 구성된다.
# 데이터 를 수집한다.
# 데이터에 대한 검정 통계량 를 계산한다.
# 검정 통계량을 '''임계값'''과 비교한다. 이면 을 출력하고, 그렇지 않으면 을 출력한다.
양측 임계값 검정은 두 개의 임계값을 사용하며, 또는 인 경우 을 출력한다.
귀무 가설 검정에는 음성 오류, 참 음성, 양성 오류, 참 양성의 네 가지 가능한 결과가 있다.
을 기각할 확률 | 을 기각하지 않을 확률 | |
---|---|---|
가 참인 경우 | α | 1-α |
가 참인 경우 | 1-β (검정력) | β |
'''유의 수준''' (α)은 귀무 가설이 참일 때 대립 가설이 참이라고 결론 내릴 확률이다.[22]
:
'''통계적 검정력'''(1-β)은 대립 가설이 참일 때 대립 가설이 참이라고 결론 내릴 확률이다.
:
'''p-값'''은 귀무 가설()을 조건으로 할 때, 검정 통계량이 적어도 그만큼 극단적일 확률이다. 귀무 가설이 참이면 p-값은 에서 균등하게 분포된다.[24][25] p-값을 계산한 후 이면 을 출력하여, 유의 수준 에서 귀무 가설을 기각할 수 있다.
2. 3. 역사적 배경
"전례 없는 속도로 새로운 데이터와 과학 출판물이 생성"되어 "게시하거나 망하는 절박함"을 초래하고, 훌륭한 과학적 관행을 따르지 못하게 함으로써 재현성 위기가 촉발될 수 있다는 지적이 있다.[102]계량 과학의 아버지로 여겨지는 데릭 데 솔라 프라이스는 1963년에 과학이 자체적인 기하급수적인 성장으로 인해 "노쇠"에 이를 수 있다고 예측했다.[103] 오늘날의 일부 문헌은 이러한 "과잉" 예언을 옹호하는 듯하며, 관심과 품질의 저하를 한탄한다.[104][105]
역사학자 필립 미로스키는 과학적 품질의 저하가 상업화와 관련이 있으며, 특히 주요 기업들이 연구를 대학과 계약 연구 기관에 아웃소싱하는 수익 중심의 결정에 의해 촉진되었다고 주장한다.[106]
독일 사회학자 니클라스 루만의 시스템 이론은 경제, 과학, 종교, 미디어와 같은 각 시스템이 고유한 코드를 사용하여 소통한다고 주장한다. 과학의 경우 '참'과 '거짓', 경제의 경우 '이익'과 '손실' 등이다.[107][108] 일부 사회학자들에 따르면, 시스템 간의 구조적 결합으로 인한 과학의 미디어화,[109] 상업화,[106] 그리고 정치화[109][110]는 원래 시스템 코드의 혼란을 초래했다.
심리학자 Brian D. Earp와 Jim A. C. Everett는 심리학에서 재현 실험을 권장하지 않는 사회적 구조에 주목하여, 왜 재현 실험이 일반적이지 않은지에 대해 5가지 사항을 제시했다.[268][269]
이러한 이유로 심리학이 방법론적인 사회적 딜레마에 직면하고 있다고 주장했다.
글렌 베글리(Glenn Begley)와 John Ioannidis|존 이오아니디스영어는 2015년에 출판된 논문에서 현재 과학의 어려움을 요약하기 위해 5가지 요점을 제시했다.[277]
번호 | 내용 |
---|---|
1 | 새로운 데이터의 생성/전례 없는 속도로의 출판 |
2 | 거의 장기적으로는 칭찬받을 수 없을 발견의 증거 강요 |
3 | 원인: 좋은 과학적 관행의 정착 실패와, 출판 아니면 죽음(publish or perish)이라는 절망 |
4 | 이는 많은 요소와 많은 이해 관계자가 존재하는 문제이다. |
5 | 한 집단이 단독으로 책임을 져야 하는 것도 아니고, 하나의 답으로 충분하지도 않을 것이다. |
심리학은 여러 요인으로 인해 재현성 위기 논쟁의 중심에 섰으며, 의학, 경제학, 수자원 관리 등 다양한 과학 분야에서도 재현성 문제가 나타나고 있다.
과학의 정밀도 제어 메커니즘에서 발생할 수 있는 위기의 예측은 수십 년 동안, 특히 science and technology studies|과학 기술학영어(STS) 분야 학자들 사이에서 있었다. scientometrics|과학 계량학영어의 아버지로 여겨지는 Derek de Solla Price|데릭 데 솔라 프라이스영어는 과학이 자체적인 지수적 성장의 결과로 '노쇠'할 것이라고 예측했다.[278]
심리학자이자 과학사학자인 Jerome R. Ravetz|제롬 R. 라베츠영어는 1971년에 출판된 저서 ''Scientific knowledge and its social problems|과학적 지식과 사회적 문제영어''에서 과학은 질 관리를 위한 내부 시스템에 큰 문제에 시달릴 것이라고 예측했다.
역사학자 Philip Mirowski|필립 미로스키영어는 2011년 저서 ''Science Mart''에서 과학의 상품화를 지적했다.[281] 미로스키는 과학의 쇠퇴를 기업이 자체 업무를 대학에 아웃소싱하기 위해 기업 내 연구실을 폐쇄한 결정에 기인한다고 주장하고 있다.
과학의 질을 관리하는 시스템의 위기는 정책에서의 과학 이용에도 영향을 미치고 있다. 이는 증거 기반 정책(evidence based policy)에서 현재의 긴장점을 식별하는 STS 과학자 집단에 의한 최근 논문에서 언급되었다.[282][283]
3. 과학 분야별 현황
2016년 ''네이처''의 설문 조사에 따르면, 많은 연구자가 다른 과학자의 실험을 재현하는 데 어려움을 겪었으며, 자신의 실험을 재현하는 데도 실패한 경험이 있는 것으로 나타났다. 이는 과학계 전반에 걸쳐 재현성 문제가 존재함을 시사한다.
3. 1. 심리학
심리학은 여러 요인으로 인해 재현성 위기 논쟁의 중심에 서게 되었다.[58][59] 사회 심리학에 주된 관심이 집중되었지만,[62] 임상 심리학,[63][64][65] 발달 심리학,[66][67][68] 및 교육 연구와 같은 다른 심리학 분야도 재현성 위기에 연루되었다.[69][70][71][72][73]재현성 프로젝트: 심리학은 심리학 분야의 재현성을 평가하기 위한 경험적 연구였다. 2015년에 발표된 이 프로젝트는 브라이언 노섹의 지휘 아래, 세 개의 주요 심리학 저널(''성격 및 사회 심리학 저널'', ''실험 심리학 저널: 학습, 기억 및 인지'', ''심리 과학'')에 게재된 100개의 연구를 재현했다. 원래 연구의 97%가 유의미한 결과를 보였지만, 재현 연구에서는 36%만이 유의미한 결과(''p'' 값 0.05 미만)를 얻었다.[11] 재현 연구의 평균 효과 크기는 원래 연구의 절반 수준이었다.
이 연구는 또한 저널 및 학문에 따른 재현율과 효과 크기를 조사했다. 연구 재현율은 ''성격 및 사회 심리학 저널''에서 23%, ''실험 심리학 저널: 학습, 기억 및 인지''에서 48%, ''심리 과학''에서 38%였다. 인지 심리학 분야의 연구는 사회 심리학 분야의 연구보다 높은 재현율(50%)을 보였다.[74]
재현되지 않은 연구 중 25%만이 원래 결과를 반증했다. 나머지 49%는 결론을 내릴 수 없었는데, 이는 많은 재현 연구가 원래 연구보다 작은 표본으로 진행되어 통계적 검증력이 부족했기 때문이다.[75]
2018년 ''네이처 인간 행동''에 발표된 연구에서는 ''네이처''와 ''사이언스''에 발표된 21개의 사회 및 행동 과학 논문을 재현한 결과, 약 62%만이 원래 결과를 성공적으로 재현했다.[76][77]
개방 과학 센터가 후원한 또 다른 연구에서는 6개 대륙 36개국 186명의 연구팀이 심리학의 28개 발견을 재현했다.[78][79] 이 연구에서는 50%의 발견이 재현에 실패했지만, 재현에 성공한 발견은 대부분의 표본에서 일관되게 재현되었다. 이는 재현 실패가 표본 변화 때문이라는 주장을 반박하는 증거이다.[79]
2022년 연구는 많은 초기 뇌–표현형 연구("뇌 전체 연관 연구"(BWAS))가 작은 효과 크기 때문에 수천 명의 표본이 필요하며, 따라서 유효하지 않은 결론을 도출했을 가능성을 제시했다.[80][81]
2016년 1,500명의 과학자를 대상으로 한 조사에서 70%가 다른 연구자의 실험을 재현하는 데 실패했고, 50%는 자신의 실험조차 재현하지 못했다.[237]
2009년에는 과학자의 2%가 연구 조작(=과학 부정 행위의 일종)을 한 적이 있으며, 14%는 그러한 조작을 한 사람을 알고 있다고 인정했다. 특히 의학 연구자들이 실험 처리 오류를 더 빈번하게 보고했다.[238]
심리학에서 재현성 위기가 발생한 주요 원인 중 하나는 의심스러운 연구 관행(questionable research practices, QRPs영어)이다. 이는 고의적인 조작은 아니지만, 데이터 선택 보고, 부분 출판, 임의 중단, p값 반올림, 파일 서랍 효과(file drawer effect영어), 사후 스토리 전개, 이상치 조작 등 다양한 방식으로 나타난다.[245][246][247][248] 2000명 이상의 심리학자를 대상으로 한 설문 조사에서 상당수가 적어도 하나의 QRP를 사용한 경험이 있다고 인정했다.[245]
또한 심리학, 특히 사회 심리학은 연구 부정 스캔들에 휘말리기도 했다. 가장 대표적인 사례는 디데릭 스타펄(Diederik Stapel)의 데이터 조작 사건이다.[250]
다니엘 카너먼은 재현성 노력을 위해 원저자가 참여해야 한다고 주장했지만,[265] 다른 과학자들은 방법론을 자세히 기술해야 한다고 주장한다. 2012년 조사에 따르면 원저자와 협력한 재현 연구의 성공률(91.7%)이 그렇지 않은 경우(64.6%)보다 높았다.[266]
3. 2. 의학
1990년부터 2003년까지 1,000회 이상 인용된 49건의 의학 연구 중 92%가 연구된 치료법이 효과적이라고 결론지었다. 이 연구들 중 16%는 후속 연구에서 반박되었고, 16%는 후속 연구보다 더 강력한 효과를 발견했으며, 44%는 재현되었고, 24%는 대체로 이의가 제기되지 않았다.[82] 2011년 제약 회사 바이엘(Bayer)의 연구원들이 분석한 결과, 바이엘 내부 연구 결과의 최대 1/4만이 원래 결과를 재현했다.[83] 그러나 바이엘의 결과 분석에 따르면 재현된 결과는 임상 적용에 성공적으로 사용될 수 있는 경우가 많았다.[84]2012년 C. 글렌 베글리(C. Glenn Begley)와 텍사스 대학교의 의학 연구원인 리 엘리스(Lee Ellis)는 53건의 전임상 암 연구 중 11%만이 원래 연구의 결론을 확인할 수 있는 재현성을 보였다는 것을 발견했다.[85] 2021년 말, '재현성 프로젝트: 암 생물학'은 2010년에서 2012년 사이에 출판된 53개의 주요 암 관련 논문을 검토한 결과, 다시 수행하기에 충분한 정보를 제공한 연구 중에서 효과 크기가 평균적으로 원래 결과보다 85% 작다는 것을 보여주었다.[86][87] 암 연구자들을 대상으로 한 설문 조사에서 절반이 출판된 결과를 재현할 수 없었다.[88] 또 다른 보고서는 거의 절반의 무작위 대조 시험에 결함 있는 데이터가 포함되어 있다고 추정했다(150개 이상의 시험에서 익명화된 개별 참가자 데이터(IPD) 분석을 기반으로 함).[89]

2016년 1,500명의 과학자를 대상으로 한 조사에 따르면, 70%의 연구자가 다른 사람의 실험 재현에 실패했으며, 50%의 연구자는 자신의 연구 재현에도 실패했다. 이 수치는 분야에 따라 다르다.[237]
분야 | 다른 사람이 수행한 실험 재현 실패 비율 | 자신이 수행한 실험 재현 실패 비율 |
---|---|---|
화학 | 90% | 60% |
생명 과학 | 80% | 60% |
물리학과 공학 | 70% | 50% |
의학 | 70% | 60% |
지구 과학과 환경 과학 | 60% | 40% |
2009년에는 과학자의 2%가 적어도 한 번은 (자신이) 《연구 조작》(=과학 부정 행위의 일종)을 저질렀으며, 과학자의 14%는 그러한 조작을 저지른 사람을 개인적으로 알고 있다고 인정했다. "(실험) 처리의 오류"는 (다른 분야에 비해) 의학 연구자 쪽이 더 빈번하게 보고하고 있다.[238]
3. 3. 경제학
경제학은 재현율을 평가하고 재현을 시도하는 연구의 수를 늘리려는 시도에서 다른 사회 과학 및 심리학에 뒤쳐져 있다.[91] 2016년 사이언스지에 실린 한 연구는 2011년에서 2014년 사이에 실험 연구 18건을 재현했는데, 이는 아메리카 경제 리뷰와 쿼터리 저널 오브 이코노믹스 등 주요 경제학 저널에 게재된 연구였다. 이 연구에 따르면 약 39%가 원래 결과를 재현하는 데 실패했다.[182][92][93] 아메리카 경제 리뷰에 게재된 연구 중 약 20%는 동일하거나 유사한 데이터 세트에 의존했음에도 불구하고 다른 연구와 모순된다.[94] 전략 경영 저널의 실증적 연구 결과에 대한 연구에 따르면, 재실험된 27개의 논문 중 약 30%는 이전에 유의미한 결과에 대해 통계적으로 유의하지 않은 결과를 보였고, 약 4%는 이전에 유의미하지 않은 결과에 대해 통계적으로 유의미한 결과를 보였다.[95]사회과학 분야 중 심리학 외에도 사회학이나 경제학 등은 자연과학과의 비교에서 용어 정의가 모호하고 연구 재현성도 낮다는 문제가 지적되고 있다. 그 때문에 미국 국립 보건원은 일부 사회과학 분야의 현상 시정 방향성을 제시하는 전략을 발표했다.[236] 불최적화는 특히 문제가 많으며, 사회과학에 불 최적화를 도입하는 것은 논리 실증주의의 시대착오적인 사고방식과 비슷하다. 그 무비판적인 적용은 재현성 위기의 한 원인이 되고 있다.[271]
3. 4. 수자원 관리
2019년 ''사이언티픽 데이터''에 게재된 연구에 따르면, 2017년에 발표된 물 자원 및 관리에 관한 논문 1,989개 중 연구 결과를 재현할 수 있는 것은 95% 신뢰 수준으로 추정했을 때 0.6%에서 6.8%에 불과하며, 이는 주로 논문에서 재현을 위한 충분한 정보를 제공하지 않았기 때문인 것으로 나타났다.[96]- '''사전 등록, 데이터, 프로그래밍 코드의 오픈 소스 공개'''는 재현성 위기에 대한 효과적인 대책으로 여겨지며, 실행 가능한 비교 횟수가 밝혀지지 않는 한, 문제의 근원 중 하나인 p값의 유의성을 설명해서는 안 된다.[298][299]
- 기계 학습 논문에서 사용되는 데이터 세트에 대한 보고[300]의 엄격성과 투명성을 높임으로써, 거의 확실하게 개선할 수 있다. 이를 위해, 논문 검색 엔진 Consensus는 엄격성과 투명성 지수를 갖추고 있으며, 그 자체가 기계 학습과 자연어 처리의 산물이다.[301][302]
3. 5. 기타 분야
영양 과학에서 대부분의 식품 성분이 암 위험에 영향을 미친다는 연구 결과가 있었다. 요리책에서 무작위로 추출한 50가지 성분 중 80%가 암 위험에 대한 기사를 가지고 있었지만, 메타 분석의 경우 통계적 유의성은 감소했다.[90]2016년 1,500명의 과학자를 대상으로 한 조사에 따르면, 70%의 연구자가 다른 사람의 실험 재현에 실패했으며, 50%의 연구자는 자신의 연구 재현에도 실패했다. 이 수치는 분야에 따라 달랐다.[237]
분야 | 다른 사람이 수행한 실험에 실패한 적이 있는 사람의 비율 | 자신이 수행한 실험에 실패한 적이 있는 사람의 비율 |
---|---|---|
화학 | 90% | 60% |
생명 과학 | 80% | 60% |
물리학과 공학 | 70% | 50% |
의학 | 70% | 60% |
지구 과학과 환경 과학 | 60% | 40% |
2009년에는 과학자의 2%가 적어도 한 번은 연구 조작(=과학 부정 행위의 일종)을 저질렀으며, 과학자의 14%는 그러한 조작을 저지른 사람을 개인적으로 알고 있다고 인정했다. "처리 오류"는 (다른 분야에 비해) 의학 연구자 쪽이 더 빈번하게 보고되고 있다.[238]
인공지능 분야의 기계 학습 예측 정확도는 과대 평가될 수 있으며,[272] 기계 학습이 부적절하게 수행될 경우 재현성 및 정보 유출 문제가 발생할 수 있다.[273][274][275] 또한, 룬드 대학교 연구자에 따르면 주성분 분석은 기계 학습에서 재현성이 없을 수 있으므로 사용할 때 특별한 주의가 필요하다.[276]
4. 원인
심리학은 여러 요인으로 인해 논쟁의 중심에 서게 되었다.[58][59] 사회적 점화와 자아 고갈[60]과 같이 한때 확실하다고 여겨졌던 심리학의 일부 분야는 재현 실패로 인해 더욱 면밀한 조사를 받게 되었다.[61] 주된 관심은 사회 심리학에 집중되었지만,[62] 임상 심리학,[63][64][65] 발달 심리학,[66][67][68] 및 교육 연구와 같은 다른 심리학 분야도 연루되었다.[69][70][71][72][73]
2015년 8월, 심리학 분야의 재현성에 대한 최초의 공개적인 경험적 연구가 재현성 프로젝트: 심리학이라는 이름으로 발표되었다. 브라이언 노섹이 조정하여, 연구자들은 세 개의 유력한 심리학 저널(''성격 및 사회 심리학 저널'', ''실험 심리학 저널: 학습, 기억 및 인지'', ''심리 과학'')에서 심리학 분야의 100개의 연구를 다시 수행했다. 원래 연구의 97개는 유의미한 결과를 보였지만, 그 중 재현 연구에서 유의미한 결과(''p'' 값 0.05 미만)를 얻은 것은 36%에 불과했다.[11] 재현 연구의 평균 효과 크기는 원래 연구에서 보고된 효과의 약 절반 수준이었다. 같은 논문에서는 저널과 학문에 따른 재현율과 효과 크기를 조사했다. 연구 재현율은 ''성격 및 사회 심리학 저널''의 경우 23%, ''실험 심리학 저널: 학습, 기억 및 인지''의 경우 48%, ''심리 과학''의 경우 38%였다. 인지 심리학 분야의 연구는 사회 심리학 분야의 연구보다 높은 재현율(50%)을 보였다.[74]
2018년 ''네이처 인간 행동''에 발표된 한 연구는 ''네이처''와 ''사이언스''에서 발표된 21개의 사회 및 행동 과학 논문을 재현하여, 약 62%만이 원래 결과를 성공적으로 재현할 수 있음을 발견했다.[76][77] 개방 과학 센터의 후원하에 진행된 또 다른 연구에서는 6개 대륙, 36개 국적의 60개 연구소, 186명의 연구팀이 심리학의 28개 고전 및 현대 발견을 재현했는데, 50%가 재현에 실패했다.[78][79]
2022년 연구 결과에 따르면, 많은 초기 뇌–표현형 연구("뇌 전체 연관 연구"(BWAS))가 작은 효과 크기로 인해 수천 명의 개인 표본이 필요하므로, 유효하지 않은 결론을 도출했다는 것을 시사한다.[80][81]
이러한 재현성 위기는 다양한 원인에 의해 발생한다.
- 연구 관행 문제: 실험 재현 실패는 심리학뿐만 아니라 과학의 모든 영역에서 발견되지만,[244] 심리학, 특히 사회 심리학 분야는 의심스러운 연구 관행(QRPs)과 연구 부정 스캔들로 인해 더 큰 주목을 받았다.[250]
- 통계적 문제점: 낮은 통계적 검정력, 효과 크기 편향, p-해킹, 다중 비교 문제, 통계적 이질성 등이 재현성 위기를 야기하는 주요 통계적 문제점으로 지적된다.
- 출판 시스템의 문제: "게시하거나 망하는 절박함"을 초래하는 출판 시스템, 그리고 이에 따르는 좋은 과학적 관행을 따르지 못하게 함으로써 재현성 위기가 촉발될 수 있다.
- 기타 원인: 맥락 민감성, 베이지안 설명, 귀무 가설 검정의 문제점, 기저율 오류 등도 재현성 위기의 원인으로 제기된다.
글렌 베글리(Glenn Begley)와 존 이오아니디스(John Ioannidis)는 2015년에 출판된 논문에서 현재 과학의 어려움을 요약하기 위해 다음 5가지 요점을 제시했다.[277]
- 새로운 데이터의 생성/전례 없는 속도로의 출판
- 거의 장기적으로는 칭찬받을 수 없을 발견의 증거 강요
- 원인: 좋은 과학적 관행의 정착 실패와, 출판 아니면 죽음(publish or perish)이라는 절망
- 이는 많은 요소와 많은 이해 관계자가 존재하는 문제이다.
- 한 집단이 단독으로 책임을 져야 하는 것도 아니고, 하나의 답으로 충분하지도 않을 것이다.
재현성은 "과학의 초석"으로 불려왔지만,[9][10] '재현'의 정의에 대한 합의는 부족하다.[11][91][12] 재현성 위기가 해당 분야가 비과학적임을 의미하는 것은 아니며,[15][16][17] 오히려 과학적 과정의 일부이다.[18][19]
4. 1. 출판 시스템의 문제점
재현성 위기는 "전례 없는 속도로 새로운 데이터와 과학 출판물이 생성"되어 "게시하거나 망하는 절박함"을 초래하고, 훌륭한 과학적 관행을 따르지 못하게 함으로써 촉발될 수 있다.[102] 과학의 품질 관리 메커니즘에 임박한 위기에 대한 예측은 수십 년 전으로 거슬러 올라간다.[103]낮은 재현성의 주요 원인은 통계적으로 유의미하지 않은 결과와 독창성이 없어 보이는 재현 연구가 거의 출판되지 않는다는 사실에서 비롯된 출판 편향이다.[111][112] 이는 재현 연구의 보고 또는 수행 시도를 장려하지 않는다. 2016년 ''네이처''가 설문 조사한 1,576명의 연구자 중 재현 연구를 출판하려 시도한 사람은 소수에 불과했다.[5][97] 출판 편향은 출판 경쟁과 저자의 확증 편향에 의해 더욱 심화된다.[39]
출판 편향은 파일 서랍 효과를 초래한다.[26] 파일 서랍 효과는 출판 편향의 결과로, 상당수의 부정적인 결과가 출판되지 않는다는 것이다. 이는 "오도하는 문헌과 편향된 메타 분석 연구"를 낳는 경향이 있다.[26]
대중 매체에는 출판 편향의 또 다른 요소가 있다. 즉, 연구 결과를 대중에게 쉽게 알리려는 욕구는 연구 결과를 지나치게 단순화하고 과장하여 비현실적인 기대를 만들고 재현 실패의 영향을 증폭시킨다. 반면에, 귀무 결과와 재현 실패는 보고되지 않는 경향이 있다.[115]
출판 편향의 재현성에 대한 결과는 학계의 "출판 아니면 죽음" 문화에 의해 악화된다. "출판 아니면 죽음" 문화는 과학자들이 인정받는 저널에 연구를 게재해야 한다는 압박이 매우 높은 환경에서 일하는 학계의 사회학적 측면이다. 이것은 학문적 작업 환경이 과도하게 경쟁적이며 서지 계량적 매개변수(예: 출판물 수)가 과학적 경력을 평가하는 데 점점 더 많이 사용되기 때문이다.[118] 이는 과학자들이 결과를 "출판 가능"하게 만드는 것을 목표로 하는 여러 전략을 사용하도록 밀어붙인다.[118]
오픈 사이언스 센터(Center for Open Science) 설립자 브라이언 노섹은 "출판 아니면 죽음" 문화가 단일 과학자의 목표와 가치(예: 출판 가능성)가 과학의 일반적인 목표(예: 과학적 진리 추구)와 일치하지 않는 상황을 만들었고, 이것은 출판된 연구 결과의 타당성에 해롭다고 하였다.[119]
일부 출판 관행 또한 재현을 어렵게 만들고 재현성 위기의 심각성을 모니터링하는 것을 어렵게 만드는데, 연구 논문들이 종종 다른 학자들이 연구를 재현하기에 충분하지 않은 설명을 제공하기 때문이다. 재현성 프로젝트: 암 생물학은 2010년에서 2012년 사이에 출판된 암에 관한 53개의 주요 논문에서 193개의 실험 중 23개의 논문에서 50개의 실험만이 연구자들이 연구를 수정하여 다시 수행할 수 있을 만큼 충분한 정보를 저자가 제공했다는 것을 보여주었다. 조사된 193개의 논문 중 실험 프로토콜이 완전히 설명된 논문은 없었으며, 실험의 70%를 재현하려면 핵심 시약을 요청해야 했다.[86][87]
4. 2. 통계적 문제점
통계적 가설 검정에서 귀무 가설()과 대립 가설()이 존재한다. 귀무 가설은 일반적으로 "X와 Y는 통계적으로 독립" 형태를 띤다. 예를 들어, "약물 X 복용이 질병 Y의 1년 회복률에 영향을 주지 않는다"는 귀무 가설이 될 수 있으며, 회복률이 변한다는 것이 대립 가설이 된다.완전한 통계적 독립성을 검증하기는 어렵기 때문에, 귀무 가설은 종종 "효과 크기는 0이다"라는 단순화된 형태로 사용된다. 여기서 "효과 크기"는 완전한 귀무 가설이 참일 때 0이 되는 값이다.[23] 예를 들어, X가 이진 변수일 때 효과 크기는 X 변화에 따른 Y의 기댓값 변화로 정의할 수 있다.
:
효과 크기는 직접 관찰할 수 없으므로, 통계적 추정량을 통해 측정해야 한다. 예를 들어, 위 효과 크기는 코헨의 d 추정량을 사용하여 측정할 수 있다. 효과 크기에 대한 추정량이 통계적 검정에 사용될 때, 이를 '''검정 통계량'''이라고 한다.
귀무 가설 '''검정'''은 데이터를 입력받아 또는 을 출력하는 절차이다. 을 출력하면 "통계적으로 유의미한 효과가 있다" 또는 "귀무 가설이 기각되었다"라고 한다.
귀무 가설 검정에는 음성 오류, 참 음성, 양성 오류, 참 양성의 네 가지 결과가 가능하다. 음성 오류는 이 참이지만 검정 결과가 인 경우이다. 참 음성은 이 참이고 검정 결과도 인 경우이다.
을 기각할 확률 | 을 기각하지 않을 확률 | |
---|---|---|
만약 가 참이면 | α | 1-α |
만약 가 참이면 | 1-β (검정력) | β |
'''유의 수준''' (α)은 귀무 가설이 참일 때 대립 가설이 참이라고 결론 내릴 확률이다.
:
'''통계적 검정력'''(1-β)은 대립 가설이 참일 때 대립 가설이 참이라고 결론 내릴 확률이다.
:
'''p-값'''은 귀무 가설 하에서 검정 통계량이 관찰된 값 이상으로 극단적일 확률이다.
:
귀무 가설이 참이면 p-값은 [0, 1]에서 균등하게 분포된다. p-값을 계산하고 이면 을 출력하여 유의 수준 에서 통계적 검정을 구성할 수 있다.
낮은 통계적 검정력연구가 재현에 실패하는 이유 중 하나는 낮은 통계적 검정력 때문이다.[14] 낮은 검정력은 다음과 같은 세 가지 문제를 야기한다.
- 재현 연구 자체가 참된 효과를 탐지할 확률이 낮아진다.
- 원래 연구의 낮은 검정력은 편향된 효과 크기 추정치를 유발한다.
- 원래 연구의 낮은 검정력은 통계적으로 유의미한 결과가 참된 효과를 반영할 확률을 낮춘다.
수학적으로, 귀무 가설 을 기각한 이전 연구를 재현할 확률은 다음과 같다.
:
유의 수준이 검정력보다 작다고 가정하면, 검정력이 낮으면 재현 확률이 낮아진다.[75]
심리학 연구의 평균 통계적 검정력은 33.1%에서 36.4% 사이로, 적절한 검정력(80%)에 비해 매우 낮다.[14] 신경과학 연구의 통계적 검정력 역시 매우 낮다.[134][121]
효과 크기 편향연구가 재현되더라도, 재현 연구는 일반적으로 더 작은 효과 크기를 보인다. 검정력이 낮은 연구는 큰 효과 크기 편향을 갖는다.[140]
데이터 세트가 작을 때는 노이즈가 회귀 계수를 과대평가하는 경향이 있다.[141]
p-해킹 및 다중 비교 문제다양한 통계적 방법들이 p-값을 실제보다 작게 보이도록 사용될 수 있다. 연구에서 사용되는 유연한 데이터 분석은 거짓 양성률을 60% 이상으로 높일 수 있다.[39]
예를 들어, 여러 유의성 검정을 적용하고 p-값이 0.05 미만인 것만 발표하면, "적어도 하나의 유의성 검정이 p < 0.05에 도달함"에 대한 총 p-값은 0.05보다 훨씬 커진다.
선택적 중단은 특정 기준에 도달할 때까지 데이터를 수집하는 관행이다. 이는 p-값을 실제보다 크게 만들 수 있다. 귀무 가설이 참이라면, 원하는 p-값을 얻을 때까지 데이터를 수집하고 중단하여 어떤 유의 수준도 달성할 수 있다.[147]
통계적 이질성연구가 재현에 실패하는 또 다른 이유는 재현하려는 효과의 높은 이질성이다. 이질성은 단일한 실제 효과 크기가 없는 경우 연구 결과의 분산을 의미한다.[14] 이질성은 실험 방법, 모집단, 통계적 방법의 차이로 인해 발생하며, 재현 연구에서 원래 연구와 다른 효과 크기를 발견할 가능성을 높인다.
직접/정확한 복제에서도 상당한 수준의 이질성이 발견된다. 심리적 효과 재현 연구에서 16가지 효과 중 8가지에서 상당한 이질성이 발견되었다.[14]
4. 3. 연구 관행 문제
의문스러운 연구 관행(QRP)은 용인 가능한 과학적 행동의 회색 지대를 활용하거나 연구자 자유도(연구자 DF)를 악용하는 의도적인 행동으로, 허위 긍정 결과의 가능성을 높여 재현 불가능성에 기여할 수 있다.[124][125][39] 연구자 DF는 가설 형성, 실험 설계, 데이터 수집 및 분석, 연구 보고에서 나타난다.[125]QRP의 몇 가지 예는 다음과 같다.
- 데이터 긁어내기[125][126][38](data dredging영어): p''-해킹'' 또는 p''-피싱''이라고도 하며, 다양한 기술을 통해 데이터가 부적절한 가설에 대한 지원을 찾는 데이터 오용이다.[127]
- 선택적 보고[124][125][126][38](selective reporting영어): ''부분적 출판''이라고도 한다. 보고는 사용되거나 악용된 모든 연구자 자유도를 공개할 기회이다. 선택적 보고는 일부 독립 및 종속 변수, 누락된 데이터, 데이터 제외 및 이상치 제외와 같은 관련 세부 정보 또는 선택 사항을 보고하지 않는 것이다.[125]
- HARKing[125][126][38](HARKing영어): 결과가 알려진 후 가설 설정. ''사후 이야기''라고도 하며, 탐색적 분석이 확인적 분석으로 간주될 때 발생한다. 연구가 완료된 후 가설을 변경하여 새로운 가설이 실험 결과에 의해 확인될 수 있도록 하는 것이다.[125]
의학에서 재현 불가능한 연구의 공통적인 특징은 다음과 같다.[128]
특징 |
---|
실험 대 대조군에 대한 연구자의 눈가림 실패 |
실험 반복 실패 |
양성 대조군과 음성 대조군 부족 |
모든 데이터 보고 실패 |
부적절한 통계적 검사 사용 |
적절하게 검증되지 않은 시약 사용 |
QRP는 데이터 위조와 같은 과학적 무결성에 대한 보다 명백한 위반을 포함하지 않는다.[124][125] 디에데릭 스테이플,[129][13] 마크 하우저, 로렌스 산나의 과학적 사기와 같은 사기 연구가 발생하지만, 드문 경우로 보인다.[13]
인디애나 대학교(IU)의 어니스트 오보일 교수와 심리학자 마틴 괴츠에 따르면, 다양한 연구에서 설문조사를 받은 연구자의 약 50%가 HARKing을 했다고 인정했다.[130] 행동 과학자 레슬리 K. 존과 동료들이 심리학자 2,000명을 대상으로 한 설문조사에서 약 94%의 심리학자가 적어도 하나의 QRP를 사용했다고 인정했다. 구체적으로, 63%는 연구의 모든 종속 변수를 보고하지 않았다고 인정했고, 28%는 연구의 모든 조건을 보고하지 않았으며, 46%는 원하는 결과 패턴을 생성한 연구만 선택적으로 보고했다고 인정했다. 또한, 56%는 이미 수집된 데이터를 검토한 후 더 많은 데이터를 수집했다고 인정했으며, 16%는 원하는 결과가 이미 나타났기 때문에 데이터 수집을 중단했다고 인정했다.[38] 생명공학 연구원 J. 레슬리 글릭은 1992년에 연구 개발 연구의 10%에서 20%가 QRP 또는 명백한 사기를 포함한다고 추정했다.[131] QRP를 추정하는 데 사용된 방법론은 논란의 대상이 되었으며, 최근 연구에서는 평균적으로 더 낮은 유병률을 시사했다.[132]
2009년의 메타 분석에 따르면, 여러 분야의 과학자 중 2%가 최소 한 번 연구를 조작했다고 인정했으며, 14%는 그렇게 한 사람을 알고 있다고 인정했다. 한 연구에 따르면, 이러한 부정행위는 다른 분야보다 의학 연구자들에 의해 더 자주 보고되었다.[133]
4. 4. 기타 원인
재현성은 "과학의 초석"으로 불려왔다.[9][10] 그러나 '재현'과 관련된 개념을 정의하는 방법에 대한 합의는 제한적이다.[11][91][12] 재현성 위기가 반드시 해당 분야가 비과학적임을 의미하는 것은 아니며,[15][16][17] 오히려 오래된 아이디어나 면밀한 조사를 견딜 수 없는 아이디어를 제거하는 과학적 과정의 일부이다.[18][19] 그러나 이 제거 과정이 항상 효과적인 것은 아니다.[20][21]재현성 위기의 다른 원인으로는 맥락 민감성, 베이지안 설명, 귀무 가설 검정의 문제점, 기저율 오류 등이 제기된다.
- 맥락 민감성: 특정 심리적 효과는 맥락에 민감하며, 재현 실패는 원래 실험과 재현 간의 맥락적 차이, 즉 "숨겨진 조절 변인"으로 설명될 수 있다.[154] 오픈 사이언스 협업의 재현성 프로젝트 데이터를 재분석한 결과, 맥락 민감성이 높을수록 효과를 재현할 확률이 낮았다.[11] 맥락 민감성은 다른 요인들을 조정한 후에도 재현 성공과 유의미한 상관관계를 보였다.[154]
- 베이지안 설명: 베이즈 정리에 따르면, 유의 수준 5%에서 귀무 가설을 기각하는 것이 대립 가설의 사후 확률이 95%임을 의미하지 않으며, 사후 확률은 재현 확률과도 다르다.[155][147] 재현 확률은 검정력과 대립 가설의 사전 확률에 따라 증가하며, 대립 가설의 사전 확률이 작다면 재현을 위해서는 높은 검정력이 필요하다.
- 귀무 가설 검정의 문제점: 특히 사회 심리학과 같은 "소프트 사이언스" 분야에서 귀무 가설 검정이 부적절하다는 주장이 제기된다.[156][200] 복잡한 시스템에서는 "귀무 가설은 항상 거짓"이거나 "모든 것은 상관관계가 있다"는 관찰이 있으며,[157] 귀무 가설이 기각되지 않더라도 이는 귀무 가설이 참임을 보여주는 것이 아니라 낮은 검정력으로 인한 위음성일 수 있다.[158] 또한, 귀무 가설이 기각될 때, 이는 실질적인 대립 가설에 대한 증거가 아닐 수 있다.
- 기저율 오류: 알렉산더 버드는 특정 과학 분야에서 재현성이 낮은 이유 중 하나는 검증된 가설의 대다수가 ''사전적(a priori)''으로 거짓이기 때문이라고 주장한다.[162] 이 관점에서 낮은 재현성은 양질의 과학과 일치할 수 있다.
과학 철학적 관점에서 뒤엠-콰인 명제는 과학적 결과가 실질적인 이론과 기기 이론 모두에 의해 해석된다는 점을 지적한다.[122] 또한, 과학적 실천의 문화 진화 모델은 특정 매개변수 설정 하에서 연구실 집단이 매우 높은 가양성 비율을 감수하더라도 최대 생산성에 수렴할 수 있음을 보여준다.[123]
5. 영향 및 대응
심리학은 여러 요인으로 인해 논쟁의 중심에 섰다.[58][59] 사회적 점화, 자아 고갈[60] 등 한때 확실하다고 여겨졌던 심리학의 일부 분야는 재현 실패로 인해 더욱 면밀한 조사를 받게 되었다.[61] 주된 관심은 사회 심리학에 집중되었지만,[62] 임상 심리학,[63][64][65] 발달 심리학,[66][67][68] 교육 연구 등 다른 심리학 분야도 연루되었다.[69][70][71][72][73]
2015년 8월, 브라이언 노섹이 조정하고 재현성 프로젝트: 심리학라는 이름으로 심리학 분야 재현성에 대한 최초의 공개적인 경험적 연구가 발표되었다. 연구자들은 세 개의 유력한 심리학 저널에서 100개의 연구를 다시 수행했다. 원래 연구의 97개는 유의미한 결과를 보였지만, 재현 연구에서 유의미한 결과를 얻은 것은 36%에 불과했다.[11] 재현 연구의 평균 효과 크기는 원래 연구의 약 절반 수준이었다. ''성격 및 사회 심리학 저널''의 재현율은 23%, ''실험 심리학 저널: 학습, 기억 및 인지''는 48%, ''심리 과학''은 38%였다. 인지 심리학(50%)이 사회 심리학(25%)보다 높은 재현율을 보였다.[74] 재현되지 않은 64% 중 25%만이 원래 결과를 반증했고, 나머지 49%는 결론을 내릴 수 없었다. 이는 많은 재현 연구가 원래 연구보다 2.5배 작은 표본으로 진행되어 통계적 검증력이 부족했기 때문이다.[75]
2018년 ''네이처 인간 행동'' 연구는 ''네이처''와 ''사이언스''에 발표된 21개의 사회 및 행동 과학 논문을 재현하여, 약 62%만이 원래 결과를 성공적으로 재현할 수 있음을 발견했다.[76][77] 개방 과학 센터 후원으로 6개 대륙 36개 국적 60개 연구소 186명 연구팀이 심리학의 28개 발견을 재현한 연구에서는, 50%가 대규모 표본에도 불구하고 재현에 실패했다. 그러나 재현되는 발견은 대부분 표본에서 재현되었고, 재현되지 않는 발견은 표본과 맥락에 거의 변화 없이 실패했다. 이는 심리학 재현 실패가 표본 변화 때문이라는 설명을 반박한다.[79] 2022년 연구는 많은 초기 뇌–표현형 연구("뇌 전체 연관 연구"(BWAS))가 작은 효과 크기로 인해 수천 명의 표본이 필요하므로 유효하지 않은 결론을 도출했음을 시사한다.[80][81]
1990년부터 2003년까지 1,000회 이상 인용된 49건의 의학 연구 중 92%가 치료법이 효과적이라고 결론지었다. 이 중 16%는 후속 연구에서 반박되었고, 16%는 효과가 더 강력했으며, 44%는 재현되었고, 24%는 대체로 이의가 제기되지 않았다.[82] 2011년 바이엘(Bayer) 연구원들은 내부 연구 결과의 최대 1/4만이 원래 결과를 재현했다고 분석했다.[83] 그러나 재현된 결과는 임상 적용에 성공하는 경우가 많았다.[84] 2012년 C. 글렌 베글리와 리 엘리스는 53건의 전임상 암 연구 중 11%만이 재현성을 보였다고 밝혔다.[85] 2021년 말, The Reproducibility Project: Cancer Biology는 2010-2012년 출판된 53개 주요 암 관련 논문 검토 결과, 충분한 정보를 제공한 연구 중 효과 크기가 평균적으로 원래 결과보다 85% 작았다고 밝혔다.[86][87] 암 연구자 대상 설문조사에서는 절반이 출판된 결과를 재현할 수 없었다.[88] 또 다른 보고서는 거의 절반의 무작위 대조 시험에 결함 있는 데이터가 포함되어 있다고 추정했다.[89]
2016년 ''네이처'' 설문조사(1,576명 연구자 대상)에 따르면, 70% 이상이 다른 과학자 실험 재현에 실패했고, 절반 이상이 자신의 실험 재현에 실패했다. 그러나 20% 미만이 자신의 연구 재현 불가 연락을 받았다. 31% 미만이 재현 실패가 원 결과 오류를 의미한다고 생각했고, 52%는 상당한 위기가 존재한다고 동의했다. 대부분은 여전히 출판된 문헌을 신뢰했다.[5][97] 2010년 Fanelli는 정신과/심리학 연구의 91.5%가 찾던 효과를 확인했으며, 이는 천문학, 지구과학보다 약 5배 높다고 결론 내렸다. 그는 "더 연성적인" 과학 분야 연구자들이 의식적, 무의식적 편향에 제약이 적기 때문이라고 주장했다. 결과 블라인드 동료 심사 초기 분석에 따르면, 생물의학 및 심리학 분야 결과 블라인드 연구의 61%가 무효 결과로 이어졌으며, 이는 이전 추정치 5~20%와 대조적이다.[99] 2021년 캘리포니아 대학교 샌디에이고 연구는 재현 불가능한 논문이 더 많이 인용될 가능성이 높고, 재현 연구 발표 후에도 종종 더 많이 인용됨을 보여준다.[100][101]
낮은 재현성의 주요 원인은 통계적으로 유의미하지 않은 결과와 독창성이 없는 재현 연구가 거의 출판되지 않는 출판 편향이다. 심리학 및 신경과학 학술 저널 중 재현 연구 투고를 명시적으로 환영하는 곳은 극히 일부이다.[111][112]
글렌 베글리와 존 이오아니디스는 2015년 논문에서 현재 과학의 어려움을 요약하는 5가지 요점을 제시했다.[277]
- 새로운 데이터의 생성과 전례 없는 속도의 출판
- 장기적으로 칭찬받기 어려운 발견에 대한 증거 강요
- 좋은 과학적 관행 정착 실패와 '출판 아니면 죽음'이라는 절망적인 상황
- 다양한 요소와 이해 관계자가 존재하는 문제
- 한 집단만의 책임이 아니며, 하나의 해결책으로 충분하지 않음
재현성은 "과학의 초석"으로,[284][285] 재현 연구는 출판된 결과가 진정한 발견인지, 거짓 양성인지 평가한다. 과학적 발견의 진실성과 연구 재현성은 미래 연구의 기초 지식을 형성하므로 중요하다.
재현성 위기 대응 방안은 다음과 같다.
- 학술 출판 개선:
- 사전 등록 보고서 사용:[286][287] 연구 프로토콜 사전 등록, 결과 상관없이 출판 보장으로 출판 편향 감소.
- 결과 블라인드 동료 심사 채택: 연구 결과 아닌 방법론 엄격성 기준으로 논문 심사, 출판 편향 감소.
- 데이터, 프로토콜, 코드 공개: 연구 투명성, 재현성 용이.
- 연구 방법론 교육 강화: 재현성 위기 중요성 인식, 재현 연구 수행 교육.
- 연구 방법론 개선:
- 실험 설계, 통계 분석 보고 개선: 명확한 보고로 재현성 향상.
- 표본 크기 확대: 통계적 검정력, 효과 크기 추정 정확성 향상.
- 통계적 방법론 개선:
- p-값 임계값 조정: ''p'' < 0.005로 낮춰 위양성률 감소.
- 베이즈 통계 활용: p-값 대체, 불확실성 명확 표현.
- 교차 검증: 과적합 문제 해결, 모델 일반화 가능성 향상.
- 재현 연구 활성화:
- 재현 연구 장려: 학술지, 연구 지원 기관 장려 및 지원.
- 재현 연구 데이터베이스 구축: 체계적 추적, 연구 중복 방지, 결과 공유.
- 원저자 참여 유도: 연구 방법 정확성 향상.
- 과학적 접근 방식 변화:
- 삼각 측량 강조: 다양한 연구 방법으로 결과 교차 검증, 인위적 결과 가능성 감소.
- 반증 과도 의존 지양: 다양한 과학적 추론 방식 고려, 단일 접근 맹신 경계.
- 복잡계 모델 고려: 정신적 변수 상호작용 고려, 선형 모델 한계 극복.
메타과학은 과학적 방법론으로 과학 자체를 연구, 과학 연구 질 향상 및 낭비 감소 목표. 메타 연구는 위기 근원 파악 및 해결 위해 지속 수행, 과학 연구 사전 등록, 임상 시험 등록, 방법론 및 보고 지침 발행, 학술 인센티브 시스템 개혁, 동료 심사 과정 개선, 통계의 오용 감소, 과학 문헌 편향 해소 등 노력으로 과학 과정 품질, 효율성 향상 기여.
5. 1. 사회적 영향
재현성 위기는 일반 대중이 과학을 덜 신뢰하게 만들 수 있다는 우려를 낳고 있다.[166] 그러나 독일에서 실시된 전국 대표 설문조사에 따르면, 독일인의 75% 이상은 과학에서의 재현 실패에 대해 들어본 적이 없는 것으로 나타났다.[167] 이 연구는 또한 대부분의 독일인이 재현 노력에 대해 긍정적으로 인식하고 있음을 보여주었다. 응답자의 18%만이 재현 불가능성이 과학을 신뢰할 수 없다는 것을 보여준다고 생각한 반면, 65%는 재현 연구가 과학의 품질 관리를 보여준다고 생각했으며, 80%는 오류와 수정이 과학의 일부라는 데 동의했다.[167]과학계의 위기는 정책 결정 과정에도 영향을 미치고 있다. 이는 증거 기반 정책(evidence based policy)의 중요성을 강조하는 과학 기술학(STS) 연구자들의 최근 논문에서 언급되었다.[282][283]
1990년부터 2003년까지 1,000회 이상 인용된 49개의 의학 연구 중 45개는 연구된 치료법이 효과적이라고 주장했다. 그러나 이 중 16%는 후속 연구에서 부정되었고, 16%는 효과가 과장되었으며, 24%는 재현되지 않았다.[239] 미국 식품의약국은 1977년부터 1990년까지 의학 연구의 10~20%에서 결함을 발견했다.[240] 암젠의 연구자들은 2012년 논문에서 암 전임상 연구의 11%만이 재현에 성공했다고 주장했다.[241][242]
글렌 베글리(Glenn Begley)와 John Ioannidis|존 이오아니디스영어는 2015년 논문에서 과학의 어려움을 요약하는 5가지 요점을 제시했다.[277]
- 새로운 데이터의 생성과 전례 없는 속도의 출판
- 장기적으로 칭찬받기 어려운 발견에 대한 증거 강요
- 좋은 과학적 관행 정착 실패와 '출판 아니면 죽음(publish or perish)'이라는 절망적인 상황
- 다양한 요소와 이해 관계자가 존재하는 문제
- 한 집단만의 책임이 아니며, 하나의 해결책으로 충분하지 않음
과학 계량학의 아버지로 여겨지는 Derek de Solla Price|데릭 데 솔라 프라이스영어는 과학이 자체적인 지수적 성장으로 인해 '노쇠'할 것이라고 예측했다.[278] 역사학자 Jerome R. Ravetz|제롬 R. 라베츠영어는 1971년 저서에서 현대 과학 시스템의 기능 부전을 예측하며, 규범과 표준을 지키는 학자 커뮤니티가 과학의 질을 유지할 것이라고 주장했다. 역사학자 Philip Mirowski|필립 미로스키영어는 2011년 저서에서 과학의 상품화를 비판하며, 기업 연구의 아웃소싱으로 인해 과학의 질이 붕괴된다고 주장했다.
5. 2. 학계의 대응
심리학 분야의 일부 연구자들은 재현성 위기가 "신뢰성 혁명"의 기반이 된다고 지적한다.[172] 이는 심리학 연구를 평가하는 기준의 변화를 의미하며, 투명성과 개방성 강조, 연구 프로젝트 사전 등록, 더 높은 증거 기준을 통한 연구 재현 등을 포함하여 과학적 주장의 강도를 개선하는 것을 목표로 한다.[172] 이러한 변화는 개별 연구자의 생산성을 감소시킬 수 있지만, 데이터 공유와 더 큰 협력을 통해 이 효과를 피할 수 있다.[172] 신뢰성 혁명은 연구 환경에 긍정적인 영향을 미칠 수 있다.[173]재현성 위기에 대한 집중은 심리학 분야에서 중요한 연구 결과를 재시험하려는 노력을 새롭게 이끌었다.[39][174] 2013년 저널 ''사회 심리학'' 특별호는 재현 연구에 초점을 맞추었다.[91]
표준화와 더불어 사용된 통계 및 실험 방법의 투명성을 요구하는 방안이 제시되었다.[175] 실험 설정에 대한 세심한 문서화는 실험의 재현성에 매우 중요하다고 여겨지며, 동물 연구에서 동물의 식단과 같이 다양한 변수가 문서화되지 않거나 표준화되지 않을 수 있다.[176]
2016년 존 요아니디스의 논문은 "왜 대부분의 임상 연구는 쓸모가 없는가"에 대해 자세히 설명했다.[177] 요아니디스는 자신이 문제로 여기는 점들을 설명하고 개혁을 촉구하며, 의료 연구가 다시 유용해지기 위한 몇 가지 사항을 제시했다. 그 예로 그는 의사, 연구자 또는 후원자의 필요가 아닌 환자 중심적(예: 환자 중심 성과 연구소)인 의학의 필요성을 제기했다.
메타과학은 과학적 방법론을 사용하여 과학 자체를 연구하는 학문이다. 이는 과학 연구의 질을 높이고 낭비를 줄이는 것을 목표로 한다. "연구에 대한 연구"와 "과학의 과학"이라고도 불리며, 연구 방법을 사용하여 연구가 어떻게 수행되고 개선할 수 있는 부분이 어디인지 연구한다. 메타사이언스는 모든 연구 분야와 관련이 있으며 "과학에 대한 조감도"라고 불리기도 한다.[178] 이오아니디스의 말처럼, "과학은 인류에게 일어난 최고의 일이지만... 더 잘할 수 있습니다."[179]
메타 연구는 위기의 근원을 파악하고 해결하기 위해 지속적으로 수행되고 있다. 위기를 해결하는 방법에는 과학 연구의 사전 등록과 임상 시험 등록뿐만 아니라, 방법론과 보고에 대한 지침을 발행하는 CONSORT 및 EQUATOR Network와 같은 기관의 설립이 포함된다. 학술적 인센티브 시스템을 개혁하고, 동료 심사 과정을 개선하고, 통계의 오용을 줄이고, 과학 문헌의 편향에 맞서 싸우고, 과학적 과정의 전반적인 품질과 효율성을 높이기 위한 노력이 계속되고 있다.
일부 저자들은 실험 방법의 불충분한 전달이 재현성 위기의 주요 원인이며, 실험 설계 및 통계 분석에 대한 더 나은 보고가 상황을 개선할 것이라고 주장해 왔다. 이러한 저자들은 통계적 사고방식에 대한 과학계의 광범위한 문화적 변화와 과학 저널 및 자금 지원 기관의 보다 강제적인 추진을 요구하는 경향이 있다.[180] 그러나 투명성 및 재현성에 대한 표준이 정량적 연구뿐만 아니라 질적 연구에도 잘못 적용될 수 있다는 우려가 제기되었다.[181]
데이터 접근성, 재현성 및 투명성에 대한 편집 정책을 도입한 비즈니스 및 경영 저널에는 ''전략 경영 저널'', ''국제 비즈니스 연구 저널'', ''경영 및 조직 검토''가 있다.[182]
심리학 분야의 출판 편향 및 데이터 마이닝에 대한 우려에 대응하여, 140개 이상의 심리학 저널이 결과 블라인드 동료 심사를 채택했다. 이 접근 방식에서 연구는 연구 결과에 따라 연구가 완료된 후에 수락되는 것이 아니라, 연구가 수행되기 전에 실험 설계의 방법론적 엄격성과 데이터 수집 또는 분석 전에 통계 분석 기법에 대한 이론적 근거를 토대로 수락된다.[183] 이 절차에 대한 초기 분석에 따르면 결과 블라인드 연구의 61%가 무의미한 결과로 이어졌으며, 이는 이전 연구의 5%에서 20% 추정치와 대조적이다.[99] 또한, 여러 국가의 여러 연구실에서 연구하는 연구자들 간의 대규모 협력이 이루어져 서로 다른 연구자들이 데이터를 공개적으로 평가할 수 있게 하는 것이 심리학 분야에서 훨씬 더 흔해졌다.[184]
과학 출판 분야에서는 사전 등록 보고서를 사용하여 재현성 위기에 대처하기 시작했다.[185][186] 사전 등록 보고서 형식에서는 연구자들이 데이터 수집 전에 연구 방법과 분석에 대한 설명을 제출해야 한다. 방법과 분석 계획이 동료 검토를 거쳐 검증되면, 연구자들이 제안된 프로토콜을 따르는지에 따라 연구 결과의 게재가 잠정적으로 보장된다. 사전 등록 보고서의 한 가지 목표는 의심스러운 연구 관행의 시행으로 이어질 수 있는 유의미한 결과에 대한 출판 편향을 피하는 것이다. 또 다른 목표는 엄격한 방법론을 갖춘 연구의 게재를 장려하는 것이다.
학술지 ''심리학 과학''은 연구의 사전 등록과 효과 크기 및 신뢰 구간의 보고를 장려해 왔다.[187] 편집장은 또한 원고를 출판하기 전에 작은 표본 크기를 사용하여 검사한 놀라운 발견에 대한 연구의 재현을 요청할 것이라고 언급했다.
5. 3. 연구 방법론 개선
심리학 분야의 출판 편향 및 데이터 마이닝에 대한 우려에 대응하여, 140개 이상의 심리학 저널이 결과 블라인드 동료 심사를 채택했다. 이 접근 방식은 연구 결과에 따라 연구가 완료된 후 수락되는 것이 아니라, 연구 수행 전 실험 설계의 방법론적 엄격성과 데이터 수집 또는 분석 전 통계 분석 기법에 대한 이론적 근거를 토대로 수락된다.[183] 이 절차에 대한 초기 분석에 따르면 결과 블라인드 연구의 61%가 무의미한 결과로 이어졌으며, 이는 이전 연구의 5%에서 20% 추정치와 대조적이다.[99] 또한, 여러 국가의 여러 연구실에서 연구하는 연구자들 간의 대규모 협력이 이루어져 서로 다른 연구자들이 데이터를 공개적으로 평가할 수 있게 하는 것이 심리학 분야에서 훨씬 더 흔해졌다.[184]과학 출판 분야에서는 사전 등록 보고서를 사용하여 재현성 위기에 대처하기 시작했다.[185][186] 사전 등록 보고서 형식에서는 연구자들이 데이터 수집 전에 연구 방법과 분석에 대한 설명을 제출해야 한다. 방법과 분석 계획이 동료 검토를 거쳐 검증되면, 연구자들이 제안된 프로토콜을 따르는지에 따라 연구 결과의 게재가 잠정적으로 보장된다. 사전 등록 보고서의 한 가지 목표는 의심스러운 연구 관행의 시행으로 이어질 수 있는 유의미한 결과에 대한 출판 편향을 피하는 것이다. 또 다른 목표는 엄격한 방법론을 갖춘 연구의 게재를 장려하는 것이다.
학술지 ''심리학 과학''(Psychological Science)은 연구의 사전 등록과 효과 크기 및 신뢰 구간의 보고를 장려해 왔다.[187] 편집장은 또한 원고를 출판하기 전에 작은 표본 크기를 사용하여 검사한 놀라운 발견에 대한 연구의 재현을 요청할 것이라고 언급했다.
연구가 얼마나 자주 반복되었는지, 원래의 연구 결과가 확인되었는지 여부를 확인할 수 있는 "간단한 방법"이 필요하다는 제안이 있었다.[164] 연구 또는 결과 수준에서 재현 가능성을 분류하고 평가하며, 제3자 확인에 대한 링크를 추가하고 평가하는 작업은 동료 심사자, 과학 저널, 또는 독자가 새로운 디지털 플랫폼이나 도구와 연계하여 수행할 수 있다.
5. 4. 통계적 방법론 개선
재현성 위기 해결을 위해 제시되는 통계적 방법론 개선 방안은 다음과 같다.- p-값 임계값 조정: 새로운 발견에 대한 통계적 유의성 기준을 ''p'' < 0.05에서 ''p'' < 0.005로 변경하자는 제안이 있다.[188] 이는 오탐률(false positive rate)을 줄일 수 있지만, 모든 문제를 해결하지 못하고 새로운 문제를 야기할 수 있다는 비판도 있다.[189]
- 베이즈 통계 활용: 베이즈 통계를 사용하여 p-값을 대체하자는 주장이 있다.[191][192] 하지만 베이즈 통계는 복잡하고, 사전 분포(prior distribution) 설정에 대한 불확실성 때문에 널리 사용되지 않는다.
- 표본 크기 확대: 원 연구보다 더 큰 표본 크기를 사용하는 것이 재현성 향상에 필요하다.[196] 발표된 연구의 효과 크기 추정치가 과장되는 경향이 있기 때문이다.[197][198][199]
- 교차 검증: 과적합 문제를 해결하기 위해 교차 검증을 사용할 수 있다.[202]
p-값 오용 문제를 해결하기 위해, "유의한"과 "비유의한"이라는 용어 사용을 지양하고, p-값과 함께 위양성 위험 지표를 제공해야 한다는 권고가 있다.[192] 또한, 특정 수준의 위양성 위험을 달성하기 위해 필요한 사전 확률을 계산하는 역 베이즈 접근 방식이 제안되었다.[195]
이러한 방법들은 통계적 유의성 개념에 대한 올바른 이해를 바탕으로 적용되어야 하며, 재현성 위기 해결을 위한 노력의 일환으로 간주되어야 한다.
5. 5. 재현 연구 활성화
재현성 위기에 대한 집중은 심리학 분야에서 중요한 연구 결과를 다시 시험하려는 노력을 새롭게 이끌었다.[39][174] 2013년 저널 ''사회 심리학'' 특별호는 재현 연구에 초점을 맞추었다.[91]표준화와 더불어 사용된 통계 및 실험 방법의 투명성을 요구하는 방안이 제시되었다.[175] 실험 설정에 대한 세심한 문서화는 실험의 재현성에 매우 중요하다고 여겨진다.[176]
2016년 존 요아니디스의 논문은 "왜 대부분의 임상 연구는 쓸모가 없는가"에 대해 자세히 설명했다.[177] 요아니디스는 자신이 문제로 여기는 점들을 설명하고 개혁을 촉구하며, 의료 연구가 다시 유용해지기 위한 몇 가지 사항을 제시했다. 그 예로 그는 환자 중심적인 의학의 필요성을 제기했다.
일부 저자들은 실험 방법의 불충분한 전달이 재현성 위기의 주요 원인이며, 실험 설계 및 통계 분석에 대한 더 나은 보고가 상황을 개선할 것이라고 주장해 왔다.[180]
데이터 접근성, 재현성 및 투명성에 대한 편집 정책을 도입한 비즈니스 및 경영 저널에는 ''전략 경영 저널(Strategic Management Journal)'', ''국제 비즈니스 연구 저널(Journal of International Business Studies)'', ''경영 및 조직 검토(Management and Organization Review)''가 있다.[182]
2016년 7월, 네덜란드 과학 연구 기구(Netherlands Organisation for Scientific Research)는 재현 연구를 위해 300만유로를 지원했다. 이 자금은 기존 데이터를 재분석하고 새로운 데이터를 수집 및 분석하여 수행되는 재현 연구를 위해 사용된다. 지원 분야는 사회 과학, 보건 연구 및 의료 혁신이다.[203]
2013년, 로라 앤 존 아놀드 재단(Laura and John Arnold Foundation)은 재현성 프로젝트(Reproducibility Project)를 시작하기 위해 오픈 사이언스 센터(The Center for Open Science)에 525만달러를 지원했다. 2017년까지, 추가로 1000만달러를 지원했다.[204] 또한, Ioannidis와 의학 과학자 스티븐 굿맨(Steven Goldman (scientist))이 운영하는 스탠퍼드 대학교의 스탠퍼드 메타 연구 혁신 센터(Meta-Research Innovation Center at Stanford)의 설립을 지원하여 과학 연구 개선 방안을 연구하도록 했다.[204] 아울러 의학 과학자 벤 골드에이커(Ben Goldacre)가 주도하는 AllTrials 이니셔티브에도 자금을 지원했다.[204]
MIT, 스탠퍼드 대학교, 워싱턴 대학교의 실험 방법론 관련 강좌를 바탕으로, 심리학 및 기타 분야의 방법론 강좌에서 독창적인 연구보다는 재현 시도를 강조해야 한다는 주장이 제기되었다.[205][206][207] 이러한 접근 방식은 학생들이 과학적 방법론을 배우는 데 도움이 되며, 과학적 발견의 재현 가능성을 테스트하는 의미 있는 과학적 발견에 대한 수많은 독립적인 재현을 제공할 것이다. 일부에서는 대학원생이 졸업하기 전에 박사 연구와 관련된 주제에 대한 고품질의 재현 시도를 출판해야 한다고 권장했다.[208]
재현 시도가 증가하고 있다는 우려가 있어 왔다.[209][210][211] 그 결과, 연구 폐기물을 초래할 수 있다.[212] 이는 체계적인 재현 시도 추적의 필요성으로 이어졌다. 그 결과, 여러 데이터베이스가 생성되었다.[213][214]
심리학자 다니엘 카네만은 심리학에서 재현 노력에 원저자가 참여해야 한다고 주장했는데, 그 이유는 출판된 방법론이 종종 너무 모호하기 때문이다.[219][220] 2012년 심리학의 재현율에 대한 조사에 따르면, 연구의 원저자와 저자가 겹치는 재현 연구에서 재현 성공률이 더 높게 나타났다[221] (저자 중복이 있는 연구에서 91.7%의 성공적인 재현율, 저자 중복이 없는 연구에서 64.6%의 성공적인 재현율).
재현성 위기는 여러 문화, 국가, 학문 분야에 걸쳐 단일 질문에 대한 자원을 모으기 위해 다양한 대규모 협력 커뮤니티의 형성 및 발전을 이끌었다.[222]
5. 6. 과학적 접근 방식 변화
마커스 머너포(Marcus R. Munafò) 심리학자와 조지 데이비 스미스(George Davey Smith) 역학자는 학술지 ''네이처''에 게재된 논문에서, 잘못된 아이디어로부터 보호하기 위해 연구가 재현뿐만 아니라 삼각 측량을 강조해야 한다고 주장한다. 이들은 재현만으로는 충분하지 않으며, 오히려 상황을 악화시킬 수 있다고 지적한다. 여러 접근 방식을 전략적으로 사용하여 하나의 질문에 답하는 삼각 측량은 각 접근 방식이 가진 고유한 가정, 강점, 약점을 고려한다. 서로 다른 방법론에서 일치하는 결과는 인위적 산물일 가능성이 적다.[224] 이들은 반증이 과학 활동의 핵심이라는 칼 포퍼의 주장에 지나치게 중점을 두는 것은 단일 접근 방식에 의존하는 발견에 대해 근거 없는 확신을 줄 수 있다고 경고하며, 피터 립턴이 제시한 "최선의 설명에 대한 추론"을 포함하여 과학자들이 실제로 일하는 방식에 대한 더 나은 설명을 고려해야 한다고 제안한다.[224]인과 관계에 대한 지배적인 과학적 및 통계적 모델은 선형 모델이다.[225] 선형 모델은 정신적 변수가 서로 독립적인 안정적인 속성이라고 가정한다. 즉, 이러한 변수는 서로 영향을 미치지 않는 것으로 예상된다. 대신, 이 모델은 변수가 관찰 가능한 결과에 독립적이고 선형적인 영향을 미칠 것이라고 가정한다.[225]
사회 과학자 세바스찬 발롯(Sebastian Wallot)과 데미안 켈티-스티븐(Damian Kelty-Stephen)은 선형 모델이 항상 적절한 것은 아니라고 주장한다.[225] 대안은 정신적 변수가 상호 의존적이라고 가정하는 복잡계 모델이다. 이러한 변수는 안정적이라고 가정하지 않고, 특정 상황에 따라 상호 작용하고 적응한다.[225] 그들은 복잡계 모델이 심리학에서 더 적절한 경우가 많으며, 복잡계 모델이 더 적절한 경우 선형 모델을 사용하면 재현 실패가 발생한다고 주장한다.[225]
재현성은 과학적 발전을 위해 원본 연구 결과를 확인하는 데 필수적이다. 그러나 재현성만으로는 재현성 위기를 해결하기에 충분하지 않다. 재현 노력은 원본 연구 결과를 지지하거나 의문을 제기하는 데 그치지 않고, 이를 수정되고 더 강력한 설명력을 가진 이론으로 대체하는 것을 목표로 해야 한다. 따라서 이러한 접근 방식은 기존 이론을 정리하고, 모든 대안 이론을 비교하며, 재현 노력을 더욱 생산적이고 이론 구축에 참여시키는 것을 포함한다.[226][227] 지리적, 역사적 및 사회적 맥락 전반에 걸쳐 결과가 일반화되는 정도를 평가하는 것도 중요하다. 이는 특히 실무자와 정책 입안자가 중요한 전략적 결정을 내리기 위해 분석을 수행하는 여러 과학 분야에 중요합니다. 재현 가능하고 반복 가능한 결과는 역사적 및 지리적 맥락을 넘어 일반화 가능성을 가장 잘 예측했으며, 이는 사회 과학의 경우 특정 시대와 장소의 결과가 개인이 보편적으로 가지고 있는 것에 대한 의미 있는 지침이 될 수 있음을 나타낸다.[228]
사전 등록, 데이터, 프로그래밍 코드의 오픈 소스 공개는 재현성 위기에 대한 효과적인 대책으로 여겨진다.[298][299]
6. 한국적 함의 및 과제
재현성 위기는 한국 사회에 여러 가지 중요한 시사점을 던져준다. 한국 과학계는 "출판 아니면 죽음"이라는 압박과 연구비 수주 경쟁 심화와 같은 구조적인 문제에 직면해 있으며[102], 이는 연구 윤리와 진실성을 저해하고 재현성 위기를 심화시키는 요인으로 작용한다.
니클라스 루만의 시스템 이론에 따르면, 과학, 경제, 미디어 등 각 시스템은 고유한 코드로 소통하지만, 과학의 미디어화[109], 상업화[106], 정치화[109][110]는 시스템 간 구조적 결합을 일으켜 원래 코드의 혼란을 초래한다.[107][108] 계량 과학의 아버지 데릭 데 솔라 프라이스는 과학의 기하급수적인 성장이 "노쇠"를 초래할 수 있다고 예측했고[103], 필립 미로스키는 과학적 품질 저하가 상업화와 관련 있다고 주장했다.[106]
이는 한국 과학계에도 시사하는 바가 크며, 연구 윤리 및 진실성 확보, 연구 시스템 개선, 건강한 과학 문화 조성을 위한 노력이 필요하다. 또한, 재현성 위기는 한국 사회의 투명성, 공정성, 신뢰 문제와도 밀접하게 관련되어 있다. 특히 사회과학 분야 연구 결과의 재현성 문제는 정책 결정 과정에서 과학적 근거의 중요성을 약화시킬 수 있으므로, 과학계뿐만 아니라 한국 사회 전반의 노력이 필요하다.
재현성 위기 해결을 위해서는 연구 윤리 강화, 연구 방법론 개선, 개방형 과학 확산, 메타 분석 개선 등 다양한 노력이 필요하다. 특히, 심리학 분야에서는 의심스러운 연구 관행 (QRPs)에 대한 문제 인식이 높아지면서, 이를 개선하기 위한 다양한 방안이 모색되고 있다.[245][246][247][248] 다니엘 카너먼과 같은 저명한 학자들은 재현성 노력을 위해 원저자가 직접 참여해야 한다고 주장한다.[265]
6. 1. 한국 과학계의 현실과 과제
재현성 위기는 "전례 없는 속도로 새로운 데이터와 과학 출판물이 생성"되고 "게시하거나 망하는 절박함"을 초래하여, 훌륭한 과학적 관행을 따르지 못하게 함으로써 촉발될 수 있다.[102]한국 과학계는 '출판 아니면 죽음'이라는 압박과 연구비 수주 경쟁 심화와 같은 구조적인 문제에 직면해 있다. 이러한 환경은 연구 윤리와 진실성을 저해하고, 결국 재현성 위기를 심화시키는 요인으로 작용한다.
니클라스 루만의 시스템 이론에 따르면, 과학, 경제, 미디어 등 각 시스템은 고유한 코드로 소통한다. 과학은 '참'과 '거짓', 경제는 '이익'과 '손실' 등으로 소통한다.[107][108] 그러나 과학의 미디어화,[109] 상업화,[106] 정치화[109][110]는 시스템 간 구조적 결합을 일으켜 원래 코드의 혼란을 초래한다.
계량 과학의 아버지 데릭 데 솔라 프라이스는 과학이 자체적인 기하급수적인 성장으로 인해 "노쇠"에 이를 수 있다고 예측했다.[103] 역사학자 필립 미로스키는 과학적 품질 저하가 상업화와 관련 있다고 주장했다.[106]
글렌 베글리와 John Ioannidis영어(존 이오아니디스)는 2015년 논문에서 과학의 어려움을 다음 5가지로 요약했다.[277]
- 새로운 데이터의 생성 및 전례 없는 속도의 출판
- 장기적으로 칭찬받을 수 없는 발견의 증거 강요
- 원인: 좋은 과학적 관행 정착 실패와, 출판 아니면 죽음(publish or perish)이라는 절망
- 다양한 요소와 이해 관계자가 존재하는 문제
- 한 집단이 단독으로 책임을 져야 하는 것도 아니고, 하나의 답으로 충분하지도 않음
제롬 R. 라베츠는 과학이 질 관리를 위한 내부 시스템에 큰 문제에 시달릴 것이라고 예측했다. 현대의 인센티브가 작용하는 과학 시스템은 기능 부전이 될 것이며, 규범과 표준을 지키려는 학자 커뮤니티가 있어야 과학의 질이 유지될 것이라고 했다. 필립 미로스키는 과학이 시장에서 거래되는 상품이 되면 질이 붕괴된다고 주장했다. 과학의 쇠퇴는 기업이 자체 업무를 대학에 아웃소싱하기 위해 기업 내 연구실을 폐쇄한 결정에 기인하며, 그 결과 기업 연구는 대학에서 더 저렴한 계약 연구 기관으로 이전되었다고 주장한다.
이는 한국 과학계에도 시사하는 바가 크다. 연구 윤리 및 진실성 확보, 연구 시스템 개선, 건강한 과학 문화 조성을 위한 노력이 필요하다.
6. 2. 한국 사회에 대한 시사점
재현성 위기는 한국 사회의 투명성, 공정성, 신뢰 문제와 밀접하게 관련되어 있다. 특히 정치, 사회 분야 연구 결과의 재현성 문제는 한국 사회에 큰 영향을 미칠 수 있다.사회과학 분야 중 심리학 외에도 사회학이나 경제학 등은 자연과학에 비해 용어 정의가 모호하고 연구 재현성이 낮다는 문제가 지적되고 있다.[236] 이는 미국 국립 보건원(NIH)이 일부 사회과학 분야의 현상 시정 방향성을 제시하는 전략을 발표하게 된 배경이 되었다.[236]
이러한 문제는 과학적 연구 결과에 대한 신뢰도를 떨어뜨리고, 정책 결정 과정에서 과학적 근거의 중요성을 약화시킬 수 있다. 따라서 재현성 위기는 과학계뿐만 아니라 한국 사회 전반의 노력이 필요한 문제라고 할 수 있다.
6. 3. 해결 방안 모색
재현성 위기를 해결하기 위한 노력은 과학계 전반에서 이루어지고 있다. 특히, 심리학 분야에서는 의심스러운 연구 관행 (QRPs)에 대한 문제 인식이 높아지면서, 이를 개선하기 위한 다양한 방안이 모색되고 있다. QRPs에는 데이터를 선택적으로 보고하거나, 부분적으로만 출판하고, 연구 중단을 임의로 결정하는 등의 행위가 포함된다.[245][246][247][248] 2000명 이상의 심리학자를 대상으로 한 설문 조사에서는 응답자의 상당수가 QRP를 사용한 경험이 있다고 인정했다.[245]다니엘 카너먼과 같은 저명한 학자들은 재현성 노력을 위해 원저자가 직접 참여해야 한다고 주장한다.[265] 원저자와 협력하면 재현 성공률이 높아진다는 연구 결과도 있다.[266] 원저자와 공동 작업하지 않은 경우의 재현 성공률은 64.6%인데 비해 원저자와 공동 작업한 연구에서의 재현 성공률은 91.7%이다.
심리학 외에도 사회학, 경제학 등 사회과학 분야 전반에서 재현성 문제가 지적되고 있다. 미국 국립 보건원(NIH)은 사회과학 분야의 현상 시정을 위한 전략을 발표하기도 했다.[236]
다음은 재현성 위기 해결을 위한 주요 방안들을 정리한 표이다.
참조
[1]
논문
Why most published research findings are false
2005-08
[2]
서적
Scientific Method
Routledge
2017-12-08
[3]
간행물
The Truth Wears Off
https://www.newyorke[...]
2020-01-30
[4]
간행물
The Crisis in Social Psychology That Isn't
https://www.newyorke[...]
2020-01-30
[5]
News Feature
1,500 scientists lift the lid on reproducibility
Springer Nature
2016-05
[6]
논문
Is the Replicability Crisis Overblown? Three Arguments Examined
2012-11
[7]
웹사이트
Reproducibility of Scientific Results
https://plato.stanfo[...]
Metaphysics Research Lab, Stanford University
2019-05-19
[8]
논문
The replication crisis has led to positive structural, procedural, and community changes
2023-07-25
[9]
논문
Most published research findings are false-but a little replication goes a long way
2007-02
[10]
논문
The Value of Direct Replication
2014-01
[11]
논문
PSYCHOLOGY. Estimating the reproducibility of psychological science
https://repository.u[...]
2015-08
[12]
논문
Shall we Really do it Again? The Powerful Concept of Replication is Neglected in the Social Sciences
SAGE Publications
[13]
논문
Psychology, Science, and Knowledge Construction: Broadening Perspectives from the Replication Crisis
Annual Reviews
2018-01
[14]
논문
What meta-analyses reveal about the replicability of psychological research
2018-12
[15]
웹사이트
Why Psychologists' Food Fight Matters
http://www.slate.com[...]
2014-07-31
[16]
웹사이트
Science Isn't Broken
https://fivethirtyei[...]
2020-01-30
[17]
웹사이트
Psychology Is Starting To Deal With Its Replication Problem
https://fivethirtyei[...]
2020-01-30
[18]
뉴스
Psychology's replication drive: it's not about you
https://www.theguard[...]
2014-05-28
[19]
논문
An Agenda for Purely Confirmatory Research
2012-11
[20]
논문
Why Science Is Not Necessarily Self-Correcting
2012-11
[21]
논문
Is the Replicability Crisis Overblown? Three Arguments Examined
2012-11
[22]
논문
Theory-Testing in Psychology and Physics: A Methodological Paradox
https://www.jstor.or[...]
1967
[23]
논문
On effect size
2012-06
[24]
논문
p-Curve and Effect Size: Correcting for Publication Bias Using Only Significant Results
2014-11
[25]
논문
P-curve: a key to the file-drawer
2014-04
[26]
논문
Philosophy of science and the replicability crisis
2019-11
[27]
논문
Automaticity of social behavior: direct effects of trait construct and stereotype-activation on action
1996-08
[28]
논문
Behavioral priming: it's all in the mind, but whose mind?
2012-01-18
[29]
웹사이트
A failed replication draws a scathing personal attack from a psychology professor
https://www.national[...]
2023-07-04
[30]
논문
Priming of social distance? Failure to replicate effects on social and food judgments
2012-08-29
[31]
논문
Two failures to replicate high-performance-goal priming effects
2013-08-16
[32]
논문
Priming intelligent behavior: an elusive phenomenon
2013-04-24
[33]
논문
Investigating Variation in Replicability
2014-05
[34]
논문
Feeling the future: experimental evidence for anomalous retroactive influences on cognition and affect
2011-03
[35]
논문
Why psychologists must change the way they analyze their data: the case of psi: comment on Bem (2011)
2011-03
[36]
논문
Correcting the past: failures to replicate ψ
2012-12
[37]
논문
Why most discovered true associations are inflated
2008-09
[38]
논문
Measuring the prevalence of questionable research practices with incentives for truth telling
2012-05
[39]
논문
False-positive psychology: undisclosed flexibility in data collection and analysis allows presenting anything as significant
2011-11
[40]
논문
"Editors' Introduction to the Special Section on Replicability in Psychological Science: A Crisis of Confidence?"
2012-11
[41]
논문
A modest proposal for encouraging replication.
http://doi.apa.org/g[...]
1969-04
[42]
논문
Replication studies: A neglected aspect of psychological research.
http://doi.apa.org/g[...]
1970-10
[43]
논문
Reviewer bias against replication research
https://www.proquest[...]
1993
[44]
논문
Editorial bias against replication research
https://www.proquest[...]
1990
[45]
간행물
They Studied Dishonesty. Was Their Work a Lie?
https://www.newyorke[...]
2023-10-01
[46]
웹사이트
The Band of Debunkers Busting Bad Scientists
https://www.wsj.com/[...]
2023-10-08
[47]
웹사이트
APA PsycNet
https://psycnet.apa.[...]
2023-10-08
[48]
논문
A Short (Personal) Future History of Revolution 2.0
2015-11
[49]
논문
An editorial.
http://doi.apa.org/g[...]
1976-01
[50]
논문
Publication Decisions and Their Possible Effects on Inferences Drawn from Tests of Significance--Or Vice Versa
https://www.jstor.or[...]
1959
[51]
논문
Data torturing
1993-10
[52]
논문
The file drawer problem and tolerance for null results.
http://doi.apa.org/g[...]
1979-05
[53]
논문
The statistical power of abnormal-social psychological research: a review
1962-09
[54]
논문
Do studies of statistical power have an effect on the power of studies?
http://doi.apa.org/g[...]
1989-03
[55]
웹사이트
What has happened down here is the winds have changed
https://statmodeling[...]
2016-09-21
[56]
논문
Nobel laureate challenges psychologists to clean up their act
https://www.nature.c[...]
2012-10-03
[57]
논문
On the persistence of low power in psychological science
2014-05
[58]
뉴스
No, science's reproducibility problem is not limited to psychology
https://www.washingt[...]
2015-09-10
[59]
논문
The replication crisis in psychology: An overview for theoretical and philosophical psychology.
http://doi.apa.org/g[...]
2019
[60]
논문
A Multilab Preregistered Replication of the Ego-Depletion Effect
2016-07
[61]
간행물
Power of Suggestion
http://chronicle.com[...]
2013-01-30
[62]
뉴스
When the Revolution Came for Amy Cuddy
https://www.nytimes.[...]
2017-10-19
[63]
논문
A critical review of the first 10 years of candidate gene-by-environment interaction research in psychiatry
2011-10
[64]
논문
Biases in research: risk factors for non-replicability in psychotherapy and pharmacotherapy research
https://discovery.uc[...]
2017-04
[65]
논문
Raising Awareness for the Replication Crisis in Clinical Psychology by Focusing on Inconsistencies in Psychotherapy Research: How Much Can We Rely on Published Findings from Efficacy Trials?
Frontiers Media
2018-02-28
[66]
논문
A Collaborative Approach to Infant Research: Promoting Reproducibility, Best Practices, and Theory-Building
2017-03-09
[67]
서적
The Nurture Assumption: Why Children Turn Out the Way They Do
Free Press
[68]
서적
No Two Alike: Human Nature and Human Individuality
W. W. Norton & Company
[69]
논문
Failure to Replicate
https://www.insidehi[...]
2018-12-19
[70]
논문
Facts Are More Important Than Novelty: Replication in the Education Sciences
https://journals.sag[...]
2018-12-19
[71]
논문
Why Minimal Guidance During Instruction Does Not Work: An Analysis of the Failure of Constructivist, Discovery, Problem-Based, Experiential, and Inquiry-Based Teaching
https://www.research[...]
Routledge
[72]
보고서
Foundations for Success: The Final Report of the National Mathematics Advisory Panel
https://www2.ed.gov/[...]
United States Department of Education
2020-11-03
[73]
논문
Learning Styles: Concepts and Evidence
SAGE Publications
2008-12
[74]
웹사이트
Summary of reproducibility rates and effect sizes for original and replication studies overall and by journal/discipline
https://mfr.osf.io/r[...]
Reproducibility Project: Psychology
2018
[75]
논문
Psychology's Renaissance
2018-01
[76]
잡지
The Science Behind Social Science Gets Shaken Up—Again
https://www.wired.co[...]
2018-08-27
[77]
논문
Evaluating the replicability of social science experiments in Nature and Science between 2010 and 2015
https://resolver.cal[...]
2018-09
[78]
논문
Many Labs 2: Investigating Variation in Replicability Across Samples and Settings
2018
[79]
잡지
Is the glass half empty or half full? Latest results in the replication crisis in Psychology
https://forbiddenpsy[...]
2019
[80]
뉴스
Brain-Imaging Studies Hampered by Small Data Sets, Study Finds
https://www.nytimes.[...]
2022-03-16
[81]
논문
Reproducible brain-wide association studies require thousands of individuals
2022-03
[82]
논문
Contradicted and initially stronger effects in highly cited clinical research
2005-07
[83]
논문
Believe it or not: how much can we rely on published data on potential drug targets?
2011-08
[84]
뉴스
Big Pharma Reveals a Biomedical Replication Crisis
https://psmag.com/ne[...]
2020-01-30
[85]
Comment article
Drug development: Raise standards for preclinical cancer research
2012-03
[86]
뉴스
Dozens of major cancer studies can't be replicated
https://www.sciencen[...]
2022-01-19
[87]
웹사이트
Reproducibility Project: Cancer Biology
https://www.cos.io/r[...]
Center for Open Science
2022-01-19
[88]
논문
A survey on data reproducibility in cancer research provides insights into our limited ability to translate findings from the laboratory to the clinic
[89]
논문
Medicine is plagued by untrustworthy clinical trials. How many studies are faked or flawed?
2023-07
[90]
논문
Is everything we eat associated with cancer? A systematic cookbook review
https://pubmed.ncbi.[...]
2013-01
[91]
논문
What Is Meant by "Replication" and Why Does It Encounter Resistance in Economics?
https://www.aeaweb.o[...]
2017-05
[92]
논문
Evaluating replicability of laboratory experiments in economics
2016-03
[93]
논문
About 40% of economics experiments fail replication survey
https://www.science.[...]
2017-10-25
[94]
논문
Now you see it, now you don't: emerging contrary results in economics
1997-12-01
[95]
논문
Is there a credibility crisis in strategic management research? Evidence on the reproducibility of study findings
2017-04-06
[96]
논문
Assessing data availability and research reproducibility in hydrology and water resources
2019-02
[97]
웹사이트
Is There a Reproducibility Crisis in Science?
https://www.scientif[...]
2019-08-15
[98]
논문
"Positive" results increase down the Hierarchy of the Sciences
2010-04
[99]
논문
Open science challenges, benefits and tips in early career and beyond
Public Library of Science
2019-05
[100]
웹사이트
A New Replication Crisis: Research that is Less Likely to be True is Cited More
https://rady.ucsd.ed[...]
University of California, San Diego
2021-05-21
[101]
논문
Nonreplicable publications are cited more than replicable ones
2021-05
[102]
논문
Reproducibility in science: improving the standard for basic and preclinical research
2015-01
[103]
서적
Little science big science
https://archive.org/[...]
Columbia University Press
[104]
논문
Overflow in science and its implications for trust
2015-09
[105]
논문
Attention decay in science
[106]
서적
Science-Mart
Harvard University Press
[107]
서적
Luhmann explained: from souls to systems
Open Court
[108]
서적
Social systems
Stanford University Press
[109]
간행물
Science communication as political communication
2014-09
[110]
서적
The honest broker : making sense of science in policy and politics
Cambridge University Press
[111]
간행물
Are Psychology Journals Anti-replication? A Snapshot of Editorial Practices
2017
[112]
간행물
Do Neuroscience Journals Accept Replications? A Survey of Literature
2017
[113]
간행물
An empirical comparison of published replication research in accounting, economics, finance, management, and marketing
1996-02-01
[114]
APA Dictionary of Psychology
Confirmation bias
2022-02-02
[115]
뉴스
When the Revolution Came for Amy Cuddy
https://www.nytimes.[...]
2017-10-18
[116]
간행물
Incongruence between test statistics and P values in medical papers
2004-05
[117]
간행물
Erroneous analyses of interactions in neuroscience: a problem of significance
2011-08
[118]
간행물
Do pressures to publish increase scientists' bias? An empirical support from US States Data
2010-04
[119]
간행물
Scientific Utopia: II. Restructuring Incentives and Practices to Promote Truth Over Publishability
2012-11
[120]
간행물
A tragedy of the (academic) commons: interpreting the replication crisis in psychology as a social dilemma for early-career researchers
2015-01-01
[121]
간행물
Methodological reporting behavior, sample sizes, and statistical power in studies of event-related potentials: Barriers to reproducibility and replicability
https://psyarxiv.com[...]
2019-11
[122]
간행물
Fearing the Future of Empirical Psychology: Bem's (2011) Evidence of Psi as a Case Study of Deficiencies in Modal Research Practice
http://journals.sage[...]
2011-12
[123]
간행물
The natural selection of bad science
2016-09
[124]
웹사이트
Research misconduct – The grey area of Questionable Research Practices
http://www.vib.be/en[...]
Vlaams Instituut voor Biotechnologie
2013-09-30
[125]
간행물
Degrees of Freedom in Planning, Running, Analyzing, and Reporting Psychological Studies: A Checklist to Avoid ''p''-Hacking
2016
[126]
Opinion
The Nine Circles of Scientific Hell
2012-11
[127]
APA Dictionary of Psychology
Data dredging
2022-01-09
[128]
Comment article
Six red flags for suspect work
2013-05
[129]
뉴스
Fraud Scandal Fuels Debate Over Practices of Social Psychology
http://chronicle.com[...]
2011-11-13
[130]
서적
Research Integrity: Best Practices for the Social and Behavioral Sciences
Oxford University Press
[131]
간행물
Scientific data audit—A key management tool
1992
[132]
간행물
Questionable Research Practices Revisited
2015-10-19
[133]
간행물
How many scientists fabricate and falsify research? A systematic review and meta-analysis of survey data
2009-05
[134]
간행물
Power failure: why small sample size undermines the reliability of neuroscience
2013-05
[135]
간행물
Power failure: why small sample size undermines the reliability of neuroscience
2013-05
[136]
간행물
The Power of Bias in Economics Research
2017-10-01
[137]
간행물
Candidate and non-candidate genes in behavior genetics
2013-02
[138]
간행물
Low statistical power in biomedical science: a review of three human research domains
2017-02
[139]
간행물
Evaluating historical candidate genes for schizophrenia
2015-05
[140]
Citation
Decline Effects: Types, Mechanisms, and Personal Reflections
https://onlinelibrar[...]
Wiley
2017-02-21
[141]
논문
Measurement error and the replication crisis
2017-02
[142]
논문
A Vast Graveyard of Undead Theories: Publication Bias and Psychological Science's Aversion to the Null
2012-11
[143]
간행물
The garden of forking paths: Why multiple comparisons can be a problem, even when there is no “fishing expedition” or “p-hacking” and the research hypothesis was posited ahead of time.
http://www.stat.colu[...]
Department of Statistics, Columbia University
2013
[144]
논문
The extent and consequences of p-hacking in science
2015-03
[145]
논문
Does rejection hurt? An FMRI study of social exclusion
2003-10
[146]
논문
Puzzlingly High Correlations in fMRI Studies of Emotion, Personality, and Social Cognition
https://escholarship[...]
2009-05
[147]
논문
A practical solution to the pervasive problems of p values
2007-10
[148]
논문
Degrees of Freedom in Planning, Running, Analyzing, and Reporting Psychological Studies: A Checklist to Avoid ''p''-Hacking
2016-11-25
[149]
논문
Quantifying heterogeneity in a meta-analysis
2002-06
[150]
논문
The fragility of results and bias in empirical research: an exploratory exposition
2019-10-02
[151]
서적
Empirical Modeling in Economics: Specification and Evaluation
https://books.google[...]
Cambridge University Press
1999
[152]
논문
Resolving empirical controversies with mechanistic evidence
2021-12-01
[153]
논문
The experiment in applied econometrics
https://onlinelibrar[...]
1997-09
[154]
논문
Contextual sensitivity in scientific reproducibility
2016-06
[155]
논문
Hypothesis testing and theory evaluation at the boundaries: surprising insights from Bayes's theorem
2003-07
[156]
논문
The earth is round (p < .05).
1994-12
[157]
웹사이트
Everything Is Correlated
https://gwern.net/ev[...]
2023-04-30
[158]
서적
Methodological issues & strategies in clinical research.
American Psychological Association
2024-07-26
[159]
서적
The restoration of dialogue: Readings in the philosophy of clinical psychology.
American Psychological Association
1992
[160]
서적
What social scientists don't understand
University of Chicago Press
1986
[161]
서적
Probability theory: the logic of science
Cambridge University Press
2003
[162]
논문
Understanding the Replication Crisis as a Base Rate Fallacy
2021-12-01
[163]
논문
Publication bias and the canonization of false facts
2016-12
[164]
뉴스
A new replication crisis: Research that is less likely to be true is cited more
https://phys.org/new[...]
Association for Psychological Science
2021-05-01
[165]
논문
Nonreplicable publications are cited more than replicable ones
2021-05
[166]
논문
Replications can cause distorted belief in scientific progress
2018-01
[167]
논문
The "replication crisis" in the public eye: Germans' awareness and perceptions of the (ir)reproducibility of scientific research
https://osf.io/ctpyn
2021-01
[168]
웹사이트
Scientists are furious after a famous psychologist accused her peers of 'methodological terrorism'
https://www.business[...]
2020-01-30
[169]
뉴스
Draft of Observer Column Sparks Strong Social Media Response
https://www.psycholo[...]
Association for Psychological Science
2017-10-04
[170]
논문
A Call to Change Science's Culture of Shaming
https://www.psycholo[...]
2016-10-31
[171]
뉴스
Inside Psychology's 'Methodological Terrorism' Debate
http://nymag.com/sci[...]
2017-10-04
[172]
논문
Implications of the Credibility Revolution for Productivity, Creativity, and Progress
https://psyarxiv.com[...]
2018-07
[173]
논문
The replication crisis has led to positive structural, procedural, and community changes
2023-07-25
[174]
논문
The Alleged Crisis and the Illusion of Exact Replication
https://research.rug[...]
2014-01
[175]
웹사이트
Replication as Success and Unsuccessful Replication
https://cla.umn.edu/[...]
University of Minnesota
2022-05-25
[176]
논문
The overlooked variable in animal studies: why diet makes a difference
2022-05
[177]
논문
Why Most Clinical Research Is Not Useful
2016-06
[178]
논문
Meta-research: Evaluation and Improvement of Research Methods and Practices
2015-10
[179]
웹사이트
On communicating science and uncertainty: A podcast with John Ioannidis
https://scopeblog.st[...]
2015-12-08
[180]
논문
Statistical Analysis Must Improve to Address the Reproducibility Crisis: The ACcess to Transparent Statistics (ACTS) Call to Action
2020-01
[181]
논문
Editorial Essay: The Tumult over Transparency: Decoupling Transparency from Replication in Establishing Trustworthy Qualitative Research
2019-11-06
[182]
논문
From Traditional Research to Responsible Research: The Necessity of Scientific Freedom and Scientific Responsibility for Better Societies
2022-01-21
[183]
웹사이트
Psychology's Replication Crisis Has Made The Field Better
https://fivethirtyei[...]
2018-12-06
[184]
간행물
The Cooperative Revolution Is Making Psychological Science Better
https://www.psycholo[...]
2018-12
[185]
웹사이트
Registered Replication Reports
http://www.psycholog[...]
Association for Psychological Science
2015-11-13
[186]
뉴스
Psychology's 'registration revolution'
https://www.theguard[...]
2014-05-20
[187]
논문
Replication in Psychological Science
2015-12
[188]
논문
Redefine statistical significance
2018-01
[189]
논문
Justify your alpha
https://pure.eur.nl/[...]
2018-03
[190]
논문
The vicious cycle that stalls statistical revolution
2022
[191]
논문
An investigation of the false discovery rate and the misinterpretation of p-values
2014-11
[192]
논문
The reproducibility of research and the misinterpretation of ''p''-values
2017-12
[193]
잡지
The problem with p-values
https://aeon.co/essa[...]
2016-10-11
[194]
웹사이트
Calculator for false positive risk (FPR)
http://fpr-calc.ucl.[...]
University College London
[195]
논문
Why should clinicians care about Bayesian methods?
2001
[196]
논문
Is psychology suffering from a replication crisis? What does "failure to replicate" really mean?
2015-09
[197]
논문
Small studies are more heterogeneous than large ones: a meta-meta-analysis
2015-08
[198]
논문
Power failure: why small sample size undermines the reliability of neuroscience
2013-05
[199]
논문
Consequences of prejudice against the null hypothesis
https://faculty.wash[...]
[200]
논문
The earth is flat (''p'' > 0.05): significance thresholds and the crisis of unreplicable research
2017
[201]
논문
Circular analysis in systems neuroscience: the dangers of double dipping
2009-05
[202]
논문
Choosing Prediction Over Explanation in Psychology: Lessons From Machine Learning
2017-11
[203]
간행물
NWO makes 3 million available for Replication Studies pilot
http://www.nwo.nl/en[...]
2016-07
[204]
뉴스
The Young Billionaire Behind the War on Bad Science
https://www.wired.co[...]
2017-01-22
[205]
논문
Teaching Replication
2012-11
[206]
논문
Harnessing the Undiscovered Resource of Student Research Projects
2012-11
[207]
논문
How to Use Replication Assignments for Teaching Integrity in Empirical Archaeology
2019-10-22
[208]
논문
A tragedy of the (academic) commons: interpreting the replication crisis in psychology as a social dilemma for early-career researchers
2015-01-01
[209]
논문
Replication and Extension of Alicke (1985) Better-Than-Average Effect for Desirable and Controllable Traits
http://journals.sage[...]
2021-08
[210]
논문
The replication crisis has led to positive structural, procedural, and community changes
2023-07-25
[211]
서적
A student's guide to open science: using the replication crisis to reform psychology
Open University Press
2023
[212]
논문
Implicit Theory of Mind – An overview of current replications and non-replications
2018-02-01
[213]
웹사이트
Curate Science
https://curatescienc[...]
2024-09-19
[214]
논문
A Unified Framework to Quantify the Credibility of Scientific Findings
http://journals.sage[...]
2018-09
[215]
논문
The Replication Database: Documenting the Replicability of Psychological Science
2024-09-11
[216]
World View article
Replication studies for undergraduate theses to improve science and education
2021-09
[217]
뉴스
"'Robot scientist' Eve finds that less than one-third of scientific results are reproducible"
https://techxplore.c[...]
2022-04
[218]
논문
Testing the reproducibility and robustness of the cancer biology literature by robot
2022-04
[219]
뉴스
Physics envy: Do 'hard' sciences hold the solution to the replication crisis in psychology?
https://www.theguard[...]
2014-06-10
[220]
Commentary
A New Etiquette for Replication
[221]
논문
Replications in Psychology Research: How Often Do They Really Occur?
2012-11
[222]
논문
Scientific Utopia III: Crowdsourcing Science
2019-09
[223]
논문
The Benefits, Barriers, and Risks of Big-Team Science
https://psyarxiv.com[...]
2023-05
[224]
논문
Robust research needs many lines of evidence
2018-01
[225]
논문
Interaction-Dominant Causation in Mind and Brain, and Its Implication for Questions of Generalization and Replication
2018-06-01
[226]
논문
Creative destruction in science
2020-11-01
[227]
논문
A creative destruction approach to replication: Implicit work and sex morality across cultures
2021-03-01
[228]
논문
Examining the generalizability of research findings from archival data
2022-07
[229]
논문
The case for open computer programs
2012-02
[230]
논문
The (ir)rational consideration of the cost of science in transition economies
2018-01
[231]
논문
Reproducibility and Replication of Experimental Particle Physics Results
2020-12-21
[232]
Commentary
Anticipating consequences of sharing raw data and code and of awarding badges for sharing
2016-02
[233]
논문
Metascience could rescue the 'replication crisis'
2014
[234]
웹사이트
The Crisis in Social Psychology That Isn’t
http://www.newyorker[...]
The New Yorker
2016-10-08
[235]
웹사이트
The Truth Wears Off
http://www.newyorker[...]
The New Yorker
2016-10-08
[236]
웹사이트
「社会科学」は崩壊した。米国の新たな指針は救いとなるか?
https://wired.jp/201[...]
2023-09-03
[237]
논문
1,500 scientists lift the lid on reproducibility
http://www.nature.co[...]
2016-05-26
[238]
논문
How Many Scientists Fabricate and Falsify Research? A Systematic Review and Meta-Analysis of Survey Data
http://journals.plos[...]
2009-05-29
[239]
논문
COntradicted and initially stronger effects in highly cited clinical research
https://doi.org/10.1[...]
2005-07-13
[240]
논문
Scientific data audit—A key management tool
http://www.tandfonli[...]
1992-01-01
[241]
문서
Begley, C. G., and Lee M. E., 2012, Drug Development: Raise Standards for Preclinical Cancer Research, Nature, 483, 531–533.
[242]
문서
Begley, C.G., 2013, Reproducibility: Six red flags for suspect work, Nature, 497, 433–434.
[243]
문서
Ioannidis JPA, 2016, Why Most Clinical Research Is Not Useful, PLoS Med 13(6): e1002049. doi:10.1371/journal.pmed.1002049.
[244]
웹사이트
No, science’s reproducibility problem is not limited to psychology
https://www.washingt[...]
2015-09-10
[245]
논문
Measuring the Prevalence of Questionable Research Practices With Incentives for Truth Telling
http://pss.sagepub.c[...]
2012-05-01
[246]
논문
The Nine Circles of Scientific Hell
http://pps.sagepub.c[...]
2012-11-01
[247]
웹사이트
Research misconduct - The grey area of Questionable Research Practices
http://www.vib.be/en[...]
2015-11-13
[248]
논문
Questionable Research Practices Revisited
http://spp.sagepub.c[...]
2015-10-19
[249]
논문
False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant
http://pss.sagepub.c[...]
Association for Psychological Science
2012-01-29
[250]
웹사이트
Fraud Scandal Fuels Debate Over Practices of Social Psychology
http://chronicle.com[...]
2016-10-08
[251]
웹사이트
A New Etiquette for Replication
http://www.scribd.co[...]
2016-10-08
[252]
문서
http://www.psyconten[...]
[253]
문서
Table of Contents(目次)
http://pps.sagepub.c[...]
[254]
논문
Estimating the reproducibility of Psychological Science
[255]
웹사이트
Are meta analyses conducted by professional organizations more trustworthy?
http://blogs.plos.or[...]
2016-09-13
[256]
웹사이트
Why Psychologists' Food Fight Matters
http://www.slate.com[...]
2016-10-08
[257]
웹사이트
Psychology Is Starting To Deal With Its Replication Problem
http://fivethirtyeig[...]
2016-10-08
[258]
웹사이트
Science Isn’t Broken
http://fivethirtyeig[...]
2016-10-08
[259]
논문
Why Science Is Not Necessarily Self-Correcting
http://pps.sagepub.c[...]
2012-11-01
[260]
논문
Is the Replicability Crisis Overblown? Three Arguments Examined
http://pps.sagepub.c[...]
2012-11-01
[261]
웹사이트
Psychology’s replication drive: it’s not about you
http://www.theguardi[...]
2016-10-08
[262]
논문
An Agenda for Purely Confirmatory Research
http://pps.sagepub.c[...]
2012-11-01
[263]
웹사이트
Power of Suggestion
http://chronicle.com[...]
2016-10-08
[264]
뉴스
Study reveals that a lot of psychology research really is just 'psycho-babble'
http://www.independe[...]
2015-08-27
[265]
웹사이트
Physics envy: Do ‘hard’ sciences hold the solution to the replication crisis in psychology?
http://www.theguardi[...]
2016-10-08
[266]
논문
Replications in Psychology Research How Often Do They Really Occur?
http://pps.sagepub.c[...]
2012-11-01
[267]
논문
Estimating the reproducibility of psychological
http://www.sciencema[...]
2015-08-28
[268]
문서
Earp and Trafimow
2015
[269]
논문
A tragedy of the (academic) commons: interpreting the replication crisis in psychology as a social dilemma for early-career researchers
http://journal.front[...]
2015-01-01
[270]
웹사이트
Resolving the replication crisis in social psychology? A new proposal
http://www.spsp.org/[...]
2015-11-18
[271]
논문
Algorithmic bias in social research: A meta-analysis
https://journals.plo[...]
2020-06-08
[272]
논문
The need to approximate the use-case in clinical machine learning
https://academic.oup[...]
2017-05-01
[273]
논문
Leakage and the Reproducibility Crisis in ML-based Science
https://arxiv.org/ab[...]
2022
[274]
웹사이트
How to avoid machine learning pitfalls: a guide for academic researchers
https://arxiv.org/pd[...]
2023-12-01
[275]
웹사이트
Is AI Driving a Scientific Reproducibility Crisis?
https://www.deeplear[...]
2023-12-01
[276]
웹사이트
Principal Component Analysis Can Negatively Impact Science
https://www.deeplear[...]
2023-12-01
[277]
논문
Reproducibility in Science: Improving the Standard for Basic and Preclinical Research
[278]
서적
Little science big science
Columbia University Press
[279]
논문
Overflow in science and its implications for trust
[280]
논문
Attention decay in science
[281]
서적
Science-Mart: Privatizing American Science
Harvard University Press
[282]
간행물
The Rightful Place of Science: Science on the Verge
The Consortium for Science, Policy and Outcomes at Arizona State University.
[283]
간행물
A new community for science
https://www.newscien[...]
2016-06-25
[284]
논문
Most Published Research Findings Are False—But a Little Replication Goes a Long Way
https://doi.org/10.1[...]
2007-02-27
[285]
논문
The Value of Direct Replication
http://pps.sagepub.c[...]
2014-01-01
[286]
웹사이트
Registered Replication Reports - Association for Psychological Science
http://www.psycholog[...]
2015-11-13
[287]
웹사이트
Psychology’s ‘registration revolution’ {{!}} Chris Chambers
http://www.theguardi[...]
2015-11-13
[288]
논문
Teaching Replication
http://pps.sagepub.c[...]
2012-11-01
[289]
논문
Harnessing the Undiscovered Resource of Student Research Projects
http://pps.sagepub.c[...]
2012-11-01
[290]
논문
Is psychology suffering from a replication crisis? What does "failure to replicate" really mean?
http://doi.apa.org/g[...]
[291]
논문
Small studies are more heterogeneous than large ones: a meta-meta-analysis
http://linkinghub.el[...]
[292]
논문
Power failure: why small sample size undermines the reliability of neuroscience
http://www.nature.co[...]
2013-05-01
[293]
논문
Consequences of prejudice against the null hypothesis.
http://content.apa.o[...]
[294]
논문
Anticipating consequences of sharing raw data and code and of awarding badges for sharing
http://linkinghub.el[...]
[295]
논문
Replication in Psychological Science
http://pss.sagepub.c[...]
2015-11-09
[296]
웹사이트
NWO makes 3 million available for Replication Studies pilot
http://www.nwo.nl/en[...]
2016-08-02
[297]
웹사이트
Big names in statistics want to shake up much-maligned P value
https://www.nature.c[...]
2019-03-14
[298]
논문
Is there a reproducibility crisis around here? Maybe not, but we still need to change.
https://jov.arvojour[...]
2019-09-06
[299]
논문
An empirical assessment of transparency and reproducibility-related research practices in the social sciences (2014–2017)
https://royalsociety[...]
2020-02
[300]
논문
Reproducibility of studies on text mining for citation screening in systematic reviews: Evaluation and checklist
https://linkinghub.e[...]
2017-09
[301]
웹사이트
Search - Consensus: AI Search Engine for Research
https://consensus.ap[...]
2023-12-01
[302]
논문
The Rigor and Transparency Index Quality Metric for Assessing Biological and Medical Science Methods
https://www.scienced[...]
2020-11-20
[303]
논문
Reproducibility in Science Improving the Standard for Basic and Preclinical Research
http://circres.ahajo[...]
2015-01-02
[304]
논문
Metascience could rescue the 'replication crisis'
[305]
웹인용
Why 'Statistical Significance' Is Often Insignificant
https://www.bloomber[...]
2017-11-07
[306]
논문
1,500 scientists lift the lid on reproducibility
https://www.nature.c[...]
Springer Nature
2021-05-21
[307]
웹인용
The Truth Wears Off
https://www.newyorke[...]
2020-01-30
[308]
웹인용
The Crisis in Social Psychology That Isn't
https://www.newyorke[...]
2020-01-30
[309]
논문
1,500 scientists lift the lid on reproducibility
https://www.nature.c[...]
Springer Nature
2021-05-21
[310]
웹인용
Is There a Reproducibility Crisis in Science?
https://www.scientif[...]
2019-08-15
[311]
논문
How Many Scientists Fabricate and Falsify Research? A Systematic Review and Meta-Analysis of Survey Data
2009-05-29
[312]
논문
What meta-analyses reveal about the replicability of psychological research.
https://www.semantic[...]
2018
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com