생물통계학
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
생물통계학은 살아있는 생물의 변동을 통계학적으로 연구하는 학문으로, 생물학, 통계학, 유전학, 공중 보건 등 다양한 분야에 응용된다. 19세기 말 프랜시스 골턴의 연구를 시작으로 칼 피어슨의 카이제곱 검정 도입을 통해 체계가 세워졌으며, 20세기 초 멘델의 법칙 재발견과 신다윈주의의 성립에 기여하며 생물학의 중요한 방법론으로 자리 잡았다. 유전학 연구에서 통계적 개념을 활용하여 유전 현상을 분석하고, 로널드 피셔, 세월 라이트, J.B.S. 홀데인 등의 학자들이 통계학적 방법을 발전시켜 집단 유전학을 확립하는 데 기여했다. 최근에는 DNA 염기 서열 분석 기술, 생물정보학, 머신 러닝의 발달로 대규모 데이터 분석이 가능해졌으며, 공중 보건, 정량 유전학, 발현 데이터 분석 등 다양한 분야에서 활용되고 있다. 통계적 가설 검정, 연구 설계, 데이터 수집 및 분석, 추론 통계 등의 방법론을 사용하며, ASReml, R, SAS, Python 등 다양한 도구를 활용한다. 생물통계학 교육 프로그램은 주로 대학원 수준에서 이루어지며, 관련 전문 학술지가 존재한다.
더 읽어볼만한 페이지
생물통계학 |
---|
2. 역사
생물통계학은 19세기 말 프랜시스 골턴이 생물 현상의 통계적 변이에 관심을 가지면서 시작되었다. 그는 사람의 유전에 흥미를 느껴 도수 분포, 표준오차 이론 등을 도입하며 생물통계학의 기초를 다졌다.[79] 칼 피어슨은 카이제곱 검정( 검정)을 도입하여 관측값과 기댓값의 관계를 명확히 하는 등 생물통계학의 체계를 세웠다.[79]
찰스 다윈의 사촌인 골턴과 그의 후계자인 피어슨 등은 19세기부터 20세기에 걸쳐 진화를 수량적으로 연구하려 시도했고, 그 과정에서 통계학을 발전시켰다.[70][71] 20세기 초 멘델의 법칙이 재발견되면서,[72][73] 진화와 유전을 어떻게 일관성 있게 이해할 것인가가 피어슨 등 생물통계학자와 베이트슨 등 유전학자 사이에서 중요한 문제로 논의되었다. 이후 1930년대까지 통일적 모델이 만들어져 신다윈주의가 성립되었다.[74] 이를 주도한 것도 통계학적 연구였으며, R.A. 피셔는 생물학 연구 과정에서 기본적인 통계학적 방법을 확립했고, 수얼 라이트와 J.B.S. 홀데인도 통계학적 방법으로 집단 유전학을 확립했다.[75][76][77]
다아시 톰슨이 수행한 생물 형태에 대한 수학적 연구(저서 "On Growth and Form"에 정리)도 생물학의 정량적 연구에서 선구적인 역할을 했다.[78]
2. 1. 생물통계학과 유전학
프랜시스 골턴은 생물이 나타내는 여러 가지 성질이 통계적인 변이를 나타내는 것에 관심을 가졌고, 이는 사람의 유전에 대한 흥미에서 비롯되었다. 이후 도수 분포, 표준오차 이론 등이 도입되면서 생물통계학의 기초가 다져졌다. 칼 피어슨은 카이제곱 검정( 검정)을 도입하여 관측값과 기댓값의 관계를 명확히 하는 등 생물통계학의 체계를 세웠다.[79]생물학자들은 생명통계학을 통해 코끼리의 배설물에서 DNA를 규명하고, 사라진 코끼리 종을 밝혀내어 멸종 위기 동물들을 추적하는 연구를 진행한다. 또한 코끼리 DNA와 이미 멸종된 매머드 DNA를 융합하여 실제 매머드를 복원하는 실험도 진행한다. 1953년 크릭과 왓슨이 ‘네이처’에 DNA의 이중나선 구조를 밝힘으로써 DNA 구조의 규명이 수학으로 가능하게 되었는데, 이들은 수학 기법인 브래그의 법칙(Bragg’s law)을 사용하였다.[79]
생물통계학적 모델링은 현대 생물학 이론의 중요한 부분이다. 유전학 연구는 초기부터 관찰된 실험 결과를 이해하기 위해 통계적 개념을 사용해 왔다. 그레고어 멘델은 완두콩 가족의 유전적 분리 패턴을 연구하고 수집된 데이터를 설명하기 위해 통계를 사용했다.
1900년대 초, 멘델의 멘델 유전 법칙이 재발견된 후, 유전학과 진화론적 다윈주의 사이의 이해에 격차가 발생했다. 프랜시스 골턴은 인간 데이터를 통해 멘델의 발견을 확장하려 시도했고, 조상 유전의 법칙이라 불리는 다른 모델을 제안했다. 그러나 그의 생각은 윌리엄 베이트슨에 의해 강하게 반대받았다. 이는 골턴을 지지하는 생물 계량학자들(라파엘 웰던, 아서 더킨필드 다비셔, 칼 피어슨)과 베이트슨을 지지하는 멘델주의자들(찰스 다벤포트, 빌헬름 요한센) 사이의 격렬한 논쟁으로 이어졌다. 이후 생물 계량학자들은 골턴의 결론을 재현할 수 없었고, 멘델의 생각이 우세해졌다. 1930년대까지 통계적 추론을 기반으로 구축된 모델은 이러한 차이점을 해결하고 신다윈주의적인 현대 진화 종합을 만들어내는 데 기여했다.
이러한 차이점을 해결함으로써 개체군 유전학의 개념을 정의하고 유전학과 진화를 결합할 수 있었다. 개체군 유전학 확립과 종합에 선두적인 역할을 한 세 사람은 모두 통계에 의존했으며 생물학에서 통계학 사용을 발전시켰다.
- 로널드 피셔는 분산 분석, p-값 개념, 피셔의 정확 검정, 피셔의 방정식 for 개체군 역학 등 여러 기본적인 통계적 방법을 개발했다. 그는 "자연 선택은 극도로 높은 수준의 비개연성을 생성하는 메커니즘이다"라는 문구로 유명하다.[2]
- 세월 라이트는 ''F''-통계량을 개발하고 이를 계산하는 방법을 개발했으며, 근친 교배 계수를 정의했다.
- J. B. S. 홀데인은 ''진화의 원인'' 저서를 통해 멘델 유전학의 수학적 결과 관점에서 자연 선택을 진화의 주요 메커니즘으로 재확립했다. 그는 또한 원시 수프 이론을 개발했다.
D'Arcy Thompson의 선구적인 저서 ''성장과 형태에 관하여'' 또한 생물학적 연구에 정량적인 규율을 추가하는 데 기여했다.
통계적 추론의 중요성에도 불구하고, 생물학자들 사이에는 질적으로 명백하지 않은 결과를 불신하거나 폄하하는 경향이 있었다. 한 일화로 토머스 헌트 모건이 캘리포니아 공과대학의 그의 학과에서 프리덴 계산기 사용을 금지한 것을 들 수 있다.[3]
찰스 다윈의 사촌인 프랜시스 골턴과 그의 후계자인 칼 피어슨 등은 19세기부터 20세기에 걸쳐 진화를 수량적으로 연구하려 시도했고, 그 과정에서 통계학을 발전시켰다.[70][71] 20세기 초 멘델의 법칙이 재발견되면서,[72][73] 진화와 유전을 어떻게 일관성 있게 이해할 것인가가 피어슨 등 생물통계학자와 베이트슨 등 유전학자 사이에서 중요한 문제로 논의되었다. 이후 1930년대까지 통일적 모델이 만들어져 신다윈주의가 성립되었다.[74] 이를 주도한 것도 통계학적 연구였으며, R.A. 피셔는 생물학 연구 과정에서 기본적인 통계학적 방법을 확립했고, 수얼 라이트와 J.B.S. 홀데인도 통계학적 방법으로 집단 유전학을 확립했다.[75][76][77] 통계학과 진화생물학은 하나로 묶여 발전했다.
다아시 톰슨이 수행한 생물 형태에 대한 수학적 연구(저서 "On Growth and Form"에 정리)도 생물학의 정량적 연구에서 선구적인 역할을 했다.[78]
2. 2. 20세기 이후의 발전
프랜시스 골턴은 20세기 초 멘델의 유전 법칙이 재발견되면서, 진화와 유전을 통합적으로 이해하고자 노력했다. 그러나 이는 칼 피어슨을 비롯한 생물통계학자들과 윌리엄 베이트슨 등의 유전학자들 사이에 큰 논쟁을 불러일으켰다.[72][73] 이후 1930년대에 이르러 통계적 추론을 기반으로 한 모델들이 개발되면서 이 둘 사이의 간극은 좁혀졌고, 신다윈주의 진화론이 성립되었다.[74]이 과정에서 개체군 유전학이 발전하였고, 유전학과 진화가 통합될 수 있었다. 로널드 피셔, 세월 라이트, J. B. S. 홀데인과 같은 학자들은 통계학을 바탕으로 생물학의 발전에 크게 기여했다.[75][76][77]
학자 | 주요 업적 |
---|---|
로널드 피셔 | 분산 분석, p-값 개념, 피셔의 정확 검정 등 여러 기본적인 통계 방법을 개발했다. 자연 선택의 유전 이론을 저술하여 유전학에 통계학을 도입하는데 기여했다.[1] |
세월 라이트 | F-통계량을 개발하고 계산 방법을 제시했으며, 근친 교배 계수를 정의했다. |
J. B. S. 홀데인 | 진화의 원인을 저술하여 자연 선택을 진화의 주요 메커니즘으로 재정립하고, 원시 수프 이론을 개발했다. |
생물통계학에서 통계적 방법론은 연구 질문에 답하고, 가설을 검정하며, 데이터를 분석하여 생물학적 현상에 대한 결론을 도출하는 데 사용되는 핵심적인 도구이다.
이들은 수학 생물학자 및 통계학적 경향을 가진 유전학자들과 함께 진화 생물학과 유전학을 정량적으로 모델링할 수 있는 일관된 체계로 통합하는 데 기여했다.
D'Arcy Thompson의 ''성장과 형태에 관하여''라는 선구적인 저서는 생물학적 연구에 정량적인 방법을 도입하는 데 중요한 역할을 했다.[78]
이러한 발전에도 불구하고, 일부 생물학자들은 통계적 추론의 중요성을 간과하고 질적 데이터에만 의존하는 경향을 보이기도 했다. 토머스 헌트 모건은 캘리포니아 공과대학에서 프리덴 계산기 사용을 금지하며 "약간의 지능만 있다면, 나는 손을 뻗어 큰 금덩이를 집어 올 수 있다."라고 말한 일화는 이러한 경향을 보여준다.[3]
생물통계학적 연구는 현대 생물학과 통계학의 발전에 중요한 역할을 수행했다. 찰스 다윈의 사촌인 프랜시스 골턴과 그의 후계자 칼 피어슨은 19세기부터 20세기에 걸쳐 진화를 수량적으로 연구하며 통계학을 발전시켰다.[70][71]
3. 통계적 방법론
통계적 가설통계적 가설은 모수를 사용하여 특정 주장을 나타내는 형태로, 모집단의 특성을 추론하는 데 사용된다. 예를 들어, "미국 성인 여성의 평균 신장은 180cm이다"와 같이 모수 (평균 신장)를 포함하는 주장이 통계적 가설이 될 수 있다. 통계적 가설은 귀무가설 (H0)과 대립가설 (H1)로 구성된다.[80][79]
연구 설계생명 과학 연구는 과학적 질문에 답하기 위해 수행되며, 정확한 결과를 얻기 위해서는 적절한 연구 설계가 필수적이다. 연구 설계에는 연구 질문, 검증할 가설, 실험 설계, 데이터 수집 방법, 데이터 분석 관점 등이 포함된다. 무작위화, 반복, 국소 통제는 실험 통계의 세 가지 기본 원칙이다.
데이터 수집 및 분석데이터 수집 방법은 데이터 유형에 따라 다르다.
수집된 데이터는 체계적인 데이터 프레임에 저장하여 분석에 활용한다.
데이터는 표, 그래프 (예: 선 그래프, 막대 그래프, 히스토그램, 산점도)를 통해 시각적으로 표현할 수 있다. 또한, 중심 경향 척도 (예: 산술 평균, 중앙값, 최빈값)와 변동성 척도를 사용하여 데이터의 특징을 요약할 수 있다.
추론 통계추론 통계는 제한된 데이터를 기반으로 모집단에 대한 결론을 도출하는 데 사용된다. 표본을 사용하여 모집단의 모수를 추정하고, 가설 검정을 통해 연구 질문에 대한 답을 얻는다.
1. 검정할 가설 (귀무가설, 대립가설) 정의
2. 유의 수준 (α) 및 결정 규칙 설정
3. 실험 수행 및 통계적 분석
4. p-값과 α 비교를 통해 귀무가설 기각 여부 결정
통계적 고려 사항가설 검정 시 제1종 오류 (참인 귀무가설 기각)와 제2종 오류 (거짓 귀무가설 기각 실패)가 발생할 수 있다. 유의 수준 (α)은 제1종 오류율을 의미하며, 검정 전에 미리 설정해야 한다. 제2종 오류율은 β로 표시되며, 검정의 통계적 검정력은 1 - β이다.
p값은 귀무 가설(H0)이 참이라고 가정했을 때, 관찰된 결과만큼 극단적이거나 더 극단적인 결과를 얻을 확률을 나타낸다. p값이 α보다 작으면 귀무 가설은 기각된다.[16]
여러 가설을 동시에 검정할 경우, (가족 현명 오류율) 증가를 제어하기 위해 본페로니 보정이나 오류 발견율 (FDR) 제어와 같은 방법을 사용한다.
모형 선택 기준 (예: 아카이케 정보 기준 (AIC), 베이즈 정보 기준 (BIC))은 참 모형에 더 가까운 모형을 선택하는 데 사용된다.
3. 1. 통계적 가설
'''통계적 가설'''은 통계학에서 사용하는 용어로, 모수를 이용해 하나의 특정 주장을 나타낸 형태를 지칭한다. 예를 들어, '미국 성인여자의 신장은 크다'는 통계적 가설이 될 수 없다. 하지만 '미국 성인여자의 평균 신장은 180cm이다.'는 통계적 가설이 될 수 있다. 여기서 평균 신장은 모집단 특성을 나타내는 모수의 역할을 수행한다. 통계적 가설은 귀무가설과 이와 반대되는 대립가설로 나타낸다.[80][79]
연구 질문은 연구의 목표를 정의한다. 연구는 질문에 의해 주도되므로 간결해야 하며, 동시에 과학과 지식, 해당 분야를 향상시킬 수 있는 흥미롭고 새로운 주제에 집중해야 한다. 과학적 질문을 제기하는 방법을 정의하기 위해, 철저한 문헌 고찰이 필요할 수 있다. 따라서 연구는 과학계에 가치를 더하는 데 유용할 수 있다.
연구 목적이 정의되면, 연구 질문에 대한 가능한 답변을 제시할 수 있으며, 이 질문을 가설로 변환한다. 주된 제안은 귀무 가설(H0)이라고 하며, 일반적으로 해당 주제에 대한 기존 지식이나 현상의 명백한 발생을 기반으로 하고, 심층적인 문헌 검토를 통해 뒷받침된다. 이것은 검사 상황에서 데이터에 대한 표준 예상 답변이라고 할 수 있다. 일반적으로 H0는 처리 간의 연관성이 없다고 가정한다. 반면에, 대립 가설은 H0을 부정하는 것이다. 이는 처리와 결과 사이에 어느 정도 연관성이 있다고 가정한다. 그러나 가설은 연구 질문과 그 예상 및 예상치 못한 답변에 의해 뒷받침된다.[4]
예를 들어, 두 가지 다른 식이 요법을 받는 유사한 동물 그룹(예: 생쥐)을 고려해 보자. 연구 질문은 다음과 같다. "어떤 식이 요법이 가장 좋은가?" 이 경우, H0는 두 가지 식이 요법이 생쥐 대사에 차이가 없다는 것이고(H0: μ1 = μ2), 대립 가설은 식이 요법이 동물의 대사에 서로 다른 영향을 미친다는 것이다(H1: μ1 ≠ μ2).
가설은 주요 질문에 답하는 데 대한 연구자의 관심사에 따라 연구자에 의해 정의된다. 그 외에도 대립 가설은 하나 이상의 가설일 수 있다. 관찰된 매개변수 간의 차이뿐만 아니라 차이의 정도(예: 더 크거나 작음)를 가정할 수 있다.
3. 2. 연구 설계
생명 과학 분야의 모든 연구는 과학적 질문에 답하기 위해 제안된다. 높은 확신을 가지고 이러한 질문에 답하기 위해서는 정확한 결과가 필요하다. 주요 가설과 연구 계획을 올바르게 정의하면 현상을 이해하는 데 있어 의사 결정을 내릴 때 오류를 줄일 수 있다. 연구 계획에는 연구 질문, 검증할 가설, 실험 설계, 데이터 수집 방법, 데이터 분석 관점 및 관련 비용이 포함될 수 있다. 무작위화, 반복, 국소 통제를 실험 통계의 세 가지 기본 원칙으로 하여 연구를 수행하는 것이 필수적이다.
일반적으로 연구는 개체군에 대한 현상의 영향을 이해하는 것을 목표로 한다. 생물학에서 개체군은 특정 시간에 특정 지역에 있는 주어진 종의 모든 개체로 정의된다. 생물통계학에서 이 개념은 연구 가능한 다양한 집합으로 확장된다. 생물통계학에서 개체군은 개체뿐만 아니라 전체 유전자체나 동물의 모든 정자 세포, 또는 식물의 총 잎 면적과 같은 그들의 유기체의 특정 구성 요소의 총합이기도 하다.
개체군의 모든 요소에서 측정을 수행하는 것은 불가능하다. 그렇기 때문에 표본 추출 과정은 통계적 추론에 매우 중요하다. 표본 추출은 모집단에 대한 후속 추론을 하기 위해 전체 개체군의 대표적인 부분을 무작위로 얻는 것으로 정의된다. 따라서 표본은 개체군 전체에서 가장 많은 통계적 변동성을 포착할 수 있다.[5] 표본 크기는 연구 범위에서 사용 가능한 자원에 이르기까지 여러 가지 요인에 의해 결정된다. 임상 연구에서 열등성, 동등성, 우월성과 같은 시험 유형은 표본 크기를 결정하는 데 핵심 요소이다.[4]
실험 설계는 실험 통계학의 기본적인 원칙을 유지한다. 모든 구획의 처리군을 무작위로 할당하는 세 가지 기본 실험 설계가 있다. 그들은 완전 임의 설계, 블록화된 임의 설계, 그리고 요인 설계이다. 처리는 실험 내에서 여러 가지 방법으로 배열될 수 있다. 농업에서, 적절한 실험 설계는 좋은 연구의 근본이며 연구 내에서 처리군의 배치는 필수적이다. 왜냐하면 환경이 구획(식물, 가축, 미생물)에 큰 영향을 미치기 때문이다. 이러한 주요 배치는 "격자 모형", "불완전 블록", "분할 구획", "확장 블록" 등의 이름으로 문헌에서 찾을 수 있다. 모든 설계에는 대조 구획이 포함될 수 있으며, 이는 연구자에 의해 결정되어 추론 중에 오차 추정을 제공한다.
임상 연구에서, 표본은 일반적으로 다른 생물학적 연구보다 작으며, 대부분의 경우 환경 효과를 제어하거나 측정할 수 있다. 무작위 대조 임상 시험을 사용하는 것이 일반적이며, 여기서 결과는 일반적으로 관찰 연구 설계, 예를 들어 환자-대조군 연구 또는 코호트 연구와 비교된다.[6]
3. 3. 데이터 수집 및 분석
데이터 수집은 데이터 유형에 따라 다르다. 질적 데이터의 경우, 구조화된 설문지를 사용하거나, 질병의 유무 또는 강도를 관찰하여 수집할 수 있으며, 발생 수준을 분류하기 위한 점수 기준을 사용할 수 있다.[7] 양적 데이터의 경우, 계측기를 사용하여 수치 정보를 측정하여 수집한다.
농업 및 생물학 연구에서, 수확량 데이터와 그 구성 요소는 계량 측정을 통해 얻을 수 있다. 그러나 식물에 대한 해충 및 질병 피해는 피해 수준에 대한 점수 척도를 고려하여 관찰을 통해 얻는다. 특히 유전학 연구에서는 표현형 및 유전자형 분석을 위한 고처리량 플랫폼과 같이 현장 및 실험실에서 데이터 수집을 위한 현대적인 방법을 고려해야 한다. 이러한 도구를 사용하면 더 큰 실험을 수행할 수 있으며, 데이터 수집에 사람 기반의 방법만 사용하는 것보다 더 짧은 시간에 많은 구획을 평가할 수 있다.
마지막으로, 관심 있는 모든 수집된 데이터는 추가 분석을 위해 체계적인 데이터 프레임에 저장해야 한다.
데이터는 표 또는 그래프 표현(예: 선 그래프, 막대 그래프, 히스토그램, 산점도)을 통해 나타낼 수 있다. 또한, 중심 경향 척도와 변동성은 데이터의 개요를 설명하는 데 매우 유용할 수 있다.
빈도표는 행과 열로 정렬된 데이터로 구성되며, 여기서 빈도는 데이터의 발생 또는 반복 횟수를 의미한다.[8] 빈도는 다음과 같이 나타낼 수 있다.
다음 예는 동일한 유기체의 10개의 오페론에 있는 유전자 수를 보여준다.
유전자 수 | 절대 빈도 | 상대 빈도 |
---|---|---|
1 | 0 | 0 |
2 | 1 | 0.1 |
3 | 6 | 0.6 |
4 | 2 | 0.2 |
5 | 1 | 0.1 |
선 그래프는 시간과 같은 다른 지표에 따른 값의 변화를 나타낸다. 일반적으로, 값은 세로축에 표시되고 시간 변화는 가로축에 표시된다.[10]
막대 그래프는 범주형 데이터를 값에 비례하는 높이(세로 막대) 또는 너비(가로 막대)를 나타내는 막대로 표시하는 그래프이다. 막대 그래프는 표 형식으로도 표현할 수 있는 이미지를 제공한다.[10]
위의 막대 그래프 예시는 2010년부터 2016년까지 12월 브라질의 출생률을 나타낸다.[9] 2016년 12월의 급격한 감소는 브라질의 출생률에서 지카 바이러스의 발병을 반영한다.
히스토그램 (또는 빈도 분포)은 표로 정리되어 균일하거나 균일하지 않은 계급으로 나뉜 데이터 집합의 그래픽 표현이다. 이는 칼 피어슨에 의해 처음 소개되었다.[11]
산점도는 직교 좌표계를 사용하여 데이터 집합의 값을 표시하는 수학적 다이어그램이다. 산점도는 데이터를 점의 집합으로 표시하며, 각 점은 수평 축의 위치를 결정하는 한 변수의 값과 수직 축의 다른 변수를 나타낸다.[12] 산점도는 '산포 그래프', '산포 차트', '산포도' 또는 '산포 다이어그램'이라고도 한다.[13]
산술 평균은 값들의 모음을 이 모음의 항목 수로 나눈 값이다.
중앙값은 데이터 집합의 중간에 위치한 값이다.
최빈값은 데이터 집합에서 가장 자주 나타나는 값이다.[14]
유형 | 예시 | 결과 |
---|---|---|
평균 | ( 2 + 3 + 3 + 3 + 3 + 3 + 4 + 4 + 11 ) / 9 | 4 |
중앙값 | 2, 3, 3, 3, 3, 3, 4, 4, 11 | 3 |
최빈값 | 2, 3, 3, 3, 3, 3, 4, 4, 11 | 3 |
상자 그림은 수치 데이터 그룹을 그래픽으로 묘사하는 방법이다. 최댓값과 최솟값은 선으로 표시되며, 사분위 범위(IQR)는 데이터의 25–75%를 나타낸다. 특이값은 원으로 표시될 수 있다.
산점도와 같은 그래프를 통해 두 종류의 데이터 간의 상관 관계를 추론할 수 있지만, 이를 수치 정보를 통해 검증하는 것이 필요하다. 이러한 이유로, 상관 계수가 필요하다. 상관 계수는 연관성의 강도를 나타내는 수치 값을 제공한다.[10]
피어슨 상관 계수는 두 변수 X와 Y 간의 연관성을 측정하는 지표이다. 이 계수는 일반적으로 모집단의 경우 ''ρ''(로)로, 표본의 경우 ''r''로 표시되며, -1과 1 사이의 값을 갖는다. 여기서 ''ρ'' = 1은 완전한 양의 상관 관계, ''ρ'' = -1은 완전한 음의 상관 관계, ''ρ'' = 0은 선형 상관 관계가 없음을 나타낸다.[10]
3. 4. 추론 통계
추론 통계학은 추정 및/또는 가설 검정을 통해 알려지지 않은 모집단에 대한 추론[15]을 수행하는 데 사용된다. 즉, 관심 있는 모집단을 설명하는 모수를 얻는 것이 바람직하지만, 데이터가 제한되어 있으므로 이를 추정하기 위해 대표적인 표본을 사용해야 한다. 이를 통해 이전에 정의된 가설을 검정하고 결론을 전체 모집단에 적용할 수 있다. 평균의 표준 오차는 추론을 수행하는 데 중요한 변동성의 척도이다.[5]- 가설 검정
가설 검정은 연구 질문에 답하기 위해 모집단에 대한 추론을 하는 데 필수적이다. 가설 검정의 단계는 다음과 같다:[5]
# '''검정할 가설:''' 귀무 가설(H0)과 대립 가설을 정의한다. 이들은 실험 시행 전에 정의되어야 한다.
# '''유의 수준 및 결정 규칙:''' 유의 수준 또는 허용 가능한 오류율(α)에 따라 결정 규칙이 달라진다. 검정 통계량이 임계값과 비교될 때 통계적 유의성을 결정하는 "임계값"을 정의한다. α도 실험 전에 미리 정의되어야 한다.
# '''실험 및 통계적 분석:''' 실험이 적절한 실험 설계에 따라 수행되고, 데이터가 수집되며, 가장 적합한 통계 검정이 평가된다.
# '''추론:''' p-값과 α의 비교에 따라 귀무 가설이 기각되거나 기각되지 않는다. H0을 기각하지 못하는 것은 기각을 뒷받침할 충분한 증거가 없다는 것을 의미할 뿐, 이 가설이 참이라는 것을 의미하는 것은 아니다.
- 신뢰 구간
신뢰 구간은 주어진 특정 신뢰 수준에서 실제 참 모수 값을 포함할 수 있는 값의 범위이다. 첫 번째 단계는 모집단 모수의 최적의 불편 추정값을 추정하는 것이다. 구간의 상한 값은 이 추정값과 평균의 표준 오차와 신뢰 수준의 곱의 합으로 얻어진다. 하한 값의 계산은 유사하지만, 합 대신 뺄셈을 적용해야 한다.[5]
3. 5. 통계적 고려 사항
'''통계적 가설'''은 통계학에서 사용하는 용어로, 하나의 특정 주장을 모수를 이용해 나타낸 형태를 말한다. 예를 들어, '미국 성인여자의 신장은 크다'는 통계적 가설이 될 수 없다. 하지만 '미국 성인여자의 평균신장은 180cm이다.'는 통계적 가설이 될 수 있다. 평균신장은 여기서 모집단 특성을 나타내는 모수의 역할을 수행한다. 통계적 가설은 귀무가설과 이와 반대에 있는 대립가설로 나타낸다.[80][79]가설을 검정할 때, 두 가지 유형의 통계적 오류가 발생할 수 있다: 제1종 오류와 제2종 오류.
- 제1종 오류 또는 거짓 양성은 참인 귀무 가설을 잘못 기각하는 것이다.
- 제2종 오류 또는 거짓 음성은 거짓 귀무 가설을 기각하지 못하는 것이다.
α로 표시되는 유의 수준은 제1종 오류율이며, 검정을 수행하기 전에 선택해야 한다. 제2종 오류율은 β로 표시되며, 검정의 통계적 검정력은 1 − β이다.
p값은 귀무 가설(H0)이 참이라고 가정했을 때, 관찰된 결과만큼 극단적이거나 더 극단적인 결과를 얻을 확률이다. 이는 계산된 확률이라고도 불린다. p값을 유의 수준 (α)과 혼동하는 경우가 많지만, α는 유의미한 결과를 판단하기 위한 미리 정의된 임계값이다. p가 α보다 작으면, 귀무 가설(H0)은 기각된다.[16]
동일한 가설에 대한 여러 검정에서 거짓 양성의 발생 확률인 (가족 현명 오류율)이 증가하므로 이러한 발생을 제어하기 위한 몇 가지 전략이 사용된다. 이는 일반적으로 귀무 가설을 기각하기 위해 더 엄격한 임계값을 사용함으로써 달성된다. 본페로니 보정은 α*로 표시되는 허용 가능한 전역 유의 수준을 정의하며, 각 검정은 α = α*/m 값과 개별적으로 비교된다. 이렇게 하면 모든 m개 검정에서 가족 현명 오류율이 α*보다 작거나 같도록 보장한다. m이 클 경우 본페로니 보정은 지나치게 보수적일 수 있다. 본페로니 보정의 대안은 오류 발견율(FDR)을 제어하는 것이다. FDR은 거짓(잘못된 기각)인 기각된 귀무 가설(소위 발견)의 예상 비율을 제어한다. 이 절차는 독립적인 검정에 대해 오류 발견율이 최대 q*가 되도록 보장한다. 따라서 FDR은 본페로니 보정보다 덜 보수적이며 더 많은 거짓 양성을 감수하는 대신 더 많은 검정력을 가집니다.
검증하려는 주요 가설(예: 치료법과 결과 간의 연관성 없음)에는 종종 다른 기술적 가정(예: 결과의 확률 분포 형태에 대한)이 함께 따르며, 이는 또한 귀무 가설의 일부이다. 기술적 가정이 실제에서 위반되면, 주요 가설이 참이라도 귀무 가설이 자주 기각될 수 있다. 이러한 기각은 모델의 오차 지정으로 인한 것이라고 한다.[18] 통계 검정의 결과가 기술적 가정을 약간 변경해도 변하지 않는지 확인하는 것(소위 견고성 검사)이 오차 지정을 방지하는 주요 방법이다.
모형 선택 기준은 참 모형에 더 가까운 모형을 선택한다. 아카이케 정보 기준(AIC)과 베이즈 정보 기준(BIC)은 점근적으로 효율적인 기준의 예시이다.
4. 응용 분야
생물통계학은 역학, 보건 서비스 연구, 영양, 환경 보건, 보건 의료 정책 및 관리 등 공중 보건 분야에 응용된다. 이러한 의학 분야에서는 임상 시험 설계 및 분석이 중요하며, 질병 예후를 가진 환자의 중증도 평가 등에 활용된다.
최근에는 새로운 기술과 유전학 지식을 바탕으로 시스템 의학에도 생물통계학이 사용된다. 시스템 의학은 기존 환자 데이터, 임상병리학적 변수, 분자 및 유전 데이터와 더불어 오믹스 기술로 생성된 데이터를 통합하여 개인 맞춤형 의학을 구현하는 것을 목표로 한다.[29]
집단 유전학과 통계 유전학 연구에서는 유전자형과 표현형 변이 간의 연관성을 분석한다. 특히, 다유전자 조절을 받는 정량적 형질의 유전적 기반을 밝히는 것을 목표로 한다. 양적 형질 유전자좌(QTL) 연구는 분자 마커를 이용하여 형질을 측정하고, 실험적 교배를 통해 집단을 얻어 QTL 매핑을 수행한다. QTL 매핑 알고리즘에는 구간 매핑, 복합 구간 매핑, 다중 구간 매핑 등이 있다.[30]
전장 유전체 연관 분석(GWAS)은 연관 불평형을 기반으로 QTL을 식별하는 방법으로, 고처리량 SNP 유전자형 분석 기술 발달로 가능해졌다.[32] 축산 및 식물 육종 분야에서는 마커 보조 선택이 활용되며, 유전체 선택(GS)은 훈련 집단을 통해 유전체 추정 육종 가치(GEBV)를 얻는 모델을 개발하는 방식으로 이루어진다.[33] 정량 유전학은 농업 분야의 작물 및 가축 개량뿐만 아니라, 생물의학 연구에서 질병 관련 유전자 대립 유전자를 찾는 데도 활용된다.
마이크로어레이, 차세대 시퀀서, 질량 분석법과 같은 기술은 방대한 양의 데이터를 생성하며, 생물통계학적 분석을 통해 유의미한 정보를 추출할 수 있다. 예를 들어, 마이크로어레이를 통해 질병 세포에서 다르게 발현되는 유전자를 확인할 수 있다.[20] 다중공선성은 고차원 생물 통계학적 설정에서 자주 발생하며, 차원 축소 기법(예: 주성분 분석)을 적용하여 해결할 수 있다. 유전자 집합 농축 분석(GSEA)은 개별 유전자가 아닌 기능적으로 관련된 유전자 집합의 변화를 고려하여 더 강력한 분석 결과를 제공한다.[21] RNA-Seq 데이터 분석에서는 일반화 선형 모형을 사용하여 통계적 유의성을 검정하고, 다중 검정 보정을 고려해야 한다.[34]
이 외에도 생물통계학은 생태학, 생태 예측, 생물학적 서열 분석[38], 시스템 생물학[39], 임상 연구, 제약 개발, 개체군 동태, 계통 발생학, 진화, 약력학, 약동학, 신경 영상 등 다양한 분야에 응용된다.
4. 1. 공중 보건
공중 보건은 역학, 보건 서비스 연구, 영양, 환경 보건, 보건 의료 정책 및 관리를 포함한다. 이러한 의학 내용에서 임상 시험의 설계와 분석을 고려하는 것이 중요하다. 한 가지 예로, 질병의 예후가 있는 환자의 중증도 상태를 평가하는 것이 있다.새로운 기술과 유전학 지식을 통해 생물 통계학은 이제 더욱 개인화된 의학인 시스템 의학에도 사용된다. 이를 위해 기존의 환자 데이터, 임상 병리학적 매개변수, 분자 및 유전 데이터뿐만 아니라 새로운 오믹스 기술로 생성된 데이터를 포함하여 다양한 출처의 데이터를 통합한다.[29]
4. 2. 정량 유전학
집단 유전학 및 통계 유전학을 연구하여 유전자형의 변이와 표현형의 변이를 연결한다. 즉, 다유전자 조절을 받는 정량적 형질인 측정 가능한 형질의 유전적 기초를 발견하는 것이 목적이다. 연속적인 형질을 담당하는 게놈 영역을 양적 형질 유전자좌(QTL)라고 한다. QTL 연구는 분자 마커를 사용하고 집단에서 형질을 측정함으로써 가능해졌지만, QTL 매핑은 F2 또는 재조합 동계 계통/계열(RIL)과 같은 실험적 교배를 통해 집단을 얻어야 한다. 게놈에서 QTL 영역을 스캔하려면 연관성에 기반한 유전자 지도를 구축해야 한다. 가장 잘 알려진 QTL 매핑 알고리즘 중 일부는 구간 매핑, 복합 구간 매핑, 다중 구간 매핑이다.[30]QTL 매핑 해상도는 검사된 재조합의 양에 의해 손상되며, 이는 많은 자손을 얻기 어려운 종에게는 문제이다. 또한 대립 유전자 다양성은 대조적인 부모로부터 유래된 개체로 제한되어 자연 집단을 대표하는 개체 패널을 가지고 있을 때 대립 유전자 다양성 연구를 제한한다.[31] 이러한 이유로, 형질과 분자 마커 간의 비무작위 연관성인 연관 불평형을 기반으로 QTL을 식별하기 위해 전장 유전체 연관 분석(GWAS)이 제안되었다. 이는 고처리량 SNP 유전자형 분석 개발을 통해 활용되었다.[32]
축산 및 식물 육종에서 육종을 목표로 하는 선택적 육종에 마커, 주로 분자 마커를 사용하는 것은 마커 보조 선택의 발전에 기여했다. QTL 매핑은 해상도가 제한적인 반면, GWAS는 환경의 영향을 받는 작은 효과의 희귀 변이체에서는 충분한 힘을 갖지 못한다. 따라서, 선택에서 모든 분자 마커를 사용하고 이 선택에서 후보자의 수행 능력을 예측할 수 있도록 하기 위해 유전체 선택(GS)의 개념이 등장했다. 제안은 훈련 집단을 유전자형 분석하고 표현형 분석하여, 유전자형에 속하지만 표현형 분석되지 않은 집단인 검정 집단의 개체에 대한 유전체 추정 육종 가치(GEBV)를 얻을 수 있는 모델을 개발하는 것이다.[33] 이러한 종류의 연구는 교차 검증의 개념을 고려하여 검증 집단을 포함할 수 있으며, 이 집단에서 측정된 실제 표현형 결과는 예측에 기반한 표현형 결과와 비교되어 모델의 정확성을 확인하는 데 사용된다.
정량 유전학은 농업에서 작물 개선 (식물 육종) 및 가축 (축산)에 사용되어 왔으며, 생물의학 연구에서 인간 유전학의 질병에 대한 소인성을 유발하거나 영향을 미칠 수 있는 후보 유전자 대립 유전자를 찾는 데 도움이 될 수 있다.
4. 3. 발현 데이터 분석
마이크로어레이, 차세대 시퀀서(유전체학용) 및 질량 분석법(단백질체학용)과 같은 새로운 생물 의학 기술은 방대한 양의 데이터를 생성하며, 이를 통해 동시에 많은 테스트를 수행할 수 있다.[19] 생물통계학적 방법을 이용해 신중하게 분석하면 노이즈에서 신호를 분리할 수 있다. 예를 들어, 마이크로어레이는 수천 개의 유전자를 동시에 측정하여 정상 세포와 비교했을 때 질병에 걸린 세포에서 어떤 유전자가 다르게 발현되는지 확인할 수 있다. 그러나 실제로 다르게 발현되는 유전자는 소수에 불과하다.[20]다중공선성은 하이 throughput 생물 통계학적 설정에서 자주 발생한다. 예측 변수(예: 유전자 발현 수준) 간의 높은 상호 상관 관계 때문에 한 예측 변수의 정보가 다른 변수에 포함될 수 있다. 5%의 예측 변수가 반응 변동성의 90%를 차지하는 경우도 있다. 이러한 경우, 차원 축소의 생물 통계학적 기술(예: 주성분 분석)을 적용할 수 있다. 선형 또는 로지스틱 회귀 및 선형 판별 분석과 같은 고전적인 통계 기법은 고차원 데이터(관측치 수 n이 특징 또는 예측 변수 p의 수보다 작을 때: n < p)에 적합하지 않다. 고차원의 경우, 항상 독립적인 검증 테스트 세트와 해당 검증 테스트 세트의 잔차 제곱합(RSS) 및 R2을 고려해야 하며, 훈련 세트의 값은 고려하지 않아야 한다.
유전자 집합 농축 분석(GSEA)은 개별 유전자가 아닌 전체 (기능적으로 관련된) 유전자 집합의 교란을 고려한다.[21] 이러한 유전자 집합은 알려진 생화학적 경로이거나 다른 기능적으로 관련된 유전자일 수 있다. 이 접근 방식은 단일 유전자가 잘못 교란되는 것보다 전체 경로가 잘못 교란될 가능성이 더 높기 때문에 더 강력하다. 또한, 이 접근 방식을 사용하여 JAK-STAT 신호 전달 경로와 같은 생화학적 경로에 대한 축적된 지식을 통합할 수 있다.
RNA-Seq 데이터에서 유전자 차등 발현 연구는 RT-qPCR 및 마이크로어레이와 마찬가지로 조건 비교를 요구한다. 목표는 서로 다른 조건 사이에서 풍부함에 유의미한 변화가 있는 유전자를 식별하는 것이다. RNA-Seq에서 발현 정량화는 유전자 서열의 일부인 엑손과 같이 일부 유전 단위로 요약된 매핑된 판독 정보를 사용한다. 마이크로어레이 결과는 정규 분포로 근사될 수 있지만, RNA-Seq 카운트 데이터는 음이항 분포로 더 잘 설명된다. 일반화 선형 모형은 통계적 유의성에 대한 테스트를 수행하는 데 사용되며, 유전자 수가 많으므로 다중 검정 보정을 고려해야 한다.[34] 유전체학 데이터에 대한 다른 분석의 예시는 마이크로어레이 또는 단백질체학 실험에서 나오며,[35][36] 질병 또는 질병 단계와 관련이 있는 경우가 많다.[37]
4. 4. 기타 응용 분야
5. 도구
- ASReml: VSNi[40]에서 개발한 소프트웨어로, R 환경에서도 패키지로 사용할 수 있다. 제한된 최대 우도 추정법(REML)을 사용하여 일반 선형 혼합 모델에서 분산 성분을 추정하도록 개발되었다. 고정 효과, 랜덤 효과, 중첩 또는 교차 효과가 있는 모델을 허용하며, 다양한 분산-공분산 행렬 구조를 조사할 수 있다.
- CycDesigN:[41] VSNi[40]에서 개발한 컴퓨터 패키지로, 연구자가 실험 설계를 만들고 CycDesigN에서 처리하는 세 가지 클래스(해결 가능, 비 해결 가능, 부분 복제 및 교차 설계) 중 하나에 있는 설계에서 나온 데이터를 분석하는 데 도움을 준다. 라틴화된 설계와 같은 덜 사용되는 설계도 포함한다.
- Orange: 고급 데이터 처리, 데이터 마이닝 및 데이터 시각화를 위한 프로그래밍 인터페이스다. 유전자 발현 및 유전체학 도구가 포함되어 있다.[22]
- R: 통계 컴퓨팅 및 그래픽에 특화된 오픈 소스 환경 및 프로그래밍 언어다. CRAN에서 관리하는 S 언어의 구현이다.[43] 데이터 테이블을 읽고, 기술 통계를 구하고, 모델을 개발 및 평가하는 기능 외에도, 전 세계 연구자가 개발한 패키지를 포함하고 있다.[44] 생물 정보학의 경우, 기본 저장소(CRAN)와 Bioconductor와 같은 다른 저장소에 패키지가 있으며, GitHub와 같은 호스팅 서비스에서 공유되는 개발 중인 패키지를 사용할 수도 있다.
- SAS: 대학교, 서비스 및 산업 전반에서 널리 사용되는 데이터 분석 소프트웨어다. SAS Institute에서 개발했으며 SAS 언어를 프로그래밍에 사용한다.
- PLA 3.0:[45] 규제 환경(예: 약물 테스트)을 위한 생물 통계 분석 소프트웨어로, 정량적 반응 분석(병렬선, 병렬 로지스틱, 기울기-비율) 및 이분형 분석(양자 반응, 이진 분석)을 지원한다. 조합 계산을 위한 가중치 방법과 독립적인 분석 데이터의 자동 데이터 집계도 지원한다.
- Weka: 기계 학습 및 데이터 마이닝을 위한 Java 소프트웨어로, 시각화, 클러스터링, 회귀, 연관 규칙 및 분류를 위한 도구 및 방법이 포함되어 있다. 교차 검증, 부트스트래핑 및 알고리즘 비교 모듈이 있으며, Perl 또는 R과 같은 다른 프로그래밍 언어로도 실행할 수 있다.[22]
- 기타: Python (프로그래밍 언어), SQL, NoSQL, NumPy, SciPy, SageMath, LAPACK, MATLAB, Apache Hadoop, Apache Spark, Amazon Web Services
6. 교육 프로그램
생물통계학 교육 프로그램은 거의 모두 대학원 수준에서 이루어진다. 이들은 대부분 보건대학, 의과대학, 임학 또는 농업과 관련된 학교에서, 또는 통계학과의 응용 분야로 발견된다.
미국에서는 여러 대학에 생물통계학과가 설치되어 있으며, 많은 다른 최상위 대학들이 생물통계학 교수를 통계학과 또는 역학과와 같은 다른 학과에 통합한다. 따라서 "생물통계학"이라는 이름을 가진 학과는 매우 다른 구조로 존재할 수 있다. 예를 들어, 비교적 새로운 생물통계학과들은 생물정보학 및 계산 생물학에 초점을 맞춰 설립되었으며, 오래된 학과들은 일반적으로 공중 보건 학교와 연계되어 있으며 역학 연구, 임상 시험 및 생물정보학을 포함하는 보다 전통적인 연구 라인을 갖추고 있다. 전 세계의 더 큰 대학에서 통계학과와 생물통계학과가 모두 존재하는 경우, 두 학과 간의 통합 정도는 최소한의 수준에서 매우 긴밀한 협력에 이르기까지 다양할 수 있다. 일반적으로 통계 프로그램과 생물통계 프로그램의 차이점은 두 가지이다. (i) 통계학과는 생물통계 프로그램에서는 덜 일반적인 이론/방법론 연구를 주최하는 경우가 많고, (ii) 통계학과는 의학 외의 생물학적 영역뿐만 아니라 산업(품질 관리), 비즈니스 및 경제와 같은 다른 영역도 포함할 수 있는 연구 라인을 가지고 있다.
7. 전문 학술지
참조
[1]
웹사이트
Allan, Frances Elizabeth (Betty) - Person - Encyclopedia of Australian Science and Innovation
https://www.eoas.inf[...]
2022-10-26
[2]
논문
Quantitative Genetics
2008-12-10
[3]
웹사이트
Academic Economics: Strengths and Faults After Considering Interdisciplinary Needs
http://www.tilsonfun[...]
2003-10-03
[4]
논문
Developing a Hypothesis and Statistical Planning
2017-10
[5]
논문
Biostatistics Primer: Part I
[6]
논문
Key Concepts in Biostatistics: Using Statistics to Answer the Question "Is There a Difference?"
2002-10-04
[7]
논문
Combining Qualitative and Quantitative Sampling, Data Collection, and Analysis Techniques in Mixed-Method Studies
2000
[8]
웹사이트
Absolute, relative, cumulative frequency and statistical tables – Probability and Statistics
https://www.sangakoo[...]
2018-04-10
[9]
웹사이트
DATASUS: TabNet Win32 3.0: Nascidos vivos – Brasil
http://tabnet.datasu[...]
[10]
서적
Introduction to Biostatistics. A Guide to Design, Analysis, and Discovery
Academic Press
[11]
논문
X. Contributions to the mathematical theory of evolution.—II. Skew variation in homogeneous material
1895-01-01
[12]
서적
Seeing through statistics
Thomson, Brooks/Cole
2005
[13]
서적
Basic statistics
Wm. C. Brown Pub
1994
[14]
서적
Econometrics
McGraw-Hill Irwin
[15]
논문
Essentials of Biostatistics in Public Health & Essentials of Biostatistics Workbook: Statistical Computing Using Excel
[16]
논문
Statisticians issue warning over misuse of P values
[17]
간행물
Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing
[18]
웹사이트
Null hypothesis
https://www.statlect[...]
2018-05-08
[19]
논문
Biostatistics: Revealing analysis
2012-02-08
[20]
논문
Microarrays, Empirical Bayes and the Two-Groups Model
2008-02
[21]
논문
Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles
2005-09-30
[22]
논문
Bioinformatics
[23]
웹사이트
TAIR - Home Page
https://www.arabidop[...]
[24]
웹사이트
Phytozome
https://phytozome.jg[...]
[25]
웹사이트
International Nucleotide Sequence Database Collaboration - INSDC
http://www.insdc.org[...]
[26]
웹사이트
Top
https://www.ddbj.nig[...]
2024-01-11
[27]
웹사이트
The European Bioinformatics Institute < EMBL-EBI
https://www.ebi.ac.u[...]
[28]
웹사이트
National Center for Biotechnology Information
https://www.ncbi.nlm[...]
U. S. National Library of Medicine –
[29]
논문
Whither systems medicine?
[30]
논문
QTL mapping and the genetic basis of adaptation: Recent developments
[31]
논문
The advantages and limitations of trait analysis with GWAS: A review
[32]
논문
Status and Prospects of Association Mapping in Plants
[33]
논문
Genomic Selection in Plant Breeding: Methods, Models, and Perspectives
http://oar.icrisat.o[...]
[34]
논문
From RNA-seq reads to differential expression results
[35]
서적
Statistical Analysis of Gene Expression Microarray Data
Wiley-Blackwell
[36]
서적
Microarray Gene Expression Data Analysis: A Beginner's Guide
Chapman & Hall/CRC
[37]
서적
Medical Biostatistics for Complex Diseases
Wiley-Blackwell
[38]
서적
Statistical Methods in Bioinformatics: An Introduction
Springer
[39]
서적
Applied Statistics for Network Biology: Methods in Systems Biology
Wiley-Blackwell
[40]
웹사이트
Home - VSN International
https://www.vsni.co.[...]
[41]
웹사이트
CycDesigN - VSN International
https://www.vsni.co.[...]
[42]
간행물
Beyond Latin Squares: A Brief Tour of Row-Column Designs
[43]
웹사이트
The Comprehensive R Archive Network
https://cran.r-proje[...]
[44]
서적
Biostatistics explored through R software: An overview
Vinaitheerthan Renganathan
[45]
웹사이트
PLA 3.0
https://www.bioassay[...]
2019-07-01
[46]
웹사이트
Biostatistics - Oxford Academic
https://academic.oup[...]
[47]
웹사이트
The International Journal of Biostatistics
https://www.degruyte[...]
[48]
웹사이트
PubMed Journals will be shut down
https://ncbiinsights[...]
2018-06-15
[49]
문서
Epidemiology
https://ebph.it/
[50]
웹사이트
Biometrics
https://onlinelibrar[...]
[51]
웹사이트
Biometrika - Oxford Academic
https://academic.oup[...]
[52]
웹사이트
Biometrical Journal
https://onlinelibrar[...]
[53]
웹사이트
Communications in Biometry and Crop Science
http://agrobiol.sggw[...]
[54]
웹사이트
Statistical Applications in Genetics and Molecular Biology
https://www.degruyte[...]
2002-05-01
[55]
웹사이트
Statistical Methods in Medical Research
https://journals.sag[...]
[56]
웹사이트
Pharmaceutical Statistics
https://onlinelibrar[...]
[57]
웹사이트
Statistics in Medicine
https://onlinelibrar[...]
[58]
서적
The biometry of plant growth
Edward Arnold
[59]
서적
Introduction to medical biometry and statistics
WB Saunders
[60]
서적
Dynamics of human reproduction: biology, biometry, demography
Routledge
[61]
서적
Introduction to biostatistics
San Francisco: WH Freeman
[62]
서적
Fundamentals of biostatistics
Nelson Education
[63]
서적
Principles of biostatistics
CRC Press
[64]
서적
Biostatistics: a foundation for analysis in the health sciences
Wiley
[65]
서적
Biostatistics: a methodology for the health sciences
John Wiley & Sons, Inc.
[66]
서적
Handbook of biometrics
Springer Science & Business Media
[67]
서적
Guide to biometrics
Springer Science & Business Media
[68]
서적
Introduction to biometrics
Springer Science & Business Media
[69]
서적
Encyclopedia of biometrics
Springer Publishing Company, Incorporated
[70]
서적
Karl Pearson: The scientific life in a statistical age
Greenwood Publishing Group
[71]
논문
Karl Pearson and the establishment of mathematical statistics
International Statistical Review
2009
[72]
논문
Mendel and modern genetics: the legacy for today
Endeavour
2003
[73]
논문
Mendelian controversies: a botanical and historical review
American Journal of Botany
2001
[74]
서적
Neo-Darwinism
Edward Arnold (Publishers) Limited
1982
[75]
논문
Population genetics history: a personal view
Annual review of genetics
1987
[76]
서적
Principles of population genetics
Sinauer associates
1997
[77]
논문
Applications of population genetics to animal breeding, from Wright, Fisher and Lush to genomic prediction
Genetics
2014
[78]
서적
On Growth and Form
Cambridge University Press
1917
[79]
뉴스
수학적 사고를 통해 생명의 신비를 찾다
http://www.segye.com[...]
세계일보
2015-07-18
[80]
문서
상계서 p,370
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com