맨위로가기

하디-바인베르크 원리

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

하디-바인베르크 평형(Hardy-Weinberg equilibrium)은 유전자 풀 내에서 대립 유전자의 빈도가 세대를 거듭해도 변하지 않고 평형 상태를 유지하는 현상을 말한다. 이 원리는 무작위 교배, 큰 개체군 크기, 돌연변이와 이주의 부재, 자연 선택의 부재 등 특정 조건을 만족하는 멘델 집단에서 성립하며, 수학적으로 증명될 수 있다. 하디-바인베르크 평형은 유전자형 빈도와 대립 유전자 빈도 사이의 관계를 설명하며, 진화 연구, 유전 질환 연구, 법의학 등 다양한 분야에서 활용된다. 실제 개체군은 이러한 조건을 완벽하게 만족하지 않으므로, 하디-바인베르크 평형으로부터의 이탈을 검정하여 유전적 구조를 파악하고 진화 과정을 연구하는 데 사용된다.

더 읽어볼만한 페이지

  • 통계유전학 - 양적 형질 위치
    양적 형질 위치(QTL)는 다유전자 효과로 나타나는 특정 표현형 형질과 연관된 DNA 영역을 의미하며, 연속적인 변이를 보이는 형질의 유전적 기초를 설명하고 후보 유전자를 식별하는 데 활용된다.
  • 통계유전학 - 대치법 (유전학)
    대치법(유전학)은 유전체 분석 비용 절감을 위해 변동성이 높은 유전적 변이의 하위 집합을 분석하고 참조 패널을 통해 유전자형 정보를 추정하는 방법이다.
  • 성선택 - 성 선택
    성 선택은 동물의 번식 성공에 유리한 특징을 진화시키는 이론으로, 수컷 간 경쟁과 암컷의 선택을 통해 작동하며, 다윈에 의해 제시되었고 현재는 동물행동학과 진화생물학의 핵심 이론으로 인정받고 있으나 사회적 맥락에 대한 고려 부족 비판도 존재한다.
  • 성선택 - 종분화
    종분화는 하나의 종이 두 개 이상의 별개 종으로 갈라지는 진화 과정으로, 유성생식, 이소적·주변적·측지적·동소적 종분화 메커니즘, 생태적·성 선택, 강화, 다배수체 형성, 잡종 종분화, 인위적 종분화 등 다양한 요인과 과정을 통해 발생하며, 점진적 진화와 단속평형설이라는 속도에 대한 논쟁이 존재한다.
  • 고전유전학 - 대립 유전자
    대립 유전자는 염색체 상의 동일한 유전자 자리에 위치하여 서로 다른 표현형을 나타내는 유전자의 변이 형태로, 유전자 활성 차이에 따라 여러 형태로 분류되며 복대립 유전 현상을 통해 다양한 표현형을 만들고 유전 질환 이해 및 유전자 검사에 중요한 역할을 한다.
  • 고전유전학 - 야생형
    야생형은 특정 유전자 좌의 표준적인 대립 유전자의 산물로, 돌연변이 대립 유전자와 대비되며, 유전자 매핑 기술 발전에 따라 종의 지리적 범위에 걸쳐 다양한 형태로 존재하고, 질병 치료, 백신 개발, 농업 생산성 향상 등 다양한 분야에 응용된다.
하디-바인베르크 원리
유전학
명칭하디-바인베르크 원리
다른 명칭하디-바인베르크 법칙
하디-바인베르크 모형
하디-바인베르크 정리
독일어 명칭Hardy-Weinberg-Gesetz (하디-바인베르크-게세츠)
영어 명칭Hardy–Weinberg principle (하디-바인베르크 원리)
일본어 명칭ハーディー・ワインベルクの法則 (하디-바인베르크 노 호소쿠)
기본 정보
내용유성 생식을 하는 종에서 충분히 큰 개체군의 유전자 풀에서 배우자가 무작위로 생성되어 다음 세대를 구성할 때, 대립형질 및 유전자형 빈도는 일정하게 유지된다. (개체군은 진화하지 않는다.)
변수 f(A)p
변수 f(a)q
변수 f(AA)
변수 f(aa)
변수 f(Aa)2pq
관련 논문G. H. Hardy (1908) and Hardy–Weinberg Equilibrium

2. 하디-바인베르크 평형의 원리

'''하디-바인베르크 평형'''(Hardy-Weinberg equilibrium영어)은 대를 거듭하더라도 유전자 풀에서 대립유전자의 빈도가 변하지 않고 평형상태를 유지하는 것을 말한다.

하디-바인베르크 평형을 수학적으로 표현하기 위해 개체군 A의 유전자 풀에 우성유전자 A와 열성유전자 a가 있다고 가정한다. 한 세대에서 AA의 유전자형 빈도를 e, 2Aa의 유전자형 빈도를 2f, aa의 유전자형 빈도를 g라 했을 때 A와 a의 유전자 빈도는 다음과 같다.


  • A의 유전자 빈도 = e + f = p
  • a의 유전자 빈도 = f + g = q


p + q = 1 이므로,

  • A의 유전자 빈도 = p^2 + pq = p(p+q) = p
  • a의 유전자 빈도 = q^2 + pq = q(q+p) = q


결과적으로 1세대와 2세대의 유전자 빈도는 같으며, 세대가 거듭되어도 유전자형 빈도와 유전자 빈도는 변하지 않는다.

하디-바인베르크 평형이 일어나려면 유전자 풀이 변하지 않고 교배가 자유롭게 일어나야 한다. 이렇게 하디-바인베르크 평형이 이루어지는 집단을 멘델 집단이라고 한다.

2. 1. 하디-바인베르크 평형의 수학적 증명 (단성생식 이배체)

개체 하나가 수컷과 암컷 배우자를 동일한 빈도로 생성하고 각 유전자 위치에서 두 개의 대립 유전자를 갖는, 단성생식 이배체 개체군을 가정한다. 이 개체군은 무한대로 취급할 수 있을 정도로 크다고 가정하며, 배우자의 무작위 결합("유전자 풀" 개체군 모델)에 의해 번식한다. 이 개체군의 한 유전자 위치에는 두 개의 대립 유전자 A와 a가 있으며, 각각 초기 빈도 및 로 발생한다. 각 세대의 대립 유전자 빈도는 동형 접합자 및 이형 접합자의 예상 기여도에 따라 동일한 세대의 각 유전자형에서 대립 유전자를 함께 풀링하여 얻으며, 각각 1 및 1/2이다.[2]



다음 세대의 유전자형을 형성하는 다양한 방법은 퍼넷 사각형에 표시될 수 있다. 각 유전자형의 비율은 현재 세대의 행과 열 대립 유전자 빈도의 곱과 동일하다.

하디-바인베르크에 대한 퍼넷 사각형
colspan="2" rowspan="2"|암컷
A (p)a (q)
수컷A (p)AA (p2)Aa (pq)
a (q)Aa (qp)aa (q2)



항목의 합은 유전자형 빈도가 1이 되어야 하므로 이다.

, 이므로 의 이항 전개는 동일한 관계를 제공한다.

퍼넷 사각형 또는 이항 전개의 요소를 합하면 한 세대 후 자손 사이에서 예상되는 유전자형 비율을 얻는다.

이러한 빈도는 하디-바인베르크 평형을 정의한다. 첫 번째 세대 이후의 유전자형 빈도는 초기 세대의 유전자형 빈도와 같을 필요는 없다 (예: ). 그러나 모든 "미래" 시간에 대한 유전자형 빈도는 하디-바인베르크 빈도와 같을 것이다 (예: for ). 이는 다음 세대의 유전자형 빈도가 및 방정식에 의해 계산된 바와 같이 초기 세대에서 보존되는 현재 세대의 대립 유전자 빈도에만 의존하기 때문이다.

:\begin{align}

f_1(\text{A}) &= f_1(\text{AA}) + \tfrac{1}{2} f_1(\text{Aa}) = p^2 + p q = p (p+q) = p = f_0(\text{A}) \\

f_1(\text{a}) &= f_1(\text{aa}) + \tfrac{1}{2} f_1(\text{Aa}) = q^2 + p q = q (p + q) = q = f_0(\text{a})

\end{align}

2. 2. 퍼넷 사각형 (Punnett square)



다음 세대의 유전자형을 형성하는 다양한 방법은 퍼넷 사각형에 표시될 수 있다. 각 유전자형의 비율은 현재 세대의 행과 열 대립 유전자 빈도의 곱과 같다.

하디-바인베르크에 대한 퍼넷 사각형
colspan="2" rowspan="2"|암컷
A (p)a (q)
수컷A (p)AA (p2)Aa (pq)
a (q)Aa (qp)aa (q2)



항목의 합은 유전자형 빈도가 1이 되어야 하므로 p^2 + 2pq + q^2 = 1이다.

다시 한번, p + q = 1이므로 (p + q)^2 = p^2 + 2pq + q^2 = 1의 이항 전개는 동일한 관계를 제공한다.

퍼넷 사각형 또는 이항 전개의 요소를 합하면 한 세대 후 자손 사이에서 예상되는 유전자형 비율을 얻는다.

개체군 내에 대립 유전자 A와 a가 있고, A 유전자의 유전자 빈도(유전자 풀에서 차지하는 대립 유전자의 비율)를 p, a 유전자의 유전자 빈도를 q로 한다(p+q=1). 이 개체군이 만드는 다음 세대의 개체군의 유전자형 분리비는 AA:Aa:aa=p2:2pq:q2가 된다. 유전자형이 AA가 되는 것은 유전자 풀에서 모은 2개의 대립 유전자가 모두 A였을 경우로, 그렇게 될 확률은 p×p=p2가 된다. 유전자형이 Aa가 되는 것은 모은 2개의 대립 유전자가 A와 a 각각 1개씩이었을 경우인데, 이 경우에는 어머니로부터 A를 받아 Aa가 되는 경우와 아버지로부터 A를 받아 Aa가 되는 경우의 2가지가 있으며, 그 결과 분리비는 2pq가 된다.

2. 3. 다항식 전개를 이용한 일반화

하디-바인베르크 원리는 2개 이상의 대립 유전자와 배수성에 대해 일반화될 수 있다.

추가적인 대립 유전자 빈도인 ''r''을 고려해 보자. 두 대립 유전자 사례는 (''p'' + ''q'')2이항 전개이며, 따라서 세 대립 유전자 사례는 (''p'' + ''q'' + ''r'')2의 삼항 전개이다.

:(p+q+r)^2=p^2 + q^2 + r^2 + 2pq +2pr + 2qr\,

더 일반적으로는, 대립 유전자 A1, ..., A''n''을 대립 유전자 빈도 ''p''1에서 ''p''''n''으로 표현할 수 있다.

:(p_1 + \cdots + p_n)^2\,

이는 모든 동형 접합체에 대해 다음과 같다.

:f(A_i A_i) = p_i^2\,

그리고 모든 이형 접합체에 대해 다음과 같다.

:f(A_i A_j) = 2p_ip_j\,

3개 대립 유전자 사례(왼쪽) 및 4개 대립 유전자 사례(오른쪽)에 대한 퍼넷 사각형. 흰색 영역은 동형 접합체이고, 색상 영역은 이형 접합체이다.


하디-바인베르크 평형 원리는 배수체 시스템, 즉 각 염색체를 2개 이상 가지고 있는 유기체로 일반화될 수 있다. 다시 두 개의 대립 유전자만 고려해 보자. 이배체 생물의 경우 다음 이항 전개와 같다.

:(p + q)^2\,

따라서 배수체 생물의 경우 이항 전개는 다음과 같다.

:(p + q)^c\,

여기서 ''c''는 배수성이며, 예를 들어 사배체(''c'' = 4)의 경우 다음과 같다.

사배체의 예상 유전자형 빈도
유전자형빈도
AAAAp^4
AAAa4p^3 q
AAaa6p^2q^2
Aaaa4pq^3
aaaaq^4



유기체가 '진정한' 사배체인지 아니면 양친배수체인지는 개체군이 하디-바인베르크 평형에 도달하는 데 얼마나 걸리는지를 결정한다.

c배체에서 n개의 서로 다른 대립 유전자가 있는 경우, 하디-바인베르크 평형에서의 유전자형 빈도는 (p_1 + \cdots + p_n)^c의 다항 정리의 개별 항에 의해 주어진다.

:(p_1 + \cdots + p_n)^c = \sum_{k_1, \ldots, k_n\ \in \mathbb{N} : k_1 + \cdots +k_n=c} {c \choose k_1, \ldots, k_n}

p_1^{k_1} \cdots p_n^{k_n}

3. 하디-바인베르크 평형의 조건 (멘델 집단의 조건)

하디-바인베르크 평형이 성립하려면 다음 조건을 모두 만족해야 한다.[3]


  • 무작위 교배가 이루어져야 한다.
  • 집단이 매우 커야 한다.
  • 돌연변이나 이주(유전자 흐름)가 없어야 한다.
  • 자연선택이 작용하지 않아야 한다.
  • 성별에 따른 대립 유전자 빈도 차이가 없어야 한다.


이 조건들 중 하나라도 만족하지 못하면, 그 집단은 진화적 변화를 나타낸다. 대부분의 자연 집단은 이 조건들을 만족하지 못한다.

하디-바인베르크 평형을 뒷받침하는 7가지 가정은 다음과 같다.[3]

  • 생물은 배수체이다.
  • 유성 생식만 일어난다.
  • 세대가 중첩되지 않는다.
  • 짝짓기는 무작위로 이루어진다.
  • 개체군 크기는 무한히 크다.
  • 대립 유전자 빈도는 성별에 따라 동일하다.
  • 이주, 유전자 흐름, 혼합, 돌연변이 또는 선택이 없다.


하디-바인베르크 가정 위반은 예상과 다른 결과를 초래할 수 있으며, 개체군에 미치는 영향은 위반된 가정에 따라 달라진다.

개체군이 무작위 짝짓기, 큰 집단 크기, 돌연변이와 이주의 부재, 자연 선택의 부재 중 하나를 위반하면, 각 세대마다 하디-바인베르크 비율은 유지되지만 대립 유전자 빈도는 시간이 지남에 따라 변경된다.

실제 유전자형 데이터에서 하디-바인베르크 평형에서 벗어나는 것은 유전자형 오류의 징후일 수 있다.[4][5][6]

3. 1. 무작위 교배 (Random mating)

하디-바인베르크 평형이 성립하기 위한 조건 중 하나는 무작위 교배(random mating)이다. 무작위 교배는 두 유전자형이 짝 지어질 확률이 집단 내에서 해당 유전자형 빈도의 곱과 같다는 의미이다. 예를 들어, MM 유전자형이 집단의 90%를 차지한다면, 어떤 개체가 MM 유전자형의 개체와 교배할 확률은 90%이다. MM과 MM이 교배할 확률은 (0.9)*(0.9)=0.81이다.[3]

하지만 선택이나 주어진 상황 때문에 무작위 교배가 이루어지지 않는 경우도 있다. 한 개체가 특정한 표현형의 개체를 교배 짝으로 선택하는 것을 분별교배(assortative mating)라고 한다. 개체들이 유사한 표현형의 개체와 교배하는 경우를 양의 분별교배 또는 동류 교배라고 한다.[3]

무작위 짝짓기 가정이 위반되면 개체군은 하디-바인베르크 비율을 갖지 못하게 된다. 무작위 짝짓기가 아닌 경우의 흔한 원인은 근친 교배이며, 이는 모든 유전자에 대해 동형 접합성을 증가시킨다.[3]

3. 2. 큰 집단 크기

하디-바인베르크 평형은 집단이 매우 커야 한다는 조건을 포함한다. 각 세대에서 많은 수의 배우자가 만들어지더라도 다음 세대는 이전 세대 배우자의 일부만을 표본으로 하기 때문이다. 표본이 작을수록 한 집단을 정확히 대표하지 못할 가능성이 커진다.[3] 따라서 하디-바인베르크 평형에서는 집단이 무한히 크다고 가정한다. 큰 집단은 배우자의 큰 표본을 생산하며, 표본이 클수록 자손의 대립 유전자 빈도가 부모 집단의 대립 유전자 빈도를 정확하게 대표할 확률이 높아진다.

집단이 작거나 대립 유전자의 빈도가 매우 낮으면 대립 유전자 빈도는 우연에 의해 바뀔 수 있다. 이러한 변화를 무작위 유전 부동 또는 유전 부동이라고 한다.[3] 유전 부동은 작은 개체군에서 대립 유전자 빈도가 무작위로 변화하는 현상으로, 표본 추출 효과 때문에 발생한다. 표본 추출 효과는 대립 유전자가 소수의 복사본으로 존재할 때 가장 중요하다.[4][5][6]

3. 3. 돌연변이와 이주(유전자 흐름)의 부재

하디-바인베르크 평형이 성립하려면 돌연변이가 일어나지 않아야 하고, 집단 내외로 개체의 이주(유전자 흐름)가 없어야 한다.[3] 이는 대립유전자의 소실이나 첨가를 막기 위한 조건이다.

  • 돌연변이: 돌연변이는 대립 유전자 빈도에 미묘한 영향을 주지만, 새로운 대립 유전자를 개체군에 도입할 수 있다.[3] 돌연변이율은 10-4에서 10-8 정도이며, 반복적인 돌연변이는 강력한 선택이 작용하더라도 개체군에서 대립 유전자를 유지할 수 있다.[3]

  • 이주 (유전자 흐름): 이주는 둘 이상의 개체군을 유전적으로 연결하며, 일반적으로 대립 유전자 빈도를 개체군 사이에서 균일하게 만든다.[3] 일부 이주 모델은 무작위 짝짓기를 포함하지 않아 하디-바인베르크 비율이 유효하지 않을 수 있다.[3]


따라서 하디-바인베르크 평형에서는 돌연변이와 이주(유전자 흐름)가 없어야 한다.[3]

3. 4. 자연 선택의 부재

하디-바인베르크 평형이 성립하려면 어느 개체도 자신의 유전자형 때문에 생식에서 유리하거나 불리하지 않아야 한다. 즉, 자연 선택이 없어야 한다.[3]

개체군이 다음 가정 중 하나를 위반하면 각 세대에서 하디-바인베르크 비율은 유지되지만, 대립 유전자 빈도는 시간이 지나면서 바뀐다.

  • 자연 선택은 보통 대립 유전자 빈도를 빠르게 변화시킨다. 방향성 선택은 결국 선호되는 대립 유전자를 제외한 나머지를 잃게 하지만(단, 한 대립 유전자가 우성인 경우 열성 대립 유전자는 낮은 빈도로 생존 가능), 균형 선택처럼 일부는 대립 유전자 손실 없이 평형을 유지한다.

3. 5. 성별에 따른 대립유전자 빈도 차이 부재

하디-바인베르크 평형을 뒷받침하는 7가지 가정 중 하나는 성별에 따른 대립 유전자 빈도가 동일하다는 것이다.[3] 만약 성별에 따라 대립유전자 빈도가 다르면 하디-바인베르크 평형이 유지되지 않을 수 있다.

예를 들어, 사람의 적록 색맹은 X 염색체 연관 열성 형질이다. 이형 배우자 성(예: 포유류 수컷, 조류 암컷)은 유전자의 사본을 하나만 가지고(반수성), 동형 배우자 성(예: 사람 암컷)은 두 개의 사본을 가진다. 이 경우 평형 상태에서 유전자형 빈도는 이형 배우자 성에서는 ''p''와 ''q''이지만, 동형 배우자 성에서는 ''p''2, 2''pq'', ''q''2이다. 서유럽 남성의 경우 약 12명 중 1명(''q'' = 0.083)이 적록 색맹을 겪지만, 여성의 경우 약 200명 중 1명(''q''2 = 0.005)으로 하디-바인베르크 비율과 매우 가깝다.

만약 각 하위 집단(남성 또는 여성)에서 서로 다른 대립 유전자 빈도를 가진 남성과 여성이 있는 집단이 합쳐지면, 다음 세대에서 남성 집단의 대립 유전자 빈도는 여성 집단의 대립 유전자 빈도를 따르게 된다. 이는 각 아들이 어머니로부터 X 염색체를 물려받기 때문이다. 이러한 이유로 집단은 매우 빠르게 평형 상태로 수렴한다.

4. 하디-바인베르크 평형의 의의 및 활용

하디-바인베르크 평형은 현실에서 여러 요인으로 인해 완벽하게 유지되기 어렵지만, 유전적 평형 상태를 가정하여 이론값을 도출하고 실제 측정값과 비교함으로써 개체군의 유전적 구조를 파악하는 데 유용하게 활용된다. 특히, 집단 유전학, 생태학, 분류학 연구에서 집단 내 또는 집단 간 유전자 교류 양상을 파악하는 데 필수적이다.[1]

4. 1. 진화 연구

자연 상태에서는 하디-바인베르크 평형을 만족하는 집단이 거의 없다. 멘델 집단의 조건을 모두 만족하는 집단이 없어 돌연변이, 자연선택, 유전적 부동, 이주, 격리 등의 이유로 인해 유전자풀이 변하기 때문이다. 그러나 이런 소진화의 과정은 너무 느려서 개체군은 거의 평형을 이루고 있는 것처럼 보인다. 따라서 사람들은 대립인자와 유전자형의 발현빈도를 추정해 개체군의 진화에 대한 연구나 공중 보건학 등에 응용할 수 있다.[1]

집단 유전학, 생태학 등의 연구, 종 수준에서의 분류학 연구에서 집단 내·집단 간의 유전자 교류 양상을 아는 것은 중요하다. 하디-바인베르크 평형의 법칙을 이해하는 것은 이를 위해 필수적이다.[1]

이 법칙이 성립하려면 다양한 전제 조건이 충족되어야 한다. 그러한 상황은 현실에서는 거의 없을 것 같지만, 이 이상적인 상태에서 도출되는 이론값과 실측값을 통계학적으로 비교하는 것은 해당 개체군의 유전적 구조를 이해하는 데 유효하다. 예를 들어, 이형 접합체의 빈도가 이론값보다 유의하게 적은 경우, 이는 집단 내에 서로 유전적으로 격리된 몇몇 집단이 존재한다는 것을 반영하고 있을지도 모른다. 이 사실은 예를 들어 동종 종의 발견으로 이어질 가능성도 있다.[1]

역사적인 의의로서는, 다윈의 이론을 보강했다는 점을 들 수 있다. 다윈의 자연 선택설에 대한 비판으로, "부모의 특징이 섞여서 자식에게 전달되므로(혼합설) 집단 내 형질이 균질화되어 유리한 형질이 남지 않는다."라는 의견이 있었지만, 멘델의 법칙이 지지하는 입자설과 하디-바인베르크 평형의 법칙을 채택하면, 여러 세대에 걸쳐 유전적 다형성이 유지될 수 있음을 설명할 수 있으며, 즉, 자연 선택의 대상이 되는 유전적 변이가 집단 내에 보존됨을 의미한다.(물론, 하디-바인베르크 평형의 법칙은 자연 선택이 작용하지 않는다는 조건을 요구한다. 자연 선택의 효과는 항상 일정하지 않다는 점에 유의해야 한다.)[1]

개체군 내의 유전자 빈도가 변화하는 것은 진화의 정의 중 하나이다. 하디-바인베르크 평형 법칙은 진화가 없는 개체군에 대해 말하고 있다. 조건 1의 "자유 교배이다"는 인간이 교배에 관여하는 원예 품종이나 가축에서는 성립하지 않는다. 조건 4의 "돌연변이가 일어나지 않는다"에 대해서는, 분자 유전학 연구의 진전에 따라 돌연변이율이 밝혀지고 있으며, 충분히 긴 기간이 있다면 돌연변이는 반드시 발생한다는 것을 알 수 있다. 조건 5의 "자연 선택이 없다"에 대해서는, 유전자형의 차이가 자연 선택을 초래하는 사례가 다수 알려져 있다. 이것들은, 상기 조건이 성립하지 않는 장기적인 시점에서는 하디-바인베르크 평형 법칙은 성립하지 않지만 (즉, 진화가 일어난다), 단기간의 시점에서는 법칙이 성립한다. 반대로 말하면, 진화 연구는 어떻게 하디-바인베르크 평형 법칙이 깨지고 있는가에 대한 연구라고 할 수 있다.[1]

4. 2. 유전 질환 연구

하디-바인베르크 평형 원리는 집단의 환자 빈도를 기반으로 상염색체 열성 질환의 보인자 빈도를 추정하는 데 사용될 수 있다.

낭성 섬유증을 가지고 태어나는 아기는 약 1/2500명이다. 이는 북유럽 인구에서 관찰되는 동형 접합 개체의 빈도이다. 하디-바인베르크 방정식을 사용하여 이형 접합 개체인 보인자 빈도 \textstyle 2pq를 추정할 수 있다.

:

\begin{align}

& q^2 = \frac{1}{2500} \\[5pt]

& q = \frac{1}{50} \\[5pt]

& p = 1 - q

\end{align}



\textstyle \frac{1}{50}은 작으므로 ''p'', \textstyle 1 - \frac{1}{50}을 1로 간주할 수 있다.

:

\begin{align}

2pq = 2 \cdot \frac{1}{50} \\[5pt]

2pq = \frac{1}{25}

\end{align}



따라서 보인자 빈도는 \textstyle \frac{1}{25}로 추정되며, 이는 북유럽 인구에서 관찰되는 빈도와 거의 같다.

이것은 보인자 빈도가 출생 빈도의 제곱근의 약 두 배라는 것으로 단순화될 수 있다.

4. 3. 법의학

하디-바인베르크 평형을 만족하는 집단은 자연 상태에서 거의 없다. 멘델 집단의 조건을 모두 만족하는 집단이 없어 돌연변이, 자연선택, 유전적 부동, 이주, 격리 등의 이유로 유전자풀이 변하기 때문이다. 그러나 이러한 소진화의 과정은 매우 느리게 일어나기 때문에 개체군은 거의 평형을 이루고 있는 것처럼 보인다. 따라서 사람들은 대립 유전자와 유전자형의 발현 빈도를 추정하여 개체군의 진화에 대한 연구나 공중 보건학 등에 응용할 수 있다.

5. 하디-바인베르크 평형으로부터의 이탈 검정

하디-바인베르크 평형을 뒷받침하는 7가지 가정이 위반되면, 관찰되는 유전자형 빈도가 예상과 달라질 수 있다. 이러한 이탈은 개체군에 영향을 미치며, 그 영향은 어떤 가정이 위반되었는지에 따라 다르다.


  • 무작위 짝짓기 가정이 위반되면 개체군은 하디-바인베르크 비율을 갖지 못한다. 근친 교배는 무작위가 아닌 짝짓기의 흔한 원인이며, 모든 유전자에 대해 동형 접합성을 증가시킨다.


다음 4가지 가정 중 하나가 위반되는 경우, 각 세대마다 하디-바인베르크 비율을 유지할 수 있지만, 대립 유전자 빈도는 시간이 지남에 따라 변한다.

  • 자연 선택은 대립 유전자 빈도를 변화시키며, 종종 매우 빠르게 변화시킨다. 방향성 선택은 결국 선호되는 대립 유전자를 제외한 모든 대립 유전자를 잃게 하지만, 균형 선택과 같은 일부 형태의 선택은 대립 유전자 손실 없이 평형 상태를 유지한다.
  • 돌연변이는 새로운 대립 유전자를 개체군에 도입하여 대립 유전자 빈도에 미묘한 영향을 미친다. 돌연변이율은 10-4에서 10-8 정도이며, 대립 유전자 빈도의 변화는 기껏해야 동일한 정도이다. 반복적인 돌연변이는 강력한 선택이 작용하더라도 개체군에서 대립 유전자를 유지한다.
  • 이주는 둘 이상의 개체군을 유전적으로 연결한다. 일반적으로 대립 유전자 빈도는 개체군 사이에서 더욱 균일해진다. 일부 이주 모델에는 본질적으로 무작위가 아닌 짝짓기가 포함된다(Wahlund 효과 등). 이러한 모델의 경우, 하디-바인베르크 비율은 일반적으로 유효하지 않다.
  • 작은 개체군 크기는 유전 부동이라고 불리는 대립 유전자 빈도의 무작위적인 변화를 일으킨다. 표본 추출 효과는 대립 유전자가 소수의 복사본으로 존재할 때 가장 중요하다.


실제 유전자형 데이터에서 하디-바인베르크 평형에서 벗어나는 것은 유전자형 오류의 징후일 수 있다.[4][5][6]

하디-바인베르크 평형(HWE)으로부터의 이탈 여부는 일반적으로 피어슨 카이제곱 검정을 이용하여 검정한다. 하지만 표본 수가 적거나 대립 유전자가 많은 경우에는 피셔의 정확 검정과 같이 컴퓨터가 필요한 경우가 있으며, 최근에는 MCMC 방법도 제안되고 있다.

5. 1. 카이제곱 검정

하디-바인베르크 평형(HWE)으로부터의 이탈 여부를 검정하는 방법에는 여러 가지가 있다. 일반적으로 데이터에서 얻은 관찰된 유전자형 빈도와 HWE를 사용하여 얻은 예상 유전자형 빈도를 비교하는 피어슨 카이제곱 검정이 사용된다.[4][5][6]

대립 유전자가 많은 시스템의 경우, 가능한 유전자형의 조합이 많아져 일부 유전자형의 빈도는 매우 낮아질 수 있다. 이 경우, 표본 크기가 충분히 크지 않으면 모든 유전자형이 적절하게 나타나지 않을 수 있다. 그러면 카이제곱 분포의 점근적 가정이 유효하지 않게 되며, 피셔의 정확 검정과 같이 컴퓨터를 이용한 복잡한 계산이 필요할 수 있다. 최근에는 MCMC 방법을 사용한 검정 방법도 제안되고 있다.[4][5]

다음은 E. B. 포드(1971)가 얼룩호랑나방에 대해 기록한 데이터를 이용한 카이제곱 검정의 예시이다. 여기서 유전자형-표현형 구분은 무시할 정도로 작다고 가정한다. 귀무 가설은 개체군이 하디-바인베르크 비율에 있다는 것이고, 대립 가설은 그렇지 않다는 것이다.

하디-바인베르크 원리 계산 예시
표현형흰 반점 (AA)중간 (Aa)작은 반점 (aa)합계
개체수146913851612



이 데이터로부터 대립 유전자 빈도를 계산하면 다음과 같다.

:

p = {2 \times \mathrm{obs}(\text{AA}) + \mathrm{obs}(\text{Aa}) \over 2 \times (\mathrm{obs}(\text{AA}) + \mathrm{obs}(\text{Aa}) + \mathrm{obs}(\text{aa}))}

= {2 \times 1469 + 138 \over 2 \times (1469+138+5)}

= { 3076 \over 3224}

= 0.954



:

q = 1 - p

= 1 - 0.954

= 0.046



따라서 하디-바인베르크 기댓값은 다음과 같다.

:

\mathrm{Exp}(\text{AA}) = p^2n = 0.954^2 \times 1612 = 1467.4



:

\mathrm{Exp}(\text{Aa}) = 2pqn = 2 \times 0.954 \times 0.046 \times 1612 = 141.2



:

\mathrm{Exp}(\text{aa}) = q^2n = 0.046^2 \times 1612 = 3.4



피어슨 카이제곱 검정 통계량은 다음과 같이 계산된다.

:

\chi^2 = \sum {(O - E)^2 \over E}

= {(1469 - 1467.4)^2 \over 1467.4} + {(138 - 141.2)^2 \over 141.2} + {(5 - 3.4)^2 \over 3.4}

= 0.001 + 0.073 + 0.756

= 0.83



자유도는 1이다(하디-바인베르크 비율 검정을 위한 자유도는 유전자형의 수에서 대립 유전자의 수를 뺀 값). 자유도 1에 대한 5% 유의 수준은 3.84이며, 계산된 χ2 값은 이보다 작으므로, 개체군이 하디-바인베르크 빈도에 있다는 귀무 가설은 '''기각되지 않는다'''.[4]

5. 2. 피셔의 정확 검정

피셔의 정확 검정은 하디-바인베르크 평형을 검정하는 데 사용될 수 있다. 이 검정은 대립 유전자 빈도 ''p''와 ''q''에 따라 조건부로 이루어지며, 문제는 이형 접합자의 적절한 수를 검정하는 것으로 볼 수 있다.[7] 하디-바인베르크 평형 가설은 이형 접합자의 수가 너무 많거나 너무 적을 경우 기각된다. 대립 유전자 빈도가 주어졌을 때 이형 접합자에 대한 조건부 확률은 다음과 같이 주어진다.[7]

:\operatorname{prob}[n_{12} \mid n_1] = \frac{\binom{n}{n_{11}, n_{12}, n_{22}} } {\binom{2n }{n_1, n_2}} 2^{n_{12}},

여기서 ''n''11, ''n''12, ''n''22는 세 가지 유전자형 AA, Aa, aa의 관측된 수이며, ''n''1는 A 대립 유전자의 수이고, n_1 = 2 n_{11} + n_{12}이다.

'''예시'''

Emigh (1980)의 예시 중 하나를 사용하여[7], ''n'' = 100이고 ''p'' = 0.34인 경우를 고려할 수 있다. 관측 가능한 이형 접합자와 그 정확한 유의 수준은 아래 표와 같다.

''n'' = 100, ''p'' = 0.34에 대한 피셔의 정확 검정 예시[7]
이형 접합자 수유의 수준
00.000
20.000
40.000
60.000
80.000
100.000
120.000
140.000
160.000
180.001
200.007
220.034
230.067
240.151
250.291
260.474
270.730
281.000



이 표를 사용하여 관측된 이형 접합자의 수를 기반으로 검정의 유의 수준을 찾는다. 예를 들어, 20개의 이형 접합자를 관측한 경우, 검정의 유의 수준은 0.007이다. 작은 표본에 대한 피셔의 정확 검정에서 흔히 볼 수 있듯이, 유의 수준의 변화는 상당히 거칠다.

그러나 이러한 표는 ''n''과 ''p'' 모두에 의존하기 때문에, 모든 실험에 대해 이러한 표를 만들어야 한다.

6. 근친 교배와 하디-바인베르크 평형

근친 계수 F (''F''-통계량 참조)는 하디-바인베르크 평형에서 기대되는 값에서 관찰된 이형접합자의 빈도를 뺀 값을, 하디-바인베르크 평형에서 기대되는 값으로 나눈 값이다.

: F = \frac{\operatorname{E}{(f(\text{Aa}))} - \operatorname{O}(f(\text{Aa}))} {\operatorname{E}(f(\text{Aa}))} = 1 - \frac{\operatorname{O}(f(\text{Aa}))} {\operatorname{E}(f(\text{Aa}))},

여기서 하디-바인베르크 평형에서 기대되는 값은 다음과 같다.

: \operatorname{E}(f(\text{Aa})) = 2 p q

예를 들어, 위의 Ford의 데이터의 경우:

:F = 1 - {138 \over 141.2} = 0.023.

두 개의 대립 유전자의 경우, 하디-바인베르크 비율에 대한 카이제곱 적합도 검정은 근친 교배에 대한 검정과 동일하다. F = 0.

근친 계수는 기대값이 0에 가까워짐에 따라 불안정하며, 따라서 희귀하고 매우 흔한 대립 유전자에는 유용하지 않다. 다음과 같다: F \big|_{E=0, O=0} = -\infty; F \big|_{E=0, O>0}는 정의되지 않는다.

7. 역사

멘델 유전학은 1900년에 재발견되었다. 그러나 멘델 유전학이 어떻게 연속적인 특성을 유발할 수 있는지는 당시에는 알려지지 않았기 때문에 몇 년 동안 다소 논란이 있었다. 어드니 율(1902)은 우성 대립 유전자가 개체군에서 증가할 것이라고 생각했기 때문에 멘델주의에 반대했다.[10] 미국의 윌리엄 E. 캐슬(1903)은 선택이 없으면 유전자형 빈도가 안정적으로 유지된다는 것을 보여주었다.[11] 칼 피어슨(1903)은 ''p'' = ''q'' = 0.5의 값을 갖는 하나의 평형 위치를 찾았다.[12] 레지날드 퍼넷은 율의 주장에 반박할 수 없어서 이 문제를 G. H. 하디에게 소개했다. 하디는 영국수학자였고 퍼넷과 크리켓을 같이하던 사이였다. 하디는 순수 수학자였고 응용 수학을 약간 경멸했다. 생물학자들이 수학을 사용하는 것에 대한 그의 견해는 그가 1908년 논문에서 "매우 간단하다"고 묘사한 부분에서 드러난다.[13]

:''과학 편집자에게: 저는 제가 전문적인 지식이 없는 문제에 관한 논의에 개입하는 것을 꺼리고, 제가 하고 싶은 매우 간단한 요점이 생물학자들에게 익숙해졌을 것이라고 생각합니다. 그러나 R. C. 퍼넷 씨가 저에게 주의를 환기시킨 어드니 율 씨의 몇몇 발언은 아직도 그것을 하는 것이 가치가 있을 수 있다는 것을 시사합니다...''

:''Aa가 멘델적 특성의 쌍이고 A가 우성이며, 주어진 세대에서 순수 우성(AA), 이형 접합자(Aa) 및 순수 열성(aa)의 수가'' ''p'':2''q'':''r''와 같다고 가정합니다. ''마지막으로, 그 수가 상당히 많아서 짝짓기를 무작위로 간주할 수 있고, 성별이 세 가지 변종으로 균등하게 분배되고, 모두 동일하게 비옥하다고 가정합니다. 곱셈표 유형의 약간의 수학만으로도 다음 세대에서 숫자가'' (''p'' + ''q'')2:2(''p'' + ''q'')(''q'' + ''r''):(''q'' + ''r'')2, 또는 ''p''1:2''q''1:''r''1와 같다는 것을 알 수 있습니다, ''라고 말합니다.''

:''흥미로운 질문은: 어떤 상황에서 이 분포가 이전 세대와 동일할 것인가? 이것의 조건이'' ''q''2 = ''pr''이라는 것을 알기 쉽습니다. 그리고 ''q''12 = ''p''1''r''1이기 때문에 ''p'', ''q'', ''r''의 값이 무엇이든, 이 분포는 두 번째 세대 이후에도 변함없이 계속될 것입니다.''

이 원리는 1943년 커트 스턴이 독일 의사 빌헬름 바인베르크(1908)가 처음으로 독립적으로 공식화했다는 점을 지적하기 전까지 영어권에서 ''하디의 법칙''으로 알려졌다.[14][15] 윌리엄 캐슬은 1903년에 동일한 대립 유전자 빈도의 특별한 경우에 대한 비율도 도출했으며, 때로는 (드물지만) 하디-바인베르크-캐슬 법칙이라고도 불린다.

참조

[1] 논문 G. H. Hardy (1908) and Hardy–Weinberg Equilibrium 2008
[2] 웹사이트 Hardy–Weinberg in dioecious organisms https://www.mun.ca/b[...]
[3] 서적 Principles of population genetics Sunderland, MA: Sinauer 2007
[4] 논문 Detection of genotyping errors by Hardy–Weinberg equilibrium testing 2004-05
[5] 논문 Genotyping errors: causes, consequences and solutions https://www.nature.c[...] 2005-11
[6] 논문 Quantification of the Power of Hardy–Weinberg Equilibrium Testing to Detect Genotyping Error https://www.karger.c[...] 2006
[7] 논문 A Comparison of Tests for Hardy–Weinberg Equilibrium
[8] 논문 Tests for establishing compatibility of an observed genotype distribution with Hardy–Weinberg equilibrium in the case of a biallelic locus 2004-09
[9] 논문 New equivalence tests for Hardy–Weinberg equilibrium and multiple alleles 2020-02
[10] 문서 Yule, 1902
[11] 문서 Castle, 1903
[12] 문서 Pearson, 1903
[13] 문서 Hardy, 1908
[14] 논문 Hardy, Weinberg and language impediments
[15] 논문 Wilhelm Weinberg
[16] 논문 Natural selection and the de Finetti diagram
[17] 문서 See e.g. Ineichen & Batschelet 1975
[18] 문서 Edwards, 1977



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com