맨위로가기

연관 불평형

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

연관 불평형은 유성 생식을 하는 개체군에서 특정 유전자 자리에 있는 대립 유전자들이 독립적으로 나타나지 않고 함께 나타나는 경향을 의미한다. 이는 두 대립 유전자의 조합 빈도가 기대치와 다를 때 발생하며, 연관 불평형 계수(D)를 통해 정량화할 수 있다. 연관 불평형은 유전적 연쇄, 집단의 유전적 구조, 특정 하플로타입의 선택적 이점 등 다양한 원인에 의해 발생하며, 재조합은 연관 불평형을 감소시키는 주요 요인으로 작용한다. 연관 불평형은 히트맵, 텍스타일 플롯, 포레스트(FHLCM) 등 다양한 시각화 방법을 통해 분석되며, PLINK, Haploview, LDlink와 같은 분석 소프트웨어를 활용하여 연구한다. 이러한 분석은 유전자 간의 관계를 파악하고 질병 관련 유전자를 찾는 데 기여한다.

더 읽어볼만한 페이지

  • 집단유전학 - 근친교배
    근친교배는 유전적으로 가까운 개체 간의 교배를 의미하며, 유전 질환 발현 가능성을 높이는 등 생물학적 영향과 품종 개량 및 연구에 활용된다.
  • 집단유전학 - 유전적 부동
    유전적 부동은 집단 내 대립형질 빈도가 무작위로 변하는 현상으로, 집단 크기가 작을수록 영향이 커지며 자연 선택과 함께 작용하여 진화에 영향을 미친다.
연관 불평형

2. 수학적 정의

유성 생식을 하는 개체군에서 한 유전자자리의 대립유전자 ''A''의 빈도를 p_A , 다른 유전자자리의 대립유전자 ''B''의 빈도를 p_B 라고 하자. 같은 생식자에 ''A''와 ''B''가 함께 존재할 빈도를 p_{AB} 라고 하면, 이는 ''AB'' 하플로타입의 빈도와 같다.[18]

대립유전자 ''A''와 ''B''가 나타날 확률이 서로 영향을 미치지 않는다면, 이 관계는 독립적이며, 곱의 법칙에 따라 p_{A} p_{B} 로 나타낼 수 있다. 그러나 p_{AB} p_A p_B 와 다르면, 두 대립유전자 사이에 연관 불평형이 존재한다.[18]

두 유전자좌에 관한 연관 불평형을 생각해 각 대립 유전자를 변수 ''I''1과 ''I''2로 나타낸다. 연관 불평형 파라미터 ''δ''는 다음과 같이 정의한다.

:\delta = Cov(I_1, I_2) = p_1 p_2 - h_{12}

여기서 ''p''1과 ''p''2는 두 유전자좌에서의 단독 대립 유전자의 빈도를, ''h12''는 양쪽 대립 유전자를 합한 하플로타입의 빈도를 나타낸다. 이 외에도 다양한 파라미터가 사용되고 있다. ''δ''가 0이 아니면 두 대립 유전자는 연관 불평형 상태에 있으며, ''δ = 0''이면 연관 평형 상태이다.

연관 불평형의 원인은 대부분 유전적 연쇄에 있으며, 대상 집단의 조상이 가지고 있던 특정 하플로타입이 아직 보존되어 있는 경우 나타난다. 또한 집단이 복수의 유전적 집단으로 구성되었거나, 특정 하플로타입이 생물의 생존이나 번식에 유리한 경우에도 발생하며, 이 경우에는 다른 염색체 상의 대립 유전자가 (겉보기에는) 연관 불평형 상태에 있을 수도 있다.

International HapMap Project(국제 햅맵 프로젝트)를 통해 인류 집단의 연관 불평형을 온라인으로 확인할 수 있다. 이러한 정보는 질병에 미치는 유전적 요인의 해석에 도움이 될 것으로 기대된다.

2. 1. 연관 불평형 계수 (D)

유성 생식을 하는 개체군에서 만들어진 생식자에서, 한 유전자자리에 있는 대립유전자 ''A''의 빈도를 p_A 라고 하고, 다른 유전자자리에 있는 대립유전자 ''B''의 빈도를 p_B 라고 한다. 마찬가지로, 같은 생식자에 ''A''와 ''B''가 둘 다 함께 존재하는 빈도를 p_{AB} 라고 한다.[18]

통계학에서 독립으로 알려진 것처럼, 한쪽의 발생이 다른 쪽의 발생에 영향을 미치지 않을 때, 대립유전자 ''A''와 ''B'' 사이의 연관성은 완전히 무작위로 간주될 수 있으며, 이 경우 ''A''와 ''B''가 함께 발생할 확률은 확률의 곱 p_{A} p_B 로 주어진다. 어떤 이유로든 p_{AB} p_A p_B 와 다를 때 두 대립유전자 사이에 연관 불평형이 있다고 한다.[3]

''A''와 ''B'' 사이에 나타나는 연관 불평형의 정도는 '연관 불평형 계수' D_{AB}로 정량화할 수 있다. p_Ap_B 둘 다 0보다 클 때, D_{AB}

: D_{AB} = p_{AB} - p_A p_B,

으로 정의된다. 연관 불평형에서는 D_{AB} \neq 0 이다. 만약 D_{AB}=0이면서 p_{AB} = p_A p_B 이라면, 대립유전자 ''A''와 ''B''는 '''연관 평형'''에 있다고 한다. D_{AB} 에서 아래첨자 'AB'는 연관 불평형이 대립유전자 {''A'', ''B''} 쌍의 특성이란 사실을 강조하는 것이지, 각 유전자자리를 따로 강조하는 것이 아니다. 같은 두 유전자자리에 존재할 수 있는 다른 대립유전자 쌍은 연관 불평형 계수도 서로 달라진다.[18]

두 개의 이대립 유전자좌의 경우, ''a''와 ''b''가 이 두 유전자좌의 다른 대립유전자일 때, 제약 조건이 매우 강력하여 하나의 ''D'' 값만으로 이러한 대립유전자 간의 모든 연관 불평형 관계를 나타내기에 충분하다. 이 경우, D_{AB} = -D_{Ab} = -D_{aB} = D_{ab}이다. 그들의 관계는 다음과 같이 특징지을 수 있다.[3]

D = P_{AB} -P_{A}P_{B}

-D = P_{Ab} -P_{A}P_{b}

-D = P_{aB} -P_{a}P_{B}

D = P_{ab} -P_{a}P_{b}

이 경우 ''D''의 부호는 임의로 선택된다. ''D''의 크기는 ''D''의 부호보다 더 중요한데, 그 이유는 ''D''의 크기가 연관 불평형의 정도를 나타내기 때문이다.[4] 그러나 양의 ''D'' 값은 배우자가 예상보다 더 흔하다는 것을 의미하고, 음의 값은 이 두 대립유전자의 조합이 예상보다 덜 흔하다는 것을 의미한다.

무성 생식 개체군에서 연관 불평형은 개체군 대립유전자 빈도로 유사하게 정의될 수 있다. 또한 세 개 이상의 대립유전자 간의 연관 불평형을 정의하는 것도 가능하지만, 이러한 고차 연관성은 실제로는 일반적으로 사용되지 않는다.[1]

두 유전자좌에 관한 연관 불평형을 생각해 각 대립 유전자를 변수 ''I''1과 ''I''2로 나타낸다. 연관 불평형 파라미터 ''δ''를 다음과 같이 정의한다.

: \delta = Cov(I_1, I_2) = p_1 p_2 - h_{12}

여기서 ''p''1과 ''p''2는 두 유전자좌에서의 단독 대립 유전자의 빈도를 나타내고, ''h12''는 양쪽 대립 유전자를 합한 하플로타입의 빈도를 나타낸다. 이 외에도 다양한 파라미터가 사용되고 있다. 이것이 0이 아닐 경우 두 대립 유전자는 연관 불평형 상태에 있다고 하며, 그에 반해 ''δ = 0''인 경우를 연관 평형이라고 한다.

2. 2. 두 유전자좌, 두 대립유전자 모델

유성 생식을 하는 개체군에서 만들어진 생식자를 기준으로 설명한다. 한 유전자자리에 있는 대립유전자 ''A''의 빈도를 p_A 라고 하고, 다른 유전자자리에 있는 대립유전자 ''B''의 빈도를 p_B 라고 한다. 마찬가지로, 같은 생식자에 ''A''와 ''B''가 둘 다 함께 존재하는 빈도를 p_{AB} 라고 하는데, 이는 ''AB'' 하플로타입의 빈도와 같다.[18]

대립유전자 ''A''와 ''B''가 나타날 확률이 서로 영향을 미치지 않는다면, 이 두 대립유전자의 관계는 완전히 독립이라고 할 수 있다. 이때의 확률은 곱의 법칙을 사용하여 p_{A} p_{B} 로 나타낼 수 있다. 그러나 p_{AB} p_A p_B 와 달라진다면, 두 대립유전자 사이에 연관 불평형이 있다고 한다.[18]

''A''와 ''B'' 사이의 연관 불평형 정도는 '연관 불평형 계수' D_{AB}로 정량화할 수 있다. p_Ap_B 둘 다 0보다 클 때, D_{AB}는 다음과 같이 정의된다.[18]

: D_{AB} = p_{AB} - p_A p_B,

연관 불평형에서는 D_{AB} \neq 0 이다. 만약 D_{AB}=0이면서 p_{AB} = p_A p_B 이라면, 대립유전자 ''A''와 ''B''는 '''연관 평형'''에 있다고 한다. D_{AB} 에서 아래첨자 'AB'는 연관 불평형이 대립유전자 {''A'', ''B''} 쌍의 특성이란 사실을 강조하는 것이지, 각 유전자자리를 따로 강조하는 것이 아니다. 같은 두 유전자자리에 존재할 수 있는 다른 대립유전자 쌍은 연관 불평형 계수도 서로 달라진다.[18]

대립유전자가 2개 있는 두 유전자자리의 경우, 즉 각 유전자자리의 다른 대립유전자가 ''a''와 ''b''인 경우, 이 대립유전자들 사이의 모든 연관 불평형 관계를 나타내는 것은 하나의 D값으로 한정된다. 이때, D_{AB} = -D_{Ab} = -D_{aB} = D_{ab}이다. 여기서 연관 불평형 관계는 다음과 같다.[19]

D = P_{AB} -P_{A}*P_{B}

-D = P_{Ab} -P_{A}*P_{b}

-D = P_{aB} -P_{a}*P_{B}

D = P_{ab} -P_{a}*P_{b}

여기서 부호 ''D''는 임의적으로 고른 것이다. D의 크기는 연관 불평형의 정도를 나타내기 때문에 D라는 부호보다 더 중요하다.[19] 이때 양의 D값은 특정 두 대립유전자 조합이 기댓값보다 빈도가 더 크다는 의미이고, 음의 D값은 특정 두 대립유전자 조합이 기댓값보다 빈도가 더 작다는 의미이다.[19]

무성 생식을 하는 개체군에서의 연관 불평형은 개체군 대립유전자 빈도에서 정의하는 것과 비슷하게 정의된다. 또한, 연관 불평형은 3개 이상의 대립유전자 사이에서도 정의할 수 있으나 실제로 자주 사용되지는 않는다.[16]

다음은 두 유전자좌, 두 대립유전자 모델에서 각 조합의 빈도를 나타내는 표이다.

Haplotype빈도
A_1B_1x_{11}
A_1B_2x_{12}
A_2B_1x_{21}
A_2B_2x_{22}



위의 빈도를 사용하여 각 대립유전자의 빈도를 다음과 같이 결정할 수 있다.

대립유전자빈도
A_1p_1=x_{11}+x_{12}
A_2p_2=x_{21}+x_{22}
B_1q_1=x_{11}+x_{21}
B_2q_2=x_{12}+x_{22}



두 유전자좌와 대립유전자가 서로 독립적이면, 각 haplotype의 빈도가 해당 대립유전자의 빈도의 곱과 같을 것으로 예상한다(예: x_{11} = p_1 q_1).

관찰된 haplotype의 빈도가 예상치에서 벗어나는 정도를 연관 불균형이라고 하며, 일반적으로 대문자 ''D''로 표시한다.

:D = x_{11} - p_1q_1

따라서 유전자좌가 독립적으로 상속되면, x_{11} = p_1 q_1이므로 D = 0이고 연관 평형이 유지된다. 그러나 관찰된 haplotype A_1B_1의 빈도가 A_1B_1의 개별 빈도를 기반으로 예상되는 것보다 높으면 x_{11} > p_1 q_1이므로 D > 0이고 양의 연관 불균형이 존재한다. 반대로, 관찰된 빈도가 더 낮으면 x_{11} < p_1 q_1, D < 0이고 음의 연관 불균형이 존재한다.

다음 표는 haplotype 빈도와 대립유전자 빈도 및 D 간의 관계를 보여준다.

A_1A_2합계
B_1x_{11}=p_1q_1+Dx_{21}=p_2q_1-Dq_1
B_2x_{12}=p_1q_2-Dx_{22}=p_2q_2+Dq_2
총계p_1p_21


2. 3. D에서 파생된 척도

연관 불평형 계수(D)는 그 값이 나타내는 대립유전자의 빈도에 따라 달라지기 때문에, 연관 불평형을 나타내는 척도로 항상 편리한 것은 아니다. D를 사용하면 서로 다른 대립유전자 쌍 사이의 연관 불평형 정도를 비교하기 어렵다.[20]

연관 불평형 D는 연관 상관 관계의 강도 변화와 유전자 빈도 변화를 모두 반영한다. 이는 빈도가 다른 대립 유전자 간의 연관 불평형을 비교할 때 문제를 야기한다. 연관 불평형을 정규화하면 이러한 대립 유전자를 더 쉽게 비교할 수 있다.

두 유전자좌에 관한 연관 불평형에서 각 대립 유전자를 변수 ''I''1과 ''I''2로 나타낼 때, 연관 불평형 파라미터 ''δ''는 다음과 같이 정의된다.

:\delta = Cov(I_1, I_2) = p_1 p_2 - h_{12}

여기서 ''p''1과 ''p''2는 두 유전자좌에서의 단독 대립 유전자의 빈도를 나타내고, ''h12''는 양쪽 대립 유전자를 합한 하플로타입의 빈도를 나타낸다. ''δ''가 0이 아니면 두 대립 유전자는 연관 불평형 상태에 있으며, ''δ = 0''이면 연관 평형 상태이다.

d와 유사하게, 두 빈도가 서로 다른 유전자좌의 대립유전자를 나타낼 때 네 개의 대립유전자 빈도 중 두 개의 곱으로 D를 정규화한 \rho도 사용된다.[7]

:\rho =\frac{D}{(1-p_A) p_B}

2. 3. 1. D' (표준화된 연관 불평형)

르원틴은 ''D''를 하플로타입의 측정값과 기댓값 차이의 이론적 최댓값으로 나누어 표준화하는 방법을 제안했다.[20]

:D_\max= \begin{cases}

\max\{-p_A p_B,\,-(1-p_A)(1-p_B)\} & \text{when } D < 0\\

\min\{p_A (1-p_B),\,(1-p_A) p_B\} & \text{when } D > 0

\end{cases}

일 때

:D' = \frac D {D_\max}

D'를 다르게 표현하는 방법은 유전자자리 여러 쌍 사이의 상관관계 계수를 이용하는 방법으로, 주로 r^2로 표현한다.[21]

:r^2=\frac{D^2}{p_A(1-p_A)p_B (1-p_B)}.

르원틴은[5] 관찰된 대립유전자 빈도와 예상된 대립유전자 빈도 사이의 이론적인 최대 차이로 D를 나누어 정규화된 연관 불평형(상대적 연관 불평형이라고도 함) D'을 계산했다.

:D' = \frac D {D_\max}

여기서

:D_\max= \begin{cases}

\min\{p_A p_B,\,(1-p_A)(1-p_B)\} & \text{when } D < 0\\

\min\{p_A (1-p_B),\,p_B(1-p_A)\} & \text{when } D > 0

\end{cases}

D' 값은 -1\leq D'\leq 1 범위 내에 있게 된다. D' = 0일 때, 유전자 좌위는 독립적이다. -1 \leq D' < 0일 때, 대립유전자는 예상보다 적게 발견된다. 0 < D' \leq 1일 때, 대립유전자는 예상보다 더 자주 발견된다.

두 대립유전자가 연관 평형에 얼마나 가까운지 측정할 때 D' 대신 |D'|를 사용할 수 있다.

2. 3. 2. r² (상관 계수)

르원틴(Lewontin)[20]이 제안한 ''D''의 표준화 방법의 대안은 일반적으로 제곱으로 표현되는 로커스 쌍 간의 상관 계수r^2이다.[6]

:r^2=\frac{D^2}{p_A(1-p_A)p_B (1-p_B)}.

r^2 값은 -1과 1 사이의 값을 가진다. r^2 = 0일 때, 쌍 사이에는 상관관계가 없다. |r^2| = 1일 때, r^2의 부호에 따라 상관관계는 완전 양의 상관관계 또는 완전 음의 상관관계가 된다.

2. 3. 3. d 및 ρ

d 방법과 유사하게, 이 대안은 두 빈도가 서로 다른 유전자좌의 대립유전자를 나타낼 때 네 개의 대립유전자 빈도 중 두 개의 곱으로 D를 정규화한다.[7]

:\rho =\frac{D}{(1-p_A) p_B}

2. 4. 연관 불평형 계산 범위의 한계

r^2영어와 D'영어 척도는 범위에 한계가 있으며, 0부터 모든 유전자자리 쌍의 값을 다 포함하지는 못한다. r^2영어의 최댓값은 비교할 두 유전자자리의 대립유전자 빈도에 따라 달라지며, 그 범위는 0부터 두 유전자자리의 대립유전자 빈도가 같을 때의 값(즉, 일 때 )까지, 또는 대립유전자 빈도가 관계를 만족하여 일 때만 전체 범위를 아우를 수 있다.[22] D'영어는 항상 최댓값 1을 가질 수 있는데, 두 유전자자리에서 D'영어의 최댓값은 그 두 유전자자리에서의 과 일치한다.[23]

3. 연관 불평형의 원인

무작위 교배, "제1 법칙"에 따른 멘델 분리 법칙, 무작위 입자 유전, 염색체 조합 및 염색체 교차 외에 다른 진화적 힘(즉, 자연 선택, 근친 교배, 유전 부동)이 없는 경우, 연관 불평형 측정값 D는 두 유전자좌 사이의 재조합률 c의 크기에 따라 시간 축을 따라 0으로 수렴한다.

두 유전자좌에 관한 연관 불평형을 고려할 때, 각 대립 유전자를 변수 ''I''1과 ''I''2로 나타낸다. 이때 연관 불평형 파라미터 ''δ''는 다음과 같이 정의된다.

:\delta = Cov(I_1, I_2) = p_1 p_2 - h_{12}

여기서 ''p''1과 ''p''2는 두 유전자좌에서 각각 나타나는 대립 유전자의 빈도를 나타내고, ''h12''는 두 대립 유전자를 모두 포함하는 하플로타입의 빈도를 나타낸다. 이 외에도 다양한 파라미터가 사용된다. ''δ''가 0이 아닐 경우 두 대립 유전자는 연관 불평형 상태에 있다고 하며, ''δ = 0''인 경우는 연관 평형이라고 한다.

연관 불평형의 원인은 대부분 유전적 연쇄에 있으며, 대상 집단의 조상이 가지고 있던 특정 하플로타입이 아직 보존되어 있는 경우에 나타난다.

또한, 집단이 복수의 유전적 집단으로 구성된 경우(겉보기에는 단일 집단이지만 아직 교잡이 많이 이루어지지 않은 경우)나 특정 하플로타입이 생물의 생존이나 번식에 유리한 경우에도 연관 불평형이 발생할 수 있다. 이 경우에는 다른 염색체 상의 대립 유전자도 (겉보기에는) 연관 불평형 상태에 있을 수 있다.

국제 햅맵 프로젝트를 통해 인류 집단의 연관 불평형을 온라인으로 확인할 수 있다. 이러한 정보는 특히 질병에 영향을 미치는 유전적 요인을 해석하는 데 도움이 될 것으로 기대된다.

4. 재조합의 역할

무작위 교배, "제1 법칙"에 따른 멘델 분리 법칙, 무작위 입자 유전, 염색체 조합 및 염색체 교차 외에 다른 진화적 힘이 없는 경우(즉, 자연 선택, 근친 교배, 유전 부동이 없는 경우) 연관 불평형 측정값 D는 두 유전자좌 사이의 재조합률 c의 크기에 따라 시간 축을 따라 0으로 수렴한다.

D= x_{11}-p_1 q_1로 정의하면, 다음 세대에서 A_1 B_1의 유전자형 빈도인 x_{11}'는 다음과 같이 표현할 수 있다.

:x_{11}' = (1-c)\,x_{11} + c\,p_1 q_1

이는 자손의 유전자형 중 (1-c)의 비율이 재조합되지 않아 부모의 임의 유전자형을 복제하기 때문이다. 이러한 유전자형 중 x_{11}의 비율은 A_1 B_1이다. c의 비율은 이 두 유전자좌를 재조합했다. 부모가 무작위 교배에서 나온 경우, 유전자좌 A의 복제본이 대립 유전자 A_1을 가질 확률은 p_1이고, 유전자좌 B의 복제본이 대립 유전자 B_1을 가질 확률은 q_1이다. 이 복제본이 처음에는 이배체 유전자형을 형성한 두 개의 다른 배우자에서 나오므로, 이는 독립적인 사건이므로 확률을 곱할 수 있다.

위 식은 다음과 같이 다시 쓸 수 있다.

:x_{11}' - p_1 q_1 = (1-c)\,(x_{11} - p_1 q_1)

따라서,

:D_1 = (1-c)\;D_0

여기서 n번째 세대의 DD_n으로 지정된다. 따라서 다음과 같다.

:D_n = (1-c)^n\; D_0.

만약 n \to \infty이면 (1-c)^n \to 0이므로 D_n은 0으로 수렴한다.

어떤 시점에서 연관 불평형을 관찰하면, 재조합으로 인해 미래에 사라질 것이다. 그러나 두 유전자좌 사이의 거리가 짧을수록 D가 0으로 수렴하는 속도가 작아진다.

5. 예시

연관 불평형의 예시로, 두 유전자좌에 관한 연관 불평형을 고려하여 각 대립 유전자를 변수 ''I''1과 ''I''2로 나타낼 수 있다. 이때 연관 불평형 파라미터 ''δ''는 다음과 같이 정의된다.

:\delta = Cov(I_1, I_2) = p_1 p_2 - h_{12}

여기서 ''p''1과 ''p''2는 두 유전자좌에서 단독 대립 유전자의 빈도를, ''h12''는 양쪽 대립 유전자를 모두 가진 하플로타입의 빈도를 나타낸다. ''δ = 0''인 경우 연관 평형, 0이 아닐 경우 연관 불평형 상태라고 한다.

연관 불평형은 주로 유전적 연쇄에 의해 발생하며, 조상 집단의 특정 하플로타입이 보존될 때 나타난다. 또한, 겉보기에는 단일 집단이지만 아직 교잡이 충분히 이루어지지 않은 복수의 유전적 집단이나, 특정 하플로타입이 생존 및 번식에 유리한 경우에도 발생할 수 있다.

국제 햅맵 프로젝트(International HapMap Project)를 통해 인류 집단의 연관 불평형을 온라인으로 확인할 수 있으며, 이는 질병의 유전적 요인 해석에 도움이 될 것으로 기대된다.

5. 1. 두 유전자좌와 두 대립유전자

두 개의 대립유전자 각각을 가진 두 개의 유전자좌 A와 B에 대한 일배체형(haplotype), 단일 염색체 상에 함께 존재하는 대립 유전자 집합을 고려해 본다. 즉, 두 유전자좌, 두 대립유전자 모델이다. 다음 표는 각 조합의 빈도를 정의한다.

일배체형빈도
A_1B_1x_{11}
A_1B_2x_{12}
A_2B_1x_{21}
A_2B_2x_{22}



이는 상대 빈도이다. 위의 빈도를 사용하여 각 대립유전자의 빈도를 결정할 수 있다.

대립유전자빈도
A_1p_1=x_{11}+x_{12}
A_2p_2=x_{21}+x_{22}
B_1q_1=x_{11}+x_{21}
B_2q_2=x_{12}+x_{22}



두 유전자좌와 대립유전자가 서로 독립적이면, 각 일배체형의 빈도는 해당 대립유전자의 빈도의 곱과 같을 것으로 예상한다(예: x_{11} = p_1 q_1).

관찰된 일배체형의 빈도가 예상치에서 벗어나는 정도를 연관 불균형(linkage disequilibrium)이라고 하며, 일반적으로 대문자 ''D''로 표시한다.

:D = x_{11} - p_1q_1

따라서 유전자좌가 독립적으로 상속되면, x_{11} = p_1 q_1이므로 D = 0이고 연관 평형이 유지된다. 그러나 관찰된 일배체형 A_1B_1의 빈도가 A_1B_1의 개별 빈도를 기반으로 예상되는 것보다 높으면 x_{11} > p_1 q_1이므로 D > 0이고 양의 연관 불균형이 존재한다. 반대로, 관찰된 빈도가 더 낮으면 x_{11} < p_1 q_1, D < 0이고 음의 연관 불균형이 존재한다.

다음 표는 일배체형 빈도와 대립유전자 빈도 및 D 간의 관계를 보여준다.

A_1A_2합계
B_1x_{11}=p_1q_1+Dx_{21}=p_2q_1-Dq_1
B_2x_{12}=p_1q_2-Dx_{22}=p_2q_2+Dq_2
총계p_1p_21



또한, 우리가 달성하려는 목표에 따라 데이터를 정규화할 수 있다. 예를 들어, 연관 지도를 사례-대조군 연구에서 만들려고 한다면, 비대칭성이 있기 때문에 d 방법을 사용할 수 있다. 특정 일배체형이 다른 일배체형에 의해 재조합되지 않고 개체군에서 내려갈 확률을 찾으려고 한다면, ρ 방법을 사용하는 것이 더 나을 수 있다. 하지만 대부분의 시나리오에서, r^2는 통계에서 상관 계수의 유용성 때문에 가장 인기 있는 방법이 되는 경향이 있다. r^2가 매우 유용할 수 있는 몇 가지 예로는 진화하는 개체군에서 재조합 속도를 측정하거나 질병 연관성을 감지하는 것이 있다.

6. 시각화

연관 불평형이 데이터 세트에 대해 계산되면, 연관 불평형을 보다 쉽게 이해할 수 있도록 시각화 방법을 선택하는 경우가 많다.

가장 일반적인 방법은 히트맵을 사용하는 것이다. 여기서 색상은 양의 연관 불평형과 연관 평형을 갖는 위치를 나타내는 데 사용된다. 이 예시는 전체 히트맵을 표시하지만, 히트맵이 대각선을 기준으로 대칭(즉, 위치 A와 B 사이의 연관 불평형은 B와 A 사이의 연관 불평형과 동일)이기 때문에, 쌍을 한 번만 표시하는 삼각 히트맵도 일반적으로 사용된다. 이 방법은 해석하기 쉽다는 장점이 있지만, 관심 있을 수 있는 다른 변수에 대한 정보를 표시할 수 없다는 단점도 있다.

GAM 방법을 사용하여 감지된 유전자 위치 간의 연관 불평형을 보여주는 히트맵


텍스타일 플롯과 같이 더 강력한 시각화 옵션도 있다. 텍스타일 플롯에서 특정 위치의 대립 유전자 조합은 다른 위치의 대립 유전자 조합과 연결될 수 있다. 각 유전자형 (대립 유전자의 조합)은 해당 유전자형의 빈도에 비례하는 면적을 가진 원으로 표시되며, 각 위치마다 열이 있다. 각 원에서 다른 열의 원으로 선이 그려지며, 연결선의 두께는 두 유전자형이 함께 발생하는 빈도에 비례한다. 연관 불평형은 다이어그램에서 선 교차 수에 의해 나타난다. 여기서 더 많은 선 교차는 낮은 연관 불평형을 나타내고, 더 적은 교차는 높은 연관 불평형을 나타낸다. 이 방법의 장점은 개별 유전자형 빈도를 보여주고, 그래프의 모양에 따라 절대 연관 불평형(두 위치의 대립 유전자가 항상 함께 나타나는 경우)과 완전 연관 불평형(두 위치의 대립 유전자가 강한 연관성을 보이지만 재조합 가능성이 있는 경우) 간의 시각적 차이를 포함한다는 것이다. [12]

또 다른 시각화 옵션은 계층적 잠재 클래스 모델의 포레스트(FHLCM)이다. 모든 위치는 그래프의 최상위 레이어에 따라 플롯되고, 이 최상위 레이어 아래에 잠재 변수를 나타내는 상자가 상단 레벨에 연결되어 추가된다. 선은 상단 레벨의 위치를 아래의 잠재 변수에 연결하며, 위치가 연결된 상자의 레벨이 낮을수록 연관 불평형이 커지고 위치 간의 거리가 작아진다. 이 방법은 텍스타일 플롯과 동일한 장점을 갖지는 않지만, 텍스타일 플롯의 경우처럼 시퀀스를 재정렬할 필요 없이 멀리 떨어진 위치를 시각화할 수 있다. [13]

이것은 시각화 방법의 전체 목록은 아니며, 연구자가 강조하고자 하는 정보에 따라 데이터 세트의 더 나은 그림을 제공하기 위해 여러 방법을 사용할 수 있다.

7. 응용

두 유전자좌에 관한 연관 불평형을 고려하여 각 대립 유전자를 변수 ''I''1과 ''I''2로 나타낸다. 연관 불평형 파라미터 ''δ''는 다음과 같이 정의된다.

:\delta = Cov(I_1, I_2) = p_1 p_2 - h_{12}

여기서 ''p''1과 ''p''2는 두 유전자좌에서의 단독 대립 유전자의 빈도를 나타내고, ''h12''는 양쪽 대립 유전자를 합한 하플로타입의 빈도를 나타낸다. 이 외에도 다양한 파라미터가 사용되고 있다. ''δ''가 0이 아닐 경우 두 대립 유전자는 연관 불평형 상태에 있다고 하며, ''δ = 0''인 경우를 연관 평형이라고 한다.

연관 불평형의 원인은 대부분 유전적 연쇄에 있으며, 대상 집단의 조상이 가지고 있던 특정 하플로타입이 아직 보존되어 있는 경우 연관 불평형이 나타난다.

또한 집단이 복수의 유전적 집단으로 구성된 경우(겉보기에는 단일 집단이지만 아직 교잡이 많이 이루어지지 않은 경우), 또는 특정 하플로타입이 생물의 생존이나 번식에 유리한 경우에도 원인이 되며, 이 경우에는 다른 염색체 상의 대립 유전자가 (겉보기에는) 연관 불평형 상태에 있을 수도 있다.

국제 햅맵 프로젝트를 통해 인류 집단의 연관 불평형을 온라인으로 확인할 수 있다. 이러한 정보는 특히 질병에 미치는 유전적 요인의 해석에 도움이 될 것으로 기대된다.

8. 분석 소프트웨어


  • PLINK – 다른 기능과 함께 연관 불평형(LD)을 계산할 수 있는 전체 유전체 연관 분석 도구 모음.[24]
  • LDHat
  • Haploview
  • LdCompare[15]— LD를 계산하는 오픈 소스 소프트웨어.
  • SNP and Variation Suite – 대화형 LD 플롯을 제공하는 상용 소프트웨어.
  • GOLD – 연관 불평형(LD)의 그래픽 개요.
  • TASSEL – 연관 불평형, 특성 연관성 및 진화 패턴을 평가하는 소프트웨어.
  • rAggr – 1000 Genomes Project(1000 게놈 프로젝트) 및 HapMap 유전자형 데이터베이스를 사용하여 쿼리된 마커 세트와 연관 불평형(LD)에 있는 프록시 마커(SNP 및 인델)를 찾는다.
  • SNeP – PLINK 형식의 대규모 유전자형 데이터 세트에 대한 LD 및 Ne의 빠른 계산.
  • LDlink – 인구 하위 그룹에서 연관 불평형(LD)을 쉽고 효율적으로 탐색할 수 있는 웹 기반 애플리케이션 모음. 모든 인구 유전자형 데이터는 1000 게놈 프로젝트의 3단계에서 파생되었으며 변이 RS 번호는 dbSNP 빌드 151을 기반으로 색인화된다.
  • Bcftools – 변이 호출 및 VCF, BCF 조작을 위한 유틸리티.

참조

[1] 논문 Linkage disequilibrium — understanding the evolutionary past and mapping the medical future 2008-06
[2] 서적 Introduction to Quantitative Genetics https://archive.org/[...] Addison Wesley Longman
[3] 논문 Linkage disequilibrium — understanding the evolutionary past and mapping the medical future null 2008-06
[4] 간행물 Linkage Disequilibrium http://www.sciencedi[...] Academic Press 2020-10-21
[5] 논문 The interaction of selection and linkage. I. General considerations; heterotic models
[6] 논문 Linkage disequilibrium in finite populations
[7] 논문 Mathematical Properties of Linkage Disequilibrium Statistics Defined by Normalization of the Coefficient D = pAB – pApB https://www.karger.c[...] 2019
[8] 논문 Mathematical properties of the r^2 measure of linkage disequilibrium
[9] 논문 The nonlinear structure of linkage disequilibrium
[10] 논문 Some applications of mathematics to breeding problems III http://www.genetics.[...] 1918-07-01
[11] 논문 The evolutionary dynamics of complex polymorphisms
[12] 논문 The Textile Plot: A New Linkage Disequilibrium Display of Multiple-Single Nucleotide Polymorphism Genotype Data 2010-04-27
[13] 논문 Visualization of Pairwise and Multilocus Linkage Disequilibrium Structure Using Latent Forests 2011-12-13
[14] 논문 A Comparison of Linkage Disequilibrium Measures for Fine-Scale Mapping http://biostat.jhsph[...]
[15] 논문 LdCompare: rapid computation of single – and multiple-marker r2 and genetic coverage
[16] 논문 Linkage disequilibrium — understanding the evolutionary past and mapping the medical future 2008-06
[17] 서적 Introduction to Quantitative Genetics https://archive.org/[...] Addison Wesley Longman
[18] 논문 Linkage disequilibrium — understanding the evolutionary past and mapping the medical future null 2008-06
[19] 간행물 Linkage Disequilibrium http://www.sciencedi[...] Academic Press 2020-10-21
[20] 논문 The interaction of selection and linkage. I. General considerations; heterotic models
[21] 논문 Linkage disequilibrium in finite populations
[22] 논문 Mathematical properties of the r^2 measure of linkage disequilibrium
[23] 논문 The nonlinear structure of linkage disequilibrium
[24] 논문 LdCompare: rapid computation of single – and multiple-marker r2 and genetic coverage



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com