맨위로가기

하플로타입

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

하플로타입은 유전형의 조합으로, 개체의 유전자형이 하플로타입을 고유하게 정의하지 못할 수 있다. 하플로타입은 Y-DNA 검사 및 가계 조사에 활용되며, 유사한 하플로타입의 집단을 하플로그룹이라고 한다. 미세 유체 전체 게놈 하플로타이핑 기술을 통해 하플로타입을 직접 해결할 수 있으며, 하플로타입 추정 소프트웨어도 존재한다.

더 읽어볼만한 페이지

  • 유전체학 - 발현체학
  • 유전체학 - 유전형 분석
    유전자형 분석은 DNA 염기 서열 분석, RFLP, PCR, DNA 마이크로어레이 등 다양한 기술을 통해 유전형을 파악하는 방법으로 질병 진단, 품종 개량 등 여러 분야에 활용되며 윤리적 문제와 사회적 영향을 동반하지만, 혁신적인 변화를 가져올 것으로 예상되는 기술이다.
  • 집단유전학 - 근친교배
    근친교배는 유전적으로 가까운 개체 간의 교배를 의미하며, 유전 질환 발현 가능성을 높이는 등 생물학적 영향과 품종 개량 및 연구에 활용된다.
  • 집단유전학 - 유전적 부동
    유전적 부동은 집단 내 대립형질 빈도가 무작위로 변하는 현상으로, 집단 크기가 작을수록 영향이 커지며 자연 선택과 함께 작용하여 진화에 영향을 미친다.
하플로타입

2. 하플로타입 결정 (Resolution)

어떤 개체의 유전형이 항상 그 개체의 하플로타입을 명확하게 나타내는 것은 아니다. 예를 들어, 이배체 생물이 있고, 같은 염색체 상에 두 개의 유전자 좌위가 있다고 가정해 보자. 각 좌위에는 두 개의 가능한 대립 유전자가 존재한다. 첫 번째 좌위에는 A 또는 T, 두 번째 좌위에는 G 또는 C가 올 수 있다. 이 경우, 각 좌위마다 세 가지 가능한 유전자형(AA, AT, TT 및 GG, GC, CC)이 존재한다. 따라서 두 좌위를 동시에 고려하면 아홉 가지 가능한 유전자형 조합이 나타난다(아래 표 참조).

AAATTT
GGAG AGAG TGTG TG
GCAG ACAG TC
or
AC TG
TG TC
CCAC ACAC TCTC TC



만약 개체가 한쪽 또는 양쪽 좌위에서 동형 접합이라면, 하플로타입은 명확해진다. 그러나 두 좌위 모두에서 이형 접합인 경우, 어떤 하플로타입을 가지고 있는지(예: TA 인지 AT 인지) 알 수 없게 된다. 이러한 모호성을 해결하는 유일한 방법은 염기서열 분석을 직접 수행하는 것이다.

하지만, 여러 개체의 샘플을 이용하면 특정 하플로타입의 확률을 추정할 수 있다. 하플로타입 결정(resolution) 또는 하플로타입 페이징(phasing) 기술은 이러한 추정을 가능하게 한다. 이 기술들은 특정 유전체 영역에서 특정 하플로타입이 자주 나타난다는 관찰 결과를 활용한다. 즉, 가능한 하플로타입 조합 중에서 전체적으로 더 적은 수의 서로 다른 하플로타입을 사용하는 조합을 선택하는 방식이다.

2. 1. 하플로타입 추정 방법

한 개체의 유전형은 고유한 하플로타입을 결정할 수 없다. 예를 들어 이배체 생물의 동일한 염색체내의 SNP과 같은 2가지 대립형질을 생각해보자. 첫째 좌위에 ''A''와 ''T''의 대립형질이 있다면 세 가지 유전형 ''AA'', ''AT'', ''TT''가 가능하다. 둘째 좌위에 ''G'', ''C'' 대립형질이 있다면 ''GG'', ''GC'', ''CC''의 유전자형이 가능하다. 따라서 이 개체의 두 좌위에는 아래 표(Punnett square에서 보듯이) 총 9가지의 유전자형 조합이 가능하다. 만일 개체의 한쪽 혹은 양쪽 좌위가 동형접합(homozygous)이라면 이는 명백히 그 하플로타입을 의미할 것이다. 양쪽 좌위에서 모두 이형접합(heterozygous)인 경우에만 하플로타입을 알 수 없다.

AAATTT
GGAG AGAG TGTG TG
GCAG ACAG TC
or
AC TG
TG TC
CCAC ACAC TCTC TC



이 모호함을 해결하는 유일한 방법은 직접 서열을 결정하는 것이다. 그러나 개체별 샘플 정보를 이용하면 이 모호한 상태의 특정한 하플로타입의 확률을 추정하는 것이 가능하다.

주어진 다수의 개체의 유전형으로부터 하플로타입 결정(resolution) 혹은 하플로타입 페이징(phasing) 기술을 통해 하플로타입을 추정할 수 있다. 이 방법들은 특정 유전체 영역 내에 하플로타입이 공통된다는 관찰을 적용함으로써 동작한다. 그러므로, 주어진 가능한 하플로타입 결정들의 집합이 주어지면 이 방법들은 전체적으로 조금 더 다른 하플로타입을 선택한다. 이 방법들은 매우 다양한데 일부는 parsimony와 같은 조합형 접근에 기반하기도 하고, 하디 와인버그 평형, Coalescent theory, Perfect phylogeny 등과 같은 가설 모델에 기반한 likelihood 함수를 이용하기도 한다.

3. Y-DNA 하플로타입과 가계 DNA 검사

일반 염색체와 달리 Y 염색체는 쌍으로 존재하지 않는다. 모든 인간 남성은 한 벌의 Y 염색체를 가지며, 이는 다음 세대로 전달될 때 섞이지 않고 그대로 전달된다는 것을 의미한다. 따라서 상염색체 하플로타입과 달리 세대 간 임의적인 변화가 없으며, 인간 남성은 일부 돌연변이를 제외하고는 아버지와 같은 염색체를 공유한다.[1] 이는 Y-DNA 족보 DNA 검사 결과가 돌연변이를 제외하고 일치해야 함을 의미한다.

하플로타입은 부모로부터 자식에게 계승되므로 가계 조사에도 응용할 수 있다. 특히 남성의 Y 염색체 하플로타입은 부계 조사를 위해 사용되며, 미토콘드리아 DNA 하플로타입은 모계를 추정하는 데 사용된다. Y 염색체 하플로타입은 다른 하플로타입과 달리 쌍을 이루지 않으므로 다른 염색체와의 교차가 일어나지 않고 아버지로부터 아들에게 전달된다.

3. 1. Y-STR 하플로타입

일반 염색체와 달리 Y 염색체는 쌍으로 존재하지 않는다. 모든 인간 남성은 한 벌의 Y 염색체를 가지며, 이는 다음 세대로 전달될 때 섞이지 않고 그대로 전달된다는 것을 의미한다. 따라서 상염색체 하플로타입과 달리 세대 간 임의적인 변화가 없으며, 인간 남성은 일부 돌연변이를 제외하고는 아버지와 같은 염색체를 공유한다.

유전자 검사 결과에는 검사된 Y-STR 마커의 결과 집합인 '''Y-STR ​​하플로타입'''도 포함된다.

UEP와 달리 Y-STR은 훨씬 더 쉽게 돌연변이를 일으키므로, 이를 통해 최근의 계보를 구별할 수 있다. 하지만 이는 또한 유전자 사건의 후손 집단이 모두 ''동일한'' 결과를 공유하는 대신, Y-STR ​​하플로타입이 퍼져 나가서 어느 정도 유사한 결과의 ''클러스터''를 형성할 가능성이 있다는 것을 의미한다. 일반적으로 이 클러스터는 가장 가능성이 높은 중심, 즉 '''최빈 하플로타입'''(원래 창립 사건의 하플로타입과 유사할 것으로 추정됨)과 '''하플로타입 다양성'''을 갖게 된다. 하플로타입 다양성은 하플로타입이 얼마나 퍼져나갔는지에 대한 정도이다. 정의적 사건이 과거에 더 많이 발생하고, 초기 인구 증가가 더 많이 발생할수록 특정 수의 후손에 대한 하플로타입 다양성은 더 커진다. 그러나 특정 수의 후손에 대한 하플로타입 다양성이 더 작다면 이는 더 최근의 공통 조상 또는 최근의 인구 확장을 나타낼 수 있다.

UEP와 달리 유사한 Y-STR 하플로타입을 가진 두 개인이 반드시 유사한 조상을 공유하지 않을 수 있다는 점에 유의하는 것이 중요하다. Y-STR ​​사건은 고유하지 않다. 대신 서로 다른 사건과 서로 다른 역사를 통해 상속된 Y-STR 하플로타입 결과의 클러스터는 겹치는 경향이 있다.

대부분의 경우 하플로그룹을 정의하는 사건이 발생한 지 오랜 시간이 지났으므로, 일반적으로 해당 사건의 후손과 관련된 Y-STR ​​하플로타입의 클러스터는 상당히 넓어졌다. 이러한 결과는 다른 하플로그룹과 관련된 Y-STR ​​하플로타입의 (유사하게 넓은) 클러스터와 상당히 겹치는 경향이 있다. 이는 연구자가 Y-STR ​​하플로타입이 어떤 Y-DNA 하플로그룹을 가리킬지 절대적인 확신을 가지고 예측하는 것을 불가능하게 만든다. UEP가 검사되지 않은 경우 Y-STR은 하플로그룹 조상의 확률을 예측하는 데만 사용될 수 있으며 확신은 할 수 없다.

유사한 성이 공유된 유전적 조상을 나타내는지를 평가하려는 시도에도 비슷한 시나리오가 존재한다. 유사한 Y-STR ​​하플로타입의 클러스터는 식별 가능한 최빈 하플로타입을 가진 공유된 공통 조상을 나타낼 수 있지만, 클러스터가 역사적으로 독립적으로 동일한 이름을 채택한 다른 개인으로부터 우연히 발생했을 수 있는 것과 충분히 구별되는 경우에만 해당한다. 예를 들어, 많은 이름이 일반적인 직업에서 채택되었거나 특정 사이트의 거주와 관련되었다. 유전적 계보를 확립하려면 더 광범위한 하플로타입 타이핑이 필요하다. 이제 상업용 DNA 검사 회사는 고객에게 유전적 조상의 정의를 개선하기 위해 더 많은 수의 마커 세트를 검사하는 서비스를 제공한다. 검사된 마커 세트 수는 초창기에는 12개에서 최근에는 111개로 증가했다.[1]

데이터베이스에서 마이닝된 서로 다른 성 간의 타당한 관련성을 설정하는 것은 훨씬 더 어렵다. 연구자는 해당 이유로 의도적으로 해당 인구에서 선택된, 질문 중인 인구의 ''가장 가까운'' 구성원이 우연히 일치할 가능성이 낮다는 것을 입증해야 한다. 이는 해당 인구의 ''무작위로 선택된'' 구성원이 우연히 그렇게 가까운 일치를 가질 가능성이 낮다는 것을 입증하는 것 이상이다. 어려움 때문에, 이러한 시나리오에서와 같이 서로 다른 성 간의 관련성을 설정하는 것은 고려 중인 후보 집단의 크기를 대폭 제한하는 특정 정보가 있는 특수한 경우를 제외하고는 불가능할 수 있다.

3. 2. SNP와 하플로그룹

단일 염기 다형성(SNP)과 같은 고유 사건 다형성(UEP)은 하플로그룹을 나타낸다. STR은 하플로타입을 나타낸다. Y 염색체 DNA 검사에서 얻은 전체 Y-DNA 하플로타입을 구성하는 결과는 UEP 결과와 마이크로새틀라이트 짧은 직렬 반복(STR) 염기 서열 (Y-STR) 결과의 두 부분으로 나눌 수 있다. UEP 결과는 UEP의 대부분이 단일 염기 다형성이므로 때때로 SNP 결과라고도 한다.

UEP 결과는 인류 역사상 단 한 번만 발생했다고 여겨지는 사건의 유전을 나타낸다. 이것들은 개인의 Y-DNA 하플로그룹을 식별하고, 전체 인류의 "족보"에서 그의 위치를 식별하는 데 사용될 수 있다. 서로 다른 Y-DNA 하플로그룹은 종종 특정 지리적 지역과 뚜렷하게 연관된 유전적 집단을 식별한다. 다른 지역에 위치한 더 최근의 집단에서 그들의 출현은 현재 개인의 직접적인 부계 조상의 수만 년 전 이주를 나타낸다.

4. 하플로타입 다양성

Y-STR 하플로타입은 유전자 검사 결과에서 확인되는 Y-STR 마커 값들의 집합이다. UEP와 달리 Y-STR은 돌연변이가 더 쉽게 일어나기 때문에, 최근의 계보를 구별하는 데 유용하다. 하지만 이는 Y-STR 하플로타입이 퍼져나가 유사한 결과의 클러스터를 형성할 수 있음을 의미한다. 이 클러스터는 '''최빈 하플로타입'''(원래 하플로타입으로 추정)과 '''하플로타입 다양성'''(하플로타입이 퍼진 정도)을 가진다. 과거에 정의적 사건이 많이 발생하고 초기 인구 증가가 클수록 하플로타입 다양성은 커진다. 반대로 하플로타입 다양성이 작다면, 이는 더 최근의 공통 조상 또는 최근의 인구 확장을 나타낼 수 있다.[9]

하지만 유사한 Y-STR 하플로타입을 가진 두 사람이 반드시 같은 조상을 공유하는 것은 아니다. Y-STR 사건은 고유하지 않기 때문에, 서로 다른 사건과 역사를 통해 상속된 Y-STR 하플로타입 결과의 클러스터는 겹칠 수 있다. 따라서 Y-STR 하플로타입만으로는 어떤 Y-DNA 하플로그룹에 속하는지 확실하게 예측할 수 없으며, UEP 검사를 하지 않은 경우 Y-STR은 하플로그룹 조상의 확률을 예측하는 데만 사용된다.

비슷한 성씨가 공유된 유전적 조상을 나타내는지 평가할 때도 유사한 문제가 발생한다. 유사한 Y-STR 하플로타입 클러스터가 공통 조상을 나타낼 수 있지만, 이는 클러스터가 역사적으로 독립적으로 같은 이름을 채택한 다른 개인으로부터 우연히 발생한 것과 충분히 구별될 때만 가능하다. 예를 들어, 많은 성씨는 직업이나 거주지와 관련되어 있다. 따라서 유전적 계보를 확립하려면 더 광범위한 하플로타입 분석이 필요하다. 최근 DNA 검사 회사들은 고객에게 더 많은 마커 세트를 검사하여 유전적 조상의 정의를 개선하는 서비스를 제공하고 있으며, 검사되는 마커 수는 초기의 12개에서 111개까지 증가했다.

서로 다른 성씨 간의 관련성을 설정하는 것은 더욱 어렵다. 연구자는 해당 인구에서 의도적으로 선택된, 질문 중인 인구의 가장 가까운 구성원이 우연히 일치할 가능성이 낮다는 것을 입증해야 한다. 이는 무작위로 선택된 구성원이 우연히 가까운 일치를 가질 가능성이 낮다는 것을 입증하는 것 이상이다. 따라서 특정 정보가 있는 특수한 경우를 제외하고는 서로 다른 성씨 간의 관련성을 설정하는 것은 불가능할 수 있다.

단일 염색체 다양성은 주어진 개체군에서 특정 단일 염색체의 고유성을 측정하는 척도이다. 단일 염색체 다양성(H)은 다음 공식으로 계산된다.[9]

:H=\frac{N}{N-1}(1- \sum_{i}x_i^2)

여기서 x_i는 표본 내 각 단일 염색체의 (상대적) 단일 염색체 빈도이며, N은 표본 크기이다. 단일 염색체 다양성은 각 표본에 대해 제공된다.

5. 하플로타입의 응용

하플로타입은 부모로부터 자식에게 계승되므로 가계 조사에 응용할 수 있다. 특히 남성의 Y 염색체 하플로타입은 부계 조사를 위해 사용된다. Y 염색체 하플로타입은 다른 하플로타입과 달리 쌍을 이루지 않으므로 다른 염색체와의 교차가 일어나지 않고 아버지로부터 아들에게 전달된다. 같은 성씨를 가진 다양한 자손을 조사했을 때, 그 성씨에 대한 표준적인 Y 염색체 하플로타입이 발견될 수도 있는데, 이는 해당 성씨를 사용한 가장 오래된 공통 조상의 하플로타입일 가능성이 높다.

미토콘드리아 DNA 하플로타입은 모계를 추정하는 데 사용된다.

하플로타입은 인류와 같은 집단의 비교에도 사용된다. 하플로타입에는 다양성이 있으며, 가까운 집단에서는 유사하지만 먼 집단에서는 크게 다르다. 하플로타입을 크게 묶은 것을 하플로그룹이라고 하며, 이는 유전적 집단을 나타내는 지표로 사용된다. 또한 지리적인 묶음을 보이는 경우가 많으므로, 인류의 이주 역사를 추정하는 데에도 사용된다.

6. 하플로그룹

고유 사건 다형성(UEP)과 같은 단일 염기 다형성(SNP)은 하플로그룹을 나타낸다.[1] STR은 하플로타입을 나타낸다.[1] 유사한 하플로타입의 집단을 하플로그룹(단배군)이라고 한다.[4] 하플로타입은 단독으로는 의미가 없으며, 많은 하플로타입을 통계적으로 처리했을 때 비로소 의미를 갖는다.[4] 이때, 유사한 하플로타입으로 구성된 하플로그룹이 연구 대상이 된다.[4] 여러 하플로그룹의 계통 관계를 조사함으로써 생물(특히 인간)의 계통을 알 수 있다.[4] 미토콘드리아 이브와 Y염색체 하플로그룹을 참조.[4]

UEP 결과는 인류 역사상 단 한 번만 발생했다고 여겨지는 사건의 유전을 나타낸다.[2] 이것들은 개인의 Y-DNA 하플로그룹을 식별하고, 전체 인류의 "족보"에서 그의 위치를 식별하는 데 사용될 수 있다.[2] 서로 다른 Y-DNA 하플로그룹은 종종 특정 지리적 지역과 뚜렷하게 연관된 유전적 집단을 식별한다.[2] 다른 지역에 위치한 더 최근의 집단에서 그들의 출현은 현재 개인의 직접적인 부계 조상의 수만 년 전 이주를 나타낸다.[2]

7. 소프트웨어


  • Fugue — EM 알고리즘에 기반한 하플로타입 추정 및 연관테스트
  • HaploBlockFinder — 하플로타입 블록 구조 분석용 소프트웨어 패키지
  • Haploview[12] — 연관불평형 가시화, 하플로타입 추정 및 태깅
  • HelixTree — 하플로타입 분석 소프트웨어
  • PHASE — 하플로타입 재구축 소프트웨어, 집단 데이터로부터 유전자 재조합 빈도 추정
  • SNPHAP — EM 알고리즘에 기반하여 페이징(phasing) 안된 유전형 데이터로부터 하플로타입 빈도 추정
  • The integrated Haplotype Analysis Pipeline (iHAP)
  • WHAP[13] — 하플로타입 기반 연관분석 프로그램

참조

[1] 웹사이트 Kimball's Biology Pages http://users.rcn.com[...] Creative Commons Attribution 3.0
[2] 웹사이트 haplotype / haplotypes | Learn Science at Scitable http://www.nature.co[...]
[3] 논문 Optimizing genomic selection in soybean: An important improvement in agricultural genomics
[4] 논문 The International HapMap Project https://deepblue.lib[...]
[5] 논문 A haplotype map of the human genome
[6] 웹사이트 Facts & Genes. Volume 7, Issue 3 http://www.familytre[...]
[7] 서적 Forensic DNA Evidence Interpretation CRC Press 2016
[8] 논문 Gametic phase estimation over large genomic regions using an adaptive window approach 2003-11-01
[9] 문서 DNA polymorphism detectable by restriction endonucleases
[10] 논문 In celebration of Ruggero Ceppellini: HLA in transplantation https://onlinelibrar[...] 2017-02
[11] 서적 Paul's fundamental immunology Wolters Kluwer/Lippincott Williams & Wikins 2023
[12] 저널 Haploview: analysis and visualization of LD and haplotype maps http://bioinformatic[...]
[13] 저널 WHAP: haplotype-based association analysis http://bioinformatic[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com