맨위로가기

인간 유전체

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

인간 유전체는 인간 게놈의 전체 DNA 배열을 의미하며, 1984년 인간 게놈 프로젝트를 통해 염기 서열 해독 연구가 시작되었다. 2000년대 초반에 초안이 발표되고 해독이 완료되었으며, 이후 기술 발전과 연구를 통해 유전자 수, 분자 구성, 조절 DNA 서열, 반복 DNA 서열 등 다양한 정보가 밝혀졌다. 인간 유전체는 단백질 코딩 유전자, 비암호화 유전자, 조절 DNA 서열, 반복 DNA 서열 등으로 구성되며, 유전 질환, 진화, 후생유전체 연구에도 활용된다. 게놈 의료는 질병의 원인 규명과 맞춤형 치료법 개발에 기여하며, 비교 유전체학 연구는 인간과 침팬지의 유전적 차이와 인간의 진화 과정을 밝히는 데 중요한 역할을 한다.

더 읽어볼만한 페이지

  • 인류유전학 - 피부색
    피부색은 멜라닌의 양과 유형에 의해 결정되며, 자외선 노출, 비타민 D 합성, 사회적 요인 등 다양한 요소와 관련되어 진화해 왔다.
  • 인류유전학 - 근친혼
    근친혼은 혈족 또는 인척 간의 결혼을 의미하며, 유전적 결함과 질병 발생의 위험으로 인해 각국에서 민법 등을 통해 규제하고 금혼 범위는 국가별로 차이를 보인다.
  • 염색체 (인간) - 6번 염색체
    6번 염색체는 인간의 23쌍 염색체 중 하나로, 약 1억 7천만 개의 염기쌍으로 구성되어 있으며 면역 반응과 관련된 유전자를 포함하고 다양한 질병과 관련이 있다.
  • 염색체 (인간) - Y 염색체
    Y 염색체는 포유류의 성별 결정에 중요한 역할을 하는 성 결정 염색체로, 진화 과정에서 유전자 소실과 높은 돌연변이율을 겪지만 자체 보존 메커니즘을 가지며, 인간에게는 부계 유전을 통해 전달되어 유전 계보학 연구 및 질병 관련 연구에 활용된다.
인간 유전체
개요
밴드와 서브 밴드를 가진 인간 핵형.
G 밴딩에서 보이는 대로, 염색체로 구성된 유전체와 주석이 달린 밴드와 서브 밴드를 보여주는 인간 핵형의 도식적 표현. 이 그림은 23번째 염색체 쌍의 여성 (XX) 및 남성 (XY) 버전을 모두 보여준다. 세포 주기 동안 염색체 변화가 중앙 상단에 표시된다. 미토콘드리아 유전체가 하단 왼쪽에 축척에 맞게 표시된다.
유전체 크기
염기쌍약 30억
단백질 코딩 유전자19,000 ~ 20,000개
비코딩 유전자21,000개 이상
구성
염색체23쌍 (46개)
DNA약 99%
비암호화 DNA약 98.5%
엑손1.5%
미토콘드리아 DNA고리 모양 (환형)
추가 정보
온라인 데이터베이스NCBI 인간 유전체 자원
앙상블 인간 유전체 브라우저
UCSC 유전체 브라우저
휴먼 지놈 명명 위원회 (HGNC)
기타
OMIM인간 유전체

2. 연구사

인간 게놈 프로젝트는 1984년에 인간 게놈의 염기 서열 해독을 목적으로 처음 제안되었고, 1991년부터 해독 작업이 시작되었다. 2000년 6월 26일에 드래프트 배열 해독이 종료되었고, 2003년 4월 14일에 해독 완료가 선언되었다. 당시 인간 유전자 수는 32,615개로 추정되었다.[121] 그러나 이후 분석을 통해 이 추정치는 오류로 밝혀졌고, 2004년 10월 21일 네이처 지에 게재된 논문에서는 새로운 추정치를 22,287개로 수정했다.

해독된 배열은 여러 국가, 여러 사람의 게놈 DNA 혼합 시료를 기반으로 한 표준 배열의 유크로마틴 영역을 중심으로 전체 게놈의 99% 영역에 대해 다수결로 결정된 것이다. 따라서 실제 유전자 수는 개인차 등에 의해 다소 변동될 수 있다. 또한 표준 배열에서도 헤테로크로마틴 영역을 중심으로 한 미해독 영역이나 중복 영역 등에 대한 해석이 계속되고 있으며, 2004년 보고 이후에도 정기적으로 수정 보고가 이루어지고 있다.

인간 게놈 프로젝트 완료 발표(2001년) 당시[67] 수백 개의 틈이 남아 있었고, 전체 염기 서열의 약 5~10%가 미결정 상태였다. 누락된 유전 정보는 대부분 반복적인 이질염색질 영역과 중심체텔로미어 근처에 있었지만, 일부 유전자 코딩 진정염색질 영역에도 존재했다.[68]

적은 유전자 수로 인간의 복잡한 몸과 뇌가 구축된다는 사실은 과학자들에게 놀라움을 안겨주었다. 이후 벼과 식물의 유전자가 인간보다 훨씬 많고, 하등 생물로 여겨졌던 성게의 유전자 수가 인간과 거의 같으며, 70%가 인간과 공통된다는 사실 등이 밝혀지면서, 인간이 유전자 수로 다른 생물보다 우위에 있을 것이라는 예상은 빗나갔다.

개인 게놈 배열 분석은 의학 연구에 중요하므로, 2008년부터 1000 게놈 프로젝트가 시작되었다.

2. 1. 21세기 이후의 발전

2022년에 텔로미어-텔로미어(T2T) 컨소시엄은 X 염색체(2020년)와 22개의 상염색체(2021년 5월)의 모든 틈을 메운 인간 여성 게놈의 완전한 염기서열을 보고했다.[2] 이전에 염기 서열이 결정되지 않은 부분에는 감염에 적응하고 생존하는 데 도움이 되는 면역 반응 유전자와 약물 반응을 예측하는 데 중요한 유전자가 포함되어 있다.[65]

2023년에는 다양한 민족 출신의 47명의 유전체를 기반으로 하는 초안 인간 팬게놈 참조가 발표되었다.[6] 더 넓은 표본에서 더 많은 생물 다양성을 포착하는 개선된 참조를 위한 계획이 진행 중이다.[6]

3. 분자적 구성 및 유전자 내용

인간 참조 유전체는 한 쌍의 상염색체 각각의 사본 1개와 두 개의 성염색체(X 및 Y) 각각의 사본 1개를 포함하며, 총 DNA 양은 31억 염기쌍(3.1 Gb)이다.[11] 핵 게놈은 세포핵 내에서 23~24종의 선형 DNA로 나뉘어 염색체를 형성한다. 염색체는 22종류의 상염색체와 X, Y 두 종류의 성염색체로 분류된다. 체세포는 2배체이며, 같은 종류의 상염색체를 2개씩, 성염색체를 2개(여성은 X와 X, 남성은 X와 Y)로 총 46개의 염색체를 가진다. 생식 세포는 1배체이며, 상염색체를 1개씩, 성염색체를 1개로 총 23개의 염색체를 가진다. 미토콘드리아 게놈은 16,569 염기쌍의 환형 DNA로, 미토콘드리아 안에 다수 존재한다.[120]

최근 연구에서는 게놈 내 대부분의 Non-coding DNA|비암호화 DNA영어가 생화학적 활성(유전자 발현 조절, 염색체의 구조 형성, 후성 유전학 조절 등)을 가지고 있다는 것이 시사되고 있다.[120]

인간 유전체의 약 8%는 탄뎀 DNA 배열 또는 탄뎀 반복 서열로 구성되어 있으며, 여러 개의 인접한 복사본(예: "CAGCAGCAG...")을 가진 낮은 복잡성의 반복 서열이다. 10개 미만의 뉴클레오티드 반복 서열은 마이크로새틀라이트 서열이라고 하며, 이중 삼중 뉴클레오티드 반복은 단백질 유전자 코딩 영역 내에서 때때로 발생하여 유전 질환을 유발할 수 있다. 더 긴 서열의 탄뎀 반복(10~60 뉴클레오티드 길이의 반복 서열 배열)은 미니새틀라이트라고 한다.

전이성 유전자 요소는 숙주 유전체 내의 다른 위치에서 복제하고 자체 복사본을 삽입할 수 있는 DNA 서열이며 인간 유전체에서 풍부한 구성 요소이다. LTR 레트로트랜스포존, SINE, LINE, SVA(SINE-VNTR-Alu) 및 클래스 II DNA 트랜스포존으로 분류할 수 있다.[120]

무엇이 "기능적" 요소인지에 대한 합의는 존재하지 않지만,[47][48] 최근 연구에서는 게놈 내 대부분의 Non-coding DNA|비암호화 DNA영어가 생화학적 활성을 가지고 있다는 것이 시사되고 있다.

3. 1. 단백질 코딩 유전자

인간 참조 유전체는 19,000개에서 20,000개 사이의 단백질 코딩 유전자를 포함한다.[12][13][14][15] 이 유전자들은 평균 10개의 인트론을 포함하고 있으며, 인트론의 평균 크기는 약 6kb (6,000bp)이다. 단백질 코딩 유전자의 평균 크기는 약 62kb이며, 이러한 유전자들이 게놈의 약 40%를 차지한다.[16]

엑손 서열은 성숙한 mRNA의 양쪽 끝에 코딩 DNA와 비번역 영역(UTR)으로 구성된다. 코딩 DNA의 총량은 게놈의 약 1-2%이다.[17][18]

3. 2. 비암호화 유전자

비부호화 RNA 분자는 세포 내에서, 특히 단백질 합성RNA 처리의 여러 반응에서 필수적인 역할을 한다. 비부호화 유전자에는 tRNA, 리보솜 RNA, microRNA, snRNA 및 긴 비부호화 RNA (lncRNA)를 위한 유전자가 포함된다.[19][20][21][22] 보고된 비부호화 유전자의 수는 계속해서 천천히 증가하고 있지만, 인간 유전체 내의 정확한 수는 아직 결정되지 않았다. 많은 RNA는 기능하지 않는 것으로 생각된다.[23]

많은 비부호화 RNA는 유전자 조절 및 발현의 중요한 요소이다. 비부호화 RNA는 또한 후성 유전학, 전사, RNA 스플라이싱 및 번역 기계에 기여한다. 유전자 조절 및 질병에서 RNA의 역할은 탐구되지 않은 유전체 복잡성의 새로운 잠재적 수준을 제공한다.[24]

3. 3. 조절 DNA 서열

인간 유전체는 유전자 발현을 조절하는 데 중요한 다양한 조절 서열을 가지고 있다. 보수적인 추정치에 따르면 이러한 서열은 유전체의 8%를 차지하지만,[27] ENCODE 프로젝트의 추론에 따르면 유전체의 20% 이상[28][29]이 유전자 조절 서열이다. 일부 유형의 비암호화 DNA는 단백질을 암호화하지 않지만 유전자가 언제, 어디서 발현되는지 조절하는 유전자 "스위치"(인핸서)라고 불린다.[30]

조절 서열은 1960년대 후반부터 알려져 왔다.[31] 인간 유전체에서 조절 서열을 처음으로 식별하는 데에는 재조합 DNA 기술이 사용되었다.[32] 이후 유전체 염기 서열 분석이 등장하면서, 이러한 서열의 식별은 진화적 보존을 통해 추론할 수 있게 되었다. 예를 들어, 영장류생쥐 사이의 진화 분기는 7천만~9천만 년 전에 발생했다.[33] 따라서 보존된 비암호화 서열을 식별하는 유전자 서열의 컴퓨터 비교는 유전자 조절과 같은 역할에서 그 중요성을 나타낸다.[34]

다른 유전체도 보존 기반 방법을 지원하기 위해 염기 서열 분석되었는데, 예를 들어 복어 유전체가 있다.[35] 그러나 조절 서열은 진화 과정에서 높은 속도로 사라지고 다시 진화한다.[36][37][38]

2012년 현재, 노력은 ChIP-Seq 기술을 통해 DNA와 조절 단백질 간의 상호 작용을 찾거나, DNA가 히스톤에 의해 포장되지 않은 간격(DNase 과민 부위)을 찾는 방향으로 전환되었으며, 이 두 가지 모두 조사된 세포 유형에서 활성 조절 서열이 어디에 있는지 알려준다.[27]

3. 4. 반복 DNA 서열

반복 DNA 서열은 인간 유전체의 약 50%를 차지한다.

인간 유전체의 약 8%는 탄뎀 DNA 배열 또는 탄뎀 반복 서열로 구성되어 있으며, 여러 개의 인접한 복사본(예: "CAGCAGCAG...")을 가진 낮은 복잡성의 반복 서열이다. 탄뎀 서열은 두 개의 뉴클레오티드에서 수십 개의 뉴클레오티드까지 다양한 길이를 가질 수 있다. 이러한 서열은 관련 개체 간에도 매우 가변적이어서 계통 DNA 검사 및 법의학 DNA 분석에 사용된다.

10개 미만의 뉴클레오티드 반복 서열(예: 이중 뉴클레오티드 반복 (AC)n)은 마이크로새틀라이트 서열이라고 한다. 마이크로새틀라이트 서열 중에서 삼중 뉴클레오티드 반복은 단백질 유전자 코딩 영역 내에서 때때로 발생하여 유전 질환을 유발할 수 있으므로 특히 중요하다. 예를 들어, 헌팅턴병은 인간 4번 염색체에 있는 ''헌팅틴'' 유전자 내의 삼중 뉴클레오티드 반복 (CAG)n의 확대로 인해 발생한다. 텔로미어(선형 염색체의 끝)는 (TTAGGG)n 서열의 마이크로새틀라이트 육중 뉴클레오티드 반복으로 끝난다.

더 긴 서열의 탄뎀 반복(10~60 뉴클레오티드 길이의 반복 서열 배열)은 미니새틀라이트라고 한다.

전이성 유전자 요소는 숙주 유전체 내의 다른 위치에서 복제하고 자체 복사본을 삽입할 수 있는 DNA 서열이며 인간 유전체에서 풍부한 구성 요소이다. 가장 풍부한 트랜스포존 계통인 ''Alu''는 약 50,000개의 활성 복사본을 가지고 있으며 유전자 내 및 유전자 간 영역에 삽입될 수 있다. 또 다른 계통인 LINE-1은 게놈당 약 100개의 활성 복사본을 가지고 있다(수는 사람마다 다르다). 오래된 트랜스포존의 비기능적 유물과 함께, 이것들은 전체 인간 DNA의 절반 이상을 차지한다. 때때로 "점핑 유전자"라고도 불리는 트랜스포존은 인간 유전체를 조형하는 데 중요한 역할을 했다. 이러한 서열 중 일부는 유전체에 영구적으로 통합되어 이제 다음 세대에 전달되는 바이러스 서열의 DNA 복사본인 내생 레트로바이러스를 나타낸다. 또한 인간 DNA의 레트로바이러스도 상당수 있으며, 이 중 적어도 3개는 중요한 기능을 가지고 있음이 입증되었다(예: HIV와 유사한 기능적 HERV-K; 비기능적 바이러스 HERV-W 및 HERV-FRD의 외피 유전자는 세포 간 융합을 유도하여 태반 형성에 역할을 한다).

인간 유전체 내의 이동성 요소는 LTR 레트로트랜스포존(총 게놈의 8.3%), SINE(총 게놈의 13.1%) (Alu 요소 포함), LINE(총 게놈의 20.4%), SVA(SINE-VNTR-Alu) 및 클래스 II DNA 트랜스포존(총 게놈의 2.9%)으로 분류할 수 있다.[120]

3. 5. 정크 DNA

유전학자, 진화 생물학자, 분자 생물학자들은 서로 다른 정의와 방법을 사용하기 때문에, 게놈에서 무엇이 "기능적" 요소인지에 대한 합의는 존재하지 않는다.[47][48] "기능적" DNA에 대한 정의는 학자마다 다르며, 문헌에서는 기능적 DNA의 양에 대한 합의가 이루어지지 않았다. 인간 게놈의 최대 90%가 기능하지 않는 DNA(정크 DNA)일 가능성이 있다는 추정에서, 게놈의 최대 80%가 기능적일 가능성이 있다는 추정까지 범위가 다양하다.[53][54]

진화적 정의에서 "기능적" DNA는 코딩 여부에 관계없이 유기체의 적합성에 기여하며, 진화적 압력에 의해 유지되는 DNA를 말한다. 반면 "비기능적" DNA는 유기체에 아무런 이점이 없으므로 중립적 선택 압력을 받으며, 이러한 유형의 DNA는 정크 DNA로 묘사되어 왔다.[50][51]

최근 연구에서는 게놈 내 대부분의 Non-coding DNA|비암호화 DNA영어가 생화학적 활성(유전자 발현 조절, 염색체의 구조 형성, 후성 유전학 조절 등)을 가지고 있다는 것이 시사되고 있다.

4. 염색체 정보

염색체길이 (mm)염기쌍확인된 단백질단백질로 추정의사유전자miRNArRNAsnRNAsnoRNAMisc ncRNA센트로미어 위치 (Mbp)누계 (%)
185249250621bp2,012311,13013466221145106125.07.9
283243199373bp1,20350948115401611179393.316.2
367198022430bp1,040257199929138877791.023.0
465191154276bp718396989224120567150.429.6
562180915260bp849246768325106616848.435.8
658171115067bp1,002397318126111736761.041.6
754159138663bp86634803902490767059.947.1
850146364022bp65939568802886524245.652.0
948141213431bp78515714691966515549.056.3
1046135534747bp74518500643287565640.260.9
1146135006516bp1,25848775632474765353.765.4
1245133851895bp1,003475827227106626935.870.0
1339115169878bp3188323421645343617.973.4
1436107349540bp60150472921065974617.676.4
1535102531392bp562434737813631363919.079.3
163190354753bp80565429523253583436.682.0
172881195210bp1,15844300611580714624.084.8
182778077248bp2682059321351362517.287.4
192059128983bp1,399261811101329311526.589.3
202163025520bp53313213571546373427.591.4
211648129895bp22581501652119813.292.6
221751304566bp4312130831523232314.793.8
X53155270560bp815237801282285645260.699.1
Y2059373566bp458327157173212.5100.0
mtDNA0.005416569bp1300020022N/A100.0
합계10523095693981bp19,31373812,8591,7565321,9441,5211,209--


5. 게놈 의료

게놈 분석 결과를 질병의 원인 규명이나 신약 개발, 개인별 차이에 맞춘 최적의 치료법을 모색하는 맞춤형 의료 등에 활용하는 것을 "게놈 의료"라고 한다. 일본에서는 2023년 6월, "양질의 적절한 게놈 의료를 국민이 안심하고 받을 수 있도록 하기 위한 시책의 종합적이고 계획적인 추진에 관한 법률"(게놈 의료법)이 성립되었다.[122] 영국미국도 2010년대부터 게놈 의료를 국가 전략으로 추진하고 있다.[122][123]

6. 인간 유전 질환

인간의 유전 질환은 단일 유전자 변이, 염색체 이상 등 다양한 원인으로 발생한다.

부모 관련성이 높은 인구 집단은 외래 교배 집단에 비해 더 많은 수의 동형 접합 유전자 녹아웃을 보인다.


사촌 간의 결혼(두 보인자 모두 이형 접합 녹아웃을 보유하고 이중선으로 표시되어 교배)이 동형 접합 유전자 녹아웃을 가진 자손으로 이어지는 가계도

  • 단일 유전자 질환: 낭성 섬유증은 CFTR 유전자의 돌연변이로 인해 발생하며, 겸상 적혈구 빈혈증은 β-글로빈 유전자의 변이와 관련이 있다.[102] 헌팅턴병은 헌팅틴 유전자의 변이로 인해 발생한다.
  • 염색체 이상: 다운 증후군은 21번 염색체가 3개 존재하는 경우이며, 터너 증후군은 여성에게서 X 염색체 하나가 부분적 또는 전체적으로 결손되어 발생한다.[102] 클라인펠터 증후군은 남성이 추가 X 염색체를 가지고 태어나는 질환이다.
  • 기타 유전 질환: 칼만 증후군, 파이퍼 증후군(유전자 FGFR1), 푹스 각막 이영양증(유전자 TCF4), 히르슈스프룽병(유전자 RET 및 FECH), 바르데-비에들 증후군 1(유전자 CCDC28B 및 BBS1), 바르데-비에들 증후군 10(유전자 BBS10), 안면견갑상완 근이영양증 2형(유전자 D4Z4 및 SMCHD1) 등이 있다.[103]


유전자 검사를 통해 질병을 예측하고 예방할 수 있다. 차세대 염기서열 분석(NGS) 기술의 발전으로 유전 질환 진단 및 치료가 향상되고 있다.[104] NGS는 어셔 증후군, 망막 질환, 청력 손상, 당뇨병, 간질, 리 증후군, 유전성 암, 신경 근육 질환, 일차 면역 결핍증, 중증 복합 면역 결핍증(SCID), 미토콘드리아 질환 등 다양한 유전 질환의 진단에 활용된다.[105] 또한, NGS는 테이-삭스병, 블룸 증후군, 고셔병, 카나반병, 가족성 자율신경 이상, 낭성 섬유증, 척수성 근위축증, 취약 X 증후군과 같이 수태 전 질병 보균자를 식별하는 데에도 사용될 수 있다.[106]

일부 인간 유전 질환의 유병률 및 관련 유전자/염색체[102][103]
질환유병률관련 염색체 또는 유전자
염색체 이상
다운 증후군1:60021번 염색체
클라인펠터 증후군남성 1:500–1000추가 X 염색체
터너 증후군여성 1:2000X 염색체 손실
겸상 적혈구 빈혈증아프리카 일부 지역에서 출생 시 50명 중 1명; 다른 지역에서는 더 희귀함β-글로빈 (11번 염색체)
블룸 증후군아슈케나지 유대인 1:48000BLM
유방암/난소암 (감수성)이러한 암 유형의 경우 ~5%BRCA1, BRCA2
FAP (유전성 비폴립증 대장암)1:3500APC
린치 증후군모든 대장암 사례의 5–10%MLH1, MSH2, MSH6, PMS2
판코니 빈혈출생 시 1:130000FANCC
신경학적 상태
헌팅턴병1:20000헌팅틴
알츠하이머병 - 조기 발병1:2500PS1, PS2, APP
테이-삭스병아슈케나지 유대인 출생 시 1:3600HEXA 유전자 (15번 염색체)
카나반병동유럽 유대인 혈통 2.5%ASPA 유전자 (17번 염색체)
가족성 자율신경 이상발견 이후 전 세계적으로 알려진 사례 600건IKBKAP 유전자 (9번 염색체)
취약 X 증후군남성 1.4:10000, 여성 0.9:10000FMR1 유전자 (X 염색체)
점액지질증 IV형아슈케나지 유대인에서 1:90에서 1:100MCOLN1
기타 조건
낭성 섬유증1:2500CFTR
뒤센 근이영양증남아 1:3500디스트로핀
베커 근이영양증남성 1.5–6:100000DMD
베타 지중해 빈혈증1:100000HBB
선천성 부신 과형성증아메리카 원주민 및 유픽 에스키모족에서 1:280, 아메리카 백인에서 1:15000CYP21A2
글리코겐 축적 질환 I형미국 출생 시 1:100000G6PC
단풍 시럽 뇨병미국에서 1:180000, 메노나이트/아미쉬 공동체에서 1:176, 오스트리아에서 1:250000BCKDHA, BCKDHB, DBT, DLD
니만-픽병, SMPD1 관련전 세계 1,200건SMPD1
어셔 증후군미국에서 1:23000, 노르웨이에서 1:28000, 독일에서 1:12500CDH23, CLRN1, DFNB31, GPR98, MYO7A, PCDH15, USH1C, USH1G, USH2A



일본에서는 2023년 6월, 게놈 의료법이 성립되어 게놈 의료를 국가 전략으로 추진하고 있다.[122] 영국미국도 2010년대부터 게놈 의료를 추진하고 있다.[122] 개인별 유전적 차이에 맞춰 최적의 치료법을 찾는 맞춤형 의료도 연구 중이다.[123]

7. 진화

비교 유전체학 연구에 따르면 포유류 게놈의 약 5%는 약 2억 년 전 현존하는 계통이 분기된 이후 진화에 의해 보존되었으며, 여기에는 대부분의 유전자가 포함되어 있다.[107][108] 발표된 침팬지 게놈은 직접적인 서열 비교에서 인간 게놈과 1.23%의 차이를 보인다.[109] 이 수치의 약 20%는 각 종 내의 변이에 의해 설명되며, 인간과 침팬지 사이의 일치하는 유전자 서열의 일관된 차이는 ~1.06%에 불과하다.[110] 그러나 이러한 뉴클레오티드 단위의 차이는 각 게놈의 공유되지 않은 부분, 즉 인간 또는 침팬지에게 고유한 기능적 유전자의 약 6%에 의해 압도된다.[111]

인간과 침팬지 사이의 상당한 관찰 가능한 차이는 공유 유전자에서 DNA 서열 변화보다는 유전자 수, 기능 및 발현의 게놈 수준의 변이로 인해 발생할 수 있다. 인간 내에서도 복제 수 변이(CNV)가 발견되었는데, 이는 인간 게놈의 5–15%를 차지할 수 있다. 평균적으로 전형적인 인간 단백질 코딩 유전자는 침팬지 상동 유전자와 단 두 개의 아미노산 치환에서 차이가 있으며, 인간 유전자의 거의 3분의 1은 침팬지 상동 유전자와 정확히 동일한 단백질 번역을 가지고 있다. 두 게놈의 주요 차이점은 인간 2번 염색체로, 침팬지 12번과 13번 염색체의 융합 산물과 동일하다.[112]

인간은 최근 진화 과정에서 후각 수용체 유전자를 극적으로 잃어, 다른 대부분의 포유류에 비해 비교적 조잡한 후각을 갖게 되었다. 진화적 증거에 따르면 인간과 다른 여러 영장류 종에서 색각의 출현은 후각의 필요성을 감소시켰다.[113]

2016년 9월, 과학자들은 인간 DNA 유전자 연구를 기반으로 오늘날 세계의 모든 비 아프리카인은 5만 년에서 8만 년 전에 단일 인구가 아프리카에서 탈출한 것으로 추적할 수 있다고 보고했다.[114]

인간 미토콘드리아 DNA는 미토콘드리아 질환에서 역할을 하기 때문에 유전학자들에게 매우 중요하다. 또한 인간 진화에 대한 단서를 제공하기도 한다. 예를 들어, 인간 미토콘드리아 유전체의 변이 분석을 통해 모계 계통의 모든 인간에게서 최근 공통 조상이 존재한다는 가설(미토콘드리아 이브 참조)이 제기되었다.

미토콘드리아 DNA(mtDNA)는 핵 DNA보다 더 빠른 변이율을 보인다. 이러한 20배 높은 돌연변이율은 mtDNA를 사용하여 모계 조상을 보다 정확하게 추적할 수 있게 한다. 집단 내 mtDNA 연구를 통해 아메리카 원주민시베리아[115] 또는 동남 아시아에서 폴리네시아인의 이주 경로와 같은 고대 이주 경로를 추적할 수 있었다. 또한 순수한 모계 계통을 통해 유전된 유럽 유전자 혼합물에는 네안데르탈인 DNA의 흔적이 없다는 것을 보여주는 데에도 사용되었다.[116]

8. 후생유전체

후생유전학은 DNA의 염기서열 변화 없이 염색질 포장, 히스톤 변형, DNA 메틸화 등의 변화를 통해 유전자 발현을 조절하는 현상을 말한다. 이는 유전자 발현, 게놈 복제 및 기타 세포 과정 조절에 중요한 역할을 한다. 후생유전학적 표지는 특정 유전자의 전사를 강화하거나 약화시키지만, DNA 뉴클레오티드의 실제 서열에는 영향을 미치지 않는다. DNA 메틸화는 유전자 발현에 대한 후생유전학적 조절의 주요 형태이며, 후생유전학에서 가장 많이 연구되는 주제 중 하나이다. 발달 과정에서 인간의 DNA 메틸화 프로파일은 극적인 변화를 겪는다. 초기 생식 세포에서 게놈은 매우 낮은 메틸화 수준을 가지는데, 이는 일반적으로 활성 유전자를 의미한다. 발달이 진행됨에 따라 부모의 각인 표지가 메틸화 활성을 증가시킨다.[117][118]

후생유전학적 패턴은 개체 내의 조직 간뿐만 아니라 개체 간에도 차이를 보인다. 후생유전학적 상태만 다른 동일한 유전자를 '''에피알렐'''이라고 한다. 에피알렐은 개체의 유전형에 의해 직접 결정되는 것, 유전형의 영향을 받는 것, 유전형과 완전히 독립적인 것의 세 가지 범주로 분류할 수 있다. 후생유전체는 환경 요인의 영향도 크게 받는다. 식단, 독소 및 호르몬은 후생유전학적 상태에 영향을 미친다. 식이 조작에 대한 연구에 따르면 메틸 결핍 식단은 후생유전체의 저메틸화와 관련이 있다. 이러한 연구는 후생유전학을 환경과 게놈 사이의 중요한 인터페이스로 확립한다.[119]

참조

[1] 서적 The Human Genome https://www.ncbi.nlm[...] Wiley-Liss 2002
[2] 논문 The complete sequence of a human genome 2022-04
[3] 논문 The complete sequence of a human Y chromosome 2023-09
[4] 웹사이트 Human assembly and gene annotation https://useast.ensem[...] 2024-02-28
[5] 논문 Assembly of 43 human Y chromosomes reveals extensive complexity and variation 2023-09
[6] 논문 A draft human pangenome reference 2023-05
[7] 논문 An integrated map of genetic variation from 1,092 human genomes 2012-11
[8] 논문 A global reference for human genetic variation 2015-10
[9] 논문 Initial sequence of the chimpanzee genome and comparison with the human genome 2005-09
[10] 논문 Comparing the human and chimpanzee genomes: searching for needles in a haystack 2005-12
[11] 웹사이트 Human genome assembly https://www.ensembl.[...] 2024-01-23
[12] 논문 Loose ends: almost one in five human genes still have unresolved coding status 2018
[13] 논문 The Protein-Coding Human Genome: Annotating High-Hanging Fruits.
[14] 논문 Research on the human proteome reaches a major milestone:> 90% of predicted human proteins now credibly detected, according to the HUPO human proteome project 2020
[15] 논문 The status of the human gene catalogue 2023
[16] 논문 Similar Ratios of Introns to Intergenic Sequence across Animal Genomes 2017-06
[17] 논문 The Protein-Coding Human Genome: Annotating High-Hanging Fruits.
[18] 논문 Human protein-coding genes and gene feature statistics in 2019
[19] 논문 Genomics. ENCODE project writes eulogy for junk DNA 2012-09
[20] 논문 The landscape of long noncoding RNAs in the human transcriptome 2015-03
[21] 논문 Non-coding RNA genes and the modern RNA world 2001-12
[22] 논문 The vast, conserved mammalian lincRNome
[23] 논문 Non-coding RNA: what is functional and what is junk?
[24] 논문 Non-coding RNA 2006-04
[25] 논문 The GENCODE pseudogene resource
[26] 논문 Human specific loss of olfactory receptor genes 2003-03
[27] 논문 An integrated encyclopedia of DNA elements in the human genome 2012-09
[28] 웹사이트 ENCODE: My own thoughts http://genomeinforma[...] 2012-09-05
[29] 논문 What does our genome encode? 2012-09
[30] 논문 Regulating Evolution 2008-05
[31] 논문 The promoter-operator region of the lac operon of Escherichia coli
[32] 논문 DNA sequences required for regulated expression of beta-globin genes in murine erythroleukemia cells
[33] 논문 Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms 2001-02
[34] 간행물 Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons 2000-04
[35] 웹사이트 Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome http://www.cns.fr/ex[...] Genoscope 2006-09-12
[36] 논문 Comparative studies of gene expression and the evolution of gene regulation 2012-07
[37] 논문 Five-vertebrate ChIP-seq reveals the evolutionary dynamics of transcription factor binding 2010-05
[38] 논문 Species-specific transcription in mice carrying human chromosome 21 2008-10
[39] 논문 Repetitive DNA and next-generation sequencing: computational challenges and solutions 2012-01
[40] 논문 Large-scale analysis of tandem repeat variability in the human genome 2014-05
[41] 서적 Genetics : a conceptual approach W.H. Freeman 2012
[42] 웹사이트 minisatellite, n. meanings, etymology and more {{!}} Oxford English Dictionary https://www.oed.com/[...] 2023-10-08
[43] 논문 Active Alu retrotransposons in the human genome 2008-12
[44] 논문 A gene expression restriction network mediated by sense and antisense Alu sequences located on protein-coding messenger RNAs
[45] 논문 Hot L1s account for the bulk of retrotransposition in the human population 2003-04
[46] 서적 Evolution Cold Spring Harbor Laboratory Press 2007
[47] 논문 Defining functional DNA elements in the human genome 2014-04
[48] 논문 Getting clear about the F-word in genomics 2020-04
[49] 논문 We simply cannot go on being so vague about 'function' 2018-12
[50] 서적 Evolution of the Human Genome I Springer 2017
[51] 서적 Human Genome Structure, Function and Clinical Considerations Springer Nature 2021
[52] 논문 Expanded Encyclopaedias of DNA elements in the Human and Mouse Genomes 2020-07-30
[53] 논문 An Upper Limit on the Functional Fraction of the Human Genome 2017-07
[54] 논문 An integrated encyclopedia of DNA elements in the human genome 2012-09
[55] 논문 Adaptive evolution of non-coding DNA in Drosophila 2005-10
[56] 웹사이트 International Human Genome Sequencing Consortium Publishes Sequence and Analysis of the Human Genome https://www.genome.g[...] National Institutes of Health, U.S. Department of Health and Human Resources 2001-02-12
[57] 논문 The human genome 2001-02
[58] 간행물 Now You Can Sequence Your Whole Genome For Just $200 https://www.wired.co[...] 2018-11-19
[59] 논문 A recount of human genes ups the number to at least 46,831 https://www.sciencen[...] 2018-09-17
[60] 논문 An estimate of the total number of true human miRNAs 2019-04
[61] 간행물 300 Million Letters of DNA Are Missing From the Human Genome 2018-11-28
[62] 뉴스 Number of Human Genes Is Put at 140,000, a Significant Gain https://archive.nyti[...] 1999-09-23
[63] 논문 Finishing the euchromatic sequence of the human genome 2004-10
[64] 논문 Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes 2014-11
[65] 논문 Filling in the gaps telomere to telomere https://www.nature.c[...] 2021-02
[66] 웹사이트 Scientists sequence the complete human genome for the first time https://edition.cnn.[...] 2022-03-31
[67] 논문 Initial sequencing and analysis of the human genome 2001-02
[68] 웹사이트 300 Million Letters of DNA Are Missing From the Human Genome https://www.theatlan[...] 2019-08-16
[69] 논문 Resolving the complexity of the human genome using single-molecule sequencing 2015-01
[70] 논문 Telomere-to-telomere assembly of a complete human X chromosome 2020-09
[71] 논문 The structure, function and evolution of a complete human chromosome 8 2021-05
[72] 웹사이트 CHM13 T2T v1.1 – Genome – Assembly – NCBI https://www.ncbi.nlm[...] 2021-07-26
[73] 웹사이트 Genome List – Genome – NCBI https://www.ncbi.nlm[...] 2021-07-26
[74] 웹사이트 GRCh38 – hg38 – Genome – Assembly https://www.ncbi.nlm[...] 2019-03-15
[75] 웹사이트 from Bill Clinton's 2000 State of the Union address http://clinton4.nara[...] 2007-06-14
[76] 논문 Global variation in copy number in the human genome 2006-11
[77] 웹사이트 What's a Genome? http://www.genomenew[...] Genomenewsnetwork.org 2003-01-15
[78] 웹사이트 Fact Sheet: Genome Mapping: A Guide to the Genetic Highway We Call the Human Genome https://www.ncbi.nlm[...] U.S. National Library of Medicine, National Institutes of Health 2004-03-29
[79] 웹사이트 About the Project http://www.hapmap.or[...] 2009-05-31
[80] 웹사이트 2008 Release: Researchers Produce First Sequence Map of Large-Scale Structural Variation in the Human Genome http://www.genome.go[...] genome.gov 2009-05-31
[81] 논문 Mapping and sequencing of structural variation from eight human genomes 2008-05
[82] 논문 Mapping and characterization of structural variation in 17,795 human genomes 2020-07
[83] 논문 Single nucleotide polymorphisms as tools in human genetics
[84] 논문 Application of SNP technologies in medicine: lessons learned and future challenges 2001-06
[85] 웹사이트 Human Genome Project Completion: Frequently Asked Questions http://www.genome.go[...] genome.gov 2009-05-31
[86] 뉴스 Craig Venter's Genome http://www.technolog[...] 2007-09-04
[87] 논문 Single-molecule sequencing of an individual human genome 2009-09
[88] 논문 Clinical assessment incorporating a personal genome 2010-05
[89] 논문 Phased whole-genome genetic risk in a family quartet using a major allele reference sequence 2011-09
[90] 간행물 Complete Genomics Adds 29 High-Coverage, Complete Human Genome Sequencing Datasets to Its Public Genomic Repository http://globenewswire[...]
[91] 뉴스 Desmond Tutu's genome sequenced as part of genetic diversity study https://www.theguard[...] 2010-02-17
[92] 논문 Complete Khoisan and Bantu genomes from southern Africa 2010-02
[93] 논문 Ancient human genome sequence of an extinct Palaeo-Eskimo 2010-02
[94] bioRxiv A Complete Public Domain Family Genomics Dataset 2013-11-12
[95] 논문 Crowdsourcing the corpasome 2013-06
[96] 논문 The whole genome sequences and experimentally phased haplotypes of over 100 personal genomes 2016-10
[97] 논문 Matching phenotypes to whole genomes: Lessons learned from four iterations of the personal genome project community challenges 2017-09
[98] 논문 Human genome sequencing in health and disease
[99] 논문 Genetic diagnosis by whole exome capture and massively parallel DNA sequencing 2009-11
[100] 논문 Human Knockout Carriers: Dead, Diseased, Healthy, or Improved? 2016-04
[101] 논문 Human knockouts and phenotypic analysis in a cohort with a high rate of consanguinity 2017-04
[102] 논문 Online Mendelian Inheritance in Man (OMIM), a knowledgebase of human genes and genetic disorders 2002-01
[103] 논문 The continuum of causality in human genetic disorders 2016-11
[104] 논문 A Next-Generation Sequencing Primer-How Does It Work and What Can It Do?
[105] 서적 Next Generation Sequencing Based Clinical Molecular Diagnosis of Human Genetic Disorders Springer International Publishing 2017
[106] 서적 Next Generation Sequencing Based Clinical Molecular Diagnosis of Human Genetic Disorders Springer International Publishing 2017
[107] 논문 Initial sequencing and comparative analysis of the mouse genome 2002-12
[108] 논문 Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project 2007-06
[109] 논문 Initial sequence of the chimpanzee genome and comparison with the human genome 2005-09
[110] 논문 Initial sequence of the chimpanzee genome and comparison with the human genome 2005-09
[111] 논문 The evolution of mammalian gene families
[112] 논문 Initial sequence of the chimpanzee genome and comparison with the human genome 2005-09
[112] 논문 Sequencing the chimpanzee genome: insights into human evolution and disease 2003-01
[113] 논문 Loss of olfactory receptor genes coincides with the acquisition of full trichromatic vision in primates 2004-01
[114] 뉴스 How We Got Here: DNA Points to a Single Migration From Africa https://www.nytimes.[...] 2016-09-21
[115] 논문 Tracing the peopling of the world through genomics 2017-01
[116] 웹사이트 Mitochondrial DNA and human history http://genome.wellco[...] The Human Genome 2006-09-19
[117] 논문 Beyond the sequence: cellular organization of genome function 2007-02
[118] 논문 The mammalian epigenome 2007-02
[119] 논문 '[Epigenetics, interface between environment and genes: role in complex diseases]' 2012-05
[120] 뉴스 ヒトゲノムの3D構造は「丸めた麺のようなフラクタル」 http://wired.jp/2009[...] WIRED.jp 2009-10-13
[121] 논문 Finishing the euchromatic sequence of the human genome. https://www.nature.c[...]
[122] 뉴스 ■ゲノム医療法成立:全遺伝情報 10万人分解析へ/難病解明、新薬開発に期待 https://www.yomiuri.[...] 読売新聞 2023-06-23
[123] 간행물 疾病克服に向けたゲノム医療実現プロジェクト オーダーメイド医療の実現プログラム https://www.amed.go.[...] 일본의료연구개발기구 2023-06-23



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com