인간 유전체
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
인간 유전체는 인간 게놈의 전체 DNA 배열을 의미하며, 1984년 인간 게놈 프로젝트를 통해 염기 서열 해독 연구가 시작되었다. 2000년대 초반에 초안이 발표되고 해독이 완료되었으며, 이후 기술 발전과 연구를 통해 유전자 수, 분자 구성, 조절 DNA 서열, 반복 DNA 서열 등 다양한 정보가 밝혀졌다. 인간 유전체는 단백질 코딩 유전자, 비암호화 유전자, 조절 DNA 서열, 반복 DNA 서열 등으로 구성되며, 유전 질환, 진화, 후생유전체 연구에도 활용된다. 게놈 의료는 질병의 원인 규명과 맞춤형 치료법 개발에 기여하며, 비교 유전체학 연구는 인간과 침팬지의 유전적 차이와 인간의 진화 과정을 밝히는 데 중요한 역할을 한다.
더 읽어볼만한 페이지
- 인류유전학 - 피부색
피부색은 멜라닌의 양과 유형에 의해 결정되며, 자외선 노출, 비타민 D 합성, 사회적 요인 등 다양한 요소와 관련되어 진화해 왔다. - 인류유전학 - 근친혼
근친혼은 혈족 또는 인척 간의 결혼을 의미하며, 유전적 결함과 질병 발생의 위험으로 인해 각국에서 민법 등을 통해 규제하고 금혼 범위는 국가별로 차이를 보인다. - 염색체 (인간) - 6번 염색체
6번 염색체는 인간의 23쌍 염색체 중 하나로, 약 1억 7천만 개의 염기쌍으로 구성되어 있으며 면역 반응과 관련된 유전자를 포함하고 다양한 질병과 관련이 있다. - 염색체 (인간) - Y 염색체
Y 염색체는 포유류의 성별 결정에 중요한 역할을 하는 성 결정 염색체로, 진화 과정에서 유전자 소실과 높은 돌연변이율을 겪지만 자체 보존 메커니즘을 가지며, 인간에게는 부계 유전을 통해 전달되어 유전 계보학 연구 및 질병 관련 연구에 활용된다.
인간 유전체 | |
---|---|
개요 | |
![]() | |
유전체 크기 | |
염기쌍 | 약 30억 |
단백질 코딩 유전자 | 19,000 ~ 20,000개 |
비코딩 유전자 | 21,000개 이상 |
구성 | |
염색체 | 23쌍 (46개) |
DNA | 약 99% |
비암호화 DNA | 약 98.5% |
엑손 | 1.5% |
미토콘드리아 DNA | 고리 모양 (환형) |
추가 정보 | |
온라인 데이터베이스 | NCBI 인간 유전체 자원 앙상블 인간 유전체 브라우저 UCSC 유전체 브라우저 휴먼 지놈 명명 위원회 (HGNC) |
기타 | |
OMIM | 인간 유전체 |
2. 연구사
인간 게놈 프로젝트는 1984년에 인간 게놈의 염기 서열 해독을 목적으로 처음 제안되었고, 1991년부터 해독 작업이 시작되었다. 2000년 6월 26일에 드래프트 배열 해독이 종료되었고, 2003년 4월 14일에 해독 완료가 선언되었다. 당시 인간 유전자 수는 32,615개로 추정되었다.[121] 그러나 이후 분석을 통해 이 추정치는 오류로 밝혀졌고, 2004년 10월 21일 네이처 지에 게재된 논문에서는 새로운 추정치를 22,287개로 수정했다.
해독된 배열은 여러 국가, 여러 사람의 게놈 DNA 혼합 시료를 기반으로 한 표준 배열의 유크로마틴 영역을 중심으로 전체 게놈의 99% 영역에 대해 다수결로 결정된 것이다. 따라서 실제 유전자 수는 개인차 등에 의해 다소 변동될 수 있다. 또한 표준 배열에서도 헤테로크로마틴 영역을 중심으로 한 미해독 영역이나 중복 영역 등에 대한 해석이 계속되고 있으며, 2004년 보고 이후에도 정기적으로 수정 보고가 이루어지고 있다.
인간 게놈 프로젝트 완료 발표(2001년) 당시[67] 수백 개의 틈이 남아 있었고, 전체 염기 서열의 약 5~10%가 미결정 상태였다. 누락된 유전 정보는 대부분 반복적인 이질염색질 영역과 중심체 및 텔로미어 근처에 있었지만, 일부 유전자 코딩 진정염색질 영역에도 존재했다.[68]
적은 유전자 수로 인간의 복잡한 몸과 뇌가 구축된다는 사실은 과학자들에게 놀라움을 안겨주었다. 이후 벼과 식물의 유전자가 인간보다 훨씬 많고, 하등 생물로 여겨졌던 성게의 유전자 수가 인간과 거의 같으며, 70%가 인간과 공통된다는 사실 등이 밝혀지면서, 인간이 유전자 수로 다른 생물보다 우위에 있을 것이라는 예상은 빗나갔다.
개인 게놈 배열 분석은 의학 연구에 중요하므로, 2008년부터 1000 게놈 프로젝트가 시작되었다.
2. 1. 21세기 이후의 발전
2022년에 텔로미어-텔로미어(T2T) 컨소시엄은 X 염색체(2020년)와 22개의 상염색체(2021년 5월)의 모든 틈을 메운 인간 여성 게놈의 완전한 염기서열을 보고했다.[2] 이전에 염기 서열이 결정되지 않은 부분에는 감염에 적응하고 생존하는 데 도움이 되는 면역 반응 유전자와 약물 반응을 예측하는 데 중요한 유전자가 포함되어 있다.[65]2023년에는 다양한 민족 출신의 47명의 유전체를 기반으로 하는 초안 인간 팬게놈 참조가 발표되었다.[6] 더 넓은 표본에서 더 많은 생물 다양성을 포착하는 개선된 참조를 위한 계획이 진행 중이다.[6]
3. 분자적 구성 및 유전자 내용
인간 참조 유전체는 한 쌍의 상염색체 각각의 사본 1개와 두 개의 성염색체(X 및 Y) 각각의 사본 1개를 포함하며, 총 DNA 양은 31억 염기쌍(3.1 Gb)이다.[11] 핵 게놈은 세포핵 내에서 23~24종의 선형 DNA로 나뉘어 염색체를 형성한다. 염색체는 22종류의 상염색체와 X, Y 두 종류의 성염색체로 분류된다. 체세포는 2배체이며, 같은 종류의 상염색체를 2개씩, 성염색체를 2개(여성은 X와 X, 남성은 X와 Y)로 총 46개의 염색체를 가진다. 생식 세포는 1배체이며, 상염색체를 1개씩, 성염색체를 1개로 총 23개의 염색체를 가진다. 미토콘드리아 게놈은 16,569 염기쌍의 환형 DNA로, 미토콘드리아 안에 다수 존재한다.[120]
최근 연구에서는 게놈 내 대부분의 Non-coding DNA|비암호화 DNA영어가 생화학적 활성(유전자 발현 조절, 염색체의 구조 형성, 후성 유전학 조절 등)을 가지고 있다는 것이 시사되고 있다.[120]
인간 유전체의 약 8%는 탄뎀 DNA 배열 또는 탄뎀 반복 서열로 구성되어 있으며, 여러 개의 인접한 복사본(예: "CAGCAGCAG...")을 가진 낮은 복잡성의 반복 서열이다. 10개 미만의 뉴클레오티드 반복 서열은 마이크로새틀라이트 서열이라고 하며, 이중 삼중 뉴클레오티드 반복은 단백질 유전자 코딩 영역 내에서 때때로 발생하여 유전 질환을 유발할 수 있다. 더 긴 서열의 탄뎀 반복(10~60 뉴클레오티드 길이의 반복 서열 배열)은 미니새틀라이트라고 한다.
전이성 유전자 요소는 숙주 유전체 내의 다른 위치에서 복제하고 자체 복사본을 삽입할 수 있는 DNA 서열이며 인간 유전체에서 풍부한 구성 요소이다. LTR 레트로트랜스포존, SINE, LINE, SVA(SINE-VNTR-Alu) 및 클래스 II DNA 트랜스포존으로 분류할 수 있다.[120]
무엇이 "기능적" 요소인지에 대한 합의는 존재하지 않지만,[47][48] 최근 연구에서는 게놈 내 대부분의 Non-coding DNA|비암호화 DNA영어가 생화학적 활성을 가지고 있다는 것이 시사되고 있다.
3. 1. 단백질 코딩 유전자
인간 참조 유전체는 19,000개에서 20,000개 사이의 단백질 코딩 유전자를 포함한다.[12][13][14][15] 이 유전자들은 평균 10개의 인트론을 포함하고 있으며, 인트론의 평균 크기는 약 6kb (6,000bp)이다. 단백질 코딩 유전자의 평균 크기는 약 62kb이며, 이러한 유전자들이 게놈의 약 40%를 차지한다.[16]엑손 서열은 성숙한 mRNA의 양쪽 끝에 코딩 DNA와 비번역 영역(UTR)으로 구성된다. 코딩 DNA의 총량은 게놈의 약 1-2%이다.[17][18]
3. 2. 비암호화 유전자
비부호화 RNA 분자는 세포 내에서, 특히 단백질 합성 및 RNA 처리의 여러 반응에서 필수적인 역할을 한다. 비부호화 유전자에는 tRNA, 리보솜 RNA, microRNA, snRNA 및 긴 비부호화 RNA (lncRNA)를 위한 유전자가 포함된다.[19][20][21][22] 보고된 비부호화 유전자의 수는 계속해서 천천히 증가하고 있지만, 인간 유전체 내의 정확한 수는 아직 결정되지 않았다. 많은 RNA는 기능하지 않는 것으로 생각된다.[23]많은 비부호화 RNA는 유전자 조절 및 발현의 중요한 요소이다. 비부호화 RNA는 또한 후성 유전학, 전사, RNA 스플라이싱 및 번역 기계에 기여한다. 유전자 조절 및 질병에서 RNA의 역할은 탐구되지 않은 유전체 복잡성의 새로운 잠재적 수준을 제공한다.[24]
3. 3. 조절 DNA 서열
인간 유전체는 유전자 발현을 조절하는 데 중요한 다양한 조절 서열을 가지고 있다. 보수적인 추정치에 따르면 이러한 서열은 유전체의 8%를 차지하지만,[27] ENCODE 프로젝트의 추론에 따르면 유전체의 20% 이상[28][29]이 유전자 조절 서열이다. 일부 유형의 비암호화 DNA는 단백질을 암호화하지 않지만 유전자가 언제, 어디서 발현되는지 조절하는 유전자 "스위치"(인핸서)라고 불린다.[30]조절 서열은 1960년대 후반부터 알려져 왔다.[31] 인간 유전체에서 조절 서열을 처음으로 식별하는 데에는 재조합 DNA 기술이 사용되었다.[32] 이후 유전체 염기 서열 분석이 등장하면서, 이러한 서열의 식별은 진화적 보존을 통해 추론할 수 있게 되었다. 예를 들어, 영장류와 생쥐 사이의 진화 분기는 7천만~9천만 년 전에 발생했다.[33] 따라서 보존된 비암호화 서열을 식별하는 유전자 서열의 컴퓨터 비교는 유전자 조절과 같은 역할에서 그 중요성을 나타낸다.[34]
다른 유전체도 보존 기반 방법을 지원하기 위해 염기 서열 분석되었는데, 예를 들어 복어 유전체가 있다.[35] 그러나 조절 서열은 진화 과정에서 높은 속도로 사라지고 다시 진화한다.[36][37][38]
2012년 현재, 노력은 ChIP-Seq 기술을 통해 DNA와 조절 단백질 간의 상호 작용을 찾거나, DNA가 히스톤에 의해 포장되지 않은 간격(DNase 과민 부위)을 찾는 방향으로 전환되었으며, 이 두 가지 모두 조사된 세포 유형에서 활성 조절 서열이 어디에 있는지 알려준다.[27]
3. 4. 반복 DNA 서열
반복 DNA 서열은 인간 유전체의 약 50%를 차지한다.인간 유전체의 약 8%는 탄뎀 DNA 배열 또는 탄뎀 반복 서열로 구성되어 있으며, 여러 개의 인접한 복사본(예: "CAGCAGCAG...")을 가진 낮은 복잡성의 반복 서열이다. 탄뎀 서열은 두 개의 뉴클레오티드에서 수십 개의 뉴클레오티드까지 다양한 길이를 가질 수 있다. 이러한 서열은 관련 개체 간에도 매우 가변적이어서 계통 DNA 검사 및 법의학 DNA 분석에 사용된다.
10개 미만의 뉴클레오티드 반복 서열(예: 이중 뉴클레오티드 반복 (AC)n)은 마이크로새틀라이트 서열이라고 한다. 마이크로새틀라이트 서열 중에서 삼중 뉴클레오티드 반복은 단백질 유전자 코딩 영역 내에서 때때로 발생하여 유전 질환을 유발할 수 있으므로 특히 중요하다. 예를 들어, 헌팅턴병은 인간 4번 염색체에 있는 ''헌팅틴'' 유전자 내의 삼중 뉴클레오티드 반복 (CAG)n의 확대로 인해 발생한다. 텔로미어(선형 염색체의 끝)는 (TTAGGG)n 서열의 마이크로새틀라이트 육중 뉴클레오티드 반복으로 끝난다.
더 긴 서열의 탄뎀 반복(10~60 뉴클레오티드 길이의 반복 서열 배열)은 미니새틀라이트라고 한다.
전이성 유전자 요소는 숙주 유전체 내의 다른 위치에서 복제하고 자체 복사본을 삽입할 수 있는 DNA 서열이며 인간 유전체에서 풍부한 구성 요소이다. 가장 풍부한 트랜스포존 계통인 ''Alu''는 약 50,000개의 활성 복사본을 가지고 있으며 유전자 내 및 유전자 간 영역에 삽입될 수 있다. 또 다른 계통인 LINE-1은 게놈당 약 100개의 활성 복사본을 가지고 있다(수는 사람마다 다르다). 오래된 트랜스포존의 비기능적 유물과 함께, 이것들은 전체 인간 DNA의 절반 이상을 차지한다. 때때로 "점핑 유전자"라고도 불리는 트랜스포존은 인간 유전체를 조형하는 데 중요한 역할을 했다. 이러한 서열 중 일부는 유전체에 영구적으로 통합되어 이제 다음 세대에 전달되는 바이러스 서열의 DNA 복사본인 내생 레트로바이러스를 나타낸다. 또한 인간 DNA의 레트로바이러스도 상당수 있으며, 이 중 적어도 3개는 중요한 기능을 가지고 있음이 입증되었다(예: HIV와 유사한 기능적 HERV-K; 비기능적 바이러스 HERV-W 및 HERV-FRD의 외피 유전자는 세포 간 융합을 유도하여 태반 형성에 역할을 한다).
인간 유전체 내의 이동성 요소는 LTR 레트로트랜스포존(총 게놈의 8.3%), SINE(총 게놈의 13.1%) (Alu 요소 포함), LINE(총 게놈의 20.4%), SVA(SINE-VNTR-Alu) 및 클래스 II DNA 트랜스포존(총 게놈의 2.9%)으로 분류할 수 있다.[120]
3. 5. 정크 DNA
유전학자, 진화 생물학자, 분자 생물학자들은 서로 다른 정의와 방법을 사용하기 때문에, 게놈에서 무엇이 "기능적" 요소인지에 대한 합의는 존재하지 않는다.[47][48] "기능적" DNA에 대한 정의는 학자마다 다르며, 문헌에서는 기능적 DNA의 양에 대한 합의가 이루어지지 않았다. 인간 게놈의 최대 90%가 기능하지 않는 DNA(정크 DNA)일 가능성이 있다는 추정에서, 게놈의 최대 80%가 기능적일 가능성이 있다는 추정까지 범위가 다양하다.[53][54]진화적 정의에서 "기능적" DNA는 코딩 여부에 관계없이 유기체의 적합성에 기여하며, 진화적 압력에 의해 유지되는 DNA를 말한다. 반면 "비기능적" DNA는 유기체에 아무런 이점이 없으므로 중립적 선택 압력을 받으며, 이러한 유형의 DNA는 정크 DNA로 묘사되어 왔다.[50][51]
최근 연구에서는 게놈 내 대부분의 Non-coding DNA|비암호화 DNA영어가 생화학적 활성(유전자 발현 조절, 염색체의 구조 형성, 후성 유전학 조절 등)을 가지고 있다는 것이 시사되고 있다.
4. 염색체 정보
염색체 | 길이 (mm) | 염기쌍 | 확인된 단백질 | 단백질로 추정 | 의사유전자 | miRNA | rRNA | snRNA | snoRNA | Misc ncRNA | 센트로미어 위치 (Mbp) | 누계 (%) |
---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 85 | 249250621bp | 2,012 | 31 | 1,130 | 134 | 66 | 221 | 145 | 106 | 125.0 | 7.9 |
2 | 83 | 243199373bp | 1,203 | 50 | 948 | 115 | 40 | 161 | 117 | 93 | 93.3 | 16.2 |
3 | 67 | 198022430bp | 1,040 | 25 | 719 | 99 | 29 | 138 | 87 | 77 | 91.0 | 23.0 |
4 | 65 | 191154276bp | 718 | 39 | 698 | 92 | 24 | 120 | 56 | 71 | 50.4 | 29.6 |
5 | 62 | 180915260bp | 849 | 24 | 676 | 83 | 25 | 106 | 61 | 68 | 48.4 | 35.8 |
6 | 58 | 171115067bp | 1,002 | 39 | 731 | 81 | 26 | 111 | 73 | 67 | 61.0 | 41.6 |
7 | 54 | 159138663bp | 866 | 34 | 803 | 90 | 24 | 90 | 76 | 70 | 59.9 | 47.1 |
8 | 50 | 146364022bp | 659 | 39 | 568 | 80 | 28 | 86 | 52 | 42 | 45.6 | 52.0 |
9 | 48 | 141213431bp | 785 | 15 | 714 | 69 | 19 | 66 | 51 | 55 | 49.0 | 56.3 |
10 | 46 | 135534747bp | 745 | 18 | 500 | 64 | 32 | 87 | 56 | 56 | 40.2 | 60.9 |
11 | 46 | 135006516bp | 1,258 | 48 | 775 | 63 | 24 | 74 | 76 | 53 | 53.7 | 65.4 |
12 | 45 | 133851895bp | 1,003 | 47 | 582 | 72 | 27 | 106 | 62 | 69 | 35.8 | 70.0 |
13 | 39 | 115169878bp | 318 | 8 | 323 | 42 | 16 | 45 | 34 | 36 | 17.9 | 73.4 |
14 | 36 | 107349540bp | 601 | 50 | 472 | 92 | 10 | 65 | 97 | 46 | 17.6 | 76.4 |
15 | 35 | 102531392bp | 562 | 43 | 473 | 78 | 13 | 63 | 136 | 39 | 19.0 | 79.3 |
16 | 31 | 90354753bp | 805 | 65 | 429 | 52 | 32 | 53 | 58 | 34 | 36.6 | 82.0 |
17 | 28 | 81195210bp | 1,158 | 44 | 300 | 61 | 15 | 80 | 71 | 46 | 24.0 | 84.8 |
18 | 27 | 78077248bp | 268 | 20 | 59 | 32 | 13 | 51 | 36 | 25 | 17.2 | 87.4 |
19 | 20 | 59128983bp | 1,399 | 26 | 181 | 110 | 13 | 29 | 31 | 15 | 26.5 | 89.3 |
20 | 21 | 63025520bp | 533 | 13 | 213 | 57 | 15 | 46 | 37 | 34 | 27.5 | 91.4 |
21 | 16 | 48129895bp | 225 | 8 | 150 | 16 | 5 | 21 | 19 | 8 | 13.2 | 92.6 |
22 | 17 | 51304566bp | 431 | 21 | 308 | 31 | 5 | 23 | 23 | 23 | 14.7 | 93.8 |
X | 53 | 155270560bp | 815 | 23 | 780 | 128 | 22 | 85 | 64 | 52 | 60.6 | 99.1 |
Y | 20 | 59373566bp | 45 | 8 | 327 | 15 | 7 | 17 | 3 | 2 | 12.5 | 100.0 |
mtDNA | 0.0054 | 16569bp | 13 | 0 | 0 | 0 | 2 | 0 | 0 | 22 | N/A | 100.0 |
합계 | 1052 | 3095693981bp | 19,313 | 738 | 12,859 | 1,756 | 532 | 1,944 | 1,521 | 1,209 | - | - |
5. 게놈 의료
게놈 분석 결과를 질병의 원인 규명이나 신약 개발, 개인별 차이에 맞춘 최적의 치료법을 모색하는 맞춤형 의료 등에 활용하는 것을 "게놈 의료"라고 한다. 일본에서는 2023년 6월, "양질의 적절한 게놈 의료를 국민이 안심하고 받을 수 있도록 하기 위한 시책의 종합적이고 계획적인 추진에 관한 법률"(게놈 의료법)이 성립되었다.[122] 영국과 미국도 2010년대부터 게놈 의료를 국가 전략으로 추진하고 있다.[122][123]
6. 인간 유전 질환
인간의 유전 질환은 단일 유전자 변이, 염색체 이상 등 다양한 원인으로 발생한다.
- 단일 유전자 질환: 낭성 섬유증은 CFTR 유전자의 돌연변이로 인해 발생하며, 겸상 적혈구 빈혈증은 β-글로빈 유전자의 변이와 관련이 있다.[102] 헌팅턴병은 헌팅틴 유전자의 변이로 인해 발생한다.
- 염색체 이상: 다운 증후군은 21번 염색체가 3개 존재하는 경우이며, 터너 증후군은 여성에게서 X 염색체 하나가 부분적 또는 전체적으로 결손되어 발생한다.[102] 클라인펠터 증후군은 남성이 추가 X 염색체를 가지고 태어나는 질환이다.
- 기타 유전 질환: 칼만 증후군, 파이퍼 증후군(유전자 FGFR1), 푹스 각막 이영양증(유전자 TCF4), 히르슈스프룽병(유전자 RET 및 FECH), 바르데-비에들 증후군 1(유전자 CCDC28B 및 BBS1), 바르데-비에들 증후군 10(유전자 BBS10), 안면견갑상완 근이영양증 2형(유전자 D4Z4 및 SMCHD1) 등이 있다.[103]
유전자 검사를 통해 질병을 예측하고 예방할 수 있다. 차세대 염기서열 분석(NGS) 기술의 발전으로 유전 질환 진단 및 치료가 향상되고 있다.[104] NGS는 어셔 증후군, 망막 질환, 청력 손상, 당뇨병, 간질, 리 증후군, 유전성 암, 신경 근육 질환, 일차 면역 결핍증, 중증 복합 면역 결핍증(SCID), 미토콘드리아 질환 등 다양한 유전 질환의 진단에 활용된다.[105] 또한, NGS는 테이-삭스병, 블룸 증후군, 고셔병, 카나반병, 가족성 자율신경 이상, 낭성 섬유증, 척수성 근위축증, 취약 X 증후군과 같이 수태 전 질병 보균자를 식별하는 데에도 사용될 수 있다.[106]
질환 | 유병률 | 관련 염색체 또는 유전자 |
---|---|---|
염색체 이상 | ||
다운 증후군 | 1:600 | 21번 염색체 |
클라인펠터 증후군 | 남성 1:500–1000 | 추가 X 염색체 |
터너 증후군 | 여성 1:2000 | X 염색체 손실 |
겸상 적혈구 빈혈증 | 아프리카 일부 지역에서 출생 시 50명 중 1명; 다른 지역에서는 더 희귀함 | β-글로빈 (11번 염색체) |
블룸 증후군 | 아슈케나지 유대인 1:48000 | BLM |
암 | ||
유방암/난소암 (감수성) | 이러한 암 유형의 경우 ~5% | BRCA1, BRCA2 |
FAP (유전성 비폴립증 대장암) | 1:3500 | APC |
린치 증후군 | 모든 대장암 사례의 5–10% | MLH1, MSH2, MSH6, PMS2 |
판코니 빈혈 | 출생 시 1:130000 | FANCC |
신경학적 상태 | ||
헌팅턴병 | 1:20000 | 헌팅틴 |
알츠하이머병 - 조기 발병 | 1:2500 | PS1, PS2, APP |
테이-삭스병 | 아슈케나지 유대인 출생 시 1:3600 | HEXA 유전자 (15번 염색체) |
카나반병 | 동유럽 유대인 혈통 2.5% | ASPA 유전자 (17번 염색체) |
가족성 자율신경 이상 | 발견 이후 전 세계적으로 알려진 사례 600건 | IKBKAP 유전자 (9번 염색체) |
취약 X 증후군 | 남성 1.4:10000, 여성 0.9:10000 | FMR1 유전자 (X 염색체) |
점액지질증 IV형 | 아슈케나지 유대인에서 1:90에서 1:100 | MCOLN1 |
기타 조건 | ||
낭성 섬유증 | 1:2500 | CFTR |
뒤센 근이영양증 | 남아 1:3500 | 디스트로핀 |
베커 근이영양증 | 남성 1.5–6:100000 | DMD |
베타 지중해 빈혈증 | 1:100000 | HBB |
선천성 부신 과형성증 | 아메리카 원주민 및 유픽 에스키모족에서 1:280, 아메리카 백인에서 1:15000 | CYP21A2 |
글리코겐 축적 질환 I형 | 미국 출생 시 1:100000 | G6PC |
단풍 시럽 뇨병 | 미국에서 1:180000, 메노나이트/아미쉬 공동체에서 1:176, 오스트리아에서 1:250000 | BCKDHA, BCKDHB, DBT, DLD |
니만-픽병, SMPD1 관련 | 전 세계 1,200건 | SMPD1 |
어셔 증후군 | 미국에서 1:23000, 노르웨이에서 1:28000, 독일에서 1:12500 | CDH23, CLRN1, DFNB31, GPR98, MYO7A, PCDH15, USH1C, USH1G, USH2A |
일본에서는 2023년 6월, 게놈 의료법이 성립되어 게놈 의료를 국가 전략으로 추진하고 있다.[122] 영국과 미국도 2010년대부터 게놈 의료를 추진하고 있다.[122] 개인별 유전적 차이에 맞춰 최적의 치료법을 찾는 맞춤형 의료도 연구 중이다.[123]
7. 진화
비교 유전체학 연구에 따르면 포유류 게놈의 약 5%는 약 2억 년 전 현존하는 계통이 분기된 이후 진화에 의해 보존되었으며, 여기에는 대부분의 유전자가 포함되어 있다.[107][108] 발표된 침팬지 게놈은 직접적인 서열 비교에서 인간 게놈과 1.23%의 차이를 보인다.[109] 이 수치의 약 20%는 각 종 내의 변이에 의해 설명되며, 인간과 침팬지 사이의 일치하는 유전자 서열의 일관된 차이는 ~1.06%에 불과하다.[110] 그러나 이러한 뉴클레오티드 단위의 차이는 각 게놈의 공유되지 않은 부분, 즉 인간 또는 침팬지에게 고유한 기능적 유전자의 약 6%에 의해 압도된다.[111]
인간과 침팬지 사이의 상당한 관찰 가능한 차이는 공유 유전자에서 DNA 서열 변화보다는 유전자 수, 기능 및 발현의 게놈 수준의 변이로 인해 발생할 수 있다. 인간 내에서도 복제 수 변이(CNV)가 발견되었는데, 이는 인간 게놈의 5–15%를 차지할 수 있다. 평균적으로 전형적인 인간 단백질 코딩 유전자는 침팬지 상동 유전자와 단 두 개의 아미노산 치환에서 차이가 있으며, 인간 유전자의 거의 3분의 1은 침팬지 상동 유전자와 정확히 동일한 단백질 번역을 가지고 있다. 두 게놈의 주요 차이점은 인간 2번 염색체로, 침팬지 12번과 13번 염색체의 융합 산물과 동일하다.[112]
인간은 최근 진화 과정에서 후각 수용체 유전자를 극적으로 잃어, 다른 대부분의 포유류에 비해 비교적 조잡한 후각을 갖게 되었다. 진화적 증거에 따르면 인간과 다른 여러 영장류 종에서 색각의 출현은 후각의 필요성을 감소시켰다.[113]
2016년 9월, 과학자들은 인간 DNA 유전자 연구를 기반으로 오늘날 세계의 모든 비 아프리카인은 5만 년에서 8만 년 전에 단일 인구가 아프리카에서 탈출한 것으로 추적할 수 있다고 보고했다.[114]
인간 미토콘드리아 DNA는 미토콘드리아 질환에서 역할을 하기 때문에 유전학자들에게 매우 중요하다. 또한 인간 진화에 대한 단서를 제공하기도 한다. 예를 들어, 인간 미토콘드리아 유전체의 변이 분석을 통해 모계 계통의 모든 인간에게서 최근 공통 조상이 존재한다는 가설(미토콘드리아 이브 참조)이 제기되었다.
미토콘드리아 DNA(mtDNA)는 핵 DNA보다 더 빠른 변이율을 보인다. 이러한 20배 높은 돌연변이율은 mtDNA를 사용하여 모계 조상을 보다 정확하게 추적할 수 있게 한다. 집단 내 mtDNA 연구를 통해 아메리카 원주민의 시베리아[115] 또는 동남 아시아에서 폴리네시아인의 이주 경로와 같은 고대 이주 경로를 추적할 수 있었다. 또한 순수한 모계 계통을 통해 유전된 유럽 유전자 혼합물에는 네안데르탈인 DNA의 흔적이 없다는 것을 보여주는 데에도 사용되었다.[116]
8. 후생유전체
후생유전학은 DNA의 염기서열 변화 없이 염색질 포장, 히스톤 변형, DNA 메틸화 등의 변화를 통해 유전자 발현을 조절하는 현상을 말한다. 이는 유전자 발현, 게놈 복제 및 기타 세포 과정 조절에 중요한 역할을 한다. 후생유전학적 표지는 특정 유전자의 전사를 강화하거나 약화시키지만, DNA 뉴클레오티드의 실제 서열에는 영향을 미치지 않는다. DNA 메틸화는 유전자 발현에 대한 후생유전학적 조절의 주요 형태이며, 후생유전학에서 가장 많이 연구되는 주제 중 하나이다. 발달 과정에서 인간의 DNA 메틸화 프로파일은 극적인 변화를 겪는다. 초기 생식 세포에서 게놈은 매우 낮은 메틸화 수준을 가지는데, 이는 일반적으로 활성 유전자를 의미한다. 발달이 진행됨에 따라 부모의 각인 표지가 메틸화 활성을 증가시킨다.[117][118]
후생유전학적 패턴은 개체 내의 조직 간뿐만 아니라 개체 간에도 차이를 보인다. 후생유전학적 상태만 다른 동일한 유전자를 '''에피알렐'''이라고 한다. 에피알렐은 개체의 유전형에 의해 직접 결정되는 것, 유전형의 영향을 받는 것, 유전형과 완전히 독립적인 것의 세 가지 범주로 분류할 수 있다. 후생유전체는 환경 요인의 영향도 크게 받는다. 식단, 독소 및 호르몬은 후생유전학적 상태에 영향을 미친다. 식이 조작에 대한 연구에 따르면 메틸 결핍 식단은 후생유전체의 저메틸화와 관련이 있다. 이러한 연구는 후생유전학을 환경과 게놈 사이의 중요한 인터페이스로 확립한다.[119]
참조
[1]
서적
The Human Genome
https://www.ncbi.nlm[...]
Wiley-Liss
2002
[2]
논문
The complete sequence of a human genome
2022-04
[3]
논문
The complete sequence of a human Y chromosome
2023-09
[4]
웹사이트
Human assembly and gene annotation
https://useast.ensem[...]
2024-02-28
[5]
논문
Assembly of 43 human Y chromosomes reveals extensive complexity and variation
2023-09
[6]
논문
A draft human pangenome reference
2023-05
[7]
논문
An integrated map of genetic variation from 1,092 human genomes
2012-11
[8]
논문
A global reference for human genetic variation
2015-10
[9]
논문
Initial sequence of the chimpanzee genome and comparison with the human genome
2005-09
[10]
논문
Comparing the human and chimpanzee genomes: searching for needles in a haystack
2005-12
[11]
웹사이트
Human genome assembly
https://www.ensembl.[...]
2024-01-23
[12]
논문
Loose ends: almost one in five human genes still have unresolved coding status
2018
[13]
논문
The Protein-Coding Human Genome: Annotating High-Hanging Fruits.
[14]
논문
Research on the human proteome reaches a major milestone:> 90% of predicted human proteins now credibly detected, according to the HUPO human proteome project
2020
[15]
논문
The status of the human gene catalogue
2023
[16]
논문
Similar Ratios of Introns to Intergenic Sequence across Animal Genomes
2017-06
[17]
논문
The Protein-Coding Human Genome: Annotating High-Hanging Fruits.
[18]
논문
Human protein-coding genes and gene feature statistics in 2019
[19]
논문
Genomics. ENCODE project writes eulogy for junk DNA
2012-09
[20]
논문
The landscape of long noncoding RNAs in the human transcriptome
2015-03
[21]
논문
Non-coding RNA genes and the modern RNA world
2001-12
[22]
논문
The vast, conserved mammalian lincRNome
[23]
논문
Non-coding RNA: what is functional and what is junk?
[24]
논문
Non-coding RNA
2006-04
[25]
논문
The GENCODE pseudogene resource
[26]
논문
Human specific loss of olfactory receptor genes
2003-03
[27]
논문
An integrated encyclopedia of DNA elements in the human genome
2012-09
[28]
웹사이트
ENCODE: My own thoughts
http://genomeinforma[...]
2012-09-05
[29]
논문
What does our genome encode?
2012-09
[30]
논문
Regulating Evolution
2008-05
[31]
논문
The promoter-operator region of the lac operon of Escherichia coli
[32]
논문
DNA sequences required for regulated expression of beta-globin genes in murine erythroleukemia cells
[33]
논문
Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms
2001-02
[34]
간행물
Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons
2000-04
[35]
웹사이트
Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome
http://www.cns.fr/ex[...]
Genoscope
2006-09-12
[36]
논문
Comparative studies of gene expression and the evolution of gene regulation
2012-07
[37]
논문
Five-vertebrate ChIP-seq reveals the evolutionary dynamics of transcription factor binding
2010-05
[38]
논문
Species-specific transcription in mice carrying human chromosome 21
2008-10
[39]
논문
Repetitive DNA and next-generation sequencing: computational challenges and solutions
2012-01
[40]
논문
Large-scale analysis of tandem repeat variability in the human genome
2014-05
[41]
서적
Genetics : a conceptual approach
W.H. Freeman
2012
[42]
웹사이트
minisatellite, n. meanings, etymology and more {{!}} Oxford English Dictionary
https://www.oed.com/[...]
2023-10-08
[43]
논문
Active Alu retrotransposons in the human genome
2008-12
[44]
논문
A gene expression restriction network mediated by sense and antisense Alu sequences located on protein-coding messenger RNAs
[45]
논문
Hot L1s account for the bulk of retrotransposition in the human population
2003-04
[46]
서적
Evolution
Cold Spring Harbor Laboratory Press
2007
[47]
논문
Defining functional DNA elements in the human genome
2014-04
[48]
논문
Getting clear about the F-word in genomics
2020-04
[49]
논문
We simply cannot go on being so vague about 'function'
2018-12
[50]
서적
Evolution of the Human Genome I
Springer
2017
[51]
서적
Human Genome Structure, Function and Clinical Considerations
Springer Nature
2021
[52]
논문
Expanded Encyclopaedias of DNA elements in the Human and Mouse Genomes
2020-07-30
[53]
논문
An Upper Limit on the Functional Fraction of the Human Genome
2017-07
[54]
논문
An integrated encyclopedia of DNA elements in the human genome
2012-09
[55]
논문
Adaptive evolution of non-coding DNA in Drosophila
2005-10
[56]
웹사이트
International Human Genome Sequencing Consortium Publishes Sequence and Analysis of the Human Genome
https://www.genome.g[...]
National Institutes of Health, U.S. Department of Health and Human Resources
2001-02-12
[57]
논문
The human genome
2001-02
[58]
간행물
Now You Can Sequence Your Whole Genome For Just $200
https://www.wired.co[...]
2018-11-19
[59]
논문
A recount of human genes ups the number to at least 46,831
https://www.sciencen[...]
2018-09-17
[60]
논문
An estimate of the total number of true human miRNAs
2019-04
[61]
간행물
300 Million Letters of DNA Are Missing From the Human Genome
2018-11-28
[62]
뉴스
Number of Human Genes Is Put at 140,000, a Significant Gain
https://archive.nyti[...]
1999-09-23
[63]
논문
Finishing the euchromatic sequence of the human genome
2004-10
[64]
논문
Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes
2014-11
[65]
논문
Filling in the gaps telomere to telomere
https://www.nature.c[...]
2021-02
[66]
웹사이트
Scientists sequence the complete human genome for the first time
https://edition.cnn.[...]
2022-03-31
[67]
논문
Initial sequencing and analysis of the human genome
2001-02
[68]
웹사이트
300 Million Letters of DNA Are Missing From the Human Genome
https://www.theatlan[...]
2019-08-16
[69]
논문
Resolving the complexity of the human genome using single-molecule sequencing
2015-01
[70]
논문
Telomere-to-telomere assembly of a complete human X chromosome
2020-09
[71]
논문
The structure, function and evolution of a complete human chromosome 8
2021-05
[72]
웹사이트
CHM13 T2T v1.1 – Genome – Assembly – NCBI
https://www.ncbi.nlm[...]
2021-07-26
[73]
웹사이트
Genome List – Genome – NCBI
https://www.ncbi.nlm[...]
2021-07-26
[74]
웹사이트
GRCh38 – hg38 – Genome – Assembly
https://www.ncbi.nlm[...]
2019-03-15
[75]
웹사이트
from Bill Clinton's 2000 State of the Union address
http://clinton4.nara[...]
2007-06-14
[76]
논문
Global variation in copy number in the human genome
2006-11
[77]
웹사이트
What's a Genome?
http://www.genomenew[...]
Genomenewsnetwork.org
2003-01-15
[78]
웹사이트
Fact Sheet: Genome Mapping: A Guide to the Genetic Highway We Call the Human Genome
https://www.ncbi.nlm[...]
U.S. National Library of Medicine, National Institutes of Health
2004-03-29
[79]
웹사이트
About the Project
http://www.hapmap.or[...]
2009-05-31
[80]
웹사이트
2008 Release: Researchers Produce First Sequence Map of Large-Scale Structural Variation in the Human Genome
http://www.genome.go[...]
genome.gov
2009-05-31
[81]
논문
Mapping and sequencing of structural variation from eight human genomes
2008-05
[82]
논문
Mapping and characterization of structural variation in 17,795 human genomes
2020-07
[83]
논문
Single nucleotide polymorphisms as tools in human genetics
[84]
논문
Application of SNP technologies in medicine: lessons learned and future challenges
2001-06
[85]
웹사이트
Human Genome Project Completion: Frequently Asked Questions
http://www.genome.go[...]
genome.gov
2009-05-31
[86]
뉴스
Craig Venter's Genome
http://www.technolog[...]
2007-09-04
[87]
논문
Single-molecule sequencing of an individual human genome
2009-09
[88]
논문
Clinical assessment incorporating a personal genome
2010-05
[89]
논문
Phased whole-genome genetic risk in a family quartet using a major allele reference sequence
2011-09
[90]
간행물
Complete Genomics Adds 29 High-Coverage, Complete Human Genome Sequencing Datasets to Its Public Genomic Repository
http://globenewswire[...]
[91]
뉴스
Desmond Tutu's genome sequenced as part of genetic diversity study
https://www.theguard[...]
2010-02-17
[92]
논문
Complete Khoisan and Bantu genomes from southern Africa
2010-02
[93]
논문
Ancient human genome sequence of an extinct Palaeo-Eskimo
2010-02
[94]
bioRxiv
A Complete Public Domain Family Genomics Dataset
2013-11-12
[95]
논문
Crowdsourcing the corpasome
2013-06
[96]
논문
The whole genome sequences and experimentally phased haplotypes of over 100 personal genomes
2016-10
[97]
논문
Matching phenotypes to whole genomes: Lessons learned from four iterations of the personal genome project community challenges
2017-09
[98]
논문
Human genome sequencing in health and disease
[99]
논문
Genetic diagnosis by whole exome capture and massively parallel DNA sequencing
2009-11
[100]
논문
Human Knockout Carriers: Dead, Diseased, Healthy, or Improved?
2016-04
[101]
논문
Human knockouts and phenotypic analysis in a cohort with a high rate of consanguinity
2017-04
[102]
논문
Online Mendelian Inheritance in Man (OMIM), a knowledgebase of human genes and genetic disorders
2002-01
[103]
논문
The continuum of causality in human genetic disorders
2016-11
[104]
논문
A Next-Generation Sequencing Primer-How Does It Work and What Can It Do?
[105]
서적
Next Generation Sequencing Based Clinical Molecular Diagnosis of Human Genetic Disorders
Springer International Publishing
2017
[106]
서적
Next Generation Sequencing Based Clinical Molecular Diagnosis of Human Genetic Disorders
Springer International Publishing
2017
[107]
논문
Initial sequencing and comparative analysis of the mouse genome
2002-12
[108]
논문
Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project
2007-06
[109]
논문
Initial sequence of the chimpanzee genome and comparison with the human genome
2005-09
[110]
논문
Initial sequence of the chimpanzee genome and comparison with the human genome
2005-09
[111]
논문
The evolution of mammalian gene families
[112]
논문
Initial sequence of the chimpanzee genome and comparison with the human genome
2005-09
[112]
논문
Sequencing the chimpanzee genome: insights into human evolution and disease
2003-01
[113]
논문
Loss of olfactory receptor genes coincides with the acquisition of full trichromatic vision in primates
2004-01
[114]
뉴스
How We Got Here: DNA Points to a Single Migration From Africa
https://www.nytimes.[...]
2016-09-21
[115]
논문
Tracing the peopling of the world through genomics
2017-01
[116]
웹사이트
Mitochondrial DNA and human history
http://genome.wellco[...]
The Human Genome
2006-09-19
[117]
논문
Beyond the sequence: cellular organization of genome function
2007-02
[118]
논문
The mammalian epigenome
2007-02
[119]
논문
'[Epigenetics, interface between environment and genes: role in complex diseases]'
2012-05
[120]
뉴스
ヒトゲノムの3D構造は「丸めた麺のようなフラクタル」
http://wired.jp/2009[...]
WIRED.jp
2009-10-13
[121]
논문
Finishing the euchromatic sequence of the human genome.
https://www.nature.c[...]
[122]
뉴스
■ゲノム医療法成立:全遺伝情報 10万人分解析へ/難病解明、新薬開発に期待
https://www.yomiuri.[...]
読売新聞
2023-06-23
[123]
간행물
疾病克服に向けたゲノム医療実現プロジェクト オーダーメイド医療の実現プログラム
https://www.amed.go.[...]
일본의료연구개발기구
2023-06-23
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com