비번역 DNA
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
비번역 DNA는 단백질로 번역되지 않는 DNA 서열을 의미하며, 유전자 조절, 복제, 전사 등 다양한 기능을 수행한다. 비번역 DNA는 5'-UTR, 3'-UTR, 복제 기원, 발판 부착 영역, 유전자 조절 서열, 인트론, 비번역 RNA, 반복 서열, 위유전자 등으로 구성된다. ENCODE 프로젝트와 전장 유전체 연관성 분석(GWAS) 등을 통해 비번역 DNA 연구의 중요성이 부각되고 있으며, 유전자 발현 조절, 질병 연관성 연구 등에 활용된다.
더 읽어볼만한 페이지
- 비부호화 DNA - 텔로미어
텔로미어는 진핵세포 염색체 말단에서 염색체 안정성을 유지하고 DNA 손상을 방지하는 반복적인 DNA 서열과 단백질 복합체로, 세포 분열 시 짧아져 노화와 관련되며 텔로머레이스 효소에 의해 유지될 수 있다는 연구로 노벨상을 수상했다. - 비부호화 DNA - 인트론
진핵생물 유전자에서 엑손 사이에 존재하는 비코딩 DNA 서열인 인트론은 스플라이싱 과정을 거쳐 제거되며 유전자 발현 조절, 선택적 스플라이싱 등 다양한 기능에 관여하는 것으로 여겨진다. - 유전자 발현 - RNA 간섭
RNA 간섭은 이중가닥 RNA에 의해 유전자 발현이 억제되는 과정으로, 다이서 효소에 의해 생성된 작은 간섭 RNA가 RNA 유도 침묵 복합체와 결합하여 표적 mRNA를 분해하거나 번역을 억제하며, 바이러스 방어, 발생 조절, 유전체 안정성 유지 등 다양한 기능과 응용 분야를 가진다. - 유전자 발현 - 유전자 재조합
유전자 재조합은 유성 생식 생물의 염색체 유전자 교차를 통한 유전자 재배열 현상으로, 유전적 변이를 증가시키고 유전학적 지도 작성에 활용되며, 생명공학 등 다양한 분야에서 기술로 이용된다. - DNA - 미토콘드리아 DNA
미토콘드리아 DNA(mtDNA)는 세포 호흡에 필수적인 유전 정보를 담고 있는 미토콘드리아 내의 이중 가닥 환상 DNA로서, 동물의 경우 약 16,000개의 염기쌍과 37개의 유전자로 구성되며, 모계 유전, 높은 돌연변이율, 질병 및 노화와의 연관성 등의 특징을 가진다. - DNA - 이중 나선
이중 나선은 DNA의 구조로서, 두 개의 폴리뉴클레오티드 사슬이 반대 방향으로 배열되어 오른손잡이 나선 구조를 이루며, 상보적인 염기쌍이 수소 결합으로 연결되고 주구와 부구라는 고랑을 가지며 다양한 형태가 존재한다.
비번역 DNA | |
---|---|
개요 | |
유형 | 비번역 RNA 유전자, 기타 기능 요소, 조절 서열, 인트론, 단순 반복 서열, 이동성 유전 인자 서열 및 유전자 파생 서열을 포함하는 DNA 서열 |
명칭 | |
영어 | Non-coding DNA |
일본어 | ノンコーディングDNA |
한국어 | 비부호화 DNA, 비암호화 DNA, 비번역 DNA |
상세 정보 | |
기능 | 유전자 발현 조절, 염색체 구조 유지 등 |
구성 | 인트론 유전자 간 서열 반복 서열 레트로트랜스포존 비번역 RNA 원시 바이러스 서열 |
인간 유전체 비율 | 약 98% |
추가 정보 | |
관련 질병 | 암, 기타 유전 질환 |
연구 분야 | 유전체학, 후성유전학 |
2. 비번역 DNA의 종류와 기능
표준 생화학 및 분자 생물학 교과서는 유전자의 5' 말단과 번역 개시 코돈 사이에 위치한 mRNA의 비코딩 뉴클레오타이드를 설명한다. 이 영역을 5'-비번역 부위(5'-UTR)라고 한다. 3'-비번역 부위(3'-UTR)라고 하는 유사한 영역이 유전자의 끝에서 발견된다. 5'-UTR 및 3'-UTR은 박테리아에서는 매우 짧지만 진핵생물에서는 길이가 수백 개의 뉴클레오타이드일 수 있다. 이들은 번역 개시(5'-UTR) 및 전사 종결(3'-UTR)을 제어하는 짧은 요소뿐만 아니라 mRNA 안정성, 처리 및 세포의 다른 영역으로의 표적화를 제어할 수 있는 조절 요소를 포함한다.[22][23][24]
DNA 합성은 복제 기원이라고 불리는 특정 부위에서 시작된다. 이 부위는 DNA 복제 기계가 조립되고 DNA가 풀려서 DNA 합성이 시작되는 유전체 영역이다. 대부분의 경우 복제는 복제 기점에서 양쪽 방향으로 진행된다.
복제 기원의 주요 특징은 특정 개시 단백질이 결합하는 염기 서열이다. 전형적인 복제 기원은 약 100~200개의 DNA 염기쌍을 포함한다. 원핵생물은 염색체 또는 플라스미드당 하나의 복제 기원을 갖지만, 진핵생물 염색체에는 일반적으로 여러 개의 기원이 있다. 인간 게놈은 게놈의 약 0.3%를 차지하는 약 100,000개의 복제 기원을 포함한다.[25][26][27]
표준적인 생화학 및 분자생물학 교과서에는 유전자의 5' 말단과 번역 개시 코돈 사이에 위치하는 mRNA의 뉴클레오타이드에 대해 기술되어 있다. 이러한 영역은 5'-비번역 영역(5'-UTR)이라고 불린다. 또한, 유전자의 말단에는 3'-비번역 영역(3'-UTR)이라고 불리는 유사한 영역이 존재한다. 5'-UTR과 3'-UTR은 세균에서는 매우 짧지만, 진핵생물에서는 수백 개의 뉴클레오타이드가 된다. 이들에는 번역 개시(5'-UTR)와 전사 종결(3'-UTR)을 제어하는 짧은 엘리먼트, mRNA의 안정성, 프로세싱, 세포 내 다양한 영역으로의 타겟팅을 제어하는 조절 엘리먼트가 포함되어 있다.[79][80][81]
DNA 합성은 복제 기점이라고 불리는 특정 위치에서 시작된다. 이들은 DNA 복제 장치가 조립되고 DNA 합성을 시작하기 위해 DNA가 풀리는 게놈의 영역이다. 대부분의 경우 복제는 복제 기점에서 양방향으로 진행된다.
복제 기점의 주요 특징은 특정 개시 단백질이 결합하는 서열이다. 전형적인 복제 기점은 DNA의 약 100-200 염기쌍을 커버한다. 원핵생물의 복제 기점은 염색체 또는 플라스미드당 1개이지만, 진핵생물의 염색체에는 일반적으로 여러 개의 복제 기점이 존재한다. 인간 게놈에는 게놈의 약 0.3%에 해당하는 약 10만 개의 복제 기점이 존재한다[82][83][84]。
발판 부착 영역(SAR) 또는 매트릭스 결합 영역(MAR)은 진핵생물의 염색체 DNA 중 세포핵의 기본 골격이 되는 핵 매트릭스가 부착하는 부분의 배열로, 다양한 단백질과의 상호 작용을 통해 전사나 복제 등에 관여한다. 인간 게놈에는 약 10만 개의 루프가 있으며, 각각 약 100bp의 DNA로 구성되어 있다. SAR에 할당되는 DNA의 총량은 인간 게놈의 약 0.3%이다.
원핵생물과 진핵생물 게놈은 단백질에 결합된 DNA의 큰 루프로 구성되어 있다. 진핵생물에서 루프의 기저부는 골격/기질 부착 영역(SAR)이라고 하며, 이는 RNA/단백질 복합체를 결합하여 루프를 안정화시키는 DNA 영역으로 구성된다. 인간 게놈에는 약 100,000개의 루프가 있으며 각 SAR은 약 100bp의 DNA로 구성되어 있으므로 SAR에 할당된 총 DNA 양은 인간 게놈의 약 0.3%를 차지한다.[32]
==== 유전자 조절 서열 ====
유전자 발현 조절에 관여하는 DNA 서열은 전사를 제어하며, 전사 인자가 결합하는 서열이다. 이러한 전사 인자는 전사를 활성화하는 활성자(activator) 또는 억제하는 억제자(repressor) 역할을 할 수 있다.[76][77] 조절 요소는 1960년대에 발견되었으며, 세균과 세균 바이러스에서 특정 전사 인자를 연구하여 1970년대에 일반적인 특성이 밝혀졌다.
프로모터는 전사가 시작되는 유전자의 5' 말단 근처에 있는 DNA 세그먼트로, RNA 중합 효소가 결합하여 RNA 합성을 시작하는 부위이다. 모든 유전자는 비코딩 프로모터를 가지고 있다.
많은 조절 서열은 프로모터 근처, 일반적으로 유전자의 전사 시작 부위 상류에 나타난다. 일부는 유전자 내에 나타나며, 소수는 전사 종결 부위 하류에 위치한다. 진핵생물에서는 프로모터 영역에서 상당한 거리에 위치한 강화자라고 불리는 조절 서열이 존재하기도 한다. 하지만 다른 전사 인자 결합 부위와 구별되는 강화자에 대한 엄격한 정의는 없다.[18][19]
포유류 게놈에서 정확한 조절 DNA 양은 기능적인 부위와 가짜 전사 인자 결합 부위를 구별하기 어렵기 때문에 불분명하다.
==== 인트론 ====
인트론은 유전자의 일부로서, 전구 RNA 서열로 전사되지만, 궁극적으로 성숙 RNA로 가공되는 동안 RNA 스플라이싱에 의해 제거된다.[20][21] 인트론은 단백질 암호화 유전자와 비암호화 유전자 두 종류 모두에서 발견된다. 인트론은 원핵생물에도 존재하지만 진핵생물 게놈에서 훨씬 더 흔하게 나타난다.
제한 효소를 코딩하는 영역이 있어 전이 현상을 일으키는 그룹 I 인트론과, 역전사 효소를 코딩하는 영역이 있어 전이 현상을 일으키는 그룹 II 인트론은, 존재해도 게놈의 적은 비율만을 차지한다. 스플라이소좀에 의해 스플라이싱되는 스플라이세오좀형 인트론은 진핵생물에만 존재하며, 게놈의 상당한 비율을 차지할 수 있다. 예를 들어, 사람의 경우 단백질을 코딩하는 유전자의 인트론은 게놈의 37%를 차지한다. 약 1%의 코딩 서열과 합하면, 단백질 코딩 유전자는 사람 게놈의 약 38%를 차지하게 된다.[78]
==== 비번역 RNA (ncRNA) ====
유전자에는 단백질 코딩 유전자와 비번역 유전자의 두 가지 유형이 있다.[13] 비번역 유전자는 비번역 DNA의 중요한 부분이며, 전령 RNA 및 리보솜 RNA에 대한 유전자를 포함한다. 이 유전자들은 1960년대에 발견되었다.[68][69] 원핵생물 게놈은 다른 여러 비번역 RNA에 대한 유전자를 포함하지만 비번역 RNA 유전자는 진핵생물에서 훨씬 더 흔하다.
진핵생물의 전형적인 비번역 유전자 종류에는 작은 핵 RNA (snRNA), 작은 인 RNA (snoRNA), 마이크로RNA (miRNA), 짧은 간섭 RNA (siRNA), PIWI-상호작용 RNA (piRNA) 및 긴 비번역 RNA (lncRNA)에 대한 유전자가 포함된다. 또한, 촉매 RNA를 생성하는 다수의 고유한 RNA 유전자가 있다.[14][70]
비번역 유전자는 원핵생물 게놈의 몇 퍼센트만을 차지하지만[15][71] 진핵생물 게놈에서는 훨씬 더 높은 비율을 나타낼 수 있다.[16][72] 인간의 경우, 비번역 유전자는 게놈의 최소 6%를 차지한다.[74][75]
인간 게놈의 비번역 유전자의 총 개수는 논란의 여지가 있다. 일부 과학자들은 약 5,000개의 비번역 유전자만 있다고 생각하는 반면, 다른 과학자들은 100,000개 이상이 있을 수 있다고 믿는다 (비번역 RNA 관련 기사 참조). 이러한 차이는 lncRNA 유전자 수에 대한 논쟁으로 인해 발생한다.[17][73]
==== 반복 서열 ====
반복 서열은 유전체 내에서 반복적으로 나타나는 DNA 서열이다. 텔로미어, 센트로미어, 이동성 유전 인자 등이 반복 서열에 해당한다.[31][29][39]
텔로미어는 염색체 말단에 있는 반복적인 DNA 영역으로, DNA 복제 동안 염색체의 열화를 방지한다.[31] 텔로미어 반복 서열 함유 RNA(TERRA)는 텔로미어에서 유래한 전사체로, 텔로머라제 활성을 유지하고 염색체 말단을 연장하는 것으로 나타났다.[31]
센트로미어(동원체)는 세포 분열 시 방추사가 새로 복제된 염색체에 부착되어 딸세포로 분리되는 부위이다.[29] 동원체 DNA는 수많은 반복 DNA 서열로 구성되어 있으며, 각 동원체는 수백만 염기쌍에 달할 수 있어 게놈의 상당 부분을 차지한다. 인간의 경우 24개 모든 동원체의 서열이 밝혀졌으며, 이는 게놈의 약 6%를 차지한다.[29]
전이인자와 레트로트랜스포존은 이동 유전자 요소이다.[39] 레트로트랜스포존 반복 서열은 긴 분산 핵 요소(LINE)와 짧은 분산 핵 요소(SINE)를 포함하며, 많은 종의 유전체 서열에서 큰 비중을 차지한다. Alu 서열은 짧은 분산 핵 요소로 분류되며, 인간 게놈에서 가장 풍부한 이동 요소이다.[36]
내생 레트로바이러스 서열은 레트로바이러스 게놈이 생식 세포의 게놈으로 역전사된 산물이다. 이러한 역전사 서열 내의 돌연변이는 바이러스 게놈을 비활성화시킬 수 있다.[39] 인간 게놈의 8% 이상이 (대부분 퇴화된) 내생 레트로바이러스 서열로 구성되어 있으며, 이는 레트로트랜스포존에서 유래된 것으로 인식되는 42% 이상의 부분의 일부이다.[40]
고도로 반복적인 DNA는 탠덤으로 여러 번 반복되는 짧은 DNA 서열로 구성된다. 반복되는 염기쌍은 일반적으로 2bp에서 10bp 사이지만 더 긴 것도 알려져 있다. 때로는 위성 DNA라고도 불린다. 대부분의 고도로 반복적인 DNA는 중심절과 텔로미어에서 발견되며(위 참조) 대부분 기능적이지만 일부는 중복될 수 있다. 인간 게놈에는 약 35만 개의 STR(마이크로새틀라이트)이 있으며, 게놈 전체에 흩어져 있고 평균 길이는 약 25개 반복이다.[43]
==== 위유전자 ====
위유전자(유사유전자)는 대부분 돌연변이 등으로 인해 기능하지 않게 된 것이지만, 기능하는 유전자가 생산하는 RNA에서 파생된 비활성 DNA 서열(프로세스형 위유전자)도 가리킨다.[91] 단세포 생물은 배타적인 효과를 갖는 위유전자를 거의 또는 전혀 갖지 않는 반면, 원핵생물과 진핵생물을 포함한 다세포 생물은 더 많은 위유전자를 보유하고 있다.[91] 포유류 및 기타 진핵생물에서는 레트로트랜스포지션이나 게놈 DNA 복제에 의해 위유전자가 생겨난다.[92][93] 대조적으로, 원핵생물에서는 위유전자는 원래 있던 유전자나 그 중복의 붕괴, 수평적 전파의 실패로 인해 생긴다고 생각된다.[94] 위유전자는 음성 선택에 의해 제거되기 때문에, 원핵생물에서는 게놈 중 논코딩 DNA의 극히 일부에 불과하다. 일부 진핵생물에서는, 선택이 위유전자를 제거할 만큼 강력하지 않기 때문에, 위유전자가 축적된다고 생각하는 연구자도 있다.(분자 진화의 거의 중립설 참조)[95]
최초의 위유전자는 1977년에 보고되었으며[96], 그 이후, 사람을 비롯한 많은 생물 종에서 다수의 위유전자가 보고되고, 기재되어 있다.[97][98][99] 사람 게놈에는 단백질을 코딩하는 유전자에서 유래하는 약 15,000개의 위유전자가 포함되어 있으며, 논코딩 유전자에서 유래하는 위유전자도 포함되어 있지만, 그 상세한 수는 알려져 있지 않다.[100] 위유전자의 대부분은 과거의 인트론 서열을 포함하고 있기 때문에, 게놈의 상당 부분(~5%)을 차지하고 있을 가능성이 있다.
위유전자는 정의상 정크 DNA의 일종이며, 중립적인 속도로 진화한다.[101] 하지만, 일부 전 위유전자는 이차적으로 기능을 획득하고 있으며, 이로 인해, 대부분의 위유전자는 아직 발견되지 않은 기능을 가지고 있기 때문에 정크가 아니라고 추측하는 과학자도 있다.[102]
2. 1. 유전자 조절 서열
유전자 발현 조절에 관여하는 DNA 서열은 전사를 제어하며, 전사 인자가 결합하는 서열이다. 이러한 전사 인자는 전사를 활성화하는 활성자(activator) 또는 억제하는 억제자(repressor) 역할을 할 수 있다.[76][77] 조절 요소는 1960년대에 발견되었으며, 세균과 세균 바이러스에서 특정 전사 인자를 연구하여 1970년대에 일반적인 특성이 밝혀졌다.프로모터는 전사가 시작되는 유전자의 5' 말단 근처에 있는 DNA 세그먼트로, RNA 중합 효소가 결합하여 RNA 합성을 시작하는 부위이다. 모든 유전자는 비코딩 프로모터를 가지고 있다.
많은 조절 서열은 프로모터 근처, 일반적으로 유전자의 전사 시작 부위 상류에 나타난다. 일부는 유전자 내에 나타나며, 소수는 전사 종결 부위 하류에 위치한다. 진핵생물에서는 프로모터 영역에서 상당한 거리에 위치한 강화자라고 불리는 조절 서열이 존재하기도 한다. 하지만 다른 전사 인자 결합 부위와 구별되는 강화자에 대한 엄격한 정의는 없다.[18][19]
포유류 게놈에서 정확한 조절 DNA 양은 기능적인 부위와 가짜 전사 인자 결합 부위를 구별하기 어렵기 때문에 불분명하다.
2. 2. 인트론
인트론은 유전자의 일부로서, 전구 RNA 서열로 전사되지만, 궁극적으로 성숙 RNA로 가공되는 동안 RNA 스플라이싱에 의해 제거된다.[20][21] 인트론은 단백질 암호화 유전자와 비암호화 유전자 두 종류 모두에서 발견된다. 인트론은 원핵생물에도 존재하지만 진핵생물 게놈에서 훨씬 더 흔하게 나타난다.제한 효소를 코딩하는 영역이 있어 전이 현상을 일으키는 그룹 I 인트론과, 역전사 효소를 코딩하는 영역이 있어 전이 현상을 일으키는 그룹 II 인트론은, 존재해도 게놈의 적은 비율만을 차지한다. 스플라이소좀에 의해 스플라이싱되는 스플라이세오좀형 인트론은 진핵생물에만 존재하며, 게놈의 상당한 비율을 차지할 수 있다. 예를 들어, 사람의 경우 단백질을 코딩하는 유전자의 인트론은 게놈의 37%를 차지한다. 약 1%의 코딩 서열과 합하면, 단백질 코딩 유전자는 사람 게놈의 약 38%를 차지하게 된다.[78]
2. 3. 비번역 RNA (ncRNA)
유전자에는 단백질 코딩 유전자와 비번역 유전자의 두 가지 유형이 있다.[13] 비번역 유전자는 비번역 DNA의 중요한 부분이며, 전령 RNA 및 리보솜 RNA에 대한 유전자를 포함한다. 이 유전자들은 1960년대에 발견되었다.[68][69] 원핵생물 게놈은 다른 여러 비번역 RNA에 대한 유전자를 포함하지만 비번역 RNA 유전자는 진핵생물에서 훨씬 더 흔하다.진핵생물의 전형적인 비번역 유전자 종류에는 작은 핵 RNA (snRNA), 작은 인 RNA (snoRNA), 마이크로RNA (miRNA), 짧은 간섭 RNA (siRNA), PIWI-상호작용 RNA (piRNA) 및 긴 비번역 RNA (lncRNA)에 대한 유전자가 포함된다. 또한, 촉매 RNA를 생성하는 다수의 고유한 RNA 유전자가 있다.[14][70]
비번역 유전자는 원핵생물 게놈의 몇 퍼센트만을 차지하지만[15][71] 진핵생물 게놈에서는 훨씬 더 높은 비율을 나타낼 수 있다.[16][72] 인간의 경우, 비번역 유전자는 게놈의 최소 6%를 차지한다.[74][75]
인간 게놈의 비번역 유전자의 총 개수는 논란의 여지가 있다. 일부 과학자들은 약 5,000개의 비번역 유전자만 있다고 생각하는 반면, 다른 과학자들은 100,000개 이상이 있을 수 있다고 믿는다 (비번역 RNA 관련 기사 참조). 이러한 차이는 lncRNA 유전자 수에 대한 논쟁으로 인해 발생한다.[17][73]
2. 4. 반복 서열
반복 서열은 유전체 내에서 반복적으로 나타나는 DNA 서열이다. 텔로미어, 센트로미어, 이동성 유전 인자 등이 반복 서열에 해당한다.[31][29][39]텔로미어는 염색체 말단에 있는 반복적인 DNA 영역으로, DNA 복제 동안 염색체의 열화를 방지한다.[31] 텔로미어 반복 서열 함유 RNA(TERRA)는 텔로미어에서 유래한 전사체로, 텔로머라제 활성을 유지하고 염색체 말단을 연장하는 것으로 나타났다.[31]
센트로미어(동원체)는 세포 분열 시 방추사가 새로 복제된 염색체에 부착되어 딸세포로 분리되는 부위이다.[29] 동원체 DNA는 수많은 반복 DNA 서열로 구성되어 있으며, 각 동원체는 수백만 염기쌍에 달할 수 있어 게놈의 상당 부분을 차지한다. 인간의 경우 24개 모든 동원체의 서열이 밝혀졌으며, 이는 게놈의 약 6%를 차지한다.[29]
전이인자와 레트로트랜스포존은 이동 유전자 요소이다.[39] 레트로트랜스포존 반복 서열은 긴 분산 핵 요소(LINE)와 짧은 분산 핵 요소(SINE)를 포함하며, 많은 종의 유전체 서열에서 큰 비중을 차지한다. Alu 서열은 짧은 분산 핵 요소로 분류되며, 인간 게놈에서 가장 풍부한 이동 요소이다.[36]
내생 레트로바이러스 서열은 레트로바이러스 게놈이 생식 세포의 게놈으로 역전사된 산물이다. 이러한 역전사 서열 내의 돌연변이는 바이러스 게놈을 비활성화시킬 수 있다.[39] 인간 게놈의 8% 이상이 (대부분 퇴화된) 내생 레트로바이러스 서열로 구성되어 있으며, 이는 레트로트랜스포존에서 유래된 것으로 인식되는 42% 이상의 부분의 일부이다.[40]
고도로 반복적인 DNA는 탠덤으로 여러 번 반복되는 짧은 DNA 서열로 구성된다. 반복되는 염기쌍은 일반적으로 2bp에서 10bp 사이지만 더 긴 것도 알려져 있다. 때로는 위성 DNA라고도 불린다. 대부분의 고도로 반복적인 DNA는 중심절과 텔로미어에서 발견되며(위 참조) 대부분 기능적이지만 일부는 중복될 수 있다. 인간 게놈에는 약 35만 개의 STR(마이크로새틀라이트)이 있으며, 게놈 전체에 흩어져 있고 평균 길이는 약 25개 반복이다.[43]
2. 5. 위유전자
위유전자(유사유전자)는 대부분 돌연변이 등으로 인해 기능하지 않게 된 것이지만, 기능하는 유전자가 생산하는 RNA에서 파생된 비활성 DNA 서열(프로세스형 위유전자)도 가리킨다.[91] 단세포 생물은 배타적인 효과를 갖는 위유전자를 거의 또는 전혀 갖지 않는 반면, 원핵생물과 진핵생물을 포함한 다세포 생물은 더 많은 위유전자를 보유하고 있다.[91] 포유류 및 기타 진핵생물에서는 레트로트랜스포지션이나 게놈 DNA 복제에 의해 위유전자가 생겨난다.[92][93] 대조적으로, 원핵생물에서는 위유전자는 원래 있던 유전자나 그 중복의 붕괴, 수평적 전파의 실패로 인해 생긴다고 생각된다.[94] 위유전자는 음성 선택에 의해 제거되기 때문에, 원핵생물에서는 게놈 중 논코딩 DNA의 극히 일부에 불과하다. 일부 진핵생물에서는, 선택이 위유전자를 제거할 만큼 강력하지 않기 때문에, 위유전자가 축적된다고 생각하는 연구자도 있다.(분자 진화의 거의 중립설 참조)[95]최초의 위유전자는 1977년에 보고되었으며[96], 그 이후, 사람을 비롯한 많은 생물 종에서 다수의 위유전자가 보고되고, 기재되어 있다.[97][98][99] 사람 게놈에는 단백질을 코딩하는 유전자에서 유래하는 약 15,000개의 위유전자가 포함되어 있으며, 논코딩 유전자에서 유래하는 위유전자도 포함되어 있지만, 그 상세한 수는 알려져 있지 않다.[100] 위유전자의 대부분은 과거의 인트론 서열을 포함하고 있기 때문에, 게놈의 상당 부분(~5%)을 차지하고 있을 가능성이 있다.
위유전자는 정의상 정크 DNA의 일종이며, 중립적인 속도로 진화한다.[101] 하지만, 일부 전 위유전자는 이차적으로 기능을 획득하고 있으며, 이로 인해, 대부분의 위유전자는 아직 발견되지 않은 기능을 가지고 있기 때문에 정크가 아니라고 추측하는 과학자도 있다.[102]
3. 비번역 DNA 연구의 중요성
3. 1. ENCODE 프로젝트
2001년 인간 게놈 프로젝트에 의해 게놈의 30억쌍에 이르는 염기 서열 정보가 전적으로 해독되어, 게놈 전체가 상호작용에서 어떻게 정보를 주고받는지 그 기능 차원에서 이해하려는 시도로 ENCODE 프로젝트(Encyclopedia of DNA Elements, ENCODE)가 시작되었다.[131][132] 이 프로젝트는 그 과정에서 정크 DNA로 불렸던 비번역 DNA에도 유전자 발현의 조절에 관여하는 영역들이 확인되는 등 이에 대한 주요한 이해가 이루어졌다.3. 2. 전장 유전체 연관성 분석 (GWAS)
전장 유전체 연관성 연구 (GWAS)는 대립 유전자와 표현형 및 질병과 같은 관찰 가능한 특성 간의 연관성을 식별한다. 대부분의 연관성은 단일 염기 다형성 (SNP)과 조사 중인 특성 사이에 있으며, 이러한 SNP의 대부분은 비기능성 DNA에 위치해 있다.[50][51][52][53][54] 이 연관성은 특성을 담당하는 DNA 영역을 매핑하는 데 도움이 되는 연결을 설정하지만, 반드시 질병이나 표현형 차이를 유발하는 돌연변이를 식별하지는 않는다.[120][121][122][123][124]특성과 밀접하게 연관된 SNP는 원인 돌연변이를 식별할 가능성이 가장 크다. (이 연관성을 긴밀한 연관 불평형이라고 한다.) 이러한 다형성의 약 12%는 코딩 영역에서 발견되고, 약 40%는 인트론에 위치하며, 나머지 대부분은 조절 서열을 포함한 비유전자 영역에서 발견된다.
4. 비번역 DNA와 한국 사회
4. 1. 한국인의 유전적 특성 연구
4. 2. 유전체 연구 윤리 문제
5. 비번역 DNA 연구의 미래
참조
[1]
논문
The ingenuity of bacterial genomes
2020
[2]
논문
Reflections on the HUPO Human Proteome Project, the Flagship Project of the Human Proteome Organization, at 10 Years
2021
[3]
논문
The genetic organization of chromosomes
1971
[4]
논문
What's in a genome? The C-value enigma and the evolution of eukaryotic genome content
2015
[5]
논문
The g-value paradox
2002
[6]
논문
The modulation of DNA content: proximate causes and ultimate consequences
1999-04
[7]
논문
Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes
2002
[8]
논문
So much "junk" DNA in our genome
1972
[9]
논문
Architecture and evolution of a minute plant genome
2013
[10]
논문
Long-read sequencing uncovers the adaptive topography of a carnivorous plant genome
2017
[11]
뉴스
Genetic Tidying Up Made Humped Bladderworts Into Carnivorous Plants
https://www.nytimes.[...]
2017-05-19
[12]
간행물
Carnivorous Plant Throws Out 'Junk' DNA
https://news.arizona[...]
University of Arizona
2013-05-13
[13]
서적
Making sense of genes
Cambridge University Press
2017
[14]
논문
The Noncoding RNA Revolution - Trashing Old Rules to Forge New Ones
2014
[15]
논문
Congruent evolution of different classes of non-coding DNA in prokaryotic genomes
2002-10
[16]
서적
Encyclopedia of Evolutionary Biology
[17]
논문
Genome-Wide Analysis of Human Long Noncoding RNAs: A Provocative Review
2022
[18]
논문
The Long Road to Understanding RNAPII Transcription Initiation and Related Syndromes
2021
[19]
논문
Genomic views of distant-acting enhancers
2009-09
[20]
논문
GENCODE: the reference human genome annotation for The ENCODE Project
2012
[21]
논문
Human protein-coding genes and gene feature statistics in 2019
2019
[22]
서적
Molecular Biology of the Cell, 3rd edition
Garland Publishing Inc.
1994
[23]
서적
Genes VIII
Pearson/Prentice Hall
2004
[24]
서적
Principles of Biochemistry Fifth Edition
Pearson
2012
[25]
논문
DNA replication origins
2013
[26]
논문
The hunt for origins of DNA replication in multicellular eukaryotes
2015
[27]
논문
DNA replication origins—where do we begin?
2016
[28]
논문
Analytical Biases Associated with GC-Content in Molecular Evolution
2017
[29]
논문
Complete genomic and epigenetic maps of human centromeres
2021
[30]
논문
Centromeric satellite DNAs: hidden sequence variation in the human population
2019
[31]
논문
Telomeric noncoding RNA: telomeric repeat-containing RNA in telomere biology
2014-05
[32]
논문
The self-organizing genome: Principles of genome architecture and function
2020
[33]
웹사이트
Ensemble Human reference genome GRCh38.p13
https://useast.ensem[...]
[34]
논문
Are human translated pseudogenes functional?
2015
[35]
논문
Pseudogenes are not pseudo any more.
2012
[36]
논문
Genomic gems: SINE RNAs regulate mRNA production
2010-04
[37]
논문
Useful 'junk': Alu RNAs in the human transcriptome
https://archive-ouve[...]
2007-07
[38]
논문
InvAluable junk: the cellular impact and function of Alu and B2 RNAs
2009-08
[39]
논문
Human endogenous retroviruses: transposable elements with potential?
2004-10
[40]
논문
Initial sequencing and analysis of the human genome
2001-02
[41]
논문
Doubling genome size without polyploidization: dynamics of retrotransposition-driven genomic expansions in Oryza australiensis, a wild relative of rice
2006-10
[42]
논문
Differential lineage-specific amplification of transposable elements is responsible for genome size variation in Gossypium
2006-10
[43]
논문
Abundant contribution of short tandem repeats to gene expression variation in humans
2016
[44]
논문
High-resolution comparative analysis of great ape genomes
2018
[45]
논문
Factors behind junk DNA in bacteria
2012
[46]
논문
Gene overlapping and size constraints in the viral world
2016
[47]
논문
The case for junk DNA
2014-05
[48]
논문
Genome as a Multipurpose Structure Built by Evolution
https://hal.archives[...]
2014
[49]
논문
No Gene in the Genome Makes Sense Except in the Light of Evolution.
[50]
논문
The advantages and limitations of trait analysis with GWAS: a review
2013
[51]
논문
Genomewide association studies and assessment of the risk of disease
2010-07
[52]
논문
10 Years of GWAS Discovery: Biology, Function, and Translation
2017
[53]
논문
The Post-GWAS Era: From Association to Function
2018
[54]
논문
Replicability and Prediction: Lessons and Challenges from GWAS
2018
[55]
논문
The ingenuity of bacterial genomes
2020
[56]
논문
Reflections on the HUPO Human Proteome Project, the Flagship Project of the Human Proteome Organization, at 10 Years
2021
[57]
논문
The genetic organization of chromosomes
1971
[58]
논문
What's in a genome? The C-value enigma and the evolution of eukaryotic genome content
2015
[59]
논문
The g-value paradox
2002
[60]
논문
The modulation of DNA content: proximate causes and ultimate consequences
1999-04
[61]
논문
Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes
2002
[62]
논문
So much "junk" DNA in our genome
1972
[63]
논문
Architecture and evolution of a minute plant genome
2013
[64]
논문
Long-read sequencing uncovers the adaptive topography of a carnivorous plant genome
2017
[65]
뉴스
Genetic Tidying Up Made Humped Bladderworts Into Carnivorous Plants
https://www.nytimes.[...]
2022-05-30
[66]
간행물
Carnivorous Plant Throws Out 'Junk' DNA
https://news.arizona[...]
University of Arizona
2022-05-29
[67]
서적
Making sense of genes
Cambridge University Press
2017
[68]
논문
The Discovery of tRNA by Paul C. Zamecnik
https://www.jbc.org/[...]
2005-10-07
[69]
논문
A comparative electron microscopical study of RNA from different sources
1961-02
[70]
논문
The Noncoding RNA Revolution - Trashing Old Rules to Forge New Ones
2014
[71]
논문
Congruent evolution of different classes of non-coding DNA in prokaryotic genomes
2002-10
[72]
논문
Congruent evolution of different classes of non-coding DNA in prokaryotic genomes
2002-10
[73]
논문
Genome-Wide Analysis of Human Long Noncoding RNAs: A Provocative Review
2022
[74]
논문
Human protein-coding genes and gene feature statistics in 2019
2019
[75]
논문
GENCODE: the reference human genome annotation for The ENCODE Project
2012
[76]
논문
The Long Road to Understanding RNAPII Transcription Initiation and Related Syndromes
2021
[77]
논문
Genomic views of distant-acting enhancers
2009-09
[78]
논문
大規模配列データにより加速するノンコーディングRNA研究
2022-06
[79]
서적
Molecular Biology of the Cell, 3rd edition
Garland Publishing Inc.
1994
[80]
서적
Genes VIII
Pearson/Prentice Hall
2004
[81]
서적
Principles of Biochemistry Fifth Edition
Pearson
2012
[82]
논문
DNA replication origins
2013
[83]
논문
The hunt for origins of DNA replication in multicellular eukaryotes
2015
[84]
논문
DNA replication origins—where do we begin?
2016
[85]
논문
Analytical Biases Associated with GC-Content in Molecular Evolution
[86]
논문
Complete genomic and epigenetic maps of human centromeres
2021
[87]
논문
Centromeric satellite DNAs: hidden sequence variation in the human population
2019
[88]
논문
The unusual telomeres of Drosophila
1995-02
[89]
논문
Telomeric noncoding RNA: telomeric repeat-containing RNA in telomere biology
2014-05
[90]
논문
The self-organizing genome: Principles of genome architecture and function
2020
[91]
논문
Re-recognition of pseudogenes: From molecular to clinical applications
2020-01-01
[92]
논문
Vertebrate pseudogenes
2000-02-25
[93]
논문
Studying genomes through the aeons: protein families, pseudogenes and proteome evolution
2002-05-17
[94]
논문
Comprehensive analysis of pseudogenes in prokaryotes: widespread gene decay and failure of putative horizontally transferred genes
2004-08-26
[95]
논문
Pseudogene evolution and natural selection for a compact genome
2000
[96]
논문
A pseudogene structure in 5S DNA of Xenopus laevis
1977-07
[97]
논문
Gene arrangement and organization in a approximately 76 kb fragment encompassing the oriC region of the chromosome of Mycobacterium leprae
1996-11
[98]
논문
Structural analysis of a hmg-coA-reductase pseudogene: insights into evolutionary processes affecting the hmgr gene family in allotetraploid cotton (Gossypium hirsutum L.)
1998-10
[99]
논문
Molecular evolution of the Cecropin multigene family in Drosophila. functional genes vs. pseudogenes
1998-09
[100]
웹사이트
Ensemble Human reference genome GRCh38.p13
https://useast.ensem[...]
2024-01-16
[101]
논문
Are human translated pseudogenes functional?
2015
[102]
논문
Pseudogenes are not pseudo any more.
2012
[103]
논문
Alu insertion polymorphisms for the study of human genomic diversity
[104]
논문
Synergy between sequence and size in large-scale genomics
[105]
논문
Genomic gems: SINE RNAs regulate mRNA production
2010-04
[106]
Submitted manuscript
Useful 'junk': Alu RNAs in the human transcriptome
https://archive-ouve[...]
2007-07
[107]
논문
InvAluable junk: the cellular impact and function of Alu and B2 RNAs
2009-08
[108]
논문
Human endogenous retroviruses: transposable elements with potential?
2004-10
[109]
논문
Initial sequencing and analysis of the human genome
2001-02
[110]
논문
Doubling genome size without polyploidization: dynamics of retrotransposition-driven genomic expansions in Oryza australiensis, a wild relative of rice
2006-10
[111]
논문
Differential lineage-specific amplification of transposable elements is responsible for genome size variation in Gossypium
2006-10
[112]
논문
Abundant contribution of short tandem repeats to gene expression variation in humans
2016
[113]
논문
High-resolution comparative analysis of great ape genomes
2018
[114]
웹사이트
Using DNA to Solve Cold Cases
http://www.ncjrs.gov[...]
アメリカ合衆国司法省
2002-07
[115]
논문
Factors behind junk DNA in bacteria
2012
[116]
논문
Gene overlapping and size constraints in the viral world
2016
[117]
논문
The case for junk DNA
2014-05
[118]
논문
Genome as a Multipurpose Structure Built by Evolution
https://hal.archives[...]
2014
[119]
논문
No Gene in the Genome Makes Sense Except in the Light of Evolution.
[120]
논문
The advantages and limitations of trait analysis with GWAS: a review
2013
[121]
논문
Genomewide association studies and assessment of the risk of disease
2010-07
[122]
논문
10 Years of GWAS Discovery: Biology, Function, and Translation
2017
[123]
논문
The Post-GWAS Era: From Association to Function
2018
[124]
논문
Replicability and Prediction: Lessons and Challenges from GWAS
2018
[125]
저널
ENCODE Project Writes Eulogy for Junk DNA
2012-09-06
[126]
참고
Published: 05 September 2012 ,ENCODE: The human encyclopaedia, Brendan Maher ,Nature volume 489, pages 46–48 (2012)Cite this article
https://www.nature.c[...]
[127]
참고
사이언스온 - '정크DNA’의 퇴장, 생명연구의 확장
http://scienceon.han[...]
[128]
저널
Park, "Junk DNA- Not So UselessAfter All."
[129]
서적
트라우마는 어떻게 유전되는가 장지인 옮김
[130]
저널
Noncoding DNA and Teem Theory of Inheritance, Emotions and Innate Behavior
[131]
참고
ENCODE프로젝트
https://www.genome.g[...]
[132]
참고
Published: 05 September 2012 ,ENCODE: The human encyclopaedia, Brendan Maher ,Nature volume 489, pages 46–48 (2012)Cite this article
https://www.nature.c[...]
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com