유전 부호
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
유전 부호는 DNA 또는 RNA의 염기 서열을 통해 유전 정보를 단백질의 아미노산 서열로 변환하는 규칙 집합이다. 1953년 DNA 구조 발견 이후 단백질 부호화 방식에 대한 연구가 시작되었으며, 세 개의 염기(코돈)가 하나의 아미노산을 지정한다는 것이 밝혀졌다. 유전 부호는 개시 코돈, 종결 코돈, 그리고 20가지 표준 아미노산을 포함하며, 다양한 변이와 확장된 형태가 존재한다. 유전 부호는 돌연변이의 영향을 받으며, 코돈 사용 빈도는 종에 따라 차이를 보인다. 유전 부호의 기원은 RNA 세계 가설, 입체 화학적 친화성, 자연 선택 등 다양한 가설을 통해 연구되고 있다.
더 읽어볼만한 페이지
- 단백질 생합성 - 리보솜
리보솜은 rRNA와 단백질로 구성된 두 개의 소단위체로 이루어진 세포 내 단백질 합성 복합체로서, 세포질 내에서 mRNA의 코돈을 해독하여 폴리펩타이드 사슬을 합성하는 번역 과정을 수행하며, 원핵세포와 진핵세포의 구조적 차이로 인해 항생제 개발의 표적이 되고, RNA 세계에서 기원한 자기 복제 복합체로 추정된다. - 단백질 생합성 - 종결 코돈
종결 코돈은 표준 유전 암호에서 단백질 합성을 종료시키는 역할을 하는 UAG(앰버), UAA(오커), UGA(오팔 또는 엄버) 세 가지 코돈이며, 넌센스 돌연변이, 논스톱 돌연변이 등 다양한 유전 질환과 관련이 있을 수 있다. - RNA - RNA 간섭
RNA 간섭은 이중가닥 RNA에 의해 유전자 발현이 억제되는 과정으로, 다이서 효소에 의해 생성된 작은 간섭 RNA가 RNA 유도 침묵 복합체와 결합하여 표적 mRNA를 분해하거나 번역을 억제하며, 바이러스 방어, 발생 조절, 유전체 안정성 유지 등 다양한 기능과 응용 분야를 가진다. - RNA - 방향성 (분자생물학)
DNA 또는 RNA 가닥의 방향성은 5' 말단(5번 탄소에 인산기)과 3' 말단(3번 탄소에 수산기)로 구별되며, 이는 유전자 발현 조절, 폴리아데닐화, DNA 염기서열 분석 등 DNA와 RNA의 합성, 안정성, 번역 과정에 필수적이다. - 유전자 발현 - RNA 간섭
RNA 간섭은 이중가닥 RNA에 의해 유전자 발현이 억제되는 과정으로, 다이서 효소에 의해 생성된 작은 간섭 RNA가 RNA 유도 침묵 복합체와 결합하여 표적 mRNA를 분해하거나 번역을 억제하며, 바이러스 방어, 발생 조절, 유전체 안정성 유지 등 다양한 기능과 응용 분야를 가진다. - 유전자 발현 - 유전자 재조합
유전자 재조합은 유성 생식 생물의 염색체 유전자 교차를 통한 유전자 재배열 현상으로, 유전적 변이를 증가시키고 유전학적 지도 작성에 활용되며, 생명공학 등 다양한 분야에서 기술로 이용된다.
유전 부호 | |
---|---|
기본 정보 | |
명칭 | 유전 부호 (遺伝情報, Genetic code) |
설명 | 유전 물질에 암호화된 정보가 단백질을 구성하는 아미노산 서열로 번역되는 규칙 |
세부 사항 | |
관련 용어 | 코돈 (codon) |
특성 | 3개의 뉴클레오타이드로 구성된 코돈이 특정 아미노산 지정 일부 코돈은 번역 시작 또는 종료 신호로 작용 |
예외 | 표준 유전 부호 외에 변형된 유전 부호 존재 일부 생물은 특정 코돈을 다른 아미노산으로 번역 |
연구 | |
관련 연구 | 특정 코돈이 두 개의 아미노산 삽입을 유도할 수 있다는 연구 결과 (Science에 게재) |
2. 역사
단백질이 어떻게 암호화되는지에 대한 연구는 1953년 DNA 구조가 발견된 이후 시작되었다. 이후 유전 암호 해독 과정과 합성 생물학을 통한 유전 부호 확장에 대한 연구, 그리고 유전 부호의 기원에 대한 가설들이 제시되었다.
유전 부호는 생명 역사의 핵심이며, RNA 세계 가설에 따르면 자기 복제 RNA 분자가 우리가 아는 생명체보다 먼저 존재했다. 이 가설에 따르면 유전 부호의 출현은 세포 내 주요 효소로서 리보자임(RNA 효소)에서 단백질로의 전이와 밀접하게 관련되어 있다. 전이 RNA 분자는 현대적인 아미노아실-tRNA 합성효소보다 먼저 진화한 것으로 보이므로, 후자는 패턴 설명의 일부가 될 수 없다.[80]
가상으로 무작위 진화한 유전 부호는 그 기원에 대한 생화학적 또는 진화적 모델을 자극한다. 아미노산이 무작위로 삼중 코돈에 할당된다면 1.5×1084개의 가능한 유전 부호가 존재할 것이다.[81] 이 숫자는 21개 항목(20개 아미노산과 1개 종결 코돈)을 64개 빈에 배치하는 방법의 수를 계산하여 얻으며, 각 항목은 최소 한 번 사용된다.[82] 그러나 유전 부호에서 코돈 할당 분포는 무작위적이지 않으며,[83] 특정 아미노산 할당을 군집화한다.
동일 생합성 경로를 공유하는 아미노산은 코돈의 첫 번째 염기를 공유하는 경향이 있다. 이는 아미노산이 더 적은 초기, 더 단순한 유전 부호의 진화적 유물일 수 있으며, 나중에 더 많은 아미노산 세트를 암호화하도록 진화했다.[84] 또한 코돈 진화에 영향을 미친 입체적 및 화학적 특성을 반영할 수 있다. 유사한 물리적 특성을 가진 아미노산도 유사한 코돈을 갖는 경향이 있어,[85][86] 점 돌연변이와 오역으로 인한 문제를 줄인다.[83]
무작위적이지 않은 유전 삼중 코딩 방식에서, 유전 부호 기원에 대한 가설은 D-아미노산 코돈 부재, 일부 아미노산의 이차 코돈 패턴, 동의어 위치의 세 번째 위치 제한, 20개 아미노산(64개에 가깝지 않은)의 작은 세트, 종결 코돈 패턴과 아미노산 코딩 패턴 관계 등 코돈 표의 여러 측면을 다룰 수 있다.[87]
유전 부호 기원을 다루는 세 가지 주요 가설은 다음과 같다:[88]
- 무작위 고정: 유전 부호는 무작위로 생성되었다. 초기 tRNA 유사 리보자임은 아미노산에 대한 다른 친화력을 가질 수 있으며, 코돈은 무작위 변동성을 나타내는 리보자임의 다른 부분에서 나타났다. 충분한 펩타이드가 코딩되면 유전 부호의 주요 무작위 변화는 치명적이었을 것이므로 "고정"되었다.[89]
- 입체 화학적 친화성: 유전 부호는 각 아미노산과 코돈 또는 안티코돈 사이의 높은 친화성 결과이다. 후자 옵션은 사전 tRNA 분자가 이 친화성에 의해 해당 아미노산과 일치함을 의미한다. 진화 과정에서 이 일치는 점차 아미노아실-tRNA 합성효소에 의한 일치로 대체되었다.[87][90][94]
- 최적성: 유전 부호는 초기 생성 이후에도 계속 진화하여 현재 코드가 일부 적합도 함수, 일반적으로 일종의 오류 최소화를 최대화한다.[87][88][91]
다음은 다양한 시나리오를 다룬 가설들이다:[92]
- 화학적 원리: 아미노산과의 특정 RNA 상호 작용을 지배한다. 앱타머 실험에서 일부 아미노산은 코돈에 대한 선택적 화학적 친화성을 갖는 것으로 나타났다.[93] 실험 결과 테스트된 8개 아미노산 중 6개가 일부 RNA 삼중체-아미노산 연관성을 보였다.[81][94]
- 생합성 확장: 유전 부호는 "생합성 확장" 과정을 통해 더 단순한 이전 코드에서 성장했다. 원시 생명체는 새로운 아미노산(예: 대사 부산물)을 "발견"하고 나중에 이 중 일부를 유전 코딩 기계에 통합했다.[95] 과거에 더 적은 수의 아미노산 유형이 사용되었다는 간접 증거가 많지만,[96] 어떤 아미노산이 어떤 순서로 코드에 들어갔는지에 대한 정확하고 상세한 가설은 논란의 여지가 있다.[97][98] 여러 연구에 따르면 Gly, Ala, Asp, Val, Ser, Pro, Glu, Leu, Thr는 초기 추가 아미노산 그룹에, Cys, Met, Tyr, Trp, His, Phe는 후기 추가 아미노산 그룹에 속할 수 있다.[99][100][101][102]
- 자연 선택: 돌연변이 영향을 최소화하는 유전 부호의 코돈 할당으로 이어졌다.[103] 최근 가설[104]은 삼중체 코드가 삼중체 코돈보다 긴 코돈(예: 사중체 코돈)을 사용한 코드에서 파생되었다고 제안한다. 삼중체보다 긴 디코딩은 코돈 중복성을 증가시켜 오류 저항성을 높인다. 이 기능은 리보솜 같은 복잡한 번역 기계 없이도 정확한 디코딩을 허용하며, 세포가 리보솜을 만들기 전과 같은 경우이다.
- 정보 채널: 정보 이론적 접근은 유전 부호를 해당 아미노산으로 번역하는 과정을 오류 발생 쉬운 정보 채널로 모델링한다.[105] 채널의 내재적 노이즈(오류)는 유기체에게 근본적 질문을 제기한다. 노이즈에 견딜 수 있는 유전 부호를 구성하여 정보를 정확하고 효율적으로 번역하려면 어떻게 해야 하는가?[106] "속도 왜곡" 모델[107]은 유전 부호가 다양한 아미노산 필요성,[108] 오류 허용성,[103] 최소 자원 비용의 세 가지 상충하는 진화적 힘의 상호 작용 결과로 발생했다고 제안한다. 코드는 코돈이 아미노산에 매핑될 때 무작위가 아닌 전이에서 나타난다. 코드 출현은 가능한 오류에 의해 정의된 위상에 의해 지배되며 지도 채색 문제와 관련 있다.[109]
- 게임 이론: 시그널링 게임 기반 모델은 게임 이론, 자연 선택, 정보 채널 요소를 결합한다. 이 모델은 최초 폴리펩타이드가 짧고 비효소적 기능을 가졌을 가능성이 높다고 제안한다. 게임 이론적 모델은 RNA 가닥을 세포로 구성하는 것이 유전 부호의 "기만적" 사용, 즉 고대 바이러스의 RNA 세계 압도를 방지하는 데 필요했을 수 있다고 제안했다.[110]
- 종결 코돈: 번역 종결 코돈도 유전 부호 기원 문제에서 흥미로운 측면이다. 종결 코돈 진화를 다루는 예로, 종결 코돈은 프레임 시프트 오류 시 번역을 조기 종료할 가능성이 가장 높도록 설계되었다고 제안되었다.[111] 반면, 일부 입체 화학적 분자 모델은 종결 코돈 기원을 "할당할 수 없음"으로 설명한다.[87]
2. 1. 유전 암호 해독 연구의 시작
단백질이 어떻게 부호화되는지를 이해하려는 노력은 1953년 DNA 구조가 발견된 이후 시작되었다. 영국의 생물물리학자 프랜시스 크릭과 미국의 생물학자 제임스 왓슨은 케번디시 연구소에서 함께 연구하면서 정보가 DNA에서 흐르고 DNA와 단백질 사이에 연관성이 있다는 가설을 세웠다.[2] 소련계 미국인 물리학자 조지 가모프는 DNA로부터 단백질을 합성하는 실현 가능한 방식을 처음으로 제시했다.[3] 그는 생명체가 단백질을 만드는 데 사용하는 20개의 표준 아미노산을 암호화하기 위해 3개의 염기 세트(트리플렛)를 사용해야 한다고 가정했는데, 이를 통해 최대 64개의 아미노산을 암호화할 수 있었다.[4] 그는 이 DNA-단백질 상호작용(원래의 유전 부호)을 "다이아몬드 코드"라고 명명했다.[5]1954년 제임스 왓슨의 제안에 따라 조지 가모프는 RNA 타이어 클럽(RNA Tie Club)이라는 비공식 과학 조직을 만들었는데, 이는 유전자로부터 단백질이 어떻게 합성되는지에 관심 있는 과학자들을 위한 모임이었다. 이 클럽은 20개의 아미노산 각각을 대표하는 20명의 정회원과 DNA의 4가지 뉴클레오티드를 대표하는 4명의 명예 회원으로만 구성되었다.[6]
이 클럽의 첫 번째 과학적 기여는 "과학 역사상 가장 중요한 미발표 논문 중 하나"[7]이자 "분자 생물학 연대기에서 가장 유명한 미발표 논문"[8]으로 기록되었으며, 프랜시스 크릭에 의해 이루어졌다. 프랜시스 크릭은 1955년 1월 클럽 회원들에게 "퇴화된 템플릿과 어댑터 가설에 관하여: RNA 타이어 클럽을 위한 노트"(On Degenerate Templates and the Adaptor Hypothesis: A Note for the RNA Tie Club)라는 제목의 타자 논문을 발표했는데, 제임스 왓슨은 이것이 "단백질 합성에 대한 우리의 생각을 완전히 바꿔놓았다"고 회상했다.[10] 이 가설은 트리플렛 코드가 조지 가모프가 생각한 것처럼 아미노산으로 전달되는 것이 아니라 아미노산과 상호 작용하는 다른 분자인 어댑터에 의해 전달된다고 주장한다.[8] 이 어댑터는 나중에 tRNA로 밝혀졌다.[11]
2. 2. 코돈의 발견과 유전 암호 해독
1953년 DNA 구조가 발견된 이후, 과학자들은 단백질이 어떻게 부호화되는지 이해하려고 노력했다. 미국의 천체물리학자 조지 가모우는 20가지 표준 아미노산이 세 개의 염기로 구성된 조합으로 지정된다고 주장했다. 그는 네 가지 염기를 사용하여 만들 수 있는 세 염기 조합이 총 64가지이므로, 20가지 아미노산을 지정하기에 충분하다고 보았다.[113]1961년, 프랜시스 크릭, 시드니 브레너, 레슬리 바넷, R.J. 와츠-토빈의 공동 실험을 통해 이 주장이 실제로 증명되었다. 같은 해, 마셜 워런 니런버그와 하인리히 마테이의 실험으로 코돈의 구조가 밝혀졌다.
프랜시스 크릭과 제임스 왓슨은 케번디시 연구소에서 함께 연구하며 DNA와 단백질 사이에 정보가 흐른다는 가설을 세웠다.[2] 조지 가모프는 DNA로부터 단백질을 합성하는 구체적인 방식을 처음으로 제시하며, 세 개의 염기 조합(트리플렛)을 사용하여 최대 64개의 아미노산을 암호화할 수 있다고 제안했다.[3][4] 그는 이 DNA-단백질 상호작용을 "다이아몬드 코드"라고 불렀다.[5]
1954년, 제임스 왓슨의 제안으로 가모프는 RNA 타이어 클럽이라는 과학자 모임을 만들었다. 이 클럽은 유전자로부터 단백질 합성에 관심 있는 과학자들의 모임이었지만, 20명의 정회원과 4명의 명예 회원으로 제한되었다.[6]
프랜시스 크릭은 1955년에 "퇴화된 템플릿과 어댑터 가설에 관하여: RNA 타이어 클럽을 위한 노트"라는 논문을 발표했는데, 이는 "과학 역사상 가장 중요한 미발표 논문 중 하나"[7]이자 "분자 생물학 연대기에서 가장 유명한 미발표 논문"[8]으로 기록되었다. 이 가설은 아미노산이 트리플렛 코드에 직접 전달되는 것이 아니라, 아미노산과 상호작용하는 다른 분자인 어댑터를 통해 전달된다고 주장한다.[8] 이 어댑터는 나중에 tRNA로 밝혀졌다.[11]
프랜시스 크릭, 시드니 브레너, 버넷, 로버트 왓츠-토빈의 실험은 '''코돈'''이 세 개의 DNA 염기로 구성되어 있음을 처음으로 보여주었다.
마셜 니렌버그와 J. 하인리히 마테이는 1961년에 무세포 시스템을 사용하여 폴리-우라실 RNA 서열(UUUUU...)을 번역했고, 합성된 폴리펩타이드가 페닐알라닌으로만 구성되어 있다는 것을 발견했다.[13] 이를 통해 UUU 코돈이 페닐알라닌을 지정한다는 것을 추론했다.
이후 세베로 오초아의 연구실에서 수행된 실험을 통해 폴리-아데닌 RNA 서열(AAAAA...)이 폴리-라이신[14]을, 폴리-시토신 RNA 서열(CCCCC...)이 폴리-프롤린[15]을 암호화한다는 것을 입증했다. 즉, AAA 코돈은 라이신, CCC 코돈은 프롤린을 지정한다는 것을 알아냈다. 다양한 공중합체를 사용하여 나머지 코돈 대부분도 결정되었다.
하 고빈드 코라나의 연구를 통해 유전 암호의 나머지 부분이 밝혀졌다. 그 직후, 로버트 W. 홀리는 RNA를 단백질로 번역하는 과정을 돕는 어댑터 분자인 전령 RNA(tRNA)의 구조를 밝혀냈다. 이 연구는 세베로 오초아의 이전 연구를 기반으로 했으며, 오초아는 1959년 RNA 합성에 대한 효소학 연구로 노벨 생리학·의학상을 받았다.[16]
니렌버그와 필립 레더는 코드의 삼중항 특성을 밝히고 코돈을 해독하는 실험을 진행했다. 이 실험에서 다양한 조합의 mRNA를 리보솜이 들어 있는 필터에 통과시켰다. 고유한 삼중항은 특정 tRNA가 리보솜에 결합하도록 촉진했다. 레더와 니렌버그는 64개의 코돈 중 54개의 서열을 결정할 수 있었다.[17] 코라나, 홀리, 니렌버그는 이 연구로 1968년 노벨상을 받았다.[18]
세 개의 종결 코돈은 발견자인 리처드 엡스타인과 찰스 스타인버그에 의해 "앰버", "오커", "오팔"로 명명되었다. "앰버"는 그들의 친구 해리스 번스타인의 성을 독일어로 번역한 것이다.[19]
2. 3. 확장된 유전 부호 (합성 생물학)
광범위한 학술적 관점에서, 원래의 모호한 유전 부호에서 20(+2)개의 표준 아미노산 레퍼토리를 가진 잘 정의된("고정된") 부호로 진화했다는 개념은 널리 받아들여지고 있다.[20] 그러나 실험적으로 이를 변경하는 최선의 방법에 대한 다양한 의견, 개념, 접근 방식 및 아이디어가 존재한다. 심지어 합성 아미노산이 유전 부호에 침투할 수 있는 "진입점"을 예측하는 모델도 제안되었다.[21]2001년 이후, 독특한 코돈(재코딩)과 그에 상응하는 운반 RNA:아미노아실-tRNA 합성효소 쌍을 생성하여 40개의 비천연 아미노산을 단백질에 추가함으로써, 다양한 물리화학적 및 생물학적 특성을 코딩하여 단백질 구조와 기능을 탐구하거나 새롭거나 향상된 단백질을 생성하는 도구로 사용하고 있다.[22][23]
H. 무라카미와 M. 시시도는 일부 코돈을 확장하여 4개 및 5개의 염기를 갖도록 했다. 스티븐 A. 베너는 기능적인 65번째 (''생체 내'') 코돈을 구성했다.[24]
2015년 N. 부디사, D. 쉔과 동료들은 박테리아 ''대장균''의 유전 부호에서 모든 20,899개의 트립토판 잔기(UGG 코돈)를 비천연 티에노피롤-알라닌으로 완전히 대체했다고 보고했다.[25]
2016년, 최초의 안정적인 반합성 유기체가 생성되었다. 그것은 두 개의 합성 염기(X와 Y로 불림)를 가진 (단일 세포) 박테리아였다. 이 염기들은 세포 분열에서 살아남았다.[26][27]
2017년, 대한민국 연구진은 비천연 아미노산을 가진 단백질을 생산할 수 있는 확장된 유전 부호를 가진 쥐를 개발했다고 보고했다.[28]
2019년 5월, 연구자들은 새로운 "Syn61" 균주의 세균 ''대장균''의 생성을 보고했다. 이 균주는 완전히 합성된 게놈을 가지고 있으며, 재구성(모든 중첩 확장), 재코딩(64개 코돈 중 3개의 사용을 완전히 제거), 그리고 이제 불필요해진 tRNA와 방출 인자를 제거하도록 추가로 수정되었다. 그것은 완전히 생존 가능하며, 야생형 대응 균주 "MDS42"보다 1.6배 느리게 성장한다.[29][30]
3. 코돈의 형성 및 특징
코돈은 전령 RNA(mRNA)와 운반RNA(tRNA)의 유전 정보 단위로, 하나의 아미노산을 지정한다.[112] 유전자 발현 과정에서 DNA는 RNA 중합효소에 의해 전사되어 전령 RNA를 형성하고, 이 전령 RNA의 염기 세 개가 짝을 이루어 코돈을 구성한다.
1953년 DNA 구조가 발견된 후, 프랜시스 크릭과 제임스 왓슨은 DNA와 단백질 사이에 연관성이 있다는 가설을 세웠다.[2] 조지 가모프는 20개의 표준 아미노산을 암호화하기 위해 3개의 염기 조합(트리플렛)이 사용되어야 한다고 제안했다.[3][4]
1955년, 크릭은 RNA 타이어 클럽 회원들에게 "퇴화된 템플릿과 어댑터 가설"이라는 논문을 발표하여 아미노산이 어댑터 분자에 의해 전달된다는 가설을 제시했다.[8] 이 어댑터는 나중에 tRNA로 밝혀졌다.[11]
프랜시스 크릭과 시드니 브레너 등의 실험을 통해 코돈이 세 개의 DNA 염기로 구성되어 있음이 밝혀졌다. 마셜 니렌버그와 J. 하인리히 마테이는 1961년에 UUU 코돈이 페닐알라닌을 지정한다는 것을 처음으로 발견했다.[12][13] 이후 세베로 오초아, 하 고빈드 코라나, 로버트 W. 홀리 등의 연구를 통해 유전 부호의 나머지 부분이 밝혀졌다.
유전 부호의 특징
- 중복성 (Degeneracy): 유전 부호는 중복성을 가지지만 모호성은 없다. 예를 들어, GAA와 GAG 코돈은 모두 글루탐산을 지정하지만(중복성), 다른 아미노산을 지정하지는 않는다(모호성 없음).
- 구조화: 코돈의 첫 번째 위치 변화는 두 번째 위치 변화보다 중요하다. 전하 반전(charge inversion)은 특정 코돈의 첫 번째 위치에서만 발생할 수 있기 때문이다.
유전 부호의 진화, 확장 유전 부호, 코돈 사용 빈도 등 다양한 연구가 진행되고 있다.
3. 1. 전사와 코돈의 형성

전령 RNA와 코돈의 형성
유전자 발현에서 새로운 단백질 형성은 DNA에서 전사된 전령 RNA의 형성과 함께 시작된다. DNA 사슬을 구성하는 특정 염기 서열이 전사를 지시하는데, 전사가 필요하지 않은 경우에는 억제자 효소가 부착되어 있어 전사를 막는다. 특정 단백질 생산이 필요하다는 신호를 받으면 억제자는 DNA 사슬에서 떨어져 나가고 RNA 중합효소에 의해 전사가 시작된다. RNA 중합효소는 전사 시작 지점에 있는 프로모터의 염기서열에 의해 전사 방향과 전사할 DNA 사슬을 선택하고 오퍼레이터에 결합되어 DNA 사슬을 풀어낸 후 전사를 시작한다. RNA 중합효소는 주형이 되는 DNA 사슬과 상보적인 리보뉴클레오타이드를 이용하여 전령 RNA를 만든다. 이렇게 만들어진 전령 RNA의 염기서열은 세 개씩 짝을 이뤄 코돈을 형성한다. 한편 RNA 중합효소는 전사 종결을 지시하는 DNA 염기서열을 만나면 전사를 중단하고 DNA에서 떨어져 나간다.[114]
3. 2. 리딩 프레임
리딩 프레임(reading frame, 번역 틀)은 번역이 시작되는 최초의 세 개의 뉴클레오타이드에 의해 정의된다. 이는 "열린 리딩 프레임(open reading frame, ORF)"이라고 하는, 일련의 연속적이고 겹치지 않는 코돈들의 틀을 설정한다. 예를 들어, 5'-AAATGAACG-3' 문자열(그림 참조)은 첫 번째 위치에서 읽으면 AAA, TGA, ACG 코돈을 포함하고; 두 번째 위치에서 읽으면 AAT와 GAA 코돈을 포함하며; 세 번째 위치에서 읽으면 ATG와 AAC 코돈을 포함한다. 따라서 모든 서열은 5' → 3' 방향으로 세 개의 리딩 프레임에서 읽을 수 있으며, 각각 잠재적으로 다른 아미노산 서열을 생성한다. 주어진 예에서, 각각 Lys (K)-Trp (W)-Thr (T), Asn (N)-Glu (E), 또는 Met (M)-Asn (N) (척추동물 미토콘드리아 코드를 사용하여 번역할 때)이다. DNA가 이중 가닥일 때, 6개의 가능한 리딩 프레임이 정의되며, 한 가닥의 정방향으로 3개, 반대 가닥의 역방향으로 3개가 있다.[40] 단백질을 암호화하는 프레임은 일반적으로 RNA (DNA) 서열의 첫 번째 AUG (ATG) 코돈인 개시 코돈에 의해 정의된다.진핵생물에서 엑손의 ORF는 종종 인트론에 의해 중단된다.
3. 3. 개시 코돈과 종결 코돈
유전자 발현에서 새로운 단백질의 형성은 DNA에서 전사된 전령 RNA의 형성과 함께 시작된다. 이렇게 만들어진 전령 RNA의 염기서열은 세 개씩 짝을 이뤄 코돈을 형성한다.[114]번역은 개시 코돈으로 시작된다. 개시 코돈만으로는 과정을 시작하기에 충분하지 않다. 대장균(''Escherichia coli'')의 샤인-달가노 염기서열과 개시 인자와 같은 주변 염기서열 또한 번역을 시작하는 데 필요하다. 가장 일반적인 개시 코돈은 AUG이며, 이는 메티오닌 또는 포르밀메티오닌(세균, 미토콘드리아, 엽록체에서)으로 읽힌다. 생물체에 따라 다른 개시 코돈에는 "GUG" 또는 "UUG"가 포함되며, 이러한 코돈은 일반적으로 각각 발린과 류신을 나타내지만, 개시 코돈으로서는 메티오닌 또는 포르밀메티오닌으로 번역된다.[32]
세 개의 종결 코돈에는 UAG는 ''앰버'', UGA는 ''오팔''(때로는 ''움버''라고도 함), UAA는 ''오커''라는 이름이 있다. 종결 코돈은 "종결" 또는 "넌센스" 코돈이라고도 한다. 이들은 리보솜에서 새로 합성된 폴리펩타이드의 방출을 신호하는데, 이들 종결 신호에 상보적인 안티코돈을 가진 인지 tRNA가 없으므로, 방출 인자가 대신 리보솜에 결합할 수 있다.[33]
3. 4. 돌연변이의 영향
DNA 복제 과정에서 때때로 오류가 발생하는데, 이를 돌연변이라고 한다. 돌연변이는 유기체의 표현형에 영향을 미칠 수 있으며, 특히 유전자의 단백질 암호화 서열 내에서 발생할 경우 더욱 그렇다. 오류율은 일반적으로 1,000만~1억 염기마다 1개의 오류로 매우 낮으며, 이는 DNA 중합 효소의 "교정" 능력 덕분이다.[35][36]미스센스 돌연변이와 넌센스 돌연변이는 점 돌연변이의 예시이다. 미스센스 돌연변이는 암호화된 아미노산 잔기의 특성을 변화시키고, 넌센스 돌연변이는 종결 코돈을 생성한다. 이러한 돌연변이는 겸형 적혈구 빈혈증과 지중해 빈혈과 같은 유전 질환을 유발할 수 있다.[37][38][39]
프레임 시프트 돌연변이는 3의 배수가 아닌 뉴클레오티드 염기의 삽입 또는 결실(indel)에 의해 판독 틀 서열이 파괴되는 돌연변이이다. 이러한 돌연변이는 원래와 완전히 다른 번역을 초래하고, 종결 코돈이 나타나 단백질이 절단될 가능성이 높다.[41] 이러한 돌연변이는 단백질의 기능을 손상시킬 수 있어 ''생체 내'' 단백질 암호화 서열에서는 드물게 나타난다. 프레임 시프트 돌연변이가 유전되는 경우가 드문 이유는 번역되는 단백질이 생장에 필수적인 경우, 기능성 단백질이 없으면 유기체가 생존하지 못할 수 있기 때문이다.[42] 테이-삭스병은 프레임 시프트 돌연변이로 인해 발생하는 심각한 유전 질환의 예시이다.[43]
대부분의 돌연변이는 유해하거나 중립적이지만, 일부 돌연변이는 이점을 가지기도 한다.[44] 이러한 돌연변이는 돌연변이 유기체가 특정 환경 스트레스를 더 잘 견디거나 더 빨리 번식할 수 있게 한다. 이 경우 돌연변이는 자연 선택을 통해 개체군에서 더 흔해지는 경향을 보인다.[45] RNA를 유전 물질로 사용하는 바이러스는 빠른 돌연변이율을 가지는데,[46] 이는 바이러스가 빠르게 진화하여 면역 체계의 방어 반응을 회피할 수 있게 해주기 때문에 유리할 수 있다.[47] ''대장균''과 같이 무성 생식을 하는 대규모 개체군에서는 여러 개의 유익한 돌연변이가 동시에 발생할 수 있다. 이 현상을 클론 간섭이라고 하며, 돌연변이 간의 경쟁을 유발한다.[48]
3. 5. 코돈 사용 빈도 (Codon usage bias)
코돈 사용 빈도(Codon usage bias)는 번역 조절에 영향을 미치는 요소로, 종에 따라 다르게 나타나는 코돈의 빈도 차이를 의미한다. 코돈은 유기체에 따라 선호도가 다르다. 예를 들어, 대장균 (E. coli)에서 가장 흔한 프롤린 코돈은 CCG이지만, 인간에서는 가장 적게 사용되는 프롤린 코돈이다.[53]다음은 인간 게놈의 코돈 빈도를 나타내는 표이다.[54]
코돈 | 아미노산 | 비율 | 1,000분율 | 수 | 코돈 | 아미노산 | 비율 | 1,000분율 | 수 | 코돈 | 아미노산 | 비율 | 1,000분율 | 수 | 코돈 | 아미노산 | 비율 | 1,000분율 | 수 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
UUU | F | 0.46 | 17.6 | 714,298 | UCU | S | 0.19 | 15.2 | 618,711 | UAU | Y | 0.44 | 12.2 | 495,699 | UGU | C | 0.46 | 10.6 | 430,311 |
UUC | F | 0.54 | 20.3 | 824,692 | UCC | S | 0.22 | 17.7 | 718,892 | UAC | Y | 0.56 | 15.3 | 622,407 | UGC | C | 0.54 | 12.6 | 513,028 |
UUA | L | 0.08 | 7.7 | 311,881 | UCA | S | 0.15 | 12.2 | 496,448 | UAA | * | 0.30 | 1.0 | 40,285 | UGA | * | 0.47 | 1.6 | 63,237 |
UUG | L | 0.13 | 12.9 | 525,688 | UCG | S | 0.05 | 4.4 | 179,419 | UAG | * | 0.24 | 0.8 | 32,109 | UGG | W | 1.00 | 13.2 | 535,595 |
CUU | L | 0.13 | 13.2 | 536,515 | CCU | P | 0.29 | 17.5 | 713,233 | CAU | H | 0.42 | 10.9 | 441,711 | CGU | R | 0.08 | 4.5 | 184,609 |
CUC | L | 0.20 | 19.6 | 796,638 | CCC | P | 0.32 | 19.8 | 804,620 | CAC | H | 0.58 | 15.1 | 613,713 | CGC | R | 0.18 | 10.4 | 423,516 |
CUA | L | 0.07 | 7.2 | 290,751 | CCA | P | 0.28 | 16.9 | 688,038 | CAA | Q | 0.27 | 12.3 | 501,911 | CGA | R | 0.11 | 6.2 | 250,760 |
CUG | L | 0.40 | 39.6 | 1,611,801 | CCG | P | 0.11 | 6.9 | 281,570 | CAG | Q | 0.73 | 34.2 | 1,391,973 | CGG | R | 0.20 | 11.4 | 464,485 |
AUU | I | 0.36 | 16.0 | 650,473 | ACU | T | 0.25 | 13.1 | 533,609 | AAU | N | 0.47 | 17.0 | 689,701 | AGU | S | 0.15 | 12.1 | 493,429 |
AUC | I | 0.47 | 20.8 | 846,466 | ACC | T | 0.36 | 18.9 | 768,147 | AAC | N | 0.53 | 19.1 | 776,603 | AGC | S | 0.24 | 19.5 | 791,383 |
AUA | I | 0.17 | 7.5 | 304,565 | ACA | T | 0.28 | 15.1 | 614,523 | AAA | K | 0.43 | 24.4 | 993,621 | AGA | R | 0.21 | 12.2 | 494,682 |
AUG | M | 1.00 | 22.0 | 896,005 | ACG | T | 0.11 | 6.1 | 246,105 | AAG | K | 0.57 | 31.9 | 1,295,568 | AGG | R | 0.21 | 12.0 | 486,463 |
GUU | V | 0.18 | 11.0 | 448,607 | GCU | A | 0.27 | 18.4 | 750,096 | GAU | D | 0.46 | 21.8 | 885,429 | GGU | G | 0.16 | 10.8 | 437,126 |
GUC | V | 0.24 | 14.5 | 588,138 | GCC | A | 0.40 | 27.7 | 1,127,679 | GAC | D | 0.54 | 25.1 | 1,020,595 | GGC | G | 0.34 | 22.2 | 903,565 |
GUA | V | 0.12 | 7.1 | 287,712 | GCA | A | 0.23 | 15.8 | 643,471 | GAA | E | 0.42 | 29.0 | 1,177,632 | GGA | G | 0.25 | 16.5 | 669,873 |
GUG | V | 0.46 | 28.1 | 1,143,534 | GCG | A | 0.11 | 7.4 | 299,495 | GAG | E | 0.58 | 39.6 | 1,609,975 | GGG | G | 0.25 | 16.5 | 669,768 |
4. 안티코돈
안티코돈은 운반 RNA의 RNA 사슬을 이루는 특정 구간의 염기서열이다. 전령 RNA의 코돈은 리보솜에서 번역되어 아미노산을 운반하는 운반 RNA의 안티코돈과 상보적으로 결합한다.[115] 안티코돈은 그 개수가 64개가 아니라 45개가 존재한다.
4. 1. 단백질 합성
운반 RNA는 RNA 사슬의 일부 구간이 안티코돈으로 작용하고 사슬의 끝에는 해당 아미노산을 결합시킨다. 이렇게 충전된 운반 RNA는 리보솜으로 들어가 전령 RNA의 코돈과 결합하고 리보솜은 운반 RNA의 끝에 달린 아미노산을 떼내어 폴리펩타이드 결합을 만든다. 아미노산이 떨어져 나간 운반 RNA는 리보솜 밖으로 나와 다시 아미노산을 전달한다.[116] 한편, 리보솜에서 만들어진 폴리펩타이드는 적당한 3차원 구조로 접혀서 단백질이 된다.[117]안티코돈은 운반 RNA의 RNA 사슬을 이루는 특정 구간의 염기서열이다. 전령 RNA의 코돈은 리보솜에서 번역되어 아미노산을 운반하는 운반 RNA의 안티코돈과 상보적으로 결합한다.[115] 그런데 이렇게 상보적으로 결합을 하는 안티코돈이지만 그 개수는 64개가 아니라 45개가 존재한다.
단백질이 어떻게 암호화되는지를 이해하려는 노력은 1953년 DNA 구조가 발견된 이후 시작되었다. 주요 발견자인 영국의 생물물리학자 프랜시스 크릭과 미국의 생물학자 제임스 왓슨은 케번디시 연구소에서 함께 연구하면서 정보가 DNA에서 흐르고 DNA와 단백질 사이에 연관성이 있다는 가설을 세웠다.[2] 소련계 미국인 물리학자 조지 가모프는 DNA로부터 단백질을 합성하는 실현 가능한 방식을 처음으로 제시했다.[3] 그는 생명체가 단백질을 만드는 데 사용하는 20개의 표준 아미노산을 암호화하기 위해 3개의 염기 세트(트리플렛)를 사용해야 한다고 가정했는데, 이를 통해 최대 64개의 아미노산을 암호화할 수 있었다.[4] 그는 이 DNA-단백질 상호작용(원래의 유전 부호)을 "다이아몬드 코드"라고 명명했다.[5]
1954년 왓슨의 제안에 따라 가모프는 RNA 타이어 클럽(RNA Tie Club)이라는 비공식 과학 조직을 만들었는데, 이는 유전자로부터 단백질이 어떻게 합성되는지에 관심 있는 다양한 성향의 과학자들을 위한 모임이었다. 그러나 이 클럽은 20개의 아미노산 각각을 대표하는 20명의 정회원과 DNA의 4가지 뉴클레오티드를 대표하는 4명의 명예 회원으로만 구성되었다.[6]
이 클럽의 첫 번째 과학적 기여는 "과학 역사상 가장 중요한 미발표 논문 중 하나"[7]이자 "분자 생물학 연대기에서 가장 유명한 미발표 논문"[8]으로 기록되었으며, 크릭에 의해 이루어졌다. 크릭은 1955년 1월 클럽 회원들에게 "퇴화된 템플릿과 어댑터 가설에 관하여: RNA 타이어 클럽을 위한 노트"(On Degenerate Templates and the Adaptor Hypothesis: A Note for the RNA Tie Club)라는 제목의 타자 논문을 발표했는데, 왓슨은 이것이 "단백질 합성에 대한 우리의 생각을 완전히 바꿔놓았다"고 회상했다.[10] 이 가설은 트리플렛 코드가 가모프가 생각한 것처럼 아미노산으로 전달되는 것이 아니라 아미노산과 상호 작용하는 다른 분자인 어댑터에 의해 전달된다고 주장한다.[8] 이 어댑터는 나중에 tRNA로 밝혀졌다.[11]
프랜시스 크릭, 시드니 브레너, 버넷, 로버트 왓츠-토빈의 실험은 처음으로 '''코돈'''이 세 개의 DNA 염기로 구성되어 있음을 보여주었다.
마셜 니렌버그와 J. 하인리히 마테이는 1961년에 코돈의 성질을 처음으로 밝혀냈다.[12] 그들은 무세포 시스템을 사용하여 폴리-우라실 RNA 서열(즉, UUUUU...)을 번역했고, 합성한 폴리펩타이드가 아미노산 페닐알라닌으로만 구성되어 있다는 것을 발견했다.[13] 그들은 UUU 코돈이 아미노산 페닐알라닌을 지정한다는 것을 추론했다.
이어서 세베로 오초아의 연구실에서 수행된 실험에서 폴리-아데닌 RNA 서열(AAAAA...)이 폴리-라이신[14] 폴리펩타이드를 암호화하고, 폴리-시토신 RNA 서열(CCCCC...)이 폴리-프롤린[15] 폴리펩타이드를 암호화한다는 것을 입증했다. 따라서 AAA 코돈은 아미노산 라이신을 지정하고, CCC 코돈은 아미노산 프롤린을 지정했다. 다양한 공중합체를 사용하여 나머지 코돈의 대부분이 결정되었다.
이어진 하 고빈드 코라나의 연구를 통해 유전 코드의 나머지가 밝혀졌다. 그 직후, 로버트 W. 홀리는 RNA를 단백질로 번역하는 과정을 촉진하는 어댑터 분자인 전령 RNA (tRNA)의 구조를 밝혀냈다. 이 연구는 오초아의 이전 연구를 기반으로 했으며, 오초아는 1959년 RNA 합성에 대한 효소학 연구로 노벨 생리학·의학상을 받았다.[16]
이 연구를 확장하여 니렌버그와 필립 레더는 코드의 삼중항 특성을 밝히고 코돈을 해독했다. 이 실험에서 다양한 조합의 mRNA가 리보솜이 들어 있는 필터를 통과했다. 리보솜은 세포의 구성 요소로, RNA를 단백질로 번역한다. 고유한 삼중항은 특정 tRNA가 리보솜에 결합하도록 촉진했다. 레더와 니렌버그는 실험에서 64개의 코돈 중 54개의 서열을 결정할 수 있었다.[17] 코라나, 홀리, 니렌버그는 이 연구로 노벨상(1968)을 받았다.[18]
세 개의 종결 코돈은 발견자인 리처드 엡스타인과 찰스 스타인버그에 의해 명명되었다. "앰버"는 독일어로 "호박색"을 의미하는 성을 가진 그들의 친구 해리스 번스타인을 기리기 위해 명명되었다.[19] 다른 두 개의 종결 코돈은 "색상 이름" 테마를 유지하기 위해 "오커"와 "오팔"로 명명되었다.
리딩 프레임(reading frame, 번역 틀)은 번역이 시작되는 최초의 세 개의 뉴클레오티드에 의해 정의된다. 이는 "열린 리딩 프레임"(open reading frame, ORF)이라고 하는, 일련의 연속적이고 겹치지 않는 코돈들의 틀을 설정한다. 예를 들어, 5'-AAATGAACG-3' 문자열(그림 참조)은 첫 번째 위치에서 읽으면 AAA, TGA, ACG 코돈을 포함하고; 두 번째 위치에서 읽으면 AAT와 GAA 코돈을 포함하며; 세 번째 위치에서 읽으면 ATG와 AAC 코돈을 포함한다. 따라서 모든 서열은 5' → 3' 방향으로 세 개의 리딩 프레임에서 읽을 수 있으며, 각각 잠재적으로 다른 아미노산 서열을 생성한다. 주어진 예에서, 각각 Lys (K)-Trp (W)-Thr (T), Asn (N)-Glu (E), 또는 Met (M)-Asn (N) (척추동물 미토콘드리아 코드를 사용하여 번역할 때). DNA가 이중 가닥일 때, 6개의 가능한 리딩 프레임이 정의되며, 한 가닥의 정방향으로 3개, 반대 가닥의 역방향으로 3개가 있다.[40] 단백질을 암호화하는 프레임은 일반적으로 RNA (DNA) 서열의 첫 번째 AUG (ATG) 코돈인 개시 코돈에 의해 정의된다.
진핵생물에서 엑손의 ORF는 종종 인트론에 의해 중단된다.
번역은 개시 코돈 또는 개시 코돈으로 시작된다. 개시 코돈만으로는 과정을 시작하기에 충분하지 않다. ''Escherichia coli''의 샤인-달가노 염기서열과 개시 인자와 같은 주변 염기서열 또한 번역을 시작하는 데 필요하다. 가장 일반적인 개시 코돈은 AUG이며, 이는 메티오닌 또는 포르밀메티오닌 (세균, 미토콘드리아, 엽록체에서)으로 읽힌다. 생물체에 따라 다른 개시 코돈에는 "GUG" 또는 "UUG"가 포함되며, 이러한 코돈은 일반적으로 각각 발린과 류신을 나타내지만, 개시 코돈으로서는 메티오닌 또는 포르밀메티오닌으로 번역된다.[32]
세 개의 종결 코돈에는 UAG는 ''앰버'', UGA는 ''오팔'' (때로는 ''움버''라고도 함), UAA는 ''오커''라는 이름이 있다. 종결 코돈은 "종결" 또는 "넌센스" 코돈이라고도 한다. 이들은 리보솜에서 새로 합성된 폴리펩타이드의 방출을 신호하는데, 이들 종결 신호에 상보적인 안티코돈을 가진 인지 tRNA가 없으므로, 방출 인자가 대신 리보솜에 결합할 수 있다.[33]
5. 아미노산
표준 아미노산은 20가지(페닐알라닌, 세린, 티로신, 시스테인, 류신, 트립토판, 프롤린, 히스티딘, 아르기닌, 글루타민, 이소류신, 트레오닌, 아스파라긴, 리신, 메티오닌, 발린, 알라닌, 글리신, 아스파라긴산, 글루타민산)가 지정되어 있으며, 이들은 세 개의 염기로 구성되어 있다. 추가로 스톱코돈(stop codon 또는 종결코돈) 등이 있다.
1961년, 마셜 니렌버그와 J. 하인리히 마테이는 무세포 시스템을 사용하여 폴리-우라실 RNA 서열(UUUUU...)을 번역했고, 합성한 폴리펩타이드가 페닐알라닌으로만 구성되어 있다는 것을 발견했다.[13] 그들은 UUU 코돈이 페닐알라닌을 지정한다는 것을 추론했다.[12]
이어서 세베로 오초아의 연구실에서 수행된 실험에서 폴리-아데닌 RNA 서열(AAAAA...)이 폴리-라이신[14] 폴리펩타이드를 암호화하고, 폴리-시토신 RNA 서열(CCCCC...)이 폴리-프롤린[15] 폴리펩타이드를 암호화한다는 것을 입증했다. 따라서 AAA 코돈은 라이신을 지정하고, CCC 코돈은 프롤린을 지정했다. 다양한 공중합체를 사용하여 나머지 코돈의 대부분이 결정되었다.
이후 하 고빈드 코라나의 연구를 통해 유전 코드의 나머지가 밝혀졌다.
코돈 | 아미노산 | 비율 | 1,000분율 | 수 | 코돈 | 아미노산 | 비율 | 1,000분율 | 수 | 코돈 | 아미노산 | 비율 | 1,000분율 | 수 | 코돈 | 아미노산 | 비율 | 1,000분율 | 수 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
UUU | F | 0.46 | 17.6 | 714,298 | UCU | S | 0.19 | 15.2 | 618,711 | UAU | Y | 0.44 | 12.2 | 495,699 | UGU | C | 0.46 | 10.6 | 430,311 |
UUC | F | 0.54 | 20.3 | 824,692 | UCC | S | 0.22 | 17.7 | 718,892 | UAC | Y | 0.56 | 15.3 | 622,407 | UGC | C | 0.54 | 12.6 | 513,028 |
UUA | L | 0.08 | 7.7 | 311,881 | UCA | S | 0.15 | 12.2 | 496,448 | UAA | * | 0.30 | 1.0 | 40,285 | UGA | * | 0.47 | 1.6 | 63,237 |
UUG | L | 0.13 | 12.9 | 525,688 | UCG | S | 0.05 | 4.4 | 179,419 | UAG | * | 0.24 | 0.8 | 32,109 | UGG | W | 1.00 | 13.2 | 535,595 |
CUU | L | 0.13 | 13.2 | 536,515 | CCU | P | 0.29 | 17.5 | 713,233 | CAU | H | 0.42 | 10.9 | 441,711 | CGU | R | 0.08 | 4.5 | 184,609 |
CUC | L | 0.20 | 19.6 | 796,638 | CCC | P | 0.32 | 19.8 | 804,620 | CAC | H | 0.58 | 15.1 | 613,713 | CGC | R | 0.18 | 10.4 | 423,516 |
CUA | L | 0.07 | 7.2 | 290,751 | CCA | P | 0.28 | 16.9 | 688,038 | CAA | Q | 0.27 | 12.3 | 501,911 | CGA | R | 0.11 | 6.2 | 250,760 |
CUG | L | 0.40 | 39.6 | 1,611,801 | CCG | P | 0.11 | 6.9 | 281,570 | CAG | Q | 0.73 | 34.2 | 1,391,973 | CGG | R | 0.20 | 11.4 | 464,485 |
AUU | I | 0.36 | 16.0 | 650,473 | ACU | T | 0.25 | 13.1 | 533,609 | AAU | N | 0.47 | 17.0 | 689,701 | AGU | S | 0.15 | 12.1 | 493,429 |
AUC | I | 0.47 | 20.8 | 846,466 | ACC | T | 0.36 | 18.9 | 768,147 | AAC | N | 0.53 | 19.1 | 776,603 | AGC | S | 0.24 | 19.5 | 791,383 |
AUA | I | 0.17 | 7.5 | 304,565 | ACA | T | 0.28 | 15.1 | 614,523 | AAA | K | 0.43 | 24.4 | 993,621 | AGA | R | 0.21 | 12.2 | 494,682 |
AUG | M | 1.00 | 22.0 | 896,005 | ACG | T | 0.11 | 6.1 | 246,105 | AAG | K | 0.57 | 31.9 | 1,295,568 | AGG | R | 0.21 | 12.0 | 486,463 |
GUU | V | 0.18 | 11.0 | 448,607 | GCU | A | 0.27 | 18.4 | 750,096 | GAU | D | 0.46 | 21.8 | 885,429 | GGU | G | 0.16 | 10.8 | 437,126 |
GUC | V | 0.24 | 14.5 | 588,138 | GCC | A | 0.40 | 27.7 | 1,127,679 | GAC | D | 0.54 | 25.1 | 1,020,595 | GGC | G | 0.34 | 22.2 | 903,565 |
GUA | V | 0.12 | 7.1 | 287,712 | GCA | A | 0.23 | 15.8 | 643,471 | GAA | E | 0.42 | 29.0 | 1,177,632 | GGA | G | 0.25 | 16.5 | 669,873 |
GUG | V | 0.46 | 28.1 | 1,143,534 | GCG | A | 0.11 | 7.4 | 299,495 | GAG | E | 0.58 | 39.6 | 1,609,975 | GGG | G | 0.25 | 16.5 | 669,768 |
6. 유전 부호의 다양성
유전 부호는 대부분의 생명체에서 거의 동일하게 사용되지만, 일부 예외도 존재한다. 이러한 다양성은 생명체의 진화 과정에서 나타난 흥미로운 현상이다.
1979년 인간 미토콘드리아 유전자 연구에서 처음으로 유전 부호의 변이가 발견된 이후,[58] 다양한 변종들이 추가로 발견되었다.[64] 예를 들어, ''미코플라스마'' 종은 코돈 UGA를 트립토판으로 번역하고, "CTG 클레이드"의 효모(예: ''칸디다 알비칸스'')는 CUG를 류신 대신 세린으로 번역한다.[60][61][62] 토티바이러스와 같이 숙주의 유전 부호 수정에 적응한 바이러스도 존재한다.[63]
세균과 고세균에서는 GUG와 UUG가 일반적인 개시 코돈으로 사용되지만, 드물게 특정 단백질은 대체 개시 코돈을 사용하기도 한다.[64]
심지어 인간의 핵-암호화 유전자에서도 유전 부호 해석의 변이가 발견되었다. 2016년 연구에 따르면, 말산 탈수소 효소를 암호화하는 mRNA의 약 4%에서 종결 코돈이 트립토판과 아르기닌을 암호화하는 데 사용된다는 사실이 밝혀졌다.[65] 이러한 재코딩은 ''기능적 번역 리드스루''라고 불린다.[67]
가장 극단적인 변이로는 특정 섬모충에서 mRNA 내 위치에 따라 종결 코돈의 의미가 달라지는 현상이 있다. 3' 말단 근처에서는 종결 코돈으로 작동하지만, 내부 위치에서는 ''콘딜로스토마''처럼 아미노산을 암호화하거나 ''유플로테스''처럼 리보솜 프레임 시프트를 유발한다.[69][70]
이러한 다양한 유전 부호 변이에도 불구하고, 자연적으로 발생하는 모든 코드는 매우 유사하며, 코딩 메커니즘은 모든 유기체에서 동일하다.[68] 즉, 3개의 염기 코돈, tRNA, 리보솜, 단일 방향 판독, 그리고 단일 코돈을 단일 아미노산으로 번역하는 방식은 동일하게 유지된다.
유전 부호의 기원, 변이, 그리고 진화 가능성은 활발하게 연구되고 있으며,[71][72] 일부 연구에서는 유전 부호를 실험적으로 진화시키기도 한다.[73][74][75][76]
6. 1. 비표준 아미노산
2001년 이후, 독특한 코돈(재코딩)과 그에 상응하는 운반 RNA:아미노아실-tRNA 합성효소 쌍을 생성하여 40개의 비천연 아미노산을 단백질에 추가함으로써, 다양한 물리화학적 및 생물학적 특성을 코딩하여 단백질 구조와 기능을 탐구하거나 새롭거나 향상된 단백질을 생성하는 도구로 사용하고 있다.[22][23]H. 무라카미와 M. 시시도는 일부 코돈을 확장하여 4개 및 5개의 염기를 갖도록 했다. 스티븐 A. 베너는 기능적인 65번째 (''생체 내'') 코돈을 구성했다.[24]
2015년 N. 부디사, D. 쉔과 동료들은 박테리아 ''대장균''의 유전 부호에서 모든 20,899개의 트립토판 잔기(UGG 코돈)를 비천연 티에노피롤-알라닌으로 완전히 대체했다고 보고했다.[25]
2016년, 최초의 안정적인 반합성 유기체가 생성되었다. 그것은 두 개의 합성 염기(X와 Y로 불림)를 가진 (단일 세포) 박테리아였다. 이 염기들은 세포 분열에서 살아남았다.[26][27]
2017년, 대한민국 연구진은 비천연 아미노산을 가진 단백질을 생산할 수 있는 확장된 유전 부호를 가진 쥐를 개발했다고 보고했다.[28]
2019년 5월, 연구자들은 새로운 "Syn61" 균주의 세균 ''대장균''의 생성을 보고했다. 이 균주는 완전히 합성된 게놈을 가지고 있으며, 재구성(모든 중첩 확장), 재코딩(64개 코돈 중 3개의 사용을 완전히 제거), 그리고 이제 불필요해진 tRNA와 방출 인자를 제거하도록 추가로 수정되었다. 그것은 완전히 생존 가능하며, 야생형 대응 균주 "MDS42"보다 1.6배 느리게 성장한다.[29][30]
일부 단백질에서는 메신저 RNA의 관련 신호 서열에 따라 표준 종결 코돈 대신 비표준 아미노산이 대체된다. 예를 들어, UGA는 셀레노시스테인을, UAG는 피롤리신을 암호화할 수 있다. 셀레노시스테인은 21번째 아미노산으로, 피롤리신은 22번째 아미노산으로 여겨지게 되었다.[55] 셀레노시스테인과 피롤리신은 모두 동일한 유기체에 존재할 수 있다.[55] 유전 부호는 일반적으로 유기체 내에서 고정되어 있지만, 고세균 원핵생물인 ''아세토할로비움 아라바티쿰''(Acetohalobium arabaticum)은 다른 성장 조건에서 유전 부호를 20개에서 21개 아미노산(피롤리신 포함)으로 확장할 수 있다.[56]
6. 2. 유전 부호 변이
광범위한 학술적 관점에서, 원래 모호했던 유전 부호가 20(+2)개의 표준 아미노산 레퍼토리를 가진 잘 정의된("고정된") 부호로 진화했다는 개념은 널리 받아들여지고 있다.[20] 그러나 실험적으로 이를 변경하는 최선의 방법에 대한 다양한 의견, 개념, 접근 방식 및 아이디어가 존재한다. 심지어 합성 아미노산이 유전 부호에 침투할 수 있는 "진입점"을 예측하는 모델도 제안되었다.[21]2001년 이후, 독특한 코돈(재코딩)과 그에 상응하는 운반 RNA:아미노아실-tRNA 합성효소 쌍을 생성하여 40개의 비천연 아미노산을 단백질에 추가하여 다양한 물리화학적 및 생물학적 특성을 코딩함으로써 단백질 구조와 기능을 탐구하거나 새롭거나 향상된 단백질을 생성하는 도구로 사용하고 있다.[22][23]
H. 무라카미와 M. 시시도는 일부 코돈을 확장하여 4개 및 5개의 염기를 갖도록 했다. 스티븐 A. 베너는 기능적인 65번째 (''생체 내'') 코돈을 구성했다.[24]
2015년 N. 부디사, D. 쉔과 동료들은 박테리아 ''대장균''의 유전 부호에서 모든 20,899개의 트립토판 잔기(UGG 코돈)를 비천연 티에노피롤-알라닌으로 완전히 대체했다고 보고했다.[25]
2016년, 최초의 안정적인 반합성 유기체가 생성되었다. 그것은 두 개의 합성 염기(X와 Y로 불림)를 가진 (단일 세포) 박테리아였다. 이 염기들은 세포 분열에서 살아남았다.[26][27]
2017년, 대한민국 연구진은 비천연 아미노산을 가진 단백질을 생산할 수 있는 확장된 유전 부호를 가진 쥐를 개발했다고 보고했다.[28]
2019년 5월, 연구자들은 새로운 "Syn61" 균주의 세균 ''대장균''의 생성을 보고했다. 이 균주는 완전히 합성된 게놈을 가지고 있으며, 재구성(모든 중첩 확장), 재코딩(64개 코돈 중 3개의 사용을 완전히 제거), 그리고 이제 불필요해진 tRNA와 방출 인자를 제거하도록 추가로 수정되었다. 그것은 완전히 생존 가능하며, 야생형 대응 균주 "MDS42"보다 1.6배 느리게 성장한다.[29][30]
일부 단백질에서는 메신저 RNA의 관련 신호 서열에 따라 표준 종결 코돈 대신 비표준 아미노산이 대체된다. 예를 들어, UGA는 셀레노시스테인을, UAG는 피롤리신을 암호화할 수 있다. 셀레노시스테인은 21번째 아미노산으로, 피롤리신은 22번째 아미노산으로 여겨지게 되었다.[55] 셀레노시스테인과 피롤리신은 모두 동일한 유기체에 존재할 수 있다.[55] 유전 부호는 일반적으로 유기체 내에서 고정되어 있지만, 고세균 원핵생물인 ''아세토할로비움 아라바티쿰''(Acetohalobium arabaticum)은 다른 성장 조건에서 유전 부호를 20개에서 21개 아미노산(피롤리신 포함)으로 확장할 수 있다.[56]

원래 유전 부호는 보편적이어야 한다는 간단하고 널리 받아들여진 주장이 있었다. 즉, 유전 부호의 변이는 유기체에 치명적일 것이라는 것이다(크릭은 바이러스가 예외라고 언급했지만). 이것은 유전 부호의 보편성에 대한 "고정된 사고" 논쟁으로 알려져 있다. 그러나 1968년 유전 부호의 기원에 대한 그의 획기적인 논문에서 프랜시스 크릭은 모든 유기체의 유전 부호의 보편성은 입증되지 않은 가정이며, 어떤 경우에는 사실이 아닐 것이라고 언급했다. 그는 "코드는 보편적(모든 유기체에서 동일)이거나 거의 그렇다"고 예측했다.[57] 첫 번째 변이는 1979년 인간 미토콘드리아 유전자를 연구하는 연구자들에 의해 발견되었다.[58] 그 이후로 다양한 약간의 변종이 발견되었으며,[64] 다양한 대체 미토콘드리아 코드를 포함한다.[59] 이러한 작은 변종은 예를 들어 ''미코플라스마'' 종에서 코돈 UGA를 트립토판으로 번역하고 "CTG 클레이드"의 효모(예: ''칸디다 알비칸스'')에서 CUG를 류신 대신 세린으로 번역하는 것을 포함한다.[60][61][62] 바이러스는 숙주와 동일한 유전 부호를 사용해야 하므로 표준 유전 부호의 수정은 바이러스 단백질 합성 또는 기능에 간섭할 수 있다. 그러나 토티바이러스와 같은 바이러스는 숙주의 유전 부호 수정에 적응했다.[63] 세균과 고세균에서 GUG와 UUG는 일반적인 개시 코돈이다. 드문 경우지만, 특정 단백질은 대체 개시 코돈을 사용할 수 있다.[64]
놀랍게도 유전 부호 해석의 변이는 인간 핵-암호화 유전자에서도 존재한다. 2016년, 말산 탈수소 효소의 번역을 연구하는 연구자들은 이 효소를 암호화하는 mRNA의 약 4%에서 종결 코돈이 아미노산 트립토판과 아르기닌을 암호화하는 데 자연적으로 사용된다는 것을 발견했다.[65] 이러한 유형의 재코딩은 높은 판독 종결 코돈 문맥에 의해 유도되며[66] 이는 ''기능적 번역 리드스루''라고 한다.[67]
이러한 차이점에도 불구하고 알려진 모든 자연 발생 코드는 매우 유사하다. 코딩 메커니즘은 모든 유기체에서 동일하다. 즉, 3개의 염기 코돈, tRNA, 리보솜, 단일 방향 판독 및 단일 코돈을 단일 아미노산으로 번역한다.[68] 가장 극단적인 변이는 mRNA 내 위치에 따라 종결 코돈의 의미가 달라지는 특정 섬모충에서 발생한다. 3' 말단에 가까울 때는 터미네이터 역할을 하는 반면 내부 위치에서는 ''콘딜로스토마''처럼 아미노산을 암호화하거나[69] ''유플로테스''처럼 리보솜 프레임 시프트를 유발한다.[70]
유전 부호의 기원과 변이, 유전 부호의 진화 가능성 뒤에 있는 메커니즘을 포함하여 광범위하게 연구되었으며,[71][72] 일부 연구에서는 일부 유기체의 유전 부호를 실험적으로 진화시켰다.[73][74][75][76]
생물이 사용하는 변형된 유전 부호는 해당 게놈에 암호화된 고도로 보존된 유전자를 식별하고, 다른 생물의 상동 단백질에 있는 아미노산과 코돈 사용법을 비교하여 추론할 수 있다. 예를 들어, 프로그램 FACIL은 상동 단백질 도메인에서 어떤 아미노산이 모든 코돈에 가장 자주 정렬되는지 검색하여 유전 부호를 추론한다. 각 코돈에 대한 결과 아미노산(또는 종결 코돈) 확률은 유전 부호 로고에 표시된다.[77]
2022년 1월 현재, 유전 부호에 대한 가장 완벽한 조사는 Shulgina와 Eddy가 Codetta 도구를 사용하여 250,000개의 원핵생물 게놈을 스크리닝한 것이다. 이 도구는 더 큰 Pfam 데이터베이스를 사용하여 FACIL과 유사한 접근 방식을 사용한다. NCBI에서 이미 27개의 번역 표를 제공하고 있음에도 불구하고, 저자들은 5개의 새로운 유전 부호 변형을 발견하고(tRNA 돌연변이로 확인), 여러 오귀속을 수정할 수 있었다.[78] Codetta는 나중에 섬모충에서 유전 부호 변화를 분석하는 데 사용되었다.[79]
7. 유전 부호의 기원
단백질이 어떻게 암호화되는지를 이해하려는 노력은 1953년 DNA 구조가 발견된 이후 시작되었다. 주요 발견자인 영국의 생물물리학자 프랜시스 크릭과 미국의 생물학자 제임스 왓슨은 케번디시 연구소에서 함께 연구하면서 정보가 DNA에서 흐르고 DNA와 단백질 사이에 연관성이 있다는 가설을 세웠다.[2] 소련계 미국인 물리학자 조지 가모프는 DNA로부터 단백질을 합성하는 실현 가능한 방식을 처음으로 제시했다.[3] 그는 생명체가 단백질을 만드는 데 사용하는 20개의 표준 아미노산을 암호화하기 위해 3개의 염기 세트(트리플렛)를 사용해야 한다고 가정했는데, 이를 통해 최대 43 = 64개의 아미노산을 암호화할 수 있었다.[4] 그는 이 DNA-단백질 상호작용(원래의 유전 부호)을 "다이아몬드 코드"라고 명명했다.[5]
1954년 왓슨의 제안에 따라 가모프는 RNA 타이어 클럽(RNA Tie Club)이라는 비공식 과학 조직을 만들었는데, 이는 유전자로부터 단백질이 어떻게 합성되는지에 관심 있는 다양한 성향의 과학자들을 위한 모임이었다.[6]
이 클럽의 첫 번째 과학적 기여는 프랜시스 크릭에 의해 이루어졌는데, 1955년 1월 "퇴화된 템플릿과 어댑터 가설에 관하여: RNA 타이어 클럽을 위한 노트"(On Degenerate Templates and the Adaptor Hypothesis: A Note for the RNA Tie Club)라는 제목의 논문을 발표했다. 이 가설은 트리플렛 코드가 아미노산으로 전달되는 것이 아니라 아미노산과 상호 작용하는 다른 분자인 어댑터에 의해 전달된다고 주장한다.[8] 이 어댑터는 나중에 tRNA로 밝혀졌다.[11]
프랜시스 크릭, 시드니 브레너 등의 실험은 처음으로 코돈이 세 개의 DNA 염기로 구성되어 있음을 보여주었다.
마셜 니렌버그와 J. 하인리히 마테이는 1961년에 코돈의 성질을 처음으로 밝혀냈다.[12] 그들은 무세포 시스템을 사용하여 폴리-우라실 RNA 서열(즉, UUUUU...)을 번역했고, 합성한 폴리펩타이드가 아미노산 페닐알라닌으로만 구성되어 있다는 것을 발견했다.[13] 그들은 UUU 코돈이 아미노산 페닐알라닌을 지정한다는 것을 추론했다.
이어서 세베로 오초아의 연구실에서 수행된 실험에서 폴리-아데닌 RNA 서열(AAAAA...)이 폴리-라이신[14] 폴리펩타이드를 암호화하고, 폴리-시토신 RNA 서열(CCCCC...)이 폴리-프롤린[15] 폴리펩타이드를 암호화한다는 것을 입증했다. 따라서 AAA 코돈은 아미노산 라이신을 지정하고, CCC 코돈은 아미노산 프롤린을 지정했다. 다양한 공중합체를 사용하여 나머지 코돈의 대부분이 결정되었다.
이어진 하 고빈드 코라나의 연구를 통해 유전 코드의 나머지가 밝혀졌다. 그 직후, 로버트 W. 홀리는 RNA를 단백질로 번역하는 과정을 촉진하는 어댑터 분자인 전령 RNA (tRNA)의 구조를 밝혀냈다. 이 연구는 오초아의 이전 연구를 기반으로 했으며, 오초아는 1959년 RNA 합성에 대한 효소학 연구로 노벨 생리학·의학상을 받았다.[16]
이 연구를 확장하여 니렌버그와 필립 레더는 코드의 삼중항 특성을 밝히고 코돈을 해독했다. 레더와 니렌버그는 실험에서 64개의 코돈 중 54개의 서열을 결정할 수 있었다.[17] 코라나, 홀리, 니렌버그는 이 연구로 1968년 노벨상을 받았다.[18]
유전 부호는 생명 역사의 핵심 부분이며, RNA 세계 가설에 따르면 유전 부호의 출현에 대한 모든 모델은 세포 내 주요 효소로서 리보자임(RNA 효소)에서 단백질로의 전이 모델과 밀접하게 관련되어 있다. RNA 세계 가설에 따라, 전이 RNA 분자는 현대적인 아미노아실-tRNA 합성효소보다 먼저 진화한 것으로 보이며, 따라서 후자는 패턴에 대한 설명의 일부가 될 수 없다.[80]
유전 부호의 기원에 대한 세 가지 주요 가설은 다음과 같다.[88]
- 무작위 고정: 유전 부호는 무작위로 생성되었다.
- 입체 화학적 친화성: 유전 부호는 각 아미노산과 코돈 또는 안티코돈 사이의 높은 친화성의 결과이다.
- 최적성: 유전 부호는 초기 생성 이후에도 계속 진화하여 현재 코드가 일부 적합도 함수, 일반적으로 일종의 오류 최소화를 최대화한다.
8. 각주
[2][3][4][5][6][7][8][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][40][32][33][34][35][36][37][38][39][41][42][43][44][45][46][47][48][49][50][51][52][53][54][55][56][77][57][58][64][59][60][61][62][63][65][66][67][68][69][70][71][72][73][74][75][76][78][79][80][81][82][83][84][85][86][87][88][89][90][94][91][92][93][95][96][97][98][99][100][101][102][103][104][105][106][107][108][109][110][111]
참조
[1]
논문
Genetic code supports targeted insertion of two amino acids by one codon
2009-01
[2]
논문
Genetical implications of the structure of deoxyribonucleic acid
https://pubmed.ncbi.[...]
1953-05-30
[3]
논문
"'Genetic Coding' Reconsidered: An Analysis of Actual Usage"
2016-09-01
[4]
서적
What Mad Pursuit: A Personal View of Scientific Discovery
Basic Books
1990-07-10
[5]
논문
Computing Science: The Invention of the Genetic Code
https://www.jstor.or[...]
1998
[6]
논문
Martynas Yčas: The "Archivist" of the RNA Tie Club
https://doi.org/10.1[...]
2019-03-01
[7]
웹사이트
Francis Crick - Profiles in Science Search Results
https://profiles.nlm[...]
2022-07-21
[8]
논문
Crick's Adaptor Hypothesis and the Discovery of Transfer RNA: Experiment Surpassing Theoretical Prediction
https://journals.pub[...]
2022
[9]
웹사이트
On Degenerate Templates and the Adaptor Hypothesis: A Note for the RNA Tie Club
https://collections.[...]
2022-07-21
[10]
서적
Avoid Boring People: Lessons from a Life in Science
https://books.google[...]
Oxford University Press
2007
[11]
논문
tRNA--the golden standard in molecular biology
https://pubmed.ncbi.[...]
2016
[12]
논문
Establishing the Triplet Nature of the Genetic Code
2007-03-09
[13]
논문
The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polyribonucleotides
1961-10
[14]
논문
Synthetic polynucleotides and the amino acid code. VII
1962-12
[15]
논문
Synthetic polynucleotides and the amino acid code. VIII
1963-01
[16]
간행물
The Nobel Prize in Physiology or Medicine 1959
http://nobelprize.or[...]
The Royal Swedish Academy of Science
1959
[17]
논문
RNA codewords and protein synthesis, VII. On the general nature of the RNA code
1965-05
[18]
간행물
The Nobel Prize in Physiology or Medicine 1968
http://nobelprize.or[...]
The Royal Swedish Academy of Science
1968
[19]
논문
The genome of bacteriophage T4: an archeological dig
2004-10
[20]
서적
The book at the Wiley Online Library
2005-12-23
[21]
논문
Synthetic alienation of microbial organisms by using genetic code engineering: Why and how?
[22]
논문
Adding amino acids to the genetic repertoire
2005-12
[23]
논문
Expanding the genetic code for biological studies
2009-03
[24]
서적
Emergent Computation: Emphasizing Bioinformatics
https://google books[...]
Springer Science & Business Media
2005-01-07
[25]
논문
Chemical evolution of a bacterial proteome
[26]
웹사이트
First stable semisynthetic organism created {{!}} KurzweilAI
http://www.kurzweila[...]
2017-02-09
[27]
논문
A semisynthetic organism engineered for the stable expansion of the genetic alphabet
2017-02
[28]
논문
Expanding the genetic code of Mus musculus
2017-02
[29]
뉴스
Scientists Created Bacteria With a Synthetic Genome. Is This Artificial Life? - In a milestone for synthetic biology, colonies of E. coli thrive with DNA constructed from scratch by humans, not nature.
https://www.nytimes.[...]
2019-05-15
[30]
논문
Total synthesis of Escherichia coli with a recoded genome
2019-05-15
[31]
문서
Homo sapiens mitochondrion, complete genome.
https://www.ncbi.nlm[...]
"[[National Center for Biotechnology Information]]"
[32]
논문
Generation of protein isoform diversity by alternative initiation of translation at non-AUG codons
2003
[33]
웹사이트
How nonsense mutations got their names
http://www.sci.sdsu.[...]
San Diego State University
2003-11-29
[34]
문서
References for the image are found in Wikimedia Commons page at: [[Commons:File:Notable mutations.svg#References]].
[35]
서적
An Introduction to Genetic Analysis
W. H. Freeman
2000
[36]
간행물
Lesion (in)tolerance reveals insights into DNA replication fidelity
2004-04
[37]
간행물
ALS: A disease of motor neurons and their nonneuronal neighbors
[38]
간행물
beta 0 thalassemia, a nonsense mutation in man
1979-06
[39]
간행물
ALS: a disease of motor neurons and their nonneuronal neighbors
2006-10
[40]
서적
A Dictionary of Genetics
https://books.google[...]
OUP USA
2013-01-10
[41]
간행물
Two novel frameshift mutations causing premature stop codons in a patient with the severe form of Maroteaux-Lamy syndrome
1996
[42]
간행물
How much do we know about spontaneous human mutation rates?
1993
[43]
서적
Human Genetics: Concepts and Applications
McGraw Hill
2005
[44]
간행물
Prevalence of positive selection among nearly neutral amino acid replacements in Drosophila
2007-04
[45]
간행물
Malaria and the Red Cell
http://sickle.bwh.ha[...]
2002
[46]
간행물
Mutation rates among RNA viruses
1999-11
[47]
간행물
Rapid evolution of RNA genomes
1982-03
[48]
간행물
Clonal interference and the periodic selection of new beneficial mutations in Escherichia coli
2006-04
[49]
서적
Molecular Biology of the Gene
https://books.google[...]
Pearson/Benjamin Cummings
[50]
서적
Reaction centers of photosynthetic bacteria: Feldafing-II-Meeting
https://books.google[...]
Springer-Verlag
[51]
문서
Genetic Algorithms and Recursive Ensemble Mutagenesis in Protein Engineering
1994
[52]
간행물
Global importance of RNA secondary structures in protein coding sequences
[53]
웹사이트
Codon Usage Frequency Table(chart)-Genscript
https://www.genscrip[...]
2022-02-04
[54]
웹사이트
Codon usage table
http://www.kazusa.or[...]
[55]
간행물
Pyrrolysine and selenocysteine use dissimilar decoding strategies
http://digitalcommon[...]
2005-05
[56]
간행물
Carbon source-dependent expansion of the genetic code in bacteria
2012-12
[57]
문서
The Origin of the Genetic Code
1968
[58]
간행물
A different genetic code in human mitochondria
https://www.ncbi.nlm[...]
1979
[59]
간행물
The genetic code in mitochondria and chloroplasts
1990-12
[60]
간행물
A fungal phylogeny based on 42 complete genomes derived from supertree and combined gene analysis
2006-01-01
[61]
간행물
The CUG codon is decoded in vivo as serine and not leucine in Candida albicans
1995-05
[62]
간행물
Evolution of pathogenicity and sexual reproduction in eight Candida genomes
2009-06
[63]
간행물
Virus-host co-evolution under a modified nuclear genetic code
2013
[64]
웹사이트
The Genetic Codes
https://www.ncbi.nlm[...]
National Center for Biotechnology Information (NCBI)
2008-04-07
[65]
간행물
The functional readthrough extension of malate dehydrogenase reveals a modification of the genetic code
2016
[66]
간행물
Peroxisomal lactate dehydrogenase is generated by translational readthrough in mammals
2014
[67]
간행물
Functional Translational Readthrough: A Systems Biology Perspective
2016
[68]
간행물
On universal coding events in protein biogenesis
2018-02
[69]
간행물
Novel Ciliate Genetic Code Variants Including the Reassignment of All Three Stop Codons to Sense Codons in ''Condylostoma magnum''
2016-11
[70]
간행물
Position-dependent termination and widespread obligatory frameshifting in ''Euplotes'' translation
2017-01
[71]
논문
Origin and Evolution of the Genetic Code: The Universal Enigma
2009-02
[72]
논문
Pathways of Genetic Code Evolution in Ancient and Modern Organisms
2015-06
[73]
논문
A chemical toolkit for proteins--an expanded genetic code
2006-08
[74]
논문
Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome
2010-03
[75]
논문
Adding new chemistries to the genetic code
2010
[76]
논문
Expanding and reprogramming the genetic code of cells and animals
2014-02
[77]
논문
FACIL: Fast and Accurate Genetic Code Inference and Logo
2011-07
[78]
논문
A computational screen for alternative genetic codes in over 250,000 genomes.
2021-11-09
[79]
논문
Stop or Not: Genome-Wide Profiling of Reassigned Stop Codons in Ciliates.
2023-04-04
[80]
논문
Genetic code origins: tRNAs older than their synthetases?
1998-09
[81]
서적
Life from an RNA World: The Ancestor Within
https://books.google[...]
Harvard University Press
[82]
웹사이트
Mathematica function for # possible arrangements of items in bins? – Online Technical Discussion Groups—Wolfram Community
http://community.wol[...]
2017-02-03
[83]
논문
The genetic code is one in a million
1998-09
[84]
논문
The code within the codons
1989
[85]
논문
The extension reached by the minimization of the polarity distances during the evolution of the genetic code
1989-10
[86]
논문
Role of minimization of chemical distances between amino acids in the evolution of the genetic code
1980-02
[87]
논문
A model of proto-anti-codon RNA enzymes requiring L-amino acid homochirality
2011-08
[88]
논문
Early fixation of an optimal genetic code
2000-04
[89]
논문
The origin of the genetic code
1968-12
[90]
논문
Origin of the genetic code: a testable hypothesis based on tRNA structure, sequence, and kinetic proofreading
1978
[91]
논문
What Would an Alien Amino Acid Alphabet Look Like and Why?
2023-04-05
[92]
논문
Selection, history and chemistry: the three faces of the genetic code
https://www.scienced[...]
1999-06
[93]
논문
Rhyme or reason: RNA-arginine interactions and the genetic code
1998-09
[94]
논문
RNA-amino acid binding: a stereochemical era for the genetic code
2009-11
[95]
논문
Pathways of genetic code evolution in ancient and modern organisms
[96]
논문
Evolution of amino acid frequencies in proteins over deep time: inferred order of introduction of amino acids into the genetic code
2002-10
[97]
논문
An analysis of the metabolic theory of the origin of the genetic code
1997-05
[98]
논문
Testing a biosynthetic theory of the genetic code: fact or artifact?
2000-12
[99]
논문
The origin of the genetic code and of the earliest oligopeptides
https://linkinghub.e[...]
2009-09
[100]
논문
A Thermodynamic Basis for Prebiotic Amino Acid Synthesis and the Nature of the First Genetic Code
http://www.liebertpu[...]
2009-06
[101]
논문
The complex evolutionary history of aminoacyl-tRNA synthetases
2017-02-17
[102]
논문
Low complexity regions in the proteins of prokaryotes perform important functional roles and are highly conserved
2019-11-04
[103]
논문
The case for an error minimizing standard genetic code
2003-10
[104]
논문
Codon size reduction as the origin of the triplet genetic code
2009
[105]
논문
A model for the emergence of the genetic code as a transition in a noisy information channel
2007-11
[106]
서적
Evolving genes and proteins
Academic Press
1965
[107]
논문
Rate-distortion scenario for the emergence and evolution of noisy molecular codes
2008-02
[108]
논문
The coevolution of genes and genetic codes: Crick's frozen accident revisited
2006-09
[109]
논문
A colorful origin for the genetic code: information theory, statistical mechanics and the emergence of molecular codes
2010-09
[110]
논문
What can information-asymmetric games tell us about the context of Crick's 'frozen accident'?
2013-11
[111]
논문
The genetic code is nearly optimal for allowing additional information within protein-coding sequences
2007
[112]
서적
분자생물학
월드사이언스
[113]
서적
What Mad Pursuit: A Personal View of Scientific Discovery
Basic Books
1990-07-10
[114]
서적
생명 생물의 과학
교보문고
2008
[115]
웹사이트
Transfer RNA Structure
http://www.pdb.org/p[...]
[116]
서적
생명 과학
동화기술
2007
[117]
간행물
과학동아 2001년 9월호
동아사이언스
2001-09
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com