단백질의 구조
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
단백질의 구조는 단백질을 구성하는 아미노산의 배열, 즉 1차 구조를 시작으로 2차, 3차, 4차 구조로 이뤄지며 단백질의 기능과 밀접한 관련이 있다. 아미노산은 펩타이드 결합을 통해 연결되며, 2차 구조는 수소 결합 패턴에 의해, 3차 구조는 소수성 상호작용과 같은 비공유 결합에 의해, 4차 구조는 여러 폴리펩타이드 사슬 간의 상호 작용에 의해 결정된다. 단백질은 끊임없이 형태를 변화시키며, 이러한 동역학은 단백질의 기능과 관련이 있다. 단백질 구조는 엑스선 결정법, 핵 자기 공명 등을 통해 결정되며, 단백질 서열로부터 구조를 예측하는 연구도 진행되고 있다.
더 읽어볼만한 페이지
| 단백질의 구조 | |
|---|---|
| 개요 | |
| 정의 | 아미노산 사슬 분자 내 원자의 3차원 배열 |
| 구조 단계 | |
| 1차 구조 | 아미노산 서열 |
| 2차 구조 | 알파 나선, 베타 병풍 구조 등 국소적인 구조 모티프 |
| 3차 구조 | 단백질 전체의 3차원 형태 |
| 4차 구조 | 여러 단백질 서브 유닛의 배열 (단백질 복합체) |
| 구조 결정 방법 | |
| 실험적 방법 | X선 결정학 NMR 분광법 저온 전자 현미경(Cryo-EM) |
| 계산적 방법 | 단백질 구조 예측 분자 동역학 |
| 중요성 | |
| 기능 | 단백질 기능은 구조에 의해 결정됨 |
| 질병 | 단백질 잘못 접힘은 여러 질병과 관련됨 |
2. 단백질 구조의 기본 구성
단백질은 생명 활동에 필수적인 고분자 화합물로, 다양한 기능을 수행한다. 이러한 단백질을 이루는 가장 기본적인 단위는 아미노산이다. 약 20여 종류의 아미노산이 펩타이드 결합이라는 화학 결합을 통해 서로 길게 연결되어 폴리펩타이드 사슬을 형성한다. 이 폴리펩타이드 사슬이 특정한 3차원 구조로 접히면서 비로소 고유한 기능을 가진 단백질이 완성된다. 따라서 단백질의 구조와 기능은 구성 아미노산의 종류와 배열 순서, 그리고 이들이 만들어내는 입체 구조에 의해 결정된다. 아미노산의 구체적인 구조와 펩타이드 결합의 특징은 이어지는 하위 섹션에서 더 자세히 다룬다.
2. 1. 아미노산
단백질을 구성하는 기본 단위인 아미노산은 중심 탄소 원자(Cα)에 아미노기(-NH₂), 카복실기(-COOH), 수소 원자(-H), 그리고 각각의 아미노산마다 다른 구조를 가지는 곁사슬(-R)이 결합된 형태이다. 자연에는 20여 종의 표준 아미노산이 존재하며, 이들은 곁사슬의 화학적 특성에 따라 다양한 성질을 나타낸다.단백질 내에서 아미노산들은 펩타이드 결합을 통해 서로 연결되어 폴리펩타이드 사슬을 형성한다. 이 과정에서 물 분자 하나가 빠져나가기 때문에, 단백질 구조를 이야기할 때는 개별 아미노산보다는 '아미노산 잔기(residue)'라는 용어를 사용하는 것이 더 정확하다.
아미노산 곁사슬의 원자들은 중심 탄소(Cα)에서부터 순서대로 α, β, γ, δ, ε 등의 그리스 문자 기호를 사용하여 구분한다. 예를 들어, Cβ는 Cα 다음, 즉 곁사슬에서 두 번째 탄소 원자를 의미한다. Cα는 일반적으로 단백질의 주쇄(backbone)의 일부로 간주된다. 곁사슬 내 원자들 사이의 결합 각도, 특히 이면각(dihedral angle)은 X1(Cα-Cβ 회전), X2(Cβ-Cγ 회전) 등으로 표기하며, 이는 곁사슬의 전체적인 입체 배좌(conformation)를 결정하는 중요한 요소이다. 곁사슬은 고슈형(gauche)이나 트랜스형(trans)과 같은 특정 입체 배좌를 선호하며, 원자 간의 충돌을 피하기 위해 특정 결합(예: X2) 주위에서는 비틀린 배좌(staggered conformation)를 취하는 경향이 있다.
2. 2. 펩타이드 결합
아미노산들은 축합 반응을 통해 서로 연결되는데, 이 과정에서 물 분자 하나가 빠져나온다 (탈수 반응).[3][4] 이 반응이 반복되면 긴 사슬 형태의 폴리펩타이드 사슬이 만들어진다. 아미노산 사이의 이렇게 형성된 결합을 펩타이드 결합이라고 부른다. 이 결합 과정은 세포 내 리보솜이라는 효소 복합체에 의해 촉매되며, 번역 과정의 일부이다. 펩타이드 결합은 단백질의 1차 구조, 즉 아미노산 서열을 유지하는 기본적인 연결 고리 역할을 한다.
펩타이드 결합은 전자의 비편재화(공명 구조) 때문에 부분적인 이중 결합의 성격을 가지며, 이로 인해 결합 주변 원자들이 거의 한 평면 위에 놓이는 평면 구조를 이룬다. 이 평면성 때문에 펩타이드 결합 자체(C1-N 결합)는 회전이 제한된다. 펩타이드 결합의 이면각 ω (C1-N 결합 기준)는 거의 180°로 고정되어 평면 형태를 유지한다.
그러나 펩타이드 결합 양옆의 다른 단일 결합들, 즉 N-Cα 결합(이면각 φ)과 Cα-C1 결합(이면각 ψ)은 비교적 자유롭게 회전할 수 있다. 이 두 각도(φ와 ψ)의 조합은 단백질 사슬이 접히는 방식, 즉 단백질의 3차 구조를 결정하는 중요한 요소이다. 하지만 이 각도들도 아미노산 곁사슬의 크기나 전하 등에 의해 특정 범위 내에서만 회전이 가능하며, 이는 라마찬드란 도표를 통해 시각적으로 확인할 수 있다.
몇 가지 중요한 결합 길이는 다음과 같다.
| 펩타이드 결합 | 평균 길이 | 단일 결합 | 평균 길이 | 수소 결합 | 평균 (±30) |
|---|---|---|---|---|---|
| Cα - C | 153 pm | C - C | 154 pm | O-H --- O-H | 280 pm |
| C - N | 133 pm | C - N | 148 pm | N-H --- O=C | 290 pm |
| N - Cα | 146 pm | C - O | 143 pm | O-H --- O=C | 280 pm |
3. 단백질 구조의 단계

단백질의 구조는 일반적으로 네 가지 단계 또는 수준으로 구분하여 이해한다. 각 단계는 이전 단계의 구조를 바탕으로 더 복잡한 입체 구조를 형성한다.
이러한 구조 단계 외에도, 단백질은 기능을 수행하는 과정에서 구조가 변하기도 한다. 구조 변화 전후의 3차 구조나 4차 구조는 서로 이성질체 관계에 있을 수 있다.
3. 1. 1차 구조
단백질의 1차 구조는 폴리펩타이드 사슬에서 아미노산들이 배열된 순서, 즉 아미노산 서열을 말한다.[3][4] 이 서열은 단백질 생합성 과정에서 아미노산들이 펩타이드 결합으로 연결되면서 형성된다. 폴리펩타이드 사슬의 양쪽 끝은 각각 자유로운 작용기의 종류에 따라 아미노 말단(N-말단)과 카르복시 말단(C-말단)이라고 부른다. 아미노산 잔기의 순서를 셀 때는 보통 아미노기(NH2)가 펩타이드 결합에 참여하지 않은 끝인 N-말단부터 시작한다.
단백질의 1차 구조는 해당 단백질의 정보를 담고 있는 유전자에 의해 결정된다. DNA의 특정 뉴클레오타이드 서열 정보는 전사 과정을 통해 mRNA로 옮겨지고, 이 mRNA 정보는 리보솜에서 번역 과정을 거쳐 아미노산 서열로 해독된다. 단백질마다 고유한 아미노산 서열을 가지며, 이 서열이 단백질의 입체 구조와 고유한 기능을 결정하는 기본 바탕이 된다.
단백질이 특정 아미노산 서열을 가지고 있다는 사실은 프레더릭 생어가 인슐린의 아미노산 서열을 최초로 밝혀내면서 증명되었다.[3][4] 단백질의 아미노산 서열은 에드만 분해나 탠덤 질량 분석법과 같은 실험적인 방법을 통해 직접 알아낼 수 있다. 또한, 해당 단백질의 유전자 염기 서열 정보를 알고 있다면 유전 암호를 이용해 아미노산 서열을 예측할 수도 있다.
펩타이드 결합이 형성될 때는 물 분자 하나가 빠져나오는 탈수 축합 반응이 일어나므로, 단백질을 구성하는 기본 단위를 지칭할 때는 '아미노산'보다는 '아미노산 잔기'라는 용어를 사용하는 것이 더 정확하다.
번역 후 변형은 단백질이 만들어진 후에 추가적으로 일어나는 화학적 변형을 말하며, 대표적으로 인산화나 당화 등이 있다. 이러한 번역 후 변형 역시 단백질의 1차 구조의 일부로 간주되지만, 유전자 서열 정보만으로는 예측할 수 없다. 예를 들어, 인슐린은 총 51개의 아미노산 잔기로 구성되어 있는데, 이들은 각각 31개와 20개의 아미노산 잔기로 이루어진 두 개의 폴리펩타이드 사슬로 나뉘어 존재한다.
3. 2. 2차 구조

단백질의 2차 구조는 폴리펩타이드 골격 사슬 상에서 국소적으로 나타나는 매우 규칙적인 입체 구조를 의미한다. 주요 2차 구조로는 알파 나선(α-helix)과 베타 병풍(β-sheet) 구조가 있으며, 이들은 1951년 라이너스 폴링 등이 처음으로 제안하였다.[5][40] 이러한 2차 구조는 폴리펩타이드 주사슬의 펩타이드 결합에 있는 카보닐기(C=O)와 아미노기(N-H) 사이의 수소 결합 패턴에 의해 안정화된다.[48]
2차 구조는 라마찬드란 조사구에서 특정 이면각 ψ(프사이)와 φ(피) 값으로 제한되는 규칙적인 기하학적 형태를 가진다. 알파 나선과 베타 병풍 구조는 모두 펩타이드 골격에서 가능한 모든 수소 결합 공여체와 수용체를 포화시키는 방식으로 형성된다. 단백질 내에서 규칙적인 2차 구조를 형성하지 않는 부분도 존재하는데, 이는 고정된 3차원 구조가 없는 펼쳐진 폴리펩타이드 사슬인 무작위 코일(random coil)과는 구별되어야 한다.[6] 때로는 여러 개의 2차 구조가 모여 초이차 구조를 형성하기도 한다.[6]
2차 구조 내의 수소 결합은 주변 환경, 특히 물 분자와의 상호작용에 영향을 받을 수 있다. 물 분자와 아미드기 사이에도 수소 결합이 형성될 수 있기 때문에, 2차 구조는 일반적으로 단백질이 접히거나 구형 구조를 형성하는 등 주변 물의 농도가 충분히 낮은 환경에서 더 안정하게 유지된다.
3. 3. 3차 구조
단백질의 3차 구조는 단일 폴리펩타이드 사슬이 형성하는 3차원적인 입체 구조를 의미한다. 이는 하나 또는 여러 개의 단백질 도메인을 포함할 수 있다. 알파 나선 구조나 베타 병풍 구조와 같은 2차 구조들이 접혀서 전체적으로 콤팩트한 구형 구조를 이룬다.
이러한 단백질 접힘 과정은 주로 비특이적인 소수성 상호작용에 의해 추진되는데, 이는 소수성 아미노산 잔기들이 물 분자와의 접촉을 피해 단백질 내부로 숨으려는 경향 때문이다. 그러나 구조가 안정적으로 유지되기 위해서는 단백질 도메인의 특정 부분들이 염다리, 수소 결합, 아미노산 측쇄들의 빽빽한 포장, 그리고 이황화 결합과 같은 특이적인 3차 상호작용에 의해 제자리에 고정되어야 한다. 특히 이황화 결합은 세포질이 일반적으로 환원 환경이기 때문에 세포질 내에 존재하는 단백질에서는 드물게 발견된다.
3. 4. 4차 구조
단백질의 4차 구조는 둘 이상의 개별 폴리펩타이드 사슬(서브 유닛)이 모여 하나의 기능 단위(다량체)를 형성할 때 나타나는 3차원 구조이다.[49][7] 이 구조는 단백질의 3차 구조에서와 같이 비공유 결합이나 이황화 결합에 의해 안정화된다.[49][7]
둘 이상의 폴리펩타이드, 즉 여러 개의 서브 유닛이 결합한 복합체를 다량체(Oligomer)라고 부른다.[7] 다량체는 구성하는 서브 유닛의 수에 따라 이름이 붙여진다. 예를 들어, 서브 유닛이 2개면 이량체(dimer), 3개면 삼량체(trimer), 4개면 사량체(tetramer), 5개면 오량체(pentamer)라고 한다.[49][7] 서브 유닛들은 종종 대칭 연산과 관련되어 배열되기도 한다.[7]
다량체는 구성하는 서브 유닛의 종류에 따라 구분될 수도 있다. 모든 서브 유닛이 동일하면 '호모(homo)-'라는 접두사를 붙여 호모다량체(예: 호모사량체)라고 하고, 서로 다른 종류의 서브 유닛으로 구성되면 '헤테로(hetero)-'라는 접두사를 붙여 헤테로다량체(예: 헤테로이량체)라고 한다.[49][7] 대표적인 예로 헤모글로빈은 2개의 알파(α) 사슬과 2개의 베타(β) 사슬이라는 서로 다른 서브 유닛 4개로 구성된 헤테로사량체이다.[49][7]
모든 단백질이 여러 개의 서브 유닛으로 구성된 4차 구조를 가지는 것은 아니다. 어떤 단백질들은 하나의 폴리펩타이드 사슬만으로 이루어진 단량체(monomer) 상태로 기능을 수행한다.
4. 단백질 구조의 요소: 도메인, 모티프, 폴드
단백질은 종종 여러 구조 단위로 구성된 것으로 설명된다. 이러한 단위에는 도메인, 모티프, 그리고 폴드(fold)가 포함된다.
- 도메인: 단백질 전체 구조의 한 요소로, 그 자체로 안정화되고 다른 부분과는 독립적으로 접히는(폴딩) 단위를 말한다. 많은 도메인은 여러 종류의 단백질에서 공통적으로 발견된다.
- 모티프: 헬릭스-턴-헬릭스 구조와 같이 어느 정도 특이적인 2차 구조의 조합을 가리키며, 초이차 구조라고도 불린다.
- 폴드: 헬릭스 번들이나 베타 배럴처럼, 아미노산 서열이 공간적으로 배열된 유형을 의미한다.
진핵생물 시스템에서는 약 10만 개의 서로 다른 단백질이 발현되지만, 이러한 도메인, 구조 모티프, 폴드의 종류는 그보다 훨씬 적다. 이는 진화 과정에서 유전자의 일부가 게놈 내에서 중복되거나 위치가 바뀌면서, 특정 단백질의 도메인이 다른 단백질에도 도입되어 새로운 기능이 더해져 왔기 때문으로 생각된다. 이러한 과정을 거쳐 대사나 기능 발현에는 다수의 다양한 단백질이 관여하게 되었다.
4. 1. 단백질 도메인 (Domain)
단백질 도메인(Structural Domain)은 단백질 전체 구조의 한 요소로, 자체적으로 안정화되고 종종 단백질 사슬의 나머지 부분과 독립적으로 접히는 단위를 의미한다. 많은 도메인은 하나의 유전자 또는 유전자 패밀리의 단백질 산물에만 고유한 것이 아니라, 여러 다양한 단백질에 걸쳐 공통적으로 나타난다.
도메인은 종종 자신이 속한 단백질의 특정 생물학적 기능을 담당하기 때문에 그 기능에 따라 이름이 붙여지고 분류된다. 대표적인 예로 칼모듈린의 칼슘 결합 도메인을 들 수 있다. 도메인은 독립적으로 안정적인 구조를 형성하므로, 유전공학 기술을 이용해 한 단백질의 도메인을 다른 단백질로 옮겨 붙여 새로운 기능을 가진 키메라 단백질(융합 단백질)을 만들 수 있다.
때로는 서로 다른 단백질에서 발견되는 여러 도메인이 보존적인 조합을 이루어 하나의 단위처럼 함께 진화하기도 하는데, 이를 "슈퍼도메인"이라고 부른다. 예를 들어 단백질 티로신 포스파타아제 도메인과 C2 도메인의 조합이 있다.[10]
단백질은 종종 도메인 외에도 모티프, 폴드와 같은 여러 구조 단위로 구성된다. 진핵생물에서는 약 10만 종류의 단백질이 발현되지만, 도메인, 모티프, 폴드의 종류는 그보다 훨씬 적다. 이는 진화 과정에서 유전자의 일부가 유전체 내에서 중복되거나 위치가 바뀌면서 한 단백질의 도메인이 다른 단백질에 도입되어 새로운 기능이 추가되었기 때문으로 설명된다. 이러한 과정을 통해 대사나 다양한 생명 현상에 관여하는 복잡하고 다양한 단백질들이 만들어졌다.
4. 2. 구조 및 서열 모티프 (Motif)
구조 모티프와 서열 모티프는 여러 종류의 단백질에서 공통적으로 발견되는 3차원 구조 또는 아미노산 서열의 짧은 부분을 가리킨다.
초이차 구조(Supersecondary Structure)는 2차 구조 요소들이 특정하게 조합된 것을 의미하며, 예를 들어 β-α-β 단위체나 헬릭스-턴-헬릭스 모티프 등이 있다. 이러한 초이차 구조 중 일부는 구조 모티프라고도 불린다.
단백질은 종종 여러 구조 단위로 구성된 것으로 설명되는데, 여기에는 도메인, 모티프, 그리고 폴드가 포함된다. 진핵생물에서는 약 10만 종류의 서로 다른 단백질이 발현되지만, 도메인, 구조 모티프, 폴드의 종류는 이보다 훨씬 적다.
도메인은 단백질 전체 구조의 한 요소로, 스스로 안정화되고 다른 부분과는 독립적으로 접히는(폴딩) 특징을 가진다. 많은 도메인은 특정 유전자나 유전자 패밀리에서 만들어지는 단백질에만 국한되지 않고, 다양한 종류의 단백질에서 공통적으로 나타난다. 도메인은 종종 단백질의 생물학적 기능 수행에 중요한 역할을 하는데, 예를 들어 칼모듈린의 칼슘 결합 도메인이 대표적이다. 도메인은 스스로 안정화되기 때문에, 유전자 공학 기술을 이용해 한 단백질의 도메인을 다른 단백질에 이식하여 새로운 기능을 가진 키메라 단백질을 만들 수도 있다.
한편, 모티프는 헬릭스-턴-헬릭스 구조와 같이 특정 2차 구조 요소들의 조합을 가리키며, 초이차 구조라고도 불린다. 단백질 폴드는 헬릭스 번들이나 베타 배럴처럼 단백질 사슬이 공간적으로 배열된 유형을 의미한다. 도메인, 모티프, 폴드의 종류가 단백질 종류보다 훨씬 적은 것은 진화 과정에서 유전자의 일부가 게놈 내에서 복제되거나 위치를 바꾸면서 여러 단백질에 걸쳐 재사용되었기 때문이다. 이러한 과정을 통해 하나의 도메인이 다른 단백질에 도입되어 새로운 기능이 추가되었고, 결과적으로 대사나 생명 현상 조절에 다양한 단백질들이 복합적으로 관여하게 되었다.
4. 3. 단백질 폴드 (Fold)
단백질 폴드(Protein fold)는 폴리펩타이드 사슬이 접히면서 형성하는 특정한 3차원 구조 패턴 또는 일반적인 단백질 구조를 의미한다.[50][11] 예를 들어 알파 나선 다발, β-배럴, 로스만 폴드 등이 있으며, 단백질 구조 분류 데이터베이스에서 더 다양한 폴드 구조를 찾아볼 수 있다. 이와 관련된 개념으로 단백질 내 아미노산 잔기 간의 접촉 배열을 나타내는 단백질 토폴로지가 있다.[50]단백질은 종종 여러 구조 단위로 구성된 것으로 설명되는데, 여기에는 도메인, 모티프, 그리고 폴드가 포함된다.
- 도메인: 단백질 전체 구조의 일부이면서 그 자체로 안정화되고 다른 부분과 독립적으로 접히는 단위이다. 많은 도메인은 특정 유전자 패밀리에 국한되지 않고 여러 종류의 단백질에서 공통으로 발견되며, 칼모듈린의 칼슘 결합 도메인처럼 단백질의 생물학적 기능에 중요한 역할을 하는 경우가 많다. 독립적으로 안정하기 때문에 유전자 공학을 통해 다른 단백질에 이식하여 키메라 단백질을 만들 수도 있다.
- 모티프: 헬릭스-턴-헬릭스 구조와 같이 특정 기능을 가지는 이차 구조의 조합을 의미하며, 초이차 구조라고도 불린다.
- 폴드: 헬릭스 번들이나 베타 배럴처럼 아미노산 서열이 공간적으로 배열된 유형을 가리킨다.
진핵생물에서는 약 10만 종류의 단백질이 발현되지만, 도메인, 모티프, 폴드의 종류는 그보다 훨씬 적다. 이는 진화 과정에서 유전자의 일부가 게놈 내에서 중복되거나 위치가 바뀌면서 특정 단백질의 도메인이 다른 단백질에 도입되어 새로운 기능이 추가되었기 때문으로 생각된다. 이러한 과정을 통해 대사나 생명 활동에 필요한 다양한 기능들이 여러 단백질의 조합을 통해 구현될 수 있게 되었다.
5. 단백질 역학

단백질은 정적인 구조가 아니라 다양한 입체 구조 상태 사이를 끊임없이 변화하는 동적인 분자이다. 이러한 상태 간의 전환은 일반적으로 나노 규모에서 발생하며, 다른 자리 입체성 조절[52][12]이나 효소 촉매작용[53][13]과 같은 기능적으로 중요한 현상과 관련되어 있다. 단백질 동역학과 구조적 변화는 단백질이 세포 내에서 나노 크기의 생체 기계로 기능하게 하며, 종종 단백질 복합체 형태로 작용한다.[54][14]
대표적인 예로는 근육 수축을 담당하는 미오신과 같은 운동 단백질이 있다. 또한 미세소관을 따라 세포 핵에서 세포 내부로 화물을 이동시키는 키네신, 반대로 핵 방향으로 화물을 이동시키고 운동성 섬모와 편모의 축사 운동을 생성하는 다이닌 등이 단백질 역학을 활용하는 분자 기계의 예이다. 운동성 섬모는 600개 이상의 단백질로 구성된 복합체로, 이 중 다수는 독립적으로 기능하는 나노 기계이다. 유연한 링커로 연결된 이동성 단백질 도메인은 결합 파트너를 모집하고 단백질 도메인 동역학을 통해 장거리 알로스테리를 유도할 수 있다.[15]
단백질은 종종 비교적 안정적인 단백질 3차 구조를 가지며, 다른 단백질과의 상호작용이나 효소 활성의 일부로서 입체 구조 변화를 겪는다고 여겨진다. 그러나 모든 단백질이 안정적인 것은 아니며, 일부 덜 안정적인 변종은 내재적 무질서 단백질이다. 이러한 단백질은 특정한 단백질 3차 구조 없이 비교적 '무질서한' 상태로 존재하고 기능한다. 따라서 단일 고정된 구조로 설명하기 어렵다. 입체 구조 앙상블은 이러한 내재적 무질서 단백질의 다양한 입체 구조 상태를 보다 정확하고 '역동적인' 방식으로 표현하기 위해 고안되었다.[16][17]
단백질 앙상블 파일은 유연한 구조를 가질 수 있는 단백질을 표현하는 여러 구조의 집합이다. 이러한 파일을 생성하려면, 다양한 이론적으로 가능한 단백질 입체 구조 중에서 실제로 존재하는 것들을 결정해야 한다. 한 가지 접근 방식은 단백질 데이터에 계산 알고리즘을 적용하여 앙상블 파일에 가장 적합한 입체 구조 세트를 결정하는 것이다. [https://web.archive.org/web/20180310010556/http://pedb.vib.be/ 단백질 앙상블 데이터베이스](pEBD)를 위한 데이터를 준비하는 데는 크게 두 가지 방법론, 즉 풀(pool) 기반 접근 방식과 분자 역학(MD) 접근 방식이 있다(그림 참조). 풀 기반 접근 방식은 단백질의 아미노산 서열을 사용하여 무작위 입체 구조의 대규모 풀을 생성한다. 이 풀은 구조를 기반으로 각 입체 구조에 대한 이론적 매개변수 세트를 생성하는 추가 계산 처리를 거친다. 이 풀에서 선택된 입체 구조 하위 집합은 평균 이론적 매개변수가 해당 단백질에 대한 알려진 실험 데이터와 밀접하게 일치한다. 대안적인 분자 역학 접근 방식은 한 번에 여러 무작위 입체 구조를 취하여 모두 실험 데이터에 적용한다. 여기서 실험 데이터는 입체 구조에 적용될 제약 조건(예: 원자 간의 알려진 거리) 역할을 한다. 실험 데이터에 의해 설정된 제약 조건 내에 유지되는 입체 구조만 허용된다. 이 접근 방식은 종종 입체 구조에 대량의 실험 데이터를 적용하며, 이는 계산적으로 매우 어려운 작업이다.[17]
입체 구조 앙상블은 Sic1/Cdc4,[18] p15 PAF,[19] MKK7,[20] 베타-시누클레인[21] 및 P27[22]과 같이 동적이고 부분적으로 펼쳐진 단백질들에 대해 생성되었다.
6. 단백질 접힘 (Protein folding)
RNA가 번역됨에 따라 리보솜을 빠져나온 폴리펩타이드 사슬은 처음에는 랜덤 코일과 같은 무작위적인 구조를 가지다가, 이내 고유한 3차원 구조인 네이티브 상태로 접히게 된다.[55][56][23][24] 단백질 접힘 과정은 폴리펩타이드 내 아미노산들 사이의 다양한 상호작용 네트워크에 의해 진행되며, 최종적으로 형성되는 단백질의 구조는 근본적으로 해당 단백질의 1차 구조, 즉 아미노산 서열에 의해 결정된다고 알려져 있다. 이를 안핀센의 도그마라고 부른다.[57][25]
단백질의 열역학적 안정성은 단백질이 접힌 상태와 풀린 상태 사이의 자유 에너지 차이로 설명할 수 있다. 이 자유 에너지 차이는 온도 변화에 매우 민감하기 때문에, 온도가 변하면 단백질 구조가 풀리거나 변성될 수 있다. 단백질이 변성되면 고유의 입체 구조를 잃어버리고 그에 따라 생물학적 기능도 상실하게 된다. 일반적으로 수용성 구상 단백질이 안정화되면서 얻는 자유 에너지는 50 kJ/mol을 넘지 않는다. 이는 단백질의 이차 구조를 안정시키는 수많은 수소 결합이나 단백질 내부 중심부를 안정화하는 소수성 상호작용과 같은 큰 에너지 요인들을 고려했을 때, 상대적으로 작은 에너지 차이에 해당한다.[26]
하나의 폴리펩타이드 사슬이라도 환경 조건에 따라 여러 가지 안정된 접힘 상태를 가질 수 있지만, 각각의 상태는 서로 다른 생물학적 활성을 나타낼 수 있다. 대부분의 경우, 생물학적으로 의미 있는 활성을 가지는 구조는 단 하나이다.
7. 단백질 구조 결정


단백질의 3차원 구조를 실험적으로 알아내는 주요 방법으로는 X선 결정학, 핵자기 공명(NMR) 분광법, 극저온 전자 현미경(Cryo-EM) 등이 있다.
단백질 정보 은행(PDB)에 등록된 단백질 구조의 약 90%는 X선 결정학을 통해 밝혀졌다.[58][27] 이 방법은 단백질을 결정화시킨 후 X선을 쏘아 그 회절 패턴을 분석하여 전자 밀도 분포를 3차원으로 측정한다. 이를 통해 단백질을 구성하는 모든 원자의 3차원 좌표를 특정 분해능으로 추론할 수 있다. 알려진 단백질 구조의 약 7~9%는 핵자기 공명(NMR) 기술로 얻어졌다.[28] NMR은 주로 용액 상태의 단백질 구조를 분석하는 데 사용된다.
최근에는 극저온 전자 현미경(Cryo-EM) 기술이 발전하면서, X선 결정학이나 NMR로 분석하기 어려운 거대 단백질 복합체의 구조를 규명하는 데 중요한 역할을 하고 있다. Cryo-EM은 시료를 극저온 상태로 급속 동결시켜 전자 현미경으로 관찰하는 방식이다. 일반적으로 X선 결정학이나 NMR보다 분해능은 낮지만, 기술의 발전으로 최대 해상도가 꾸준히 향상되고 있다. 특히 바이러스의 캡시드(바이러스 외피 단백질)나 아밀로이드 섬유와 같이 매우 큰 단백질 복합체의 구조 연구에 유용하게 사용된다.
이 외에도 단백질 구조를 연구하는 여러 방법이 있다.
- 원편광 이색성(Circular Dichroism, CD) 분광법은 단백질의 전반적인 2차 구조(알파 나선, 베타 병풍 등) 비율을 추정하는 데 사용된다.
- 적외선 분광법(Infrared Spectroscopy, IR)이나 진동 분광법은 펩타이드, 폴리펩타이드, 단백질의 특정 화학 결합 진동을 측정하여 구조적 형태(conformation)를 분석하는 데 활용된다.[59][29] 특히 2차원 적외선 분광법(2D IR)은 구조적으로 유연한 펩타이드나 단백질처럼 다른 방법으로 연구하기 어려운 대상의 구조를 조사하는 데 유용하다.[60][61][30][31]
- 단백질 분해 실험은 단백질 분해 효소를 처리했을 때 잘리는 부위를 분석하여 단백질의 접힌 구조나 노출된 부위에 대한 정성적인 정보를 얻는 방법이다. 이는 결정화가 잘 될 만한 안정적인 단백질 조각을 찾는 데 활용되기도 한다. 고속 병렬 단백질 분해(FASTpp)와 같은 새로운 기술은 단백질을 정제하지 않고도 구조화된 부분과 그 안정성을 빠르게 분석할 수 있게 해준다.[62][32]
실험적으로 단백질 구조가 결정되면, 분자 동역학(Molecular Dynamics, MD) 시뮬레이션과 같은 계산화학 기법을 이용하여 단백질의 움직임이나 다른 분자와의 상호작용 등 더 자세한 정보를 얻기 위한 연구가 수행되기도 한다.[63][33]
이렇게 실험적으로 결정된 단백질 구조 정보는 단백질 정보 은행(Protein Data Bank, PDB)과 같은 공공 데이터베이스에 저장되어 누구나 접근하고 활용할 수 있다. PDB에는 원자의 3D 좌표뿐만 아니라 구조 결정에 사용된 실험 방법(예: X선 결정학), 분해능, 단위 세포 치수 및 각도와 같은 실험 정보, 그리고 관련 서열 정보 등이 포함되어 있다.[34] 이러한 구조 정보는 생명 현상 이해를 위한 기초 연구는 물론, 구조 기반 약물 설계와 같은 응용 연구에도 매우 중요하게 활용된다.
아래 표는 X선 결정학 등에서 얻어지는 분해능에 따라 단백질 구조가 어느 정도로 자세히 보이는지를 나타낸다.
| 분해능(Å) | 구조의 유의성 |
|---|---|
| >4.0 | 개별 원자의 좌표를 논의하는 것은 무의미하다. 전체적인 윤곽만 파악할 수 있다. |
| 3.0 - 4.0 | 전체적인 접힘(fold)은 거의 정확하지만, 세부 구조에는 오류가 많을 수 있다. |
| 2.5 - 3.0 | 전체적인 접힘은 정확하지만, 단백질 표면의 루프 구조 등 일부 영역의 위치에 오류가 있을 수 있다. 아미노산 곁사슬 중 가늘고 긴 것이나 작은 것의 형태는 오류가 발생하기 쉽다. |
| 2.0 - 2.5 | 곁사슬 위치의 오류는 상당히 적지만, 미세한 오류는 여전히 존재할 수 있다. 전체적인 접힘은 매우 정확하며, 표면 루프의 오류도 적다. 물 분자나 작은 리간드 분자도 관찰 가능하다. |
| 1.5 - 2.0 | 몇몇 아미노산 잔기 위치에 오류가 있을 수 있으나, 전반적으로 매우 정확하다. 표면 루프를 포함한 전체 접힘 구조에 오류가 거의 없다. |
| 0.5 - 1.5 | 구조적인 오류가 거의 없는 매우 높은 분해능이다. 구조 정보 라이브러리 구축 등에 사용될 수 있는 수준이다. |
8. 단백질 구조 예측
단백질 서열을 알아내는 것은 단백질 구조를 밝히는 것보다 훨씬 쉽다. 하지만 단백질의 구조는 서열 정보보다 단백질의 기능에 대해 훨씬 더 많은 정보를 제공한다. 따라서 단백질 서열로부터 컴퓨터를 이용해 단백질 구조를 계산적으로 예측하는 여러 방법이 개발되었다.[39]
주요 예측 방법은 다음과 같다.
- ''Ab initio'' 예측법: 단백질의 서열 정보만을 사용하여 구조를 직접 예측하는 방법이다.
- 스레딩 및 상동성 모델링: 이미 구조가 밝혀진, 진화적으로 관련된 단백질 계열의 단백질 정보를 이용하여 아직 구조가 알려지지 않은 단백질의 3차원 모델을 구축하는 방법이다.
이러한 구조 예측을 위해 대규모 컴퓨팅 자원을 활용하는 프로젝트도 진행되고 있다. Rosetta@home는 분산 컴퓨팅 프로젝트 중 하나로, 수천 대의 가정용 컴퓨터의 유휴 자원을 모아 단백질 구조 예측에 사용한다. 또한, 2008년에 공개된 Foldit은 사용자가 퍼즐 게임처럼 단백질 구조를 직접 조립해보는 방식으로 구조를 예측하는 게임이다. 이 게임에서는 더 정확하다고 추측되는 구조를 만들수록 높은 점수를 얻는데, 실제로 컴퓨터 예측보다 상위 랭킹 플레이어들이 더 우수한 구조를 찾아내는 경우도 있는 것으로 알려져 있다.[41]
참조
[1]
서적
Organic and Biological Chemistry
https://books.google[...]
Cengage Learning
2015-01-01
[2]
논문
Protein length in eukaryotic and prokaryotic proteomes
2005-06-10
[3]
논문
The amino-acid sequence in the phenylalanyl chain of insulin. I. The identification of lower peptides from partial hydrolysates
1951-09
[4]
논문
Chemistry of insulin; determination of the structure of insulin opens the way to greater understanding of life processes
1959-05
[5]
논문
The structure of proteins; two hydrogen-bonded helical configurations of the polypeptide chain
1951-04
[6]
논문
New classification of supersecondary structures of sandwich-like proteins uncovers strict patterns of strand assemblage
2007-09
[7]
논문
A periodic table of coiled-coil protein structures
2009-01
[8]
논문
Interactions between nascent proteins translated by adjacent ribosomes drive homomer assembly
2021-01
[9]
논문
Intragenic Complementation Among Temperature Sensitive Mutants of Bacteriophage T4D
1965-06
[10]
논문
Superdomains in the protein structure hierarchy: The case of PTP-C2
2015-05
[11]
논문
Estimating the total number of protein folds
http://www3.intersci[...]
1999-06
[12]
서적
Protein Structure and Diseases
Academic Press
2011
[13]
논문
Hidden alternative structures of proline isomerase essential for catalysis
2009-12
[14]
서적
Biochemistry
John Wiley & Sons
2011
[15]
논문
Structure and function of mammalian cilia
2008-06
[16]
웹사이트
Protein Ensemble Database
https://web.archive.[...]
[17]
논문
Computational approaches for inferring the functions of intrinsically disordered proteins
2015-01-01
[18]
논문
Structure/function implications in a dynamic complex of the intrinsically disordered Sic1 with the Cdc4 subunit of an SCF ubiquitin ligase
2010-03
[19]
논문
p15PAF is an intrinsically disordered protein with nonrandom structural preferences at sites of interaction with other proteins
2014-02
[20]
논문
Structure and dynamics of the MKK7-JNK signaling complex
2015-03
[21]
논문
A relationship between the transient structure in the monomeric state and the aggregation propensities of α-synuclein and β-synuclein
2014-11
[22]
논문
Disordered p27Kip1 exhibits intrinsic structure resembling the Cdk2/cyclin A-bound conformation
2005-11
[23]
논문
Folding at the birth of the nascent chain: coordinating translation with co-translational folding
2011-02
[24]
서적
Molecular Biology of the Cell
Garland Science
[25]
논문
The formation and stabilization of protein structure
1972-07
[26]
논문
Protein structure and function at low temperatures
1990-01
[27]
논문
A three-dimensional model of the myoglobin molecule obtained by x-ray analysis
1958-03
[28]
웹사이트
PDB Statistics
https://www.rcsb.org[...]
2022-10-01
[29]
서적
Advances in Protein Chemistry Volume 38
1986
[30]
논문
Identifying residual structure in intrinsically disordered systems: a 2D IR spectroscopic study of the GVGXPGVG peptide
https://pure.rug.nl/[...]
2012-03
[31]
논문
Two-dimensional infrared population transfer spectroscopy for enhancing structural markers of proteins
2008-03
[32]
논문
Determining biophysical protein stability in lysates by a fast proteolysis assay, FASTpp
2012
[33]
논문
Molecular Dynamics Simulations, Challenges and Opportunities: A Biologist's Prospective
2017-08
[34]
논문
Protein structure databases
2011-06
[35]
논문
SCOP: a structural classification of proteins database for the investigation of sequences and structures
http://scop.mrc-lmb.[...]
1995-04
[36]
논문
CATH--a hierarchic classification of protein domain structures
1997-08
[37]
논문
Cross-over between discrete and continuous protein structure space: insights into automatic classification and networks of protein structures
2009-03
[38]
논문
Dali server: conservation mapping in 3D
2010-07
[39]
논문
Progress and challenges in protein structure prediction
2008-06
[40]
논문
The structure of proteins; two hydrogen-bonded helical configurations of the polypeptide chain.
1951-04
[41]
간행물
People power - Networks of human minds are taking citizen science to a new level.
ネイチャー
2010
[42]
웹사이트
Quantum Pharmaceuticals software
http://www.q-pharm.c[...]
[43]
서적
Organic and Biological Chemistry
https://books.google[...]
Cengage Learning
2015-01-01
[44]
저널
Protein length in eukaryotic and prokaryotic proteomes
2005-06-10
[45]
저널
The amino-acid sequence in the phenylalanyl chain of insulin. I. The identification of lower peptides from partial hydrolysates
1951-09-01
[46]
저널
Chemistry of Insulin
1959-05-15
[47]
저널
The structure of proteins; two hydrogen-bonded helical configurations of the polypeptide chain
1951
[48]
저널
New classification of supersecondary structures of sandwich-like proteins uncovers strict patterns of strand assemblage.
2007
[49]
저널
A periodic table of coiled-coil protein structures
2009-01
[50]
저널
Estimating the total number of protein folds.
http://www3.intersci[...]
1999-09-17
[51]
저널
Superdomain in the protein structure hierarchy: the case of PTP-C2.
2015
[52]
서적
Protein Structure and Diseases
2011
[53]
저널
Hidden alternative structures of proline isomerase essential for catalysis
2009-12
[54]
서적
Biochemistry
https://archive.org/[...]
John Wiley & Sons
2011
[55]
저널
Folding at the birth of the nascent chain: coordinating translation with co-translational folding
2011-02-01
[56]
서적
Molecular Biology of the Cell; Fourth Edition
https://archive.org/[...]
Garland Science
2002
[57]
저널
The formation and stabilization of protein structure
1972
[58]
저널
A Three-Dimensional Model of the Myoglobin Molecule Obtained by X-Ray Analysis
1958
[59]
서적
Vibrational spectroscopy and conformation of peptides, polypeptides, and proteins
1986
[60]
저널
Identifying Residual Structure in Intrinsically Disordered Systems: A 2D IR Spectroscopic Study of the GVGXPGVG Peptide
https://www.rug.nl/r[...]
2020-04-02
[61]
저널
Two-dimensional infrared population transfer spectroscopy for enhancing structural markers of proteins
2008
[62]
저널
Determining biophysical protein stability in lysates by a fast proteolysis assay, FASTpp
2012
[63]
저널
Molecular Dynamics Simulations, Challenges and Opportunities: A Biologist's Prospective
2017-08
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com