맨위로가기

단백질의 1차 구조

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

단백질의 1차 구조는 아미노산이 펩타이드 결합으로 연결되어 형성된 선형 서열을 의미한다. 이 구조는 단백질의 생물학적 기능과 3차원 구조를 결정하는 데 중요한 역할을 하며, N-말단에서 C-말단 방향으로 표기된다. 1차 구조는 생물학적 과정과 화학적 합성을 통해 형성될 수 있으며, 다양한 번역 후 변형을 거쳐 단백질의 기능이 조절된다.

더 읽어볼만한 페이지

  • 단백질 구조 - 메틸화
    메틸화는 메틸기를 분자에 첨가하는 과정으로, 생물학에서 유전자 발현 조절 등 생명현상에 관여하고 유기화학에서 유기 합성에 활용되며, 다양한 생물종에 존재하는 중요한 생리적 과정이다.
  • 단백질 구조 - 녹색 형광 단백질
    녹색 형광 단백질(GFP)은 해파리에서 발견된 단백질로, 특정 파장의 빛을 흡수하여 녹색 형광을 방출하며, 자체 발색단 형성 능력과 유전자 조작을 통한 개량형 개발로 생물학 연구에서 리포터 유전자로 널리 사용되지만, 실험 결과 해석 시 주의가 필요하고 대체 기술 또한 개발 중이다.
  • 입체화학 - 배위수
    배위수는 중심 원자에 직접 결합한 이웃 원자의 총 개수를 의미하는 개념으로, 배위 화합물의 성질과 원자 배열을 이해하는 데 중요하며, 결정 구조나 리간드 종류에 따라 다양한 값을 가지고 실험적 방법이나 계산 화학을 통해 결정될 수 있다.
  • 입체화학 - 카이랄성
    카이랄성은 거울상과 겹쳐지지 않는 성질로, 물리학, 화학, 수학, 생물학 등 다양한 분야에서 분자, 결정, 도형 등에서 관찰되며, 특히 화학에서는 거울상 이성질체 관계, 생물학에서는 특정 분자의 생명체 내 흔한 발견, 의약품 개발에서 약효 개선 및 부작용 감소 연구와 관련된다.
단백질의 1차 구조
단백질 구조
종류단백질
단백질 1차 구조
정의펩타이드 또는 단백질아미노산의 선형 서열
특징유전자에 의해 결정됨
펩타이드 결합으로 연결된 아미노산 사슬
단백질의 고유한 3차원 구조 결정에 중요
중요성
기능단백질의 궁극적인 기능에 영향
연구단백질 연구의 기본 단계
서열 분석으로 결정
관련 용어
관련 구조단백질 2차 구조
단백질 3차 구조
단백질 4차 구조
관련 결합펩타이드 결합

2. 형성

아미노산펩타이드 결합으로 연결되어 긴 골격을 형성하며, 다른 아미노산 곁사슬이 돌출되어 있다. 단백질은 세포 내 리보솜번역에 의해 생성된다. 일부 유기체는 비리보솜 펩타이드 합성을 통해 짧은 펩타이드를 만들기도 하는데, 이는 20개의 표준 아미노산 이외의 아미노산을 사용하며 고리화, 변형, 가교될 수 있다. 펩타이드는 실험실에서 화학적으로 합성될 수 있으며, 이는 생물학적 단백질 합성과 반대 순서(C 말단에서 시작)로 진행된다.

2. 1. 생물학적 형성

아미노산펩타이드 결합을 통해 중합되어 긴 골격을 형성하며, 다른 아미노산 곁사슬이 돌출되어 있다. 생물학적으로 단백질은 세포 내 리보솜번역에 의해 생성된다. 일부 유기체는 비리보솜 펩타이드 합성을 통해 짧은 펩타이드를 생성하기도 하는데, 이는 20개의 표준 아미노산 이외의 아미노산을 사용하며 고리화, 변형, 가교될 수 있다.

2. 2. 화학적 합성

펩타이드는 다양한 실험실 방법을 통해 화학적으로 합성될 수 있다. 화학적 방법은 전형적으로 생물학적 단백질 합성(N-말단에서 시작)과 반대 순서(C 말단에서 시작)로 펩타이드를 합성한다.[4]

3. 표기법

단백질의 아미노산 서열은 N 말단에서 C 말단 순서로 표기하며, 20가지 표준 아미노산과 일부 변형 아미노산은 한 글자 또는 세 글자 약어로 나타낸다.[8][9][10] 펩타이드 서열은 직접 분석하거나 DNA 서열로부터 추론할 수 있으며, 알려진 단백질 서열을 모아놓은 대규모 서열 데이터베이스가 존재한다.

22개의 아미노산과 모호한 아미노산의 표기법은 아래 표와 같다.

아미노산 표기법
아미노산3글자 약어[4]1글자 약어[4]설명표현된 잔기
알라닌AlaA
아르기닌ArgR
아스파라긴AsnN
아스파르트산AspD
시스테인CysC
글루탐산GluE
글루타민GlnQ
글라이신GlyG
히스티딘HisH
아이소류신IleI
류신LeuL
라이신LysK
메티오닌MetM
페닐알라닌PheF
프롤린ProP
피롤리신PylO
셀레노시스테인SecU
세린SerS
트레오닌ThrT
트립토판TrpW
티로신TyrY
발린ValV
X모든 아미노산 또는 알 수 없음모두
B아스파르트산 또는 아스파라긴D, N
Z글루탐산 또는 글루타민E, Q
J류신 또는 아이소류신I, L
Φ소수성 아미노산V, I, L, F, W, M
Ω방향족 아미노산F, W, Y, H
Ψ지방족 아미노산V, I, L, M
π분자량이 작은 아미노산P, G, A, S
ζ친수성 아미노산S, T, H, N, Q, E, D, K, R, Y
+양전하를 띠는 아미노산K, R, H
-음전하를 띠는 아미노산D, E


3. 1. 표준 아미노산

단백질 서열은 N 말단에서 시작하여 C 말단까지 아미노산이 열거되는 일련의 문자로 표시된다. 20개의 자연 발생 아미노산뿐만 아니라 혼합물 또는 모호한 아미노산을 나타내기 위해 세 글자 약어 또는 한 글자 약어를 사용한다.[8][9][10]

펩타이드는 직접 서열을 분석하거나 DNA 서열로부터 추론될 수 있다. 알려진 단백질 서열을 대조하는 큰 서열 데이터베이스가 존재한다.

20개의 표준 아미노산 표기법[11]
아미노산세 글자 약어한 글자 약어
알라닌AlaA
아르기닌ArgR
아스파라긴AsnN
아스파르트산AspD
시스테인CysC
글루탐산GluE
글루타민GlnQ
글라이신GlyG
히스티딘HisH
아이소류신IleI
류신LeuL
라이신LysK
메티오닌MetM
페닐알라닌PheF
프롤린ProP
세린SerS
트레오닌ThrT
트립토판TrpW
티로신TyrY
발린ValV


3. 2. 모호한 아미노산

단백질 서열은 일련의 문자로 표시되며, N 말단에서 시작하여 C 말단까지 아미노산이 열거된다. 세 글자 약어 또는 한 글자 약어를 사용하여 20개의 자연 발생 아미노산뿐만 아니라 혼합물 또는 모호한 아미노산을 나타낼 수 있다.[8][9][10]

모호한 아미노산 표기법
기호설명표현된 잔기
X모든 아미노산 또는 알 수 없음모두
B아스파르트산 또는 아스파라긴D, N
Z글루탐산 또는 글루타민E, Q
J류신 또는 아이소류신I, L
Φ소수성 아미노산V, I, L, F, W, M
Ω방향족 아미노산F, W, Y, H
Ψ지방족 아미노산V, I, L, M
π분자량이 작은 아미노산P, G, A, S
ζ친수성 아미노산S, T, H, N, Q, E, D, K, R, Y
+양전하를 띠는 아미노산K, R, H
-음전하를 띠는 아미노산D, E


4. 변형

폴리펩타이드는 비분지형 중합체이지만, 단백질은 이황화 결합으로 가교 결합될 수 있다. 1차 구조는 가교 결합 원자를 지정해야 하는데, 예를 들어 단백질의 이황화 결합에 관여하는 시스테인을 지정한다. 다른 가교 결합으로는 데스모신이 있다.

번역 후 변형(Post-translational modification)은 단백질의 기능, 위치, 상호작용 등을 조절하는 중요한 과정이다.

4. 1. 이성질화

폴리펩타이드 사슬의 광학 이성질체라세미화를 겪을 수 있다. 이는 서열을 변경하지는 않지만 서열의 화학적 특성에 영향을 미친다. 특히, 단백질에서 일반적으로 발견되는 L-아미노산은 \mathrm{C^{\alpha}} 원자에서 자발적으로 이성질화되어 단백질 가수 분해 효소에 의해 분해될 수 없는 D-아미노산을 형성할 수 있다. 또한, 프롤린은 펩타이드 결합에서 안정적인 트랜스 이성질체를 형성할 수 있다.

4. 2. 번역 후 변형

단백질은 번역 후 다양한 변형을 거쳐 그 기능, 위치, 상호작용 등이 조절된다.[1] 이러한 변형은 폴리펩타이드의 N-말단, C-말단, 그리고 곁사슬에서 일어날 수 있으며, 다음과 같이 요약할 수 있다.

이러한 폴리펩타이드 변형은 대부분 진핵생물 세포 내 소포체에서 발생하며, 리보솜에서 단백질이 합성된 후에 일어난다.[1]

4. 2. 1. N-말단 변형

'''그림 1.''' N-말단 아세틸화

  • '''아세틸화''' \mathrm{-C(=O)-CH_{3}}

: N-말단 아미노기의 양전하는 아세틸기로 변형됨으로써 제거될 수 있다(N-말단 차단).

  • '''포르밀화''' \mathrm{-C(=O)H}

: 번역 후 일반적으로 발견되는 N-말단 메티오닌은 포르밀기로 차단된 N-말단을 갖는다. 이 포르밀기는 탈포르밀효소(Defromylase)에 의해 제거된다.

  • '''파이로글루탐산(Pyroglutamate)'''

'''그림 2.''' N-말단 글루타민으로부터 파이로글루탐산의 형성


: N-말단 글루타민은 그 자체를 공격하여 순환적 파이로글루탐산을 형성할 수 있다.

  • '''미리스토일화''' \mathrm{-C(=O)-\left(CH_{2}\right)_{12}-CH_{3}}

: 미리스토일화는 아세틸화와 유사하다. 미리스일기는 단순한 메틸기 대신 14개의 소수성 탄소 꼬리를 가지고 있어 단백질세포막에 고정시키는 데 사용된다.

4. 2. 2. C-말단 변형

C 말단은 아미노화에 의해 차단될 수 있다(따라서 음전하를 중화시킴).[1]

C 말단 아미노화


글리코실포스파티딜이노시톨(GPI)은 단백질을 세포막에 고정시키는 큰 소수성 인지질 그룹이다.[1] 이는 아미노 결합을 통해 폴리펩타이드 C 말단에 부착되고, 이후 에탄올아민에 연결되고, 최종적으로 포스파티딜이노시톨의 지질 부분에 연결된다.[1]

4. 2. 3. 곁사슬 변형

단백질의 곁사슬은 인산화, 당화, 탈아미드화, 하이드록시화, 메틸화, 아세틸화, 황화, 프레닐화, 팔미토일화, 카복실화, ADP-리보실화, 유비퀴틴화, SUMO화 등 다양한 공유 결합 변형을 겪는다.

  • 인산화: 단백질의 가장 중요한 화학적 변형 중 하나이다. 인산기가 세린, 트레오닌, 티로신 잔기의 곁사슬 하이드록시기에 부착되어 음전하를 띠고 비천연 아미노산을 생성한다. 이 반응은 인산화 효소에 의해 촉매되며, 역반응은 인산가수분해효소에 의해 촉매된다. 인산화된 티로신은 단백질 간 결합 도구로 작용하며, 세린/트레오닌 인산화는 음전하로 인해 구조적 변화를 유도한다.

  • 당화: 당 Moiety가 세린/트레오닌의 곁사슬 하이드록시기 또는 아스파라긴의 곁사슬 아미노기에 부착된다. 용해도 증가, 복잡한 인식 등 다양한 기능을 수행한다.

  • 메틸화: 라이신아르기닌의 양전하 잔기들이 메틸화될 수 있다. 아르기닌 잔기는 핵산 인산 골격과 상호작용하며, 라이신 잔기는 단일, 이중, 삼중 메틸화될 수 있다. 메틸화는 곁사슬 양전하를 변화시키지 않는다.

  • 아세틸화: 라이신 아미노기의 아세틸화는 N-말단 아세틸화와 화학적으로 유사하며, 단백질의 핵산 결합 조절에 사용된다.

  • 황화: 티로신 잔기는 황화될 수 있으며, 골지체에서 발생한다. 황화 티로신은 세포 표면 케모카인 수용체 등 특정 인식에 사용된다.

  • 프레닐화 및 팔미토일화: 소수성 이소프렌 및 팔미토일기는 시스테인 잔기에 추가되어 단백질을 세포막에 고정시킨다.

  • 카복실화: 글루탐산 곁사슬에 추가 카복실산기를 부착하여 Gla 잔기를 생성, 칼슘 등 금속 이온 결합을 강화한다.

  • ADP-리보실화: 큰 ADP-리보실기는 단백질 내 여러 유형 곁사슬로 전달, 이질적 효과를 가진다.

  • 유비퀴틴화 및 SUMO화: 다양한 단백질이 C-말단에서 다른 단백질 라이신 곁사슬 암모늄기에 부착될 수 있다. 유비퀴틴은 단백질 분해 신호를 보낸다.

4. 3. 분열 및 결찰

단백질은 가수분해되거나 단백질 가수 분해 효소에 의해 절단될 수 있다.[1] 단백질은 종종 비활성 전구체 형태로 합성된다.[1] 일반적으로 N 말단 또는 C 말단 세그먼트가 단백질의 활성 자리를 차단하여 그 기능을 억제한다.[1] 단백질은 억제 펩타이드를 절단함으로써 활성화된다.[1]

일부 단백질은 스스로를 쪼개는 힘을 가지고 있다.[1] 전형적으로 세린(드물게 트레오닌)의 하이드록시기 또는 시스테인 잔기의 티올기는 앞선 펩타이드 결합의 카르보닐 탄소를 공격하여 사면 결합 된 중간체를 형성한다.[1] 이 중간체는 아미드 형태로 되돌아가는 경향이 있지만, 추가적인 분자 상호 작용은 아미드 형태를 덜 안정적으로 만들 수 있다.[1] 대신에 아미노기가 방출되어 펩타이드 결합 대신에 에스터 결합(세린/트레오닌) 또는 티오에스터 결합(시스테인)이 생성된다.[1] 이 화학 반응을 'N-O 아실 이동'이라고 한다.[1]

에스터/티오에스터 결합은 여러 가지 방법으로 분해될 수 있다.[1]

  • 단순한 가수 분해는 치환된 아미노기가 새로운 N 말단이 되는 폴리펩타이드 사슬을 분할한다. 이는 글리코실아스파라기나제의 성숙에서 볼 수 있다.[1]
  • β-제거 반응 역시 사슬을 분할하지만, 새로운 N 말단에서 피루보일 그룹이 생성된다. 이 피루보일 그룹은 일부 효소, 특히 S-아데노실메티오닌 탈카르복실화 효소와 같은 탈카르복실화 효소에서 공유 결합된 촉매 보조 인자로 사용될 수 있다.[1]
  • 분자 내 트랜스에스테르화는 ''분지된'' 폴리펩타이드가 생성된다. 인테인에서 새로운 에스터 결합은 곧 C 말단 아스파라긴에 의한 분자 내 공격으로 끊어진다.[1]
  • 분자 간 트랜스에스테르화는 한 폴리펩타이드에서 다른 폴리펩타이드로 전체 세그먼트를 전송할 수 있으며, 이는 헤지호그 단백질 자체 처리에서 볼 수 있다.[1]

5. 2차 및 3차 구조와의 관계

생물학적 중합체의 1차 구조는 대부분 3차원 형태(3차 구조)를 결정한다. 단백질 서열은 2차 구조의 세그먼트 또는 막 관통 영역과 같은 국소 특징을 예측하는 데 사용될 수 있다. 그러나 단백질 접힘의 복잡성은 현재 그 서열만으로 단백질의 3차 구조를 예측하는 것을 어렵게 한다. 유사한 서열 상동성(예: 동일한 단백질 계열의 구성원)의 구조를 알면 상동성 모델링에 의해 3차 구조를 매우 정확하게 예측할 수 있다.

6. 역사

단백질이 α-아미노산의 선형 사슬이라는 주장은 1902년 카를스바트에서 열린 제74차 독일 과학자 및 의사 협회 회의에서 두 과학자에 의해 거의 동시에 제기되었다. 프란츠 호프마이스터는 단백질의 뷰렛 반응 관찰을 바탕으로 오전에 이 주장을 제기했고, 몇 시간 후 에밀 피셔가 펩타이드 결합 모델을 뒷받침하는 풍부한 화학적 세부 정보를 제시했다. 1882년 프랑스 화학자 E. 그리마우에 의해 단백질이 아미드 결합을 포함한다는 주장이 처음 제기되었다.[6]

이러한 데이터와 단백질을 프로테아제로 소화하면 올리고펩타이드만 생성된다는 후기 증거에도 불구하고, 단백질이 아미노산의 선형, 비분지 중합체라는 생각은 즉시 받아들여지지 않았다. 윌리엄 애스버리와 같은 일부 과학자들은 공유 결합이 그렇게 긴 분자를 함께 유지할 만큼 강하지 않다고 의심했다. 그들은 열적 교반이 그러한 긴 분자를 파괴할 것이라고 우려했다. 헤르만 슈타우딩거고무가 거대분자로 구성되어 있다고 주장했을 때 1920년대에 유사한 편견에 직면했다.[6]

따라서 여러 가지 대체 가설이 등장했다. '''콜로이드 단백질 가설'''은 단백질이 더 작은 분자의 콜로이드 집합체라고 주장했다. 이 가설은 테오도르 스베드베르크의 초원심분리 측정으로 단백질이 잘 정의되고 재현 가능한 분자량을 가지고 있다는 것과, 아르네 티셀리우스의 전기 영동 측정으로 단백질이 단일 분자임이 밝혀지면서 1920년대에 반증되었다. 두 번째 가설인 사이클롤 가설은 도로시 린치에 의해 제시되었으며, 선형 폴리펩타이드가 C=O + HN \rightarrow C(OH)-N의 화학적 사이클롤 재배열을 거쳐 골격 아미드기를 가교하여 2차원 "직물"을 형성한다고 제안했다. 에밀 아브데르할덴의 '''디케토피페라진 모델'''과 1942년 트로엔스고르드의 '''피롤/피페리딘 모델'''과 같이 단백질의 다른 1차 구조가 다양한 연구자들에 의해 제안되었다. 이러한 대체 모델들은 프레더릭 생어인슐린의 서열을 성공적으로 분석하고, 막스 페루츠와 존 켄드루미오글로빈헤모글로빈결정 구조를 결정함으로써 최종적으로 반증되었다.

7. 다른 분자의 1차 구조

단백질 외에 RNA, DNA, 다당류와 같은 다른 생물학적 중합체도 1차 구조를 갖는 것으로 간주될 수 있다. 그러나 이는 단백질에 대한 용어 사용에 비해 드물게 사용된다. RNA는 광범위한 2차 구조를 가지며, 염기의 선형 사슬은 DNA에서와 마찬가지로 일반적으로 서열로 지칭된다.

참조

[1] 서적 Advances in Protein Chemistry
[2] 학술지 Normalization of nomenclature for peptide motifs as ligands of modular protein domains 2002-02-20
[3] 학술지 A One-Letter Notation for Amino Acid Sequences* 1968-07-01
[4] 서적 The cell: a molecular approach ASM Press
[5] 학술지 AC2: An Efficient Protein Sequence Compression Tool Using Artificial Neural Networks and Cache-Hash Models 2021-04
[6] 학술지 Early theories of protein structure 1979-05
[7] 서적 인용 The arrangement of amino acids in proteins
[8] 서적 인용 The arrangement of amino acids in proteins
[9] 저널 인용 Normalization of nomenclature for peptide motifs as ligands of modular protein domains 2002-02-20
[10] 저널 인용 A One-Letter Notation for Amino Acid Sequences* 1968-07-01
[11] 서적 인용 The cell: a molecular approach ASM Press



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com