단백체
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
단백체(proteome)는 특정 시점과 조건에서 세포, 조직 또는 유기체 내에서 발현되는 모든 단백질의 총체이다. 단백체는 세포 프로테옴, 전체 유기체 프로테옴, 세포 내 시스템 프로테옴 등으로 구분되며, 바이러스 프로테옴과 세균 프로테옴도 존재한다. 단백체 연구는 암 연구에서 암세포의 특성 분석, 생체 지표 발굴, 맞춤형 의료에 기여하며, 단백질의 분리, 질량 분석법, 크로마토그래피, 블로팅, 단백질 상호작용 분석, 구조 예측 등의 방법으로 연구된다. 단백체 데이터베이스는 인간 단백질 아틀라스, 혈장 단백질체 데이터베이스, UniProt 등이 있으며, 단백체의 크기와 내용은 생물의 종류, 유전자 대체 스플라이싱, 단백질 변이체, 암흑 단백질체 등에 따라 달라진다. 1994년 마크 윌킨스가 처음 사용한 '단백체'라는 용어는 유전체, 세포, 조직 또는 유기체에 의해 발현되는 모든 단백질 집합체를 설명하는 데 사용된다.
"프로테옴"이라는 용어는 소기관과 같은 특정 '''세포 내 시스템'''의 단백질 집합을 지칭하는 데도 사용된다. 예를 들어, 미토콘드리아 프로테옴은 3,000개 이상의 서로 다른 단백질로 구성될 수 있다.[1][2][3]
2. 프로테옴의 종류
2. 1. 세포 프로테옴
'''세포 프로테옴'''은 세포 유형에서 특정 호르몬 자극과 같은 특정 환경 조건에서 발견되는 단백질의 집합이다.
또한 유기체의 '''전체 프로테옴'''을 고려하는 것이 유용할 수 있는데, 이는 다양한 세포 프로테옴의 모든 단백질의 완전한 집합으로 개념화할 수 있다. 이는 게놈에 해당하는 단백질과 거의 유사하다.
2. 2. 유기체 프로테옴
일반적으로 프로테옴은 유기체의 프로테옴을 지칭하지만, 다세포 생물은 서로 다른 세포에서 매우 다른 프로테옴을 가질 수 있으므로, 세포와 유기체의 프로테옴을 구별하는 것이 중요하다.
유기체의 '''전체 프로테옴'''은 다양한 세포 프로테옴의 모든 단백질의 완전한 집합으로 개념화할 수 있으며, 이는 게놈에 해당하는 단백질과 거의 유사하다.
2. 3. 바이러스 프로테옴
바이러스의 단백질은 ''바이러스 프로테옴''이라고 불릴 수 있다. 일반적으로 바이러스 프로테옴은 바이러스 게놈으로부터 예측되지만[4], 바이러스 게놈으로부터 발현되는 모든 단백질, 즉 바이러스 프로테옴을 결정하려는 시도가 있었다.[5] 그러나 바이러스 프로테오믹스는 바이러스 감염 시 숙주 단백질의 변화를 분석하는 경우가 더 많으므로, 실제로 ''두 개의'' 프로테옴(바이러스와 숙주)이 연구된다.[6]
3. 프로테옴 연구의 중요성
단백체 연구는 암 연구에 매우 중요하다. 단백체는 서로 다른 암세포 계열을 비교 분석하고, 전이 가능성을 식별하며, 새로운 암 신호 전달 메커니즘을 밝히는 데 사용될 수 있다.[7]
질량 분석법 기반 단백체 분석을 통해 암의 생체 지표를 발견할 수 있으며, 이는 환자 맞춤형 치료를 가능하게 한다.[8] 예를 들어, 난소암 세포 계열 분석을 통해 여러 잠정적인 생체 지표가 발견되었다.[9]
11개 세포 계열에 대한 비교 단백체 분석 결과, 세포 계열 간 대사 과정의 유사성이 입증되었고, 하우스키핑 단백질의 변동성이 더 크다는 사실이 밝혀졌다.[10]
또한, 단백체 분석은 특정 암 약물에 대한 내성 기전을 이해하고, 항암 약물 특성을 가진 단백질을 식별하는 데에도 활용된다.[11]
3. 1. 암 연구에서의 중요성
단백체는 서로 다른 암세포 계열을 비교 분석하는 데 사용될 수 있다. 단백체 연구는 방광암 세포 계열 KK47 및 YTS1에서 전이 가능성을 식별하는 데 사용되었으며, 36개의 상향 조절 단백질과 74개의 하향 조절 단백질이 발견되었다.[7] 단백질 발현의 차이는 새로운 암 신호 전달 메커니즘을 식별하는 데 도움이 될 수 있다.
생체 지표는 질량 분석법 기반 단백체 분석을 통해 암에서 발견되었다. 단백체학, 즉 단백체 연구는 환자의 특정 단백체 및 유전체 프로파일에 따라 약물 칵테일을 맞춤화하는 맞춤형 의료의 진전이다.[8] 난소암 세포 계열 분석 결과, 난소암의 잠정적인 생체 지표에는 "α-에놀라제(ENOA), 신장 인자 Tu, 미토콘드리아(EFTU), 글리세르알데히드 3-인산 탈수소효소(G3P), 스트레스-70 단백질, 미토콘드리아(GRP75), 아포지단백질 A-1(APOA1), 퍼옥시레독신(PRDX2) 및 안넥신 A(ANXA)"가 포함된다.[9]
11개 세포 계열에 대한 비교 단백체 분석은 각 세포 계열의 대사 과정 간 유사성을 입증했다. 이 연구에서 11,731개의 단백질이 완전히 확인되었다. 하우스키핑 단백질은 세포 계열 간에 더 큰 변동성을 보이는 경향이 있다.[10]
특정 암 약물에 대한 내성은 아직 잘 이해되지 않고 있다. 단백체 분석은 결장암 약물 이리노테칸과 같이 항암 약물 특성을 가질 수 있는 단백질을 식별하는 데 사용되었다.[11] 선암종 세포 계열 LoVo에 대한 연구에서는 8개 단백질이 상향 조절되었고 7개 단백질이 하향 조절되었음이 밝혀졌다. 차등 발현을 보인 단백질은 전사, 세포 자멸사, 세포 증식/세포 분화 등의 과정에 관여했다.
4. 프로테옴 연구 방법
DNA를 구성하는 뉴클레오티드는 4개뿐이지만, 단백질을 구성하는 아미노산은 20가지 이상이다. 또한, 현재 단일 단백질의 사본을 만들 수 있는 고 처리량 기술은 알려져 있지 않다. 따라서 단백질, 단백질 집합, 또는 전체 단백질체(프로테옴)를 연구하는 것은 핵산 서열을 분석하는 것보다 어렵다. 단백질체 연구에는 다양한 방법이 사용될 수 있으며, 계산 방법을 사용하거나 유전체를 분석하는 등 간접적인 방법으로 연구되기도 한다.
4. 1. 분리 기술 및 전기영동
단백질체학은 단백질체를 연구하는 분야로, 주로 2차원 젤 전기영동을 통해 단백질을 분리하는 방식으로 수행되어 왔다. 1차원에서는 단백질을 전하를 기준으로 분리하는 등전점 포커싱을 사용한다. 2차원에서는 분자량을 기준으로 SDS-PAGE를 사용하여 단백질을 분리한다. 젤은 단백질을 시각화하기 위해 염색 시약인 쿠마시 브릴리언트 블루 또는 은 염색으로 염색한다. 젤 위의 점들은 특정 위치로 이동한 단백질이다.4. 2. 질량 분석법 (Mass Spectrometry)
질량 분석법은 단백질체를 연구하는 핵심적인 방법 중 하나이다.[22] Orbitrap 질량 분석법, MALDI (매트릭스 보조 레이저 탈착/이온화), ESI (전기분무 이온화) 등이 대표적인 질량 분석법이다. 펩타이드 질량 지문은 단백질을 짧은 펩타이드로 절단한 후, 관찰된 펩타이드 질량을 서열 데이터베이스와 비교하여 단백질을 식별한다. 탠덤 질량 분석법은 개별 펩타이드를 분리, 비반응성 기체와 충돌시켜 생성된 단편 이온을 목록화하여 펩타이드 서열 정보를 얻는다.[23]
2014년 5월, ''네이처''에 인간 단백질체의 초안 지도가 게재되었다.[24] 이 지도는 고해상도 푸리에 변환 질량 분석법을 사용하여 생성되었다. 30개의 조직학적으로 정상적인 인간 샘플을 프로파일링하여 17,294개의 유전자에 의해 암호화된 단백질을 식별했는데, 이는 전체 주석 처리된 단백질 코딩 유전자의 약 84%에 해당한다.
4. 3. 크로마토그래피
액체 크로마토그래피는 단백체 연구에서 중요한 도구이다. 이는 기질에 대한 친화성을 기반으로 다양한 종류의 단백질을 매우 민감하게 분리할 수 있게 해준다. 단백질의 분리 및 식별을 위한 새로운 방법으로는 단일체 모세관 컬럼 사용, 고온 크로마토그래피 및 모세관 전기 크로마토그래피 등이 있다.[25]4. 4. 블로팅 (Blotting)
웨스턴 블롯은 특정 단백질의 양을 정량화하는 데 사용될 수 있다. 관심 있는 단백질에 특이적인 항체를 사용함으로써, 단백질 혼합물에서 특정 단백질의 존재 여부를 탐지할 수 있다.4. 5. 단백질 상호작용 분석
단백질 조각 상보성 분석은 단백질-단백질 상호작용을 감지하는 데 자주 사용된다. 효모 2-하이브리드 분석이 가장 널리 사용되지만, ''생체 외''와 ''생체 내'' 모두에서 사용되는 수많은 변형이 존재한다. 풀다운 분석은 주어진 단백질의 단백질 결합 파트너를 결정하는 방법이다.[26]4. 6. 단백질 구조 예측
단백질 구조 예측은 전체 단백질체에 대한 3차원 단백질 구조 예측을 제공하는 데 사용될 수 있다. 2022년, EMBL-EBI와 딥마인드 간의 대규모 협력을 통해 생명체의 모든 종에서 2억 개 이상의 단백질에 대한 예측 구조를 제공했다.[27] 소규모 프로젝트에서도 개별 유기체의 단백질체를 매핑하는 데 단백질 구조 예측을 사용해 왔다. 예를 들어 [https://www.isoform.io isoform.io]는 인간 게놈에서 2만 개 이상의 유전자에 대해 여러 단백질 이형체에 대한 정보를 제공한다.[28]5. 프로테옴 데이터베이스
https://www.proteinatlas.org/ 인간 단백질 아틀라스(Human Protein Atlas)는 세포, 조직 및 기관 내 인간 단백질에 대한 정보를 담고 있다. 이 지식 자료의 모든 데이터는 학계와 산업계의 과학자들이 인간 단백질체 탐구를 위해 자유롭게 접근할 수 있도록 공개되어 있다. [https://elixir-europe.org ELIXIR]는 폭넓은 생명 과학 커뮤니티에 대한 근본적인 중요성 때문에 단백질 아틀라스를 핵심 자원으로 선정했다.
http://www.plasmaproteomedatabase.org 혈장 단백질체 데이터베이스는 10,500개의 혈장 단백질에 대한 정보를 담고 있다. 혈장의 단백질 함량 범위가 매우 넓기 때문에 풍부한 단백질에 비해 희소한 경향이 있는 단백질을 감지하기가 어렵다. 이것은 초저농도 단백질 감지에 대한 장벽이 될 수 있는 분석적 한계이다.[29]
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkz995/5625540?guestAccessKey=57d5366c-20f0-4a32-96b9-f20c8780442a neXtprot 및 https://www.uniprot.org/help/human_proteome UniProt와 같은 데이터베이스는 인간 단백질체 데이터의 중심 자원이다.
6. 프로테옴의 크기와 내용
바이러스와 원핵생물의 게놈은 각 단백질이 개방형 읽기 틀을 기반으로 높은 신뢰도로 예측될 수 있어, 상대적으로 잘 정의된 단백질체를 암호화한다. 바이러스는 약 3개에서 1000개, 박테리아는 약 500개에서 10,000개의 단백질을 가진다.[15] 그러나 대부분의 유전자 예측 알고리즘은 50개 또는 100개의 아미노산과 같은 특정 컷오프를 사용하므로, 작은 단백질은 종종 누락된다.[16] 진핵생물에서는 대체 스플라이싱으로 인해 대부분의 유전자에서 둘 이상의 단백질이 생성될 수 있어 더욱 복잡하다. 예를 들어, 인간 게놈은 약 20,000개의 단백질을 암호화하지만, 일부 추정치는 92,179개의 단백질을 예측하기도 한다.[17]
6. 1. 단백질 변이체
단백질에 가변성을 더할 수 있는 다양한 요인이 있다. SAP(단일 아미노산 다형성) 및 비동의 단일 뉴클레오티드 다형성(nsSNP)은 서로 다른 "단백질 변이체"[19] 또는 "단백질 형태"로 이어질 수 있다. 최근 추정치에 따르면 현재 SwissProt에 약 135,000개의 검증된 비동의 cSNP가 있다. dbSNP에는 470만 개의 후보 cSNP가 있지만, 1,000개 게놈 세트에서 단백질의 아미노산 정체성을 변경하는 비동의 cSNP로 검증된 cSNP는 약 670,000개에 불과하다.[19]6. 2. 암흑 프로테옴 (Dark Proteome)
바이러스와 원핵생물의 게놈은 각 단백질이 개방형 읽기 틀을 기반으로 높은 신뢰도로 예측될 수 있으므로 상대적으로 잘 정의된 단백질체를 암호화한다. 그러나 대부분의 유전자 예측 알고리즘은 특정 컷오프를 사용하므로 이러한 예측에 의해 작은 단백질이 종종 누락된다.[16] 진핵생물에서는 대체 스플라이싱으로 인해 대부분의 유전자에서 둘 이상의 단백질이 생성될 수 있기 때문에 훨씬 더 복잡하다.[17]암흑 단백질체는 Perdigão와 동료들이 만들어낸 용어로, 알려진 단백질 삼차 구조의 다른 단백질과 감지 가능한 염기 서열 상동성이 없어 상동성 모델링으로 모델링할 수 없는 단백질 영역을 정의한다. 546,000개의 Swiss-Prot 단백질의 경우, 진핵생물과 바이러스의 단백질체의 44~54%가 "암흑"으로 발견되었으며, 고세균과 박테리아에서는 약 14%에 불과했다.[20]
6. 3. 인간 프로테옴 지도
현재 인간 단백질체 지도, ProteomicsDB, isoform.io, 인간 단백질체 프로젝트(HPP)를 포함하여 인간 단백체를 매핑하는 여러 프로젝트가 진행 중이다. 인간 게놈 프로젝트와 마찬가지로 이러한 프로젝트는 인간 게놈에서 예측된 모든 단백질 코딩 유전자에 대한 증거를 찾고 수집하는 것을 목표로 한다. 인간 단백질체 지도는 현재(2020년 10월) 17,294개의 단백질을, ProteomicsDB는 서로 다른 기준을 사용하여 15,479개의 단백질을 주장한다. 2020년 10월 16일, HPP는 예측된 단백질 코딩 유전자의 90% 이상을 포괄하는 고강도 청사진을 발표했다.[21] 단백질은 조혈모세포를 포함한 다양한 태아 및 성인 조직 및 세포 유형에서 식별된다.6. 4. DNA 복구 능력과의 연관성
"단백질체 제약"이라는 개념은 DNA 복구 능력이 게놈의 정보 내용과 양의 상관관계가 있다는 것을 의미하며, 이는 다시 단백질체 크기와 대략적으로 관련되어 있다.[18] 박테리아, 고세균 및 DNA 바이러스에서 DNA 복구 능력은 게놈 정보 내용 및 게놈 크기와 양의 상관관계를 갖는다.[1] "단백질체 제약"은 DNA 복구 유전자와 같은 돌연변이율 조절 인자가 게놈의 정보량에 비례하는 선택 압력을 받는다고 제안한다.[1]7. 역사
마크 윌킨스는 1994년 이탈리아 시에나에서 열린 "2D 전기영동: 단백질 지도에서 유전체까지" 심포지엄에서 '단백체'라는 용어를 처음 사용했다.[13] 1995년에 그의 박사 학위 논문 일부가 출판되면서 이 용어가 인쇄물로 등장했다.[14] 윌킨스는 유전체, 세포, 조직 또는 유기체가 발현하는 모든 단백질 집합체를 설명하는 데 이 용어를 사용했다.
참조
[1]
논문
Tissue heterogeneity of the mammalian mitochondrial proteome
https://doi.org/10.1[...]
2006
[2]
논문
Definition of a High-Confidence Mitochondrial Proteome at Quantitative Scale
null
2017-06
[3]
논문
Mitoproteomics: Tackling Mitochondrial Dysfunction in Human Disease.
2018-11
[4]
논문
From ORFeomes to Protein Interaction Maps in Viruses
2004-10-15
[5]
논문
Viral proteomics
2007-06
[6]
논문
Viral proteomics: global evaluation of viruses and their interaction with the host
https://pubmed.ncbi.[...]
2007-12
[7]
논문
Quantitative Analysis of Differential Proteome Expression in Bladder Cancer vs. Normal Bladder Cells Using SILAC Method
2015-07-31
[8]
논문
Molecular insights into cancer drug resistance from a proteomics perspective
2019-05-04
[9]
논문
Proteomics Analysis of Ovarian Cancer Cell Lines and Tissues Reveals Drug Resistance-associated Proteins
http://cgp.iiarjourn[...]
2017-01-01
[10]
논문
Comparative Proteomic Analysis of Eleven Common Cell Lines Reveals Ubiquitous but Varying Expression of Most Proteins
2012-03
[11]
논문
Proteomic analysis of cell lines to identify the irinotecan resistance proteins
2010-12
[12]
논문
Membrane Proteomes and Ion Transporters in Bacillus anthracis and Bacillus subtilis Dormant and Germinating Spores
2019-03-15
[13]
논문
Proteomics data mining
2009-12
[14]
논문
" Progress with gene-product mapping of the Mollicutes: Mycoplasma genitalium"
[15]
논문
Proteome-''pI'': proteome isoelectric point database
2016-10-26
[16]
논문
Outsize impact
https://www.science.[...]
2019-10-18
[17]
논문
UniProt: a hub for protein information
[18]
논문
DNA Repair Is Associated with Information Content in Bacteria, Archaea, and DNA Viruses
2015-09
[19]
논문
How many human proteoforms are there?
null
2018-03
[20]
논문
Unexpected features of the dark proteome
[21]
논문
A high-stringency blueprint of the human proteome
2020-10
[22]
논문
Next-generation proteomics: towards an integrative view of proteome dynamics.
2013-01
[23]
논문
Mass-Spectrometry-Based Draft of the Human Proteome
https://www.jpt.com/[...]
2016-09-29
[24]
논문
A draft map of the human proteome
2014-05
[25]
논문
The role of liquid chromatography in proteomics
2004-10-22
[26]
웹사이트
Pull-Down Assays - US
https://www.thermofi[...]
2019-12-05
[27]
논문
"'The entire protein universe': AI predicts shape of nearly every known protein"
2022-07-28
[28]
논문
Structure-guided isoform identification for the human transcriptome
2022-12-15
[29]
논문
The Size of the Human Proteome: The Width and Depth
2016
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com