단백체학
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
- 1. 개요
- 2. 역사와 어원
- 3. 단백체학의 복잡성
- 4. 단백체학 연구의 한계
- 5. 단백질 연구 방법
- 6. 현대 연구 방법론
- 7. 고처리량 단백체학 기술 (High-throughput proteomics technologies)
- 8. 실용적 응용
- 9. 단백체학 정보학 (Proteome informatics)
- 10. 새로운 연구 동향
- 참조
1. 개요
단백체학은 생물학적 시스템을 연구하는 오믹스 분야 중 하나로, 유기체 내 단백질의 전체 집합인 단백질체를 연구하는 학문이다. 1974년 세균의 단백질 지도를 작성하면서 시작되었으며, "단백질"과 "게놈"을 혼합하여 1994년 마크 윌킨스가 명명했다. 유전체학, 전사체학보다 단백질체가 세포 및 시간에 따라 변화하기 때문에 더욱 복잡하며, 단백질의 발현, 번역 후 변형, 단백질 간 상호작용 등을 연구한다. 다양한 실험 방법과 고처리량 기술을 활용하여 신약 개발, 생체 지표 발굴, 시스템 생물학 연구 등에 활용되며, 생물정보학의 발달과 더불어 데이터 분석 및 예측 기술이 발전하고 있다.
더 읽어볼만한 페이지
- 단백체학 - 단백질
단백질은 아미노산 중합체로 생체 구조 유지와 기능에 필수적이며, 아미노산 서열에 따라 고유한 3차원 구조를 형성하여 효소, 구조, 수송, 저장, 수축, 방어, 조절 단백질 등 다양한 기능을 수행하고, 인체 내에서 건강 유지와 질병 예방에 중요한 역할을 하는 필수 영양소이다. - 단백체학 - 단백질-단백질 상호작용
단백질-단백질 상호작용은 단백질 간의 결합을 의미하며, 결합의 지속성, 결합력, 구성 단백질 종류에 따라 다양한 유형으로 분류되고, 물 분자에 의해 조절되며, 연구 방법과 데이터베이스를 통해 질병 연구 및 신약 개발에 응용된다. - 유전체학 - 발현체학
- 유전체학 - 유전형 분석
유전자형 분석은 DNA 염기 서열 분석, RFLP, PCR, DNA 마이크로어레이 등 다양한 기술을 통해 유전형을 파악하는 방법으로 질병 진단, 품종 개량 등 여러 분야에 활용되며 윤리적 문제와 사회적 영향을 동반하지만, 혁신적인 변화를 가져올 것으로 예상되는 기술이다. - 생물정보학 - Rosetta@home
Rosetta@home은 분산 컴퓨팅 플랫폼 BOINC를 활용하여 단백질 구조 예측 연구를 수행하며, 신약 개발 및 질병 연구에 기여하는 것을 목표로 한다. - 생물정보학 - 발현체학
단백체학 |
---|
2. 역사와 어원
단백체학 연구의 시작은 1974년 대장균 단백질 지도 작성으로 거슬러 올라가며,[8] '단백체'라는 용어는 1994년 마크 윌킨스에 의해 처음 사용되었다.[9]
2. 1. 역사
단백체학으로 간주될 수 있는 단백질에 대한 최초의 연구는 1974년, 세균 ''대장균''의 단백질 지도를 작성하고 2차원 젤을 도입하면서 시작되었다.[8]''단백체''(Proteome)는 "단백질"(Protein)과 "게놈"(Genome)을 합성한 용어로, 1994년 맥쿼리 대학교의 박사 과정 학생이었던 마크 윌킨스가 처음 만들었다.[9] 이듬해인 1995년에는 최초의 단백체학 전문 연구소가 설립되었다.[10][11]
2. 2. 어원
단백체학으로 간주될 수 있는 단백질에 대한 최초의 연구는 1974년, 세균 ''대장균''의 단백질 지도를 작성하고 2차원 젤을 도입하면서 시작되었다.[8]'단백체'라는 용어는 "단백질"과 "게놈"을 합쳐 만든 말이다. 이 용어는 1994년 맥쿼리 대학교 박사 과정 학생이었던 마크 윌킨스가 처음 사용하였다.[9] 이후 1995년에는 최초의 단백체학 전문 연구소가 설립되었다.[10][11]
3. 단백체학의 복잡성
단백체는 세포의 종류나 상태, 시간에 따라 끊임없이 변화하며, 많은 단백질이 만들어진 후에도 다양한 번역 후 변형을 거치기 때문에, 상대적으로 고정적인 유전체를 다루는 유전체학이나 전사체학보다 훨씬 복잡한 연구 분야이다. 이러한 복잡성은 단백체학 연구 자체를 어렵게 만드는 요인이 된다.
예를 들어, 특정 암 아형(subtype)에 대한 생체 지표(biomarker)를 찾는 연구를 진행한다고 가정해 보자. 연구자는 암 환자마다 다른 유전적 배경, 생활 습관 등의 교란 요인을 최소화하고 실험 과정에서 발생하는 노이즈를 고려하기 위해 여러 환자로부터 다수의 혈청 샘플을 확보하여 분석해야 한다.[17] 이처럼 단백체의 동적인 변화와 개체 간의 차이를 고려하기 위해서는 복잡한 실험 설계가 필수적이다.
또한, 많은 단백질은 단독으로 기능하기보다 다른 단백질과 상호작용하며 복잡한 네트워크를 이룬다. 따라서 단백체학 연구의 중요한 목표 중 하나는 이러한 단백질 간 상호작용을 밝혀내는 것이다. 이를 통해 새롭게 발견된 단백질의 기능을 추정하는 단서를 얻기도 한다. 단백질 상호작용을 연구하는 전통적인 방법으로는 효모를 이용한 투-하이브리드 법(Yeast two-hybrid system)이 있으며, 최근에는 마이크로어레이, 친화성 크로마토그래피, 질량 분석법 등 다양한 기술이 개발되어 활용되고 있다.
단백체를 분석하기 위해서는 일반적으로 복잡한 단백질 혼합물 시료를 개별 단백질 또는 펩타이드로 분리하고 동정하는 과정을 거친다. 과거에는 2차원 전기영동(2-DE)을 통해 단백질을 등전점과 분자량에 따라 분리한 후, 겔(gel) 상의 단백질 스팟(spot)을 염색하여 정량하고, 각 스팟을 잘라내어 프로테아제(protease)로 처리한 뒤 질량 분석법(주로 MALDI법)으로 펩타이드를 동정하는 방식이 주로 사용되었다.
최근에는 단백질 혼합물을 분리하지 않고 직접 분석하는 방법도 널리 사용된다. 단백질 혼합물을 바로 펩타이드로 분해한 뒤, 고속 액체 크로마토그래피(HPLC)를 이용하여 펩타이드 혼합물을 분리하고, 이를 직접 연결된 탠덤 질량 분석(tandem mass spectrometry, MS/MS) 장치로 분석하는 방식이다. 이 방법은 각 펩타이드의 서열 정보를 얻을 수 있어 단백질 동정에 매우 효과적이다. 여러 샘플 간의 단백질 양을 비교하기 위해 동위 원소 표지(isotope labeling) 기술을 사용하기도 한다.
단백체학 연구는 질병의 진단 및 치료법 개발에 큰 기여를 할 것으로 기대된다. 특정 질병과 관련된 단백질을 발굴하고 그 3차원 구조를 분석하여, 해당 단백질의 기능을 조절하는 새로운 약물 후보 물질을 설계하는 것이 가능해진다. 예를 들어, HIV 증식에 필수적인 HIV-1 프로테아제의 활성을 억제하는 약물은 컴퓨터를 이용한 "가상 리간드 스크리닝"(virtual ligand screening)을 통해 성공적으로 개발된 대표적인 사례이다.
최근에는 World Community Grid와 같은 분산 컴퓨팅 프로젝트를 통해 전 세계 일반인들의 컴퓨터 자원을 활용하여 단백질 구조 예측, 단백질 상호작용 시뮬레이션 등 방대한 계산이 필요한 연구를 수행하기도 한다. 이러한 노력은 HIV, 암, 뎅기열 등 다양한 질병에 대한 새로운 치료법 개발의 실마리를 제공할 수 있을 것으로 기대된다.
3. 1. 유전체와의 차이점
유전체학과 전사체학에 이어 단백체학은 생물학적 시스템 연구의 다음 단계로 여겨진다. 유기체의 유전체는 세포 종류나 환경에 관계없이 거의 일정한 상태를 유지하지만, 단백체는 세포마다, 그리고 시간에 따라 달라지기 때문에 유전체학보다 더 복잡한 양상을 보인다. 이는 서로 다른 세포 유형에서 서로 다른 유전자가 유전자 발현되기 때문이며, 각 세포에서 생성되는 기본적인 단백질 세트 자체도 다양하다는 것을 의미한다.[12]과거에는 이러한 세포 내 단백질 발현 양상을 RNA 분석, 즉 전사체 분석을 통해 간접적으로 추정하려 했으나, RNA 양과 실제 단백질 함량 사이의 상관관계가 부족하다는 점이 밝혀졌다.[13][14] 현재는 mRNA가 항상 단백질로 번역되는 것은 아니며, 주어진 양의 mRNA로부터 생성되는 단백질의 양은 해당 유전자가 전사된 세포의 종류나 생리적 상태에 따라 크게 달라질 수 있다는 것이 알려져 있다.[15] 단백체학은 이러한 간접적인 추정이 아닌, 단백질의 존재 유무와 그 양을 직접 측정하여 세포의 상태를 보다 정확하게 파악한다.
세포는 발생, 세포 분화, 세포 주기와 같은 정상적인 생명 현상뿐만 아니라 암 발생과 같은 병리적 상태 등 다양한 조건과 시점에 따라 서로 다른 종류와 양의 단백질 집합을 만들어낸다. 더 나아가, 대부분의 단백질은 합성된 이후에도 번역 후 변형(Post-Translational Modification, PTM)이라는 과정을 통해 구조와 기능이 다양하게 변화할 수 있어 단백체의 복잡성은 더욱 증가한다.
따라서 단백체는 유전체와 달리 매우 동적이며 복잡한 특성을 지니고 있어, 단백체학 연구는 특정 주제에 한정하더라도 유전체학 연구에 비해 훨씬 복잡한 접근 방식과 분석을 요구한다.
3. 2. 번역 후 변형 (Post-translational modification)
단백질은 mRNA로부터 번역 과정을 거쳐 생성되지만, 이것이 단백질 형성의 전부는 아니다. 많은 단백질은 번역된 이후에도 다양한 화학적 변형 과정을 거치는데, 이를 번역 후 변형(Post-translational modification, PTM)이라고 부른다.이러한 번역 후 변형은 단백질의 최종적인 기능과 활동을 조절하는 데 매우 중요한 역할을 한다. 대표적인 예로는 인산화, 당화, 유비퀴틴화 등이 있으며, 이 외에도 메틸화, 아세틸화 등 다양한 종류의 변형이 존재한다.[12] 특정 아미노산에 작은 화학 그룹이 붙거나 떨어지는 방식으로 단백질의 3차원 구조, 안정성, 다른 분자와의 상호작용 방식 등이 변화하게 된다. 이러한 변형 중 많은 부분이 단백질의 기능에 매우 중요하다.
번역 후 변형은 단백체의 복잡성을 크게 증가시키는 요인이다. 하나의 유전자로부터 만들어진 단백질이라도 어떤 종류의 번역 후 변형을 겪는지, 그리고 변형이 어느 위치에서 일어나는지에 따라 다양한 형태와 기능을 가질 수 있기 때문이다. 세포는 처한 환경이나 발생 단계, 세포 분화, 세포 주기, 또는 암 발생 등 다양한 조건에 따라 특정 단백질에 각기 다른 번역 후 변형을 가함으로써 세포 내 신호 전달 경로를 정교하게 조절하고 생명 현상을 유지한다. 따라서 단백체학 연구에서 번역 후 변형을 이해하는 것은 단백질의 실제 기능을 파악하고 생명 현상의 복잡한 메커니즘을 밝히는 데 필수적이다.
3. 2. 1. 인산화 (Phosphorylation)
단백질은 mRNA로부터 번역된 후에도 다양한 화학적 변형을 겪는데, 이를 번역 후 변형이라고 한다. 이러한 변형은 단백질의 기능에 매우 중요한 역할을 한다. 가장 흔하고 널리 연구되는 번역 후 변형 중 하나가 바로 인산화(Phosphorylation)이다.인산화는 세포 신호 전달 과정에서 많은 효소와 구조 단백질에서 일어나는 핵심적인 조절 메커니즘이다. 이 과정은 특정 아미노산 잔기에 인산기가 부착되는 것을 의미한다. 가장 흔하게 인산화되는 아미노산은 세린(Serine)과 트레오닌(Threonine)이며[16], 이는 세린/트레오닌 키나아제(Serine/Threonine Kinase)라는 효소에 의해 매개된다. 드물게는 티로신(Tyrosine) 잔기가 인산화되기도 하는데, 이는 티로신 키나아제(Tyrosine Kinase)가 담당한다. 단백질이 인산화되면, 인산화된 부위를 인식하는 다른 단백질들과 결합하거나 상호작용할 수 있게 되어 세포 내 신호 전달 경로를 조절하는 표적이 된다.
단백질 인산화는 가장 많이 연구된 단백질 변형 중 하나이다. 따라서 단백체학 연구에서는 특정 조건 하의 세포나 조직에서 어떤 단백질들이 인산화되어 있는지를 밝히는 데 많은 노력을 기울인다. 이를 통해 특정 시점에서 세포 내에서 어떤 신호 전달 경로가 활성화되어 있는지를 파악할 수 있다.
3. 2. 2. 유비퀴틴화 (Ubiquitination)
mRNA로부터 단백질이 만들어지는 번역 과정뿐만 아니라, 많은 단백질은 번역 이후에도 다양한 화학적 변형을 겪는다. 이를 번역 후 변형이라고 하며, 인산화나 당화 등이 대표적이다. 이러한 변형은 단백질의 기능에 매우 중요한 역할을 한다.유비퀴틴화 역시 중요한 번역 후 변형 중 하나이다. 유비퀴틴은 작은 단백질로, 특정 단백질 기질에 E3 유비퀴틴 연결 효소라는 효소에 의해 부착될 수 있다. 어떤 단백질이 여러 개의 유비퀴틴 분자와 결합하는 다중 유비퀴틴화 과정을 거치는지 파악하는 것은 세포 내 단백질 관련 경로가 어떻게 조절되는지 이해하는 데 도움을 준다. 따라서 유비퀴틴화 연구는 단백체학의 중요한 분야이다. 또한, 각 E3 유비퀴틴 연결 효소가 어떤 기질 단백질을 유비퀴틴화하는지 알아내는 연구와 함께, 특정 세포 유형에서 어떤 종류의 연결 효소들이 발현되는지 확인하는 것도 의미 있는 연구 방향이다.
3. 2. 3. 기타 변형
mRNA로부터 단백질이 번역되는 것 외에도, 많은 단백질은 번역 후에 광범위한 화학적 변형을 겪는다. 이를 번역 후 변형이라고 부른다. 가장 일반적이고 널리 연구되는 번역 후 변형에는 인산화와 당화가 포함된다. 이러한 번역 후 변형 중 상당수는 단백질의 기능에 매우 중요하다.인산화와 유비퀴틴화 외에도 단백질은 메틸화, 아세틸화, 당화, 산화, 그리고 니트로실화 등 다양한 변형을 겪을 수 있다. 일부 단백질은 시간에 따라 이러한 변형들이 여러 조합으로 나타나기도 한다. 이는 단백질의 구조와 기능을 연구하는 데 있어 잠재적인 복잡성을 더한다.
4. 단백체학 연구의 한계
단백체는 세포의 상태(발생, 세포 분화, 세포 주기, 암 발생 등)나 시간에 따라 끊임없이 변화하며, 단백질 자체도 다양한 번역 후 변형을 거치기 때문에 본질적으로 매우 복잡하다.[17] 이러한 복잡성은 단백체 연구를 어렵게 만드는 근본적인 요인이다. 예를 들어 특정 암의 생체 지표를 찾는 연구에서는 여러 환자의 샘플을 분석해야 하고 다양한 변수를 통제해야 하므로 실험 설계 자체가 복잡해진다.[17]
또한, 유전체나 전사체 정보만으로는 실제 단백질의 양이나 활성을 정확히 예측하기 어렵기 때문에 단백체 연구가 필수적이지만[18][19], 이는 분석의 복잡성을 더욱 증가시키는 요인이 된다. (세부 내용은 #유전체학 및 전사체학과의 비교 참조)
실험 과정에서도 기술적인 한계로 인해 재현성을 확보하기 어렵고[20][21][22][23], 생성되는 방대한 데이터의 품질 관리 또한 중요한 과제로 남아있다.[24][25][26][27] (세부 내용은 #재현성 문제, #데이터 품질 문제 참조)
4. 1. 유전체학 및 전사체학과의 비교
유전체학과 전사체학에 이어 단백체학은 생물학적 시스템 연구의 다음 단계로 여겨진다. 유기체의 유전체는 거의 변하지 않지만, 단백체는 세포 종류나 시간에 따라 달라지기 때문에 유전체학보다 더 복잡하다. 세포마다 다른 유전자가 발현되므로, 각 세포에서 만들어지는 기본적인 단백질 세트부터 파악해야 한다.[12]과거에는 이러한 세포 내 단백질 상태를 RNA 분석, 즉 전사체학을 통해 파악하려 했지만, RNA 양과 실제 단백질 양 사이에는 상관관계가 부족하다는 점이 밝혀졌다.[13][14] mRNA가 만들어졌다고 해서 항상 단백질로 번역되는 것은 아니며,[15] 같은 양의 mRNA라도 유전자가 어디서 전사되었는지, 세포의 생리적 상태가 어떤지에 따라 최종적으로 생성되는 단백질의 양은 달라질 수 있다. 단백체학은 이러한 단백질의 존재를 직접 확인하고 그 양을 측정한다.
단백체학은 여러 측면에서 유전체학이나 전사체학보다 더 깊은 수준의 이해를 제공한다.
- 유전자의 전사 수준(mRNA 양)은 단백질로의 "번역 수준"을 대략적으로 예측할 뿐이다.[18] 많이 만들어진 mRNA라도 빨리 분해되거나 비효율적으로 번역되면 실제 단백질은 소량만 생성될 수 있다.
- 많은 단백질은 만들어진 후에 활성에 심각한 영향을 미치는 번역 후 변형 과정을 거친다. 예를 들어, 어떤 단백질은 인산화되어야만 활성을 띤다. 인산화 단백체학이나 당단백체학 같은 방법은 이러한 번역 후 변형을 연구하는 데 사용된다.
- 하나의 전사체로부터 선택적 스플라이싱이나 다른 번역 후 변형 과정을 통해 여러 종류의 단백질이 만들어질 수 있다.
- 많은 단백질은 다른 단백질이나 RNA 분자와 복합체를 이루어야만 제 기능을 수행하며, 이러한 단백질 간 상호작용이 필수적이다.
- 단백질이 얼마나 빨리 분해되는지도 세포 내 단백질 양을 결정하는 중요한 요인이다.[19]
4. 2. 재현성 문제
단백체학 실험의 재현성에는 몇 가지 어려움이 따른다. 주요 원인 중 하나는 질량 분석기가 한 번에 처리할 수 있는 양보다 훨씬 많은 펩타이드가 동시에 분석 장치에서 흘러나오는(용리) 현상이다. 이는 트립신으로 잘린 펩타이드 조각들이 매번 조금씩 다르게 나타나는 확률적인 특성과 결합되어, 데이터 종속적 획득 방식에서 실험 간 차이를 유발한다. 초기 대규모 샷건 단백체학 분석 결과는 실험실마다 상당한 차이를 보였는데,[20][21] 이는 부분적으로 실험실 간의 기술 수준이나 실험 방식의 차이 때문으로 여겨진다. 하지만 최근에는 질량 분석법 기술의 발달로, 특히 단백질 수준에서의 분석 재현성이 상당히 개선되었다.[22]특히, 타겟 단백체학 방법은 데이터 밀도 및 효율성을 희생하는 대신 샷건 단백체학에 비해 재현성과 반복성이 더 높다는 장점이 있다.[23]
4. 3. 데이터 품질 문제
단백체학 실험의 재현성은 중요한 문제 중 하나이다. 질량 분석기로 분석할 때, 측정 능력보다 훨씬 많은 펩타이드가 동시에 분리되어 나오는 경우가 많다. 이는 실험마다 분석되는 펩타이드가 확률적으로 달라지는 결과를 낳는데, 특히 샷건 단백체학과 같은 대규모 분석에서 초기에는 실험실 간 결과 차이가 크게 나타났다.[20][21] 이러한 차이는 기술 및 실험 방법의 차이 때문일 수 있으며, 최근에는 질량 분석법 기술의 발전으로 재현성이 향상되고 있다.[22] 특히 타겟 단백체학은 분석 대상 단백질을 미리 정하고 분석하므로, 샷건 방식보다 재현성과 반복성이 높다.[23]데이터 품질 역시 중요한 고려 사항이다. 단백체학 분석은 자동화되어 대규모 데이터를 생성하고 소프트웨어 알고리즘으로 처리하는 경우가 많다. 이때 잘못된 결과를 줄이기 위해 필터링 과정을 거치지만, 오류를 완전히 제거하기는 어렵다. 따라서 과학자들은 단백체학 실험이 분석 화학의 기준, 즉 충분한 데이터 품질 확보, 데이터 무결성 검사, 결과 검증 등의 요건을 충족해야 한다는 점을 강조한다.[24][25][26][27]
5. 단백질 연구 방법
단백체학에서 단백질을 연구하는 데는 여러 가지 방법이 있다. 일반적으로 단백질은 항체를 사용하는 면역 분석법, 전기 영동 분리, 또는 질량 분석법을 통해 검출하고 분석한다. 복잡한 생물학적 샘플을 분석할 때는 정확한 검출 및 정량화를 위해 매우 특이적인 항체를 사용하거나, 검출 단계 전에 생화학적 분리 과정을 거치는 경우가 많다.
주요 단백질 연구 방법은 크게 항체를 이용하는 방법과 이용하지 않는 방법, 그리고 이 둘을 결합한 하이브리드 방법으로 나눌 수 있다.
- 항체를 이용한 방법 (면역 분석법): 특정 단백질이나 변형된 형태에 대한 항체를 사용하여 단백질을 검출하고 정량하는 방법이다. 효소 결합 면역 흡착 분석법(ELISA), 웨스턴 블롯, 면역 염색 등이 대표적이다. 인산화 등 특정 번역 후 변형을 인식하는 항체나, 재조합 방식으로 생산된 항체 유사 결합 분자(나노바디, DARPins 등)도 사용된다. 최근에는 극미량의 단백질 검출을 위한 고감도 디지털 면역 분석 기술도 개발되고 있다.
- 항체를 사용하지 않는 방법:
- 에드만 분해법: 단백질의 아미노산 서열을 결정하는 고전적인 방법이지만, 현재는 처리량이 높은 다른 기술로 대체되고 있다.
- 질량 분석법: MALDI나 ESI와 같은 연성 이온화 기술의 발달로 단백체학 연구의 핵심 기술이 되었다. 단백질이나 펩타이드의 서열 결정, 정량 분석, 번역 후 변형 분석 등에 사용된다. 질량 분석 전 전기 영동이나 액체 크로마토그래피를 이용한 분리 과정이 선행되는 경우가 많다.
- 하이브리드 기술: 항체를 이용해 특정 단백질이나 펩타이드를 먼저 분리(정제)한 후, 질량 분석법으로 동정하고 정량하는 방식이다. MSIA[32]나 SISCAPA[33] 등이 있다.
이 외에도 단백질 발현량 변화를 비교 분석하기 위한 형광 2차원 차등 겔 전기영동(2-D DIGE)[34], 단백질 구조 분석을 위한 X선 회절이나 핵자기 공명 분광법, 단백질 상호작용 연구를 위한 투-하이브리드 법이나 친화성 크로마토그래피 등 다양한 기술이 활용된다. 또한, 생물정보학적 분석 도구와 계산 모델[71][72]을 활용하여 대량의 단백체 데이터를 분석하고, 바이오마커 발굴, 질병 진단 및 치료제 개발[60] 등에 응용하고 있다.
단백체학 연구에 사용되는 주요 기술들을 요약하면 다음과 같다.
분류 | 주요 기술 | 설명 |
---|---|---|
단백질 분리 및 검출 (항체 이용) | 효소 결합 면역 흡착 분석법 (ELISA) | 특정 단백질 정량 |
웨스턴 블롯 | 전기영동 후 특정 단백질 검출 | |
면역 염색 | 조직/세포 내 단백질 위치 확인 | |
단백질 분리 및 검출 (항체 미사용) | 전기 영동 (1D/2D) | 분자량, 등전점에 따른 단백질 분리 |
액체 크로마토그래피 (HPLC 등) | 소수성 등 특성에 따른 펩타이드/단백질 분리 | |
질량 분석법 (MALDI, ESI, MS/MS) | 단백질/펩타이드 동정, 서열 분석, 정량 | |
단백질 서열 분석 (고전) | 에드만 분해법 | 단계적 화학 분해를 통한 서열 결정 |
하이브리드 기술 | MSIA, SISCAPA | 항체 정제 + 질량 분석 |
정량 분석 | 2D-DIGE, 동위 원소 표지 (ICAT 등) | 샘플 간 단백질 발현량 비교 |
구조 분석 | X선 회절, 핵자기 공명 분광법 (NMR) | 3차원 구조 결정 |
원편광 이색성 (CD), 푸리에 변환 적외선 분광법 (FTIR) | 2차 구조 분석 | |
상호작용 분석 | 투-하이브리드 법 | 효모 이용 상호작용 스크리닝 |
친화성 크로마토그래피, 표면 플라즈몬 공명 (SPR) | 결합 친화도 및 동역학 분석 | |
형광 공명 에너지 이동 (FRET) | 분자 간 근접성 측정 | |
세포 내 위치 분석 | 형광 현미경, X선 토모그래피 | 단백질의 세포 내 국재화 확인 |
이러한 다양한 방법들을 통해 단백질의 정체, 양, 구조, 기능, 상호작용, 세포 내 위치 등을 종합적으로 연구하여 생명 현상을 이해하고 질병의 진단 및 치료에 기여하고자 한다.[41][55][56]
5. 1. 항체를 이용한 단백질 검출 (면역분석법)
단백체학에서 단백질을 연구하는 주요 방법 중 하나는 항체를 이용하는 면역 분석법이다. 복잡한 생물학적 샘플에는 분석 대상 물질이 매우 많기 때문에, 특정 단백질을 정확하게 검출하고 양을 측정하기 위해서는 매우 특이적인 항체를 사용하거나, 검출 전에 생화학적 분리 과정을 거쳐야 한다.특정 단백질이나 변형된 형태의 단백질을 인식하는 항체는 생화학 및 세포 생물학 연구에서 오랫동안 사용되어 왔으며, 오늘날 분자 생물학자들이 가장 흔하게 사용하는 도구 중 하나이다. 항체를 이용한 단백질 검출 기술에는 효소 결합 면역 흡착 분석법(ELISA), 웨스턴 블롯 등 여러 가지 방법이 있다.
단백질의 특정 변형 상태를 연구하기 위해 해당 변형에만 특이적으로 결합하는 항체를 개발하여 사용하기도 한다. 예를 들어, 특정 단백질이 티로신 잔기에 인산화되었을 때만 인식하는 '인산화 특이적 항체'가 있으며, 다른 종류의 변형에 특이적인 항체들도 존재한다. 이러한 항체들을 이용하면 특정 변형을 겪은 단백질 집합을 식별할 수 있다. 또한, 항체 외에도 높은 항원 특이성을 갖도록 재조합 방식으로 만들거나 합성 설계된 단백질 스캐폴드(예: 단일 도메인 항체 단편인 나노바디, 설계된 앵커린 반복 단백질(DARPins), 압타머 등)를 이용한 면역 분석도 가능하다.
분자 수준에서 질병을 감지하는 것은 조기 진단과 치료에 중요하지만, 초기 단계의 단백질 바이오마커는 매우 낮은 농도로 존재할 수 있다는 어려움이 있다. 기존의 면역 분석 기술은 대개 펨토몰(10−13 M) 농도 범위까지 검출이 가능하지만, 이는 극미량의 바이오마커를 검출하기에는 부족할 수 있다. 최근 개발된 디지털 면역 분석 기술은 검출 감도를 약 1,000배 향상시켜 아토몰(10−16 M) 범위까지 검출할 수 있게 함으로써 진단 및 치료 분야의 새로운 가능성을 열었으나, 아직 일상적인 사용에는 한계가 있다.
항체를 이용한 단백질 검출은 여전히 매우 중요하지만, 항체에 의존하지 않는 다른 방법들도 개발되어 사용되고 있다. 예를 들어, 질량 분석법은 단백질이나 펩타이드의 서열 결정, 더 높은 처리량, 항체가 없는 단백질의 식별 및 정량화 등에서 장점을 가질 수 있다. 또한, 항체 기반 정제와 질량 분석을 결합한 하이브리드 기술도 개발되었다. 대표적인 예로 MSIA (질량 분석 면역 분석법)[32]와 SISCAPA(안정 동위 원소 표준 및 항펩타이드 항체를 이용한 포획)[33] 방법이 있으며, 이는 특정 분석물을 항체로 정제한 후 질량 분석을 통해 동정하고 정량화하는 방식이다.
5. 1. 1. 효소 결합 면역 흡착 분석법 (ELISA)
효소 결합 면역 흡착 분석법(ELISA)은 샘플 내 특정 단백질을 검출하고 그 양을 정량적으로 측정하기 위해 수십 년 동안 널리 사용되어 온 면역 분석 기법이다. 이 방법은 특정 단백질이나 변형된 형태의 단백질에 결합하는 항체를 이용하며, 생화학 및 세포 생물학 연구에서 가장 기본적인 도구 중 하나로 자리 잡았다.ELISA는 항체를 사용하는 여러 단백질 검출 기술 중 하나이다. 예를 들어, 웨스턴 블롯 역시 항체를 사용하지만, 이는 복잡한 단백질 혼합물을 SDS-PAGE와 같은 전기 영동 방법으로 먼저 분리한 후 특정 항체를 사용하여 원하는 단백질을 식별하고 정량화하는 방식이라는 차이가 있다.
항체는 단백질의 특정 변형 상태를 연구하는 데에도 유용하게 사용된다. 예를 들어, 특정 단백질이 티로신에 인산화되었을 때만 인식하는 '인산화 특이적 항체'처럼 특정 변형에만 결합하는 항체를 개발하여 사용할 수 있다. 이를 통해 특정 변형을 겪은 단백질 집합을 식별할 수 있다. 또한, 항체 외에도 높은 항원 특이성을 갖도록 설계된 재조합 면역글로불린 유도체나 합성 단백질 스캐폴드(예: 나노바디, DARPins, 압타머)를 이용한 면역 분석도 가능하다.
기존의 ELISA와 같은 면역 분석 기술은 일반적으로 펨토몰(10−13 M) 수준의 농도까지 단백질을 검출할 수 있다. 이는 분자 수준의 질병 진단, 특히 매우 낮은 농도로 존재하는 초기 바이오마커를 검출하는 데 한계가 될 수 있다. 최근 개발된 디지털 면역 분석 기술은 이보다 약 1000배 더 민감하여 아토몰(10−16 M) 범위까지 검출 감도를 높였으며, 이는 진단 및 치료 분야에서 새로운 가능성을 열어줄 잠재력을 가지고 있다. 하지만 이러한 고감도 기술은 아직 일상적인 실험에 적용하기에는 수동 절차에 의존하는 등 한계가 있다.
항체를 이용한 단백질 검출은 여전히 매우 중요하지만, 항체에 의존하지 않는 다른 단백체학 방법들도 개발되어 사용되고 있다. 예를 들어 질량 분석법은 단백질 서열 결정, 높은 처리량, 항체가 존재하지 않는 단백질 분석 등에서 장점을 가진다. 또한, 항체 기반 정제와 질량 분석을 결합한 MSIA (질량 분석 면역 분석법)[32]나 SISCAPA(안정 동위 원소 표준 및 항펩타이드 항체를 이용한 포획)[33] 같은 하이브리드 기술도 특정 단백질의 정밀한 동정 및 정량화를 위해 활용된다.
5. 1. 2. 웨스턴 블롯 (Western blot)
웨스턴 블롯은 개별 단백질의 검출 및 정량화에 사용될 수 있다. 이 방법은 초기 단계에서 복잡한 단백질 혼합물을 SDS-PAGE를 사용하여 분리한 다음, 항체를 사용하여 관심 단백질을 식별하는 방식으로 이루어진다. 또한, 특정 질병 발생 시 발현되는 단백질, 즉 생체 지표(biomarker)를 찾아 질병을 조기 진단하는 데에도 활용된다. 웨스턴 블롯은 면역 염색, ELISA, 질량 분석법 등과 함께 이러한 생체 지표를 조사하는 방법 중 하나이다.5. 1. 3. 면역조직화학 염색
항체를 이용하여 특정 단백질을 검출하는 방법은 생화학 및 세포 생물학 연구의 기본적인 도구 중 하나이다. 이러한 항체 기반 분석법 중 하나인 면역 염색(Immunostaining)은 조직이나 세포 내 특정 단백질의 위치와 분포를 시각적으로 확인하는 데 사용된다.특히 질병 진단 분야에서 특정 단백질을 생체 지표(biomarker)로 활용하는 연구가 활발하며, 면역 염색은 이러한 생체 지표를 확인하는 중요한 방법이다. 예를 들어, 알츠하이머병 진단에서는 환자의 뇌 조직에서 특정 단백질의 변화를 관찰하는 것이 중요하다. 알츠하이머병 환자의 뇌에서는 β-세크레타제라는 효소의 농도가 증가하여 아밀로이드 단백질이 과도하게 생성되고 축적되어 플라크를 형성하는 것으로 알려져 있다. 면역 염색 기법을 통해 뇌 조직 샘플에서 이러한 아밀로이드 플라크의 존재와 분포를 직접 확인함으로써 질병 진단에 도움을 받을 수 있다.
5. 2. 항체를 사용하지 않는 단백질 검출
단백체학에서 단백질을 연구하는 방법은 다양하며, 항체를 사용하는 면역 분석법 외에도 항체에 의존하지 않는 여러 분석 기술들이 개발되었다. 항체를 사용하지 않는 방법들은 단백질이나 펩타이드의 서열 결정, 항체 기반 방법보다 높은 처리량 제공, 항체가 존재하지 않는 단백질의 식별 및 정량화 가능 등 다양한 장점을 가진다.[38][39]초창기 단백질 서열 분석법 중 하나는 에드만 분해법이었으나, 이는 처리량이 낮아 현재는 더 효율적인 기술들로 대체되었다. 특히 1980년대에 개발된 MALDI(매트릭스 보조 레이저 탈착/이온화법) 및 ESI(전기분무 이온화법)와 같은 연성 이온화 방법의 발견은 질량 분석법 기반 단백체학 연구의 발전을 크게 이끌었다. 이러한 질량 분석 기술은 탑다운 단백체학 및 바텀업 단백체학과 같은 주요 연구 흐름의 기반이 된다.
복잡한 생물학적 시료를 분석할 때는 시료 내 분석 대상 물질이 너무 많아 정확한 검출 및 정량화가 어렵기 때문에, 분석 전에 시료의 복잡성을 줄이는 과정이 필요하다. 이를 위해 1차원 또는 2차원 전기 영동, 크로마토그래피 등의 분리 기술이 사용된다.
또한, 특정 분석물의 항체 기반 정제 후 질량 분석을 통해 동정 및 정량화를 수행하는 하이브리드 기술도 개발되었다. 대표적인 예로는 1995년 개발된 MSIA (질량 분석 면역 분석법)[32]와 2004년 소개된 SISCAPA(안정 동위 원소 표준 캡처, Anti-Peptide Antibodies) 방법이 있다.[33] 단백질 발현량의 변화를 정량적으로 비교 분석하기 위한 기술로는 형광 물질을 이용하는 2차원 차등 겔 전기영동(2-D DIGE) 등이 사용된다.[34]
최근에는 바이오직교 화학 기술을 단백질 분석에 응용하려는 시도도 이루어지고 있다. 비단백질성 아미노산이나 특정 작용기를 가진 분자를 세포 내 단백질에 표지(labeling)하여 검출하는 방식이다. 예를 들어, 아지도호모알라닌(AHA)은 메티오닌 대신 단백질에 삽입되어 새로 합성된 단백질을 식별하는 데 사용될 수 있으며,[45] 케톤이나 알데히드의 축합 반응, 아지드 그룹과 포스핀의 스타우딩거 반응 등을 이용한 표지 방법도 연구되고 있다.[46][47]
이러한 항체 비의존적 단백질 검출 및 분석 방법들은 비교 단백체학 연구(예: 살충제 처리된 벼멸구의 생식 관련 단백질 변화 분석[35][36]), 특정 세포 소기관(예: ''애기장대'' 페록시좀[37])의 단백질체 분석, 인간 단백질체 특성화, 동물의 종양 단백질체 연구[60], 기타 생물 프로파일링 (''왕새우''[40]) 등 다양한 생명과학 연구 분야에서 활용되고 있다.
5. 2. 1. 에드만 분해법 (Edman degradation)
단백질 동정을 위한 잘 알려진 고전적인 방법 중 하나로 에드만 분해가 있다.5. 2. 2. 질량 분석법 (Mass spectrometry)

항체를 이용한 단백질 검출 외에도 항체에 의존하지 않는 다양한 단백질 분석 방법들이 개발되었다. 이 중 질량 분석법은 단백질 또는 펩타이드의 서열 결정, 높은 처리량 제공, 항체가 없는 단백질 식별 및 정량화 등 여러 장점을 가진 핵심 기술이다. 초기 단백질 서열 분석 방법인 에드만 분해법 등은 점차 질량 분석법과 같이 처리량이 높은 기술로 대체되었다.
질량 분석법 기반 기술은 1980년대에 개발된 MALDI(매트릭스 보조 레이저 탈착/이온화법) 및 ESI(전기분무 이온화법)와 같은 연성 이온화 방법의 발견으로 크게 발전했다. 이러한 기술들은 분석 전 추가적인 분리 과정을 포함하는 탑다운 단백체학 및 바텀업 단백체학 워크플로우를 가능하게 했다.
복잡한 생물학적 시료를 분석하기 위해서는 시료의 복잡성을 줄이는 과정이 필요하다. 이는 1차원 또는 2차원 전기 영동을 이용한 오프라인 분리나, 역상 크로마토그래피로 펩타이드를 분리한 후 ESI로 직접 이온화하는 온라인 방식으로 수행될 수 있다. 또한, 항체 기반 정제와 질량 분석을 결합한 하이브리드 기술도 개발되었다. 대표적인 예로 MSIA[32]와 SISCAPA(안정 동위 원소 표준 캡처, Anti-Peptide Antibodies)[33] 방법이 있다.
현재 단백체 프로파일링에 사용되는 질량 분석 기반 방법은 크게 두 가지로 나눌 수 있다.
첫 번째는 고해상도 2차원 전기 영동으로 단백질을 분리한 뒤, 발현량에 차이를 보이는 단백질 스팟을 선택하고 염색하여 질량 분석법으로 동정하는 방식이다. 이 방법은 널리 사용되지만, 단백질의 다양한 발현 수준과 특성 때문에 샘플 내 모든 단백질을 분리하기 어렵다는 한계가 있다.[41] 구체적으로, 겔 상의 단백질 스팟을 잘라내 프로테아제로 처리하여 펩타이드로 만들고, MALDI법으로 펩타이드 질량 지문(peptide mass fingerprinting)을 얻어 단백질을 동정한다. MALDI법에서는 펩타이드 이온의 비행시간(time-of-flight)을 측정하여 질량 대 전하 비(m/z)를 정밀하게 결정하고, 이를 통해 펩타이드 서열과 단백질을 식별한다.
두 번째는 동위 원소 표지를 이용한 정량 단백체학 접근 방식이다.[42][43] 이 방법에서는 서로 다른 샘플의 단백질을 안정 동위원소로 표지한 후 혼합하고, 단백질을 소화시켜 얻은 표지된 펩타이드 혼합물을 다차원 액체 크로마토그래피로 분리하여 직렬 질량 분석법(MS/MS)으로 분석한다. 널리 사용되는 ICAT(Isotope-Coded Affinity Tag) 시약은 단백질의 시스테인 잔기에 결합하여 분석의 복잡성을 줄인다. 이 동위원소 표지 기술은 인산화된 펩타이드 분리, 거대 분자 복합체 분석, 염색질 관련 단백질 연구, 세포 소기관 프로파일링 등 다양한 분야에 응용된다.[41] 단백질 혼합물을 분리하지 않고 직접 분석하는 경우, 단백질을 소화시킨 펩타이드 혼합물을 HPLC로 분리하고 바로 질량 분석 장치에 연결하여 분석한다. 탠덤 질량 분석에서는 첫 번째 질량 분석기에서 특정 펩타이드 이온을 선택하고, 두 번째 질량 분석기에서 이를 조각내어 그 패턴으로부터 서열을 결정한다.
리처드 D. 스미스와 태평양 북서 국립 연구소 연구진이 개발한 AMT(Accurate Mass and Time) 태그 접근 방식은 직렬 질량 분석 없이, 정확한 질량 측정값과 분리 시간 정보를 활용하여 펩타이드 및 단백질을 식별함으로써 처리량과 감도를 높인 방법이다.
질량 분석법은 친화성 단백체학, 단백질 마이크로어레이와 함께 단백질의 대규모 연구에 가장 일반적으로 사용되는 기술 중 하나이며, 특히 단백질 간 상호작용 규명이나 질병 진단을 위한 생체지표 발굴 등 다양한 연구 분야에서 핵심적인 역할을 수행하고 있다.
5. 2. 3. 분리 방법
단백체학 연구에서 단백질 혼합물을 효과적으로 분리하는 기술은 중요하다. 개별 단백질이나 펩타이드를 분리해야 후속 분석을 통해 정확한 정보를 얻을 수 있기 때문이다.초창기 단백질 분석 방법 중 하나는 1967년에 소개된 에드만 분해법이다. 이 방법은 펩타이드 하나를 여러 단계의 화학 반응을 통해 아미노산 서열을 알아내는 방식이었지만, 처리량이 낮아 현재는 더 효율적인 기술들로 대체되었다.
1980년대에 MALDI나 ESI와 같은 '연성 이온화' 방식의 질량 분석법이 개발되면서 단백체학 연구는 크게 발전했다. 이 기술들은 단백질이나 펩타이드를 손상 없이 이온화하여 질량을 정밀하게 측정할 수 있게 해주었고, 탑다운 단백체학이나 바텀업 단백체학 같은 주요 연구 흐름을 가능하게 했다.
복잡한 생체 시료에 포함된 수많은 단백질을 분석하기 위해서는 먼저 시료를 단순화하는 분리 과정이 필요하다. 전통적으로는 1차원 전기영동이나 2차원 전기 영동을 이용해 단백질을 겔 상에서 분리하는 '오프라인' 방식이 사용되었다. 2차원 전기 영동은 단백질을 등전점과 분자량이라는 두 가지 기준으로 분리하여 해상도가 높다. 분리된 단백질 스폿은 염색하여 위치를 확인하고 양을 측정할 수 있다. 이후 특정 스폿을 잘라내 프로테아제로 처리하여 얻은 펩타이드 조각들을 MALDI법 등의 질량 분석법으로 분석하여 단백질을 동정한다.
최근에는 HPLC, 특히 역상 크로마토그래피를 이용해 펩타이드 혼합물을 분리하고, 이를 ESI 장치와 직접 연결하여 질량 분석법으로 바로 분석하는 '온라인' 방식이 널리 쓰인다. 이 방식은 분리와 분석이 연속적으로 이루어져 효율성이 높다. HPLC는 주로 펩타이드의 소수성 차이를 이용해 분리하며, 연결된 탠덤 질량 분석기는 펩타이드 이온을 선택하고 조각내어 그 패턴으로 서열을 결정한다. 여러 시료 간의 단백질 양을 비교하기 위해 동위 원소 표지법을 사용하기도 한다.
특정 단백질을 표적으로 분리하고 분석하는 하이브리드 기술도 개발되었다. 예를 들어, 항체를 이용해 원하는 단백질이나 펩타이드를 먼저 분리(정제)한 뒤, 질량 분석법으로 동정하고 정량하는 방식이다. 대표적인 예로 MSIA (1995년)[32]와 SISCAPA (2004년)[33] 등이 있다.
단백질 발현량의 변화를 정량적으로 비교 분석하기 위한 기술로는 형광 물질을 이용하는 2차원 차등 겔 전기영동(2-D DIGE) 등이 사용된다.[34]
5. 3. 하이브리드 기술
다수의 하이브리드 기술은 개별 분석물의 항체 기반 정제를 사용한 다음, 동정 및 정량화를 위해 질량 분석법을 수행한다. 이러한 방법의 예로는 1995년 랜달 넬슨(Randall Nelson)이 개발한 MSIA (질량 분석 면역 분석법)[32]와 2004년 리 앤더슨(Leigh Anderson)이 소개한 SISCAPA(안정 동위 원소 표준 캡처, Anti-Peptide Antibodies) 방법[33] 등이 있다.형광 2차원 차등 젤 전기영동(2-D DIGE)[34]는 2-D DIGE 과정의 변화를 정량화하고, 표본 간의 정량적 변화를 할당하기 위한 통계적으로 유효한 임계값을 설정하는 데 사용될 수 있다.[34]
5. 3. 1. 질량 분석 면역 분석법 (MSIA)
ốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngốngống5. 3. 2. SISCAPA (Stable Isotope Standards Capture by Anti-Peptide Antibodies)
SISCAPA(Stable Isotope Standards Capture by Anti-Peptide Antibodies)는 안정 동위 원소 표준을 항-펩타이드 항체로 포획하는 기술을 의미한다. 이 방법은 개별 분석물을 항체 기반으로 정제한 다음, 질량 분석법을 이용하여 동정하고 정량하는 하이브리드 기술 중 하나이다. 2004년 리 앤더슨(Leigh Anderson)에 의해 소개되었다.[33] 유사한 하이브리드 기술로는 1995년 랜달 넬슨(Randall Nelson)이 개발한 MSIA (질량 분석 면역 분석법)이 있다.[32]6. 현대 연구 방법론
단백체학 연구에는 다양한 방법이 사용된다. 전통적으로 단백질은 항체를 이용한 면역 분석이나 전기영동, 질량 분석법 등으로 검출하고 분석한다. 복잡한 생물학적 시료의 경우 분석 대상 물질이 매우 많아, 때로는 검출 전에 추가적인 생화학적 분리 과정을 거쳐야 하는 경우가 많다.
항체를 이용하는 방법은 여전히 널리 쓰이지만, 항체 없이 단백질을 분석하는 기술들도 발전해왔다. 특히 질량 분석법 기반 기술은 단백질이나 펩타이드의 서열을 직접 결정할 수 있고, 항체 기반 방법보다 더 많은 시료를 빠르게 처리할 수 있으며, 항체가 없는 단백질까지 식별하고 정량할 수 있다는 장점이 있다. 초기 단백질 서열 분석법인 에드만 분해법(1967년 소개) 등은 처리량이 높은 현대 기술들로 대체되었다.
1980년대에 개발된 MALDI(매트릭스 보조 레이저 탈착/이온화법)나 ESI(전기분무 이온화법) 같은 '연성 이온화(soft ionization)' 기법의 등장은 질량 분석법 기반 단백체학 연구의 발전을 이끌었다. 이를 바탕으로 단백질을 통째로 분석하는 탑다운 단백체학과 단백질을 잘게 펩타이드 조각으로 만들어 분석하는 바텀업 단백체학 워크플로우가 개발되었다.
항체 기반 정제와 질량 분석을 결합한 하이브리드 기술도 사용된다. 특정 단백질을 항체로 먼저 분리한 뒤 질량 분석기로 동정하고 정량하는 방식이다. MSIA (질량 분석 면역 분석법)[32]나 SISCAPA[33] 등이 그 예시이다.
서로 다른 조건이나 개체 간의 단백질체 차이를 비교 분석하는 비교 단백체학 연구[35][36]나, 특정 세포 소기관(예: 애기장대 페록시좀[37]) 또는 상태(예: 동물의 종양[60])에 존재하는 단백질들을 집중적으로 연구하는 특정 단백체 연구도 이루어지고 있다. 인간 단백질체는 약 20,000~25,000개의 유전자로부터 만들어지지만, RNA 스플라이싱, 단백질 분해, 번역 후 변형 등을 고려하면 실제 고유한 단백질 종류는 수십만에서 수백만 개에 이를 것으로 추정된다.[38][39]
현재 질량 분석법을 이용한 단백체 분석에는 크게 두 가지 주요 접근 방식이 있다. 첫 번째는 고해상도 2차원 전기영동으로 단백질들을 분리한 뒤, 양적으로 차이를 보이는 단백질 스팟을 염색하고 잘라내어 질량 분석기로 동정하는 방식이다. 이 방법은 널리 사용되지만, 발현량이 매우 낮거나 높은 단백질, 특정 물리화학적 특성을 가진 단백질 등 모든 단백질을 분리하기 어렵다는 한계점을 가진다.[41]
두 번째는 안정 동위원소 표지(stable isotope labeling)를 이용하는 방식이다.[42][43] 서로 다른 샘플의 단백질에 질량이 다른 동위원소 표지를 붙인 후, 단백질들을 펩타이드로 분해한다. 이 펩타이드 혼합물을 다차원 액체 크로마토그래피로 분리하고 직렬 질량 분석(tandem mass spectrometry)으로 분석하여 각 펩타이드의 양을 비교한다. 동위원소 표지 시약 중 하나인 ICAT(Isotope-Coded Affinity Tag)는 단백질의 시스테인 잔기에 결합하여 분석의 복잡성을 줄이는 데 사용된다. 안정 동위원소 표지법은 특정 단백질 기능 연구, 단백질 복합체 분석, 염색질 관련 단백질 연구, 세포 소기관 단백체 분석 등 다양한 분야에서 활용된다.[41] 리처드 D. 스미스(Richard D. Smith) 연구팀이 개발한 정확한 질량 및 시간(AMT) 태그 접근 방식은 펩타이드의 정확한 질량과 분리 시간을 이용해 직렬 질량 분석 없이도 단백질을 동정함으로써 분석 속도와 감도를 높인다.
항체나 압타머와 같은 친화성 시약을 이용해 특정 단백질들을 검출하고 정량하는 친화성 단백체학[44]은 특히 혈액이나 뇌척수액 같은 생체 유체 분석에 강점을 가지며, 많은 수의 샘플을 빠르게 분석할 수 있다. 단백질 마이크로어레이는 유리 슬라이드 같은 표면에 수천 개의 항체나 단백질을 배열하여 샘플 내 단백질 발현 양상이나 단백질 간 상호작용을 대규모로 분석하는 기술이다.
최근에는 바이오직교 화학 기술을 단백체 분석에 응용하려는 시도가 이루어지고 있다. 세포 내에서 자연적인 생화학 반응과 간섭하지 않으면서 특정 분자 표지를 도입하는 방법이다. 예를 들어, 비단백질성 아미노산인 아지도호모알라닌(AHA)을 세포에 처리하면 메티오닌 대신 단백질 합성에 사용되어 새로 만들어지는 단백질에 아지드 그룹을 표지할 수 있다.[45] 이렇게 표지된 단백질은 스타우딩거 반응 등을 통해 검출하거나 분리할 수 있다.[47] 케톤이나 알데히드 작용기를 이용한 표지 방법[46] 등 다양한 바이오직교 반응들이 개발되어 단백질 연구에 활용된다.
컴퓨터를 이용한 계산 분석 역시 단백체학 연구에 중요하게 사용된다. 특히 단백질의 기능을 조절하는 번역 후 변형(PTM)은 실험적으로 분석하기 어렵기 때문에, 이를 예측하고 분석하는 계산 모델 개발이 이루어지고 있다.[69][70] 또한, 계산 모델은 질병 진단을 위한 바이오마커 발굴에도 기여한다.
단백체학 연구는 단백질의 절대 정량, 번역 후 변형(PTM) 분석, 분석 처리량 및 민감도 향상, 단일 세포 수준 분석[74][75][76] 등 여러 도전 과제를 안고 있으며, 이를 해결하기 위한 새로운 기술 개발이 계속되고 있다.[73] 특히 단백질의 기능은 단순히 양적인 변화뿐 아니라 PTM에 의해 조절되는 경우가 많아 PTM 분석 기술의 중요성이 커지고 있다. 또한, 세포 내 환경에서 단백질의 실제 상호작용을 연구하기 위한 화학적 가교법이나 실시간 이미징 기술 개발도 중요한 연구 방향이다.[41]
궁극적으로 단백체학은 유전체학, 전사체학, 대사체학 등 다른 -오믹스 학문과 통합되어 생명 현상을 시스템 수준에서 이해하는 데 이바지한다.[55][56] 예를 들어, 암 게놈 아틀라스 프로젝트와 연계된 ''암 단백체 아틀라스''[79]는 유전체, 전사체 정보와 함께 단백체 데이터를 제공하여 암 발생 및 진행 과정에 대한 통합적인 이해를 돕고 있다. 이러한 대규모 단백체 데이터는 암 생물학, 발달, 줄기 세포 연구, 의학, 진화 생물학 등 다양한 분야의 연구에 중요한 자원이다.
단백질 간의 상호작용 네트워크를 밝히는 것 역시 단백체학의 주요 목표 중 하나이다. 전통적인 효모 투-하이브리드 법 외에도 마이크로어레이, 친화성 크로마토그래피, 질량 분석법 등 다양한 방법이 개발되어 단백질의 기능을 추론하고 세포 내 경로를 이해하는 데 사용된다.
단백체학 연구 결과는 새로운 질병 치료제 개발이나 진단법 개발에 응용될 수 있다. 질병 관련 단백질을 발굴하고 그 구조와 기능을 분석하여 약물 표적을 설정하거나, 특정 질병 상태에서 변화하는 단백질을 바이오마커로 활용하여 조기 진단에 이용하는 것이 대표적인 예이다. 예를 들어 HIV-1 프로테아제 저해제 개발이나, 특정 질병의 진단에 활용되는 단백질 바이오마커 연구 등이 진행되고 있다. 분산 컴퓨팅 프로젝트인 World Community Grid 등은 단백질 구조 예측 및 모델링 계산을 통해 신약 개발 연구를 지원한다.
6. 1. 형광 2차원 차등 젤 전기영동 (2-D DIGE)
형광 2차원 차등 젤 전기영동(2-D DIGE)[34]은 2차원 전기영동 과정에서 나타나는 단백질 양의 변화를 측정하는 기술이다. 이 방법을 통해 서로 다른 표본(샘플) 사이에 나타나는 단백질 양의 차이를 통계적으로 의미 있는 수준에서 비교하고 분석할 수 있다.[34]6. 2. 비교 단백체학 (Comparative proteomics)
비교 단백질체 분석은 생식 과정을 포함한 복잡한 생물학적 시스템에서 단백질의 역할을 밝히는 데 유용하게 사용될 수 있다. 예를 들어, 살충제의 일종인 트리아조포스를 처리했을 때 수컷 벼멸구(학명: ''Nilaparvata lugens'')에서 특정 부속 생식선 단백질(Acps)의 양이 증가하는 현상이 관찰되었다. 이 단백질은 교미 과정에서 암컷에게 전달되어 암컷의 번식 능력, 즉 새끼를 낳는 비율을 높이는 역할을 할 수 있다.[35] 연구자들은 비교 단백질체 분석 방법을 이용하여, 교미를 마친 암컷 벼멸구가 수컷으로부터 어떤 종류의 부속 생식선 단백질과 생식 관련 단백질을 받았는지 그 변화를 자세히 조사했다.[36] 이 연구를 통해 해당 단백질들이 벼멸구 암수 성체의 생식 과정에서 중요한 역할을 한다는 사실이 밝혀졌다.[36]6. 3. 특정 단백체 연구 (Targeted proteomics)
단백체학에서 특정 단백질이나 단백질 그룹을 연구하는 방법은 다양하다. 전통적으로 항체를 이용한 면역 분석이 널리 사용되었으며, 이는 매우 특이적인 항체를 사용하거나 검출 전에 생화학적 분리 과정을 거쳐야 할 때가 많다. 복잡한 생물학적 샘플에는 분석 및 정량화해야 할 대상이 너무 많기 때문이다.항체에 의존하지 않는 방법들도 개발되었는데, 대표적으로 질량 분석법이 있다. 이 방법들은 단백질이나 펩타이드의 서열 결정이 가능하고, 항체 기반 방법보다 처리량이 높으며, 항체가 존재하지 않는 단백질도 식별하고 정량화할 수 있다는 장점이 있다.
두 방법을 결합한 하이브리드 기술도 존재한다. 특정 분석물을 항체로 먼저 정제한 다음, 질량 분석법을 이용해 동정하고 정량하는 방식이다. 대표적인 예로 1995년 랜달 넬슨(Randall Nelson)이 개발한 MSIA (질량 분석 면역 분석법)[32]와 2004년 리 앤더슨(Leigh Anderson)이 소개한 SISCAPA(안정 동위 원소 표준 캡처, Anti-Peptide Antibodies) 방법이 있다.[33] 형광 2차원 차등 젤 전기영동(2-D DIGE)[34] 역시 특정 단백질 변화를 정량적으로 분석하는 데 사용될 수 있다.[34]
비교 단백체 분석은 특정 조건 하에서 단백질의 역할을 밝히는 데 유용하다. 예를 들어, 살충제 처리 시 수컷 벼멸구(''Nilaparvata lugens'')의 부속 생식선 단백질(Acps) 함량이 증가하며, 이 단백질이 교미를 통해 암컷에게 전달되어 번식력을 높이는 현상을 비교 단백체 분석으로 확인했다.[35][36] 또한, ''애기장대''의 페록시좀 단백질체 분석은 새로운 페록시좀 단백질을 대규모로 식별하는 주요 접근법으로 활용되었다.[37] 최근에는 동물의 종양 단백질체를 해독하려는 시도도 보고되었다.[60]
친화성 단백체학은 항체나 압타머와 같은 친화성 시약을 사용하여 단백질을 특이적으로 검출하는 방법이다.[44] 이 기술은 특히 혈장, 혈청, 뇌척수액(CSF)과 같은 생체 유체에서 수천 개의 단백질을 동시에 조사할 수 있으며, 수백 또는 수천 개의 샘플을 비교적 짧은 시간(며칠 또는 몇 주) 내에 분석할 수 있다는 장점이 있다. 이는 질량 분석법 기반 방법으로는 달성하기 어려운 수준의 샘플 처리량이다.
단백질 마이크로어레이는 수천 개의 단백질 검출 기능(예: 항체 또는 특정 단백질)을 고체 표면에 배열하여 생물학적 샘플 내 상호작용(단백질-DNA, 단백질-단백질, 단백질-리간드 등)을 연구하는 기술이다. 특히, 레이저 포획 미세 절개술(LCM)과 결합된 역상 단백질 마이크로어레이는 특정 조직(예: 암 조직) 내의 미세한 영역에서 서로 다른 세포 집단(예: 정상 세포와 암세포) 간의 단백질체 변화를 정밀하게 모니터링하는 데 유용하다. 이를 통해 질병의 진행 단계나 세포 신호 전달 경로를 추적하고, 진단 및 치료 전략 개발에 기여할 수 있다.[41]
특정 단백질은 질병 진단을 위한 생체 지표로 활용될 수 있다. 특정 질병 상태에서 발현량이 변하는 단백질을 찾아 웨스턴 블롯, 면역 염색, ELISA, 질량 분석법 등으로 검출하여 질병을 조기에 진단하는 데 도움을 줄 수 있다.
- 알츠하이머병: β-세크레타제 농도 증가 및 아밀로이드 플라크 형성이 주요 지표로 활용된다.
- 심장병: 인터루킨6, 인터루킨8, 혈청 아밀로이드 A, 피브리노겐, 트로포닌 등 다양한 단백질이 생체 지표로 사용된다. 특히 심장 손상 후 트로포닌 수치 변화는 급성 심근 경색 진단에 중요하다.
- 간세포암: 건강한 세포와 암세포의 단백질체 비교를 통해 생체 지표를 발굴했으며, 소변 내 폴리펩티드 등을 분석하여 조기 진단에 활용하려는 연구가 진행 중이다.
계산 생물정보학 모델 역시 특정 단백질 연구에 기여한다. 예를 들어, 임신 중 모체 혈액으로 이동하는 태아 단백질을 예측하고 분석하여 비침습적 산전 진단 가능성을 탐색하는 연구[71]나, 생체 유체와 조직 정보를 통합하여 새로운 바이오마커를 발굴하는 정보 이론적 접근법[72] 등이 개발되고 있다.
7. 고처리량 단백체학 기술 (High-throughput proteomics technologies)
세포는 처한 환경이나 발생, 세포 분화, 세포 주기, 암 발생과 같은 다양한 생물학적 조건에 따라 서로 다른 종류와 양의 단백질을 만들어낸다. 또한, 대부분의 단백질은 만들어진 후에도 번역 후 변형(PTM)이라는 과정을 통해 구조와 기능이 다양하게 변화하므로, 특정 시점이나 조건에서의 단백질 총체, 즉 단백체는 매우 복잡하고 역동적인 특성을 가진다.
이러한 단백체의 복잡성 때문에 단백질 연구, 즉 단백체학은 매우 방대한 데이터를 다루어야 하는 경우가 많다. 예를 들어, 특정 암의 생체 지표를 찾기 위해서는 여러 환자의 다양한 샘플(예: 혈청)을 비교 분석해야 하며, 실험 과정에서 발생할 수 있는 오차나 교란 요인을 고려한 정교한 실험 설계가 필수적이다.[17] 이처럼 대량의 샘플에서 수많은 단백질을 효율적으로 분석하고 비교하기 위해서는 고처리량(High-throughput) 기술이 반드시 필요하다.
전통적으로 단백질 연구에는 특정 단백질에 결합하는 항체를 이용한 면역 분석법이나, 단백질을 크기나 전하에 따라 분리하는 전기 영동 방법이 주로 사용되었다. 하지만 이러한 방법들은 한 번에 분석할 수 있는 단백질의 수가 제한적이거나, 분석하고자 하는 단백질에 대한 항체가 없는 경우에는 사용하기 어렵다는 한계가 있었다. 특히 복잡한 생물학적 샘플에는 분석 대상 단백질이 너무 많아 정확한 분석을 위해 특별한 항체(예: 정량적 도트 블롯 분석, QDB)를 사용하거나 복잡한 분리 과정을 거쳐야 했다.
이러한 한계를 극복하기 위해 질량 분석법을 비롯한 다양한 고처리량 분석 기술들이 개발되었다. 질량 분석법은 단백질이나 펩타이드의 서열 정보를 얻을 수 있을 뿐만 아니라, 항체가 존재하지 않는 단백질도 식별하고 정량할 수 있으며, 자동화를 통해 대량의 샘플을 빠르게 분석할 수 있다는 장점이 있다. 단백질 마이크로어레이 역시 작은 칩 위에 수천 개의 단백질 또는 항체를 배열하여 단백질의 발현 양상이나 상호작용을 한 번에 분석할 수 있는 대표적인 고처리량 기술이다.
또한, 기존 기술들을 조합하거나 개선한 방법들도 개발되었다. 예를 들어, 항체를 이용해 특정 단백질이나 펩타이드를 먼저 분리한 후 질량 분석법으로 정밀하게 분석하는 MSIA[32]나 SISCAPA(Stable Isotope Standards and Capture by Anti-Peptide Antibodies)[33]와 같은 하이브리드 기술이 있다. 2차원 전기 영동 기술도 형광 물질을 이용해 여러 샘플을 동시에 비교하고 정량 분석의 정확성을 높인 형광 2차원 차등 젤 전기영동(2-D DIGE) 등으로 발전하였다.[34]
이러한 고처리량 단백체학 기술들은 특정 조건(예: 질병 상태, 약물 처리)에 따른 단백질 발현 변화를 비교 분석하는 비교 단백체학(Comparative proteomics) 연구를 가능하게 한다. 예를 들어, 살충제 처리가 곤충의 생식 단백질에 미치는 영향을 분석하거나,[35][36] 식물 세포 소기관인 페록시좀의 새로운 단백질 기능을 밝히는[37] 등 다양한 생명 현상 연구에 핵심적인 역할을 수행하고 있다. 수많은 단백질 변이체와 번역 후 변형을 고려할 때 수백만 종류에 이를 것으로 추정되는[38][39] 복잡한 인간 단백체를 이해하고, 이를 통해 질병의 진단 및 치료법 개발에 기여하는 데 중요한 기반을 제공한다.
7. 1. 질량 분석법 및 단백질 프로파일링
세포는 처한 환경이나 발생, 세포 분화, 세포 주기, 암 발생과 같은 생물학적 과정에 따라 서로 다른 종류와 양의 단백질을 만들어낸다. 또한, 대부분의 단백질은 만들어진 후에도 다양한 번역 후 변형(Post-translational modification, PTM)을 겪기 때문에 단백체의 복잡성은 더욱 증가한다. 따라서 특정 조건에서의 단백체, 즉 프로테옴(proteome)을 연구하는 단백체학은 매우 복잡한 분야이다. 예를 들어 특정 암의 생체 지표를 찾기 위해서는 여러 환자의 다양한 샘플을 분석하고 실험 오차를 고려하는 복잡한 실험 설계가 필요할 수 있다.[17]단백체학에서 단백질을 연구하는 전통적인 방법으로는 특정 단백질에 결합하는 항체를 이용한 면역 분석법이나 전기 영동을 이용한 분리 및 검출이 있다. 하지만 복잡한 생물학적 샘플에는 분석 대상 물질이 너무 많아 정확한 검출과 정량을 위해 매우 특이적인 항체를 사용하거나(예: 정량적 도트 블롯 분석, QDB) 검출 전에 생화학적 분리 과정을 거쳐야 한다. 항체 기반 방법은 여전히 널리 쓰이지만, 항체가 존재하지 않는 단백질을 분석하거나 더 높은 처리량이 요구될 때는 한계가 있다. 초창기 단백질 서열 분석법인 에드만 분해법(1967년) 역시 현재는 더 높은 처리량을 제공하는 기술로 대부분 대체되었다.
이러한 한계를 극복하고 단백체 연구의 핵심적인 역할을 하는 기술이 바로 질량 분석법(Mass Spectrometry, MS)이다. 질량 분석법은 단백질이나 펩타이드의 서열을 결정할 수 있고, 항체 기반 방법보다 처리량이 높으며, 항체가 없는 단백질도 식별하고 정량할 수 있는 장점이 있다. 질량 분석법이 단백체학에 본격적으로 활용되기 시작한 것은 1980년대 매트릭스 보조 레이저 탈착/이온화법(MALDI)과 전기분무 이온화법(ESI)과 같은 연성 이온화(soft ionization) 방법이 개발되면서부터이다. 이 기술들은 단백질이나 펩타이드를 손상시키지 않고 이온화하여 질량 분석기로 보낼 수 있게 해, 탑다운 단백체학(top-down proteomics, 단백질을 그대로 분석)과 바텀업 단백체학(bottom-up proteomics, 단백질을 펩타이드로 분해하여 분석) 워크플로우의 발전을 이끌었다.
복잡한 생물학적 시료를 질량 분석법으로 분석하기 위해서는 시료의 복잡성을 줄이는 과정이 필수적이다. 이는 1차원 또는 2차원 전기 영동으로 단백질을 분리한 후 분석하는 오프라인(offline) 방식으로 수행될 수 있다. (2차원 전기영동의 자세한 내용과 한계는 #2차원 전기영동의 한계 참조) 최근에는 단백질을 펩타이드로 분해한 뒤 액체 크로마토그래피(특히 역상 크로마토그래피)로 분리하고 이를 직접 ESI 방식으로 질량 분석기에 도입하는 온라인(online) 방식이 널리 사용되어 분석의 자동화와 효율성을 높이고 있다.
질량 분석법은 단백질의 정량 분석에도 활발히 이용된다. 안정 동위원소 표지법(Stable isotope labeling)은 서로 다른 샘플(예: 정상 세포 vs 암 세포)의 단백질을 질량이 다른 안정 동위원소로 표지한 후, 두 샘플을 혼합하여 질량 분석을 통해 단백질의 상대적인 양을 비교하는 방법이다.[42][43] 대표적인 예로 ICAT(Isotope-Coded Affinity Tag) 시약은 단백질의 시스테인 잔기를 표지하여 분석의 복잡성을 줄이는 데 사용된다. 이 기술은 단백질 기능 연구, 거대 분자 복합체 분석, 염색질 관련 단백질 연구, 세포 소기관 단백체 분석 등 다양한 분야에 응용된다.[41] 또 다른 정량적 접근 방식으로는 리처드 D. 스미스(Richard D. Smith) 연구팀이 개발한 정확한 질량 및 시간(AMT) 태그 접근법이 있다. 이 방법은 펩타이드의 매우 정확한 질량과 액체 크로마토그래피에서의 용출 시간 정보를 이용하여 탠덤 질량 분석(MS/MS) 없이도 펩타이드와 단백질을 식별함으로써 처리량과 감도를 높인다.
질량 분석법 외에도 다양한 단백질 프로파일링 기술이 존재한다.
- 친화성 단백체학(Affinity Proteomics): 항체나 압타머(aptamer)와 같은 친화성 시약을 사용하여 특정 단백질을 검출하고 정량하는 방법이다.[44] 이 기술은 특히 혈액, 혈청, 뇌척수액(CSF)과 같은 생체 유체에서 수천 개의 단백질을 동시에 분석할 수 있으며, 수백 또는 수천 개의 샘플을 비교적 짧은 시간(며칠 또는 몇 주) 내에 분석할 수 있다는 높은 샘플 처리량의 장점이 있다.
- 단백질 마이크로어레이(Protein Microarray): 작은 유리 슬라이드나 칩 표면에 수천 개의 단백질 또는 항체를 고밀도로 배열하여 생물학적 샘플 내 단백질의 양, 활성, 상호작용 등을 한 번에 분석하는 기술이다. 항체 어레이는 샘플 내 여러 항원을 동시에 검출하는 데 사용되며, 기능적 단백체 어레이는 단백질 간 상호작용 연구에 활용된다. 단백질은 DNA보다 다루기 어렵고 안정성이 낮아 기술 구현에 어려움이 있다. 역상 단백질 마이크로어레이(RPPA)는 레이저 포획 미세 절개술(LCM)로 특정 세포 집단을 분리하고 추출한 단백질을 칩에 고정시킨 후 항체로 분석하여, 질병 단계나 세포 집단 간 단백질 변화를 정밀하게 모니터링하는 데 유용하다.[41]
- 바이오직교 화학(Bioorthogonal Chemistry)의 응용: 살아있는 세포 내에서 정상적인 생화학 반응을 방해하지 않고 특정 분자들끼리만 선택적으로 반응하는 화학 기술도 단백체 분석에 활용된다. 비단백질성 아미노산(예: 아지도호모알라닌, AHA)을 단백질 합성에 이용하거나[45], 케톤/알데히드[46] 또는 아지드 그룹[47]을 가진 분자를 표적 단백질에 도입한 후, 특정 화학 반응을 통해 리포터 분자(형광 물질, 바이오틴 등)를 부착하여 단백질을 표지하고 분석하는 방법들이 개발되고 있다.
항체 기반의 정제 기술과 질량 분석법을 결합한 하이브리드 기술도 있다. 예를 들어, MSIA (Mass Spectrometric Immunoassay) (1995년 개발)[32]나 SISCAPA(Stable Isotope Standards and Capture by Anti-Peptide Antibodies) (2004년 소개)[33]는 특정 단백질이나 펩타이드를 항체로 포획한 뒤 질량 분석을 통해 동정하고 정량하는 방식이다.
이러한 다양한 질량 분석법 및 프로파일링 기술들은 특정 샘플의 주요 단백질을 식별하고, 질병 조직과 건강한 조직처럼 관련된 샘플 간에 차등적으로 발현되는 단백질을 찾아내는 발현 단백체학 연구의 기반이 된다. 이를 통해 질병 진단 지표나 새로운 약물 표적을 발굴하는 데 기여한다.
7. 1. 1. 2차원 전기영동의 한계
2차원 전기 영동(2D-PAGE)은 복잡한 생물학적 시료에서 단백질을 분리하고 분석하는 데 오랫동안 사용되어 온 중요한 기술이다. 1차원 전기영동과 함께 사용되어 시료 내 단백질의 복잡성을 줄이는 데 기여하며,[34] 특정 조건 하에서 단백질 발현량의 변화를 비교하는 발현 단백체학 연구에서도 질량 분석법과 함께 활용된다. 형광 물질을 이용한 2차원 차등 젤 전기영동(2-D DIGE) 기법은 단백질 양의 변화를 정량적으로 분석하는 데 도움을 주기도 한다.[34]하지만 2차원 전기영동은 몇 가지 기술적인 한계를 지니고 있다. 특히, 분석하려는 시료 내 단백질들의 양적 차이가 매우 클 경우 어려움이 발생한다. 예를 들어, 인간 혈장에는 매우 풍부한 알부민과 같은 단백질부터 극미량으로 존재하는 사이토카인까지 다양한 단백질이 혼재하는데, 이들 사이의 농도 차이는 1010 배 이상 벌어질 수 있다.[81] 2차원 전기영동 젤은 이러한 넓은 동적 범위(dynamic range)를 가진 시료에서 모든 단백질을 동시에 효과적으로 분리하고 검출하는 데 한계가 있으며, 이는 특히 질병 진단 등에 중요한 낮은 농도의 바이오마커 단백질을 식별하기 어렵게 만들 수 있다.
또한, 단백질 기능 조절에 중요한 역할을 하는 번역 후 변형(PTM)을 분석하는 데에도 제약이 따른다. 많은 단백질 분석 도구들이 PTM을 충분히 고려하지 않고 개발되었으며,[69] 2D 전기영동만으로는 동일한 단백질이라도 다양한 PTM 상태를 가진 변종들을 명확하게 분리하고 각각을 동정하는 것이 어려울 수 있다.
이러한 2차원 전기영동의 한계를 극복하고 더 높은 처리량과 감도를 제공하기 위해, 질량 분석법을 기반으로 한 새로운 단백체 분석 기술들이 활발히 개발되었다. 특히 MALDI나 ESI와 같은 연성 이온화(soft ionization) 방법의 등장은 단백질 연구에 혁신을 가져왔다. 최근에는 단백질을 펩타이드 조각으로 분해한 뒤 액체 크로마토그래피(특히 역상 크로마토그래피)로 분리하고, 이를 직접 ESI 방식을 통해 질량 분석기에 도입하는 온라인(online) 분석 방식(분리와 분석을 직접 연결하는 방식)이 널리 사용되어 분석의 자동화와 효율성을 높이고 있다.
7. 1. 2. 안정 동위원소 표지 (Stable isotope labeling)
주어진 원본 소스에는 "안정 동위원소 표지 (Stable isotope labeling)" 섹션에 해당하는 내용이 포함되어 있지 않다.7. 2. 친화성 단백체학 (Affinity proteomics)
친화성 단백체학은 항체 또는 압타머와 같은 다른 친화성 시약을 단백질 특이적 검출 프로브로 사용하는 방법이다.[44] 현재 이 방법은 일반적으로 혈장, 혈청 또는 뇌척수액(CSF)과 같은 생체 유체에서 수천 개의 단백질을 동시에 조사하는 데 사용될 수 있다. 이 기술의 주요 차별점은 합리적인 기간(며칠 또는 몇 주) 내에 수백 또는 수천 개의 샘플을 분석할 수 있다는 점이다. 이는 질량 분석법 기반 방법으로는 달성하기 어려운 수준의 샘플 처리량이다.7. 3. 단백질 칩 (Protein chip)
단백질 마이크로어레이는 질량 분석법과 함께 단백체학 및 의학 분야에서 단백질 연구에 활용되는 주요 기술 중 하나이다. 흔히 단백질 칩이라고도 불리며, 이는 DNA 마이크로어레이와 유사한 원리로 작동한다. 단백질 마이크로어레이의 기본적인 목적은 생물학적 샘플 내에 존재하는 다양한 단백질들을 동시에 분석하기 위해, 수천 가지의 단백질 검출 물질(주로 항체나 단백질 자체)을 작은 고체 표면(예: 유리 슬라이드) 위에 고밀도로 배열하여 인쇄하는 것이다.[44]단백질 마이크로어레이에는 여러 종류가 있다. 대표적인 예로는 항체 어레이가 있는데, 이는 다양한 종류의 항체를 배열하여 혈액과 같은 생체 시료 내에 존재하는 특정 항원(단백질)들을 검출하고 그 양을 측정하는 데 사용된다. 또 다른 방식으로는 기능적 단백체 어레이가 있으며, 이는 여러 종류의 정제된 단백질 자체를 배열하여 단백질-단백질 상호작용, 단백질-DNA 상호작용, 단백질-리간드 상호작용 등 단백질의 다양한 생화학적 기능과 특성을 연구하는 데 활용된다. 궁극적으로는 특정 유기체가 가진 전체 단백질(단백체)을 포함하는 기능적 단백체 어레이를 제작하는 것이 목표이다.
이러한 단백질 칩 기술의 초기 버전 중 하나는 효모에서 추출하여 정제한 약 5,000개의 단백질을 유리 현미경 슬라이드 위에 배열하여 만든 것이었다. 초기의 성공에도 불구하고, 단백질 칩 기술을 구현하고 활용하는 데에는 여러 가지 기술적인 어려움이 따른다. 단백질은 DNA에 비해 본질적으로 다루기가 훨씬 까다롭기 때문이다. 단백질은 종류에 따라 세포 내 존재량이 매우 큰 폭으로 차이 나고(넓은 동적 범위), DNA보다 화학적으로 덜 안정하며, 특히 단백질의 고유한 3차원 구조를 칩 표면에서 온전하게 유지하는 것이 어려운데, 이는 단백질의 기능을 분석하는 데 매우 중요하기 때문이다.[41] 이러한 기술적 한계 때문에 단백질 칩 기술은 지속적인 개발과 개선이 이루어지고 있다.
7. 3. 1. 단백질 마이크로어레이 (Protein microarray)
단백체학 및 의학 분야에서 질량 분석법과 함께 중요한 기술로 단백질 마이크로어레이가 사용된다. 단백질 마이크로어레이는 생물학적 샘플을 분석하기 위해 수천 개의 단백질 검출 기능을 고체 표면 위에 배열하여 인쇄하는 기술이다. 대표적인 예로 항체 어레이가 있는데, 이는 다양한 항체를 배열하여 인간 혈액 샘플 내 특정 항원을 검출하는 데 사용된다. 또 다른 방식으로는 단백질-DNA, 단백질-단백질, 단백질-리간드 상호작용과 같은 특성을 연구하기 위해 여러 종류의 단백질을 배열하는 기능적 단백체 어레이가 있다. 이상적으로는 특정 유기체의 전체 단백질체를 포함하는 기능적 단백체 어레이를 구축하는 것이 목표이다.이러한 어레이의 초기 버전 중 하나는 효모에서 추출한 5,000개의 정제된 단백질을 유리 현미경 슬라이드에 증착하여 만든 것이었다. 초기 성공에도 불구하고 단백질 어레이 구현에는 여러 어려움이 따른다. 단백질은 DNA보다 다루기 훨씬 까다로운데, 발현량이 매우 다양하고(넓은 동적 범위), DNA보다 안정성이 낮으며, 분석에 필수적인 단백질 구조를 슬라이드 표면에서 유지하기 어렵기 때문이다.
최근에는 암과 같은 복잡한 질병의 진단, 연구, 치료를 위한 새로운 마이크로어레이 응용 기술이 개발되고 있다. 특히 레이저 포획 미세 절개술(LCM)과 마이크로어레이 기술을 결합한 역상 단백질 마이크로어레이(Reverse Phase Protein Microarray, RPPA)가 주목받고 있다. 이 방식은 개별 환자로부터 얻은 조직 샘플 내 질병의 여러 단계를 포착하기 위해 전체 단백질 추출물을 마이크로어레이 슬라이드에 고정시킨다. LCM 기술을 이용해 특정 세포 집단(예: 암세포와 정상 세포)을 분리한 후, 이들로부터 추출한 단백질 용해물을 니트로셀룰로오스 슬라이드 등에 배열하고 특정 항체로 분석한다. 이를 통해 조직 내 미세 환경에서 서로 다른 세포 집단 간의 단백질체 변화, 특히 세포 신호전달 분자의 상태 변화를 정밀하게 모니터링할 수 있다. 예를 들어, 정상 전립선 상피 조직과 침윤성 전립선암 조직에서 주요 단백질 인자들의 상태 변화를 추적하는 데 성공적으로 활용되었다. 이 방법은 동일 환자 내에서 질병 조직과 건강한 조직을 직접 비교하여 분자 수준의 변화를 추적하고, 이를 바탕으로 맞춤형 치료 전략 개발 및 진단에 기여할 수 있다. LCM과 결합된 역상 마이크로어레이 기술은 종양 연구뿐만 아니라, 다양한 조직의 정상적인 생리학 및 병리학 연구, 발달 과정 및 이상 상태 규명 등 광범위한 생명과학 연구 분야에서 중요한 도구로 활용될 잠재력을 가진다.[41]
7. 3. 2. 역상 단백질 마이크로어레이 (Reverse-phase protein microarray)
역상 단백질 마이크로어레이는 암과 같은 복잡한 질병의 진단, 연구, 치료를 위한 유망한 마이크로어레이 응용 기술이다. 이 기술은 레이저 포획 미세 절개술(LCM)과 마이크로어레이 기술을 결합하여 개발되었다. 일반적인 단백질 마이크로어레이와 달리, 역상 단백질 마이크로어레이는 분석 대상인 단백질 용해물(lysate) 자체를 슬라이드 위에 고정시킨다. 즉, 개별 환자로부터 얻은 조직 샘플 내 다양한 질병 단계의 단백질 전체를 배열하는 방식이다.[41]LCM 기술을 함께 사용하면, 특정 조직 부위(예: 종양 조직 내의 암세포와 정상 세포)에서 원하는 세포 집단만을 정밀하게 분리하여 분석할 수 있다. 이를 통해 인간 조직의 미세한 영역 내에서 서로 다른 세포 집단 간의 단백체 변화 상태를 정밀하게 모니터링할 수 있다. 예를 들어, 정상 세포와 암세포가 섞여 있는 조직 단면에서 특정 세포 신호 전달 분자의 상태 변화를 파악하는 데 유용하다. 실제로 정상 전립선 상피 조직과 침윤성 전립선암 조직에서 주요 인자들의 상태를 비교 분석하는 데 활용되었다. LCM으로 분리된 조직의 단백질 용해물을 니트로셀룰로오스 슬라이드에 배열하고, 특정 항체를 이용하여 원하는 단백질을 검출하고 분석한다.[41]
이 방법을 통해 연구자들은 특정 분자 수준의 변화를 추적하고, 동일한 환자 내에서 질병 조직과 건강한 조직을 직접 비교 분석할 수 있다. 이는 새로운 치료 전략 개발이나 진단법 개발에 중요한 정보를 제공한다. LCM과 역상 마이크로어레이를 결합하여 인접한 세포 집단의 단백체 상태를 스냅샷처럼 파악하는 기능은 종양 연구뿐만 아니라 다양한 분야에서 응용될 잠재력이 있다. 모든 종류의 조직에서 정상적인 생리학적 과정이나 병리학적 상태를 깊이 이해하는 데 도움을 줄 수 있으며, 특히 발생 과정이나 발달 이상을 규명하는 데 중요한 도구가 될 수 있다.[41]
7. 4. 생체 직교 화학 (Bioorthogonal chemistry)을 이용한 단백질 검출
최근 바이오직교 화학의 발전은 단백질 분석 분야에 새로운 가능성을 열었다. 이 방법은 살아있는 세포나 유기체 내에서 본래의 생화학적 과정을 방해하지 않고 특정 분자를 관찰하고 조작하는 화학 반응을 이용한다. 단백질 연구에서는 유기 분자를 사용하여 단백질에 표지를 붙이는 방식으로 활용된다. 비단백질성 아미노산이나 특정 작용기를 가진 분자를 세포에 도입하면, 이들이 단백질 합성과정에 참여하거나 기존 단백질에 결합하여 표지 역할을 하게 된다. 이는 단백질체학에서 새롭게 주목받는 기술이다.세포나 조직 내에서 대사될 수 있는 특정 생체 분자는 단백질이나 글리칸에 삽입될 수 있다. 이 분자들은 '친화성 태그'를 가지고 있어, 표지된 단백질을 쉽게 분리하거나 검출할 수 있게 한다. 예를 들어, 아지도호모알라닌(AHA)이라는 비단백질성 아미노산은 메티오닌 대신 단백질 합성에 사용될 수 있다. AHA 분자는 아지드 작용기를 가지고 있어, 특정 화학 반응(클릭 화학 등)을 통해 형광 물질이나 다른 표지 물질을 붙일 수 있다. 이를 통해 새로 합성된 단백질을 추적하거나, 세포 외부로 분비되는 단백질을 식별하는 데 활용할 수 있다.[45]
다른 예로는 케톤이나 알데히드 작용기를 이용하는 방법이 있다. 이 작용기들은 특정 분자(하이드라진 또는 아미노옥시 유도체)와 선택적으로 반응하여 단백질을 표지할 수 있다. 이 반응은 시험관 내 실험이나 근접 표지(특정 위치에 있는 단백질을 표지하는 기술)에 유용하지만, 반응 속도가 느려 표지를 위해서는 상대적으로 높은 농도의 시약이 필요하다는 단점이 있다.[46]
아지드 작용기를 가진 비단백질성 아미노산을 이용하는 또 다른 방법은 스타우딩거 반응을 활용하는 것이다. 아지드 그룹은 포스핀 시약과 특이적으로 반응하는데, 이 반응은 살아있는 세포나 동물 내에서도 다른 생체 분자에 영향을 주지 않고 진행될 수 있어 생체 내 단백질 표지에 효과적으로 사용된다.[47]
생체 직교 화학 분야는 계속 발전하고 있으며, 단백질체학 연구에 더욱 다양하게 응용될 것으로 기대된다. 반응 속도가 빠른 화학 반응은 적은 양의 시약으로도 효율적인 표지를 가능하게 하지만, 케톤/알데히드 축합처럼 반응 속도가 느린 경우는 효과는 좋지만 높은 농도가 필요하여 비용 효율성이 떨어질 수 있다. 이러한 장단점을 고려하여 연구 목적에 맞는 적절한 생체 직교 화학 반응을 선택하는 것이 중요하다.
7. 4. 1. 비단백질성 아미노산 (Non-canonical amino acid)
단백질 분석의 가장 초기 방법 중 하나는 에드만 분해법으로, 1967년에 소개되었다. 이 방법은 하나의 펩타이드를 여러 단계의 화학적 분해를 거쳐 서열을 밝혀내는 방법이다. 이러한 초기 방법들은 현재 대부분 더 높은 처리량을 제공하는 기술들로 대체되었다.보다 최근에 구현된 방법들은 질량 분석법 기반 기술을 사용한다. 이는 1980년대에 개발된 "연성 이온화" 방법, 예를 들어 매트릭스 보조 레이저 탈착/이온화법(MALDI) 및 전기분무 이온화법(ESI)의 발견으로 가능해졌다. 이러한 기술들은 분석 전에 종종 추가적인 분리 과정을 거치는 탑다운 단백체학 및 바텀업 단백체학 워크플로우로 이어졌다.
복잡한 생물학적 시료를 분석할 때는 시료의 복잡성을 줄이는 과정이 필요하다. 이는 1차원 또는 2차원 전기 영동 분리를 통해 오프라인에서 수행될 수 있다. 최근에는 개별 펩타이드(하향식 단백질체학 접근 방식)를 역상 크로마토그래피를 사용하여 분리한 후, ESI를 이용해 직접 이온화하는 온라인 방법이 개발되었다. 분리와 분석 과정을 직접 연결한다는 점에서 "온라인" 분석이라는 용어가 사용된다.
7. 4. 2. 작용기 (Functional group)
단백질 분석의 가장 초창기 방법 중 하나는 에드만 분해법(1967년 소개)으로, 하나의 펩타이드를 여러 단계의 화학적 분해를 거쳐 서열을 밝혀내는 방법이다. 이러한 초기 방법들은 대부분 더 높은 처리량을 제공하는 기술로 대체되었다.보다 최근에 구현된 방법들은 질량 분석법 기반 기술을 사용하며, 이는 1980년대에 개발된 "연성 이온화" 방법, 예를 들어 매트릭스 보조 레이저 탈착/이온화법(MALDI) 및 전기분무 이온화법(ESI)의 발견으로 가능해졌다. 이러한 방법들은 분석 전에 종종 추가적인 분리가 수행되는 탑다운 단백체학 및 바텀업 단백체학 워크플로우를 낳았다.
복잡한 생물학적 시료 분석을 위해서는 시료의 복잡성 감소가 필요하다. 이는 1차원 또는 2차원 전기 영동 분리를 통해 오프라인으로 수행될 수 있다. 최근에는 개별 펩타이드(하향식 단백질체학 접근 방식)를 역상 크로마토그래피를 사용하여 분리한 다음, ESI를 사용하여 직접 이온화하는 온라인 방식이 개발되었다. 분리와 분석을 직접 연결한다는 의미에서 "온라인" 분석이라는 용어가 사용된다.
8. 실용적 응용
세포는 처한 환경이나 발생 단계, 세포 분화, 세포 주기, 암 발생과 같은 특정 조건에 따라 서로 다른 종류와 양의 단백질을 만들어낸다. 또한, 대부분의 단백질은 만들어진 후에도 다양한 번역 후 변형을 거치기 때문에 실제 세포 내 단백질의 총체, 즉 단백체는 매우 복잡한 양상을 띤다.
이러한 복잡성 때문에 단백체학 연구는 신중한 접근이 필요하다. 예를 들어, 특정 암 아형(subtype)과 관련된 생체 지표를 찾는 연구에서는 여러 환자의 혈청 샘플을 비교 분석하여 개인 간의 차이나 실험 과정에서 발생할 수 있는 오차 요인을 최소화해야 한다.[17] 즉, 단백체의 동적인 변화와 복잡성을 고려한 정교한 실험 설계가 필수적이다.
단백체학 연구는 다양한 실용적인 목표를 가지고 진행된다. 주요 응용 분야는 다음과 같다.
- 신약 개발: 질병과 관련된 특정 단백질의 기능을 이해하고 이를 조절하는 새로운 약물을 탐색하고 설계하는 데 기여한다.
- 단백질 상호작용 규명: 단백질 간 상호작용 네트워크를 밝혀내어 단백질의 기능을 추정하고 세포 내 생명 현상을 시스템 수준에서 이해하는 데 중요한 정보를 제공한다.
- 단백질 발현 변화 분석: 특정 조건 변화에 따른 단백질 발현량의 차이를 분석하여 세포의 반응 기작이나 질병 상태를 이해하는 데 활용된다.
- 생체 지표 발굴: 질병의 조기 진단, 예후 예측, 치료 반응 평가 등에 활용될 수 있는 생체 지표 단백질을 찾아낸다.
이러한 연구 목표를 달성하기 위해 단백체학에서는 단백질을 분리하고 동정하는 다양한 기술들이 복합적으로 사용된다. 대표적으로 단백질을 등전점과 분자량에 따라 분리하는 2차원 전기영동이나, 단백질 또는 펩타이드 조각의 질량을 정밀하게 측정하여 동정하는 질량 분석법(MALDI법, 탠덤 질량 분석 등)이 핵심 기술로 활용된다. 또한, 친화성 크로마토그래피나 투-하이브리드 법 등은 단백질 간 상호작용 연구에 사용된다.
최근에는 World Community Grid와 같은 분산 컴퓨팅 프로젝트를 통해 전 세계 수많은 컴퓨터의 연산 능력을 활용하여 방대한 단백체 데이터를 분석하고, HIV, 암, 뎅기열과 같은 질병 연구 및 단백질 구조 예측 등에 기여하며 새로운 치료법 개발의 단서를 찾으려는 노력도 이루어지고 있다.
8. 1. 신약 개발
인간의 유전자 및 단백질 연구를 통해 기대할 수 있는 중요한 성과 중 하나는 새로운 질병 치료제를 개발할 가능성이다. 게놈 및 프로테옴 분석 정보를 활용하여 질병과 관련된 특정 단백질을 찾아내고, 그 단백질의 3차원 구조를 바탕으로 활동을 억제하는 물질을 설계함으로써 새로운 약물 후보를 선정할 수 있다. 이는 신약 탐색의 기본적인 전략으로 활용된다. 예를 들어, 특정 효소의 활성 부위에 정확히 결합하여 떨어지지 않는 분자를 설계하면 해당 효소의 기능을 효과적으로 막을 수 있다. 또한, 개인마다 유전자 차이가 존재하므로, 이를 고려하여 특정 개인에게 더 효과적으로 작용하는 맞춤형 약물을 개발할 수도 있다.수백만 개의 저분자 화합물 중에서 특정 단백질의 3차원 구조에 잘 들어맞는 물질을 컴퓨터를 이용하여 찾는 작업을 '가상 리간드 스크리닝'이라고 한다. 이 기술의 대표적인 성공 사례로는 HIV-1 프로테아제를 비활성화하는 약물 개발을 들 수 있다. HIV-1 프로테아제는 HIV가 증식하는 데 필수적인 효소로, 바이러스가 가진 거대 단백질을 기능 단위로 절단하는 역할을 한다. 이 효소의 기능을 억제하는 약물은 HIV의 생존을 막아 효과적인 치료제가 될 수 있다.
최근에는 World Community Grid와 같은 분산 컴퓨팅 프로그램이 활발히 운영되고 있다. 이는 전 세계 수많은 개인용 컴퓨터의 유휴 처리 능력을 모아 슈퍼컴퓨터급의 연산 능력을 확보하는 방식으로 과학 연구를 지원한다. World Community Grid에서는 HIV, 암, 단백질 접힘, 뎅기열 등 다양한 질병 연구를 위한 계산을 수행하고 있으며, 특히 단백질 모델링 및 변형 연구에 중점을 둔 프로젝트가 많다. 이러한 분산 컴퓨팅을 통해 얻어진 방대한 데이터는 더욱 특이적이고 효율적인 치료법 개발의 중요한 단서를 제공할 수 있다.
8. 1. 1. 화학단백체학 (Chemical proteomics)
바이오직교 화학의 발전은 단백질 분석 분야에 새로운 가능성을 열어주었다. 이는 유기 분자를 사용하여 단백질과 반응을 관찰하고 표지하는 다양한 방법을 제공한다. 비단백질성 아미노산과 여러 작용기의 활용은 단백체학 분야에서 주목받는 새로운 기술이다.[45]구체적인 예로, 세포나 조직에서 대사될 수 있는 특정 생체 분자를 단백질이나 글리칸에 삽입하는 방법이 있다. 이 분자에는 친화성 태그가 달려 있어, 단백질을 변형시키고 검출할 수 있게 한다. 예를 들어, 아지도호모알라닌(AHA)은 Met-t-RNA 합성효소와 결합하여 단백질 내부에 삽입될 수 있다. 이를 통해 AHA는 세포가 특정 교란에 반응하여 새로 합성하는 단백질을 식별하거나, 세포 밖으로 분비되는 단백질을 찾아내는 데 도움을 줄 수 있다.[45]
케톤과 알데히드의 축합 반응은 시험관 내 실험이나 근접 표지에 유용하지만, 반응 속도가 느려 높은 농도의 시약이 필요하다는 단점이 있다.[46]
다른 방법으로는 특정 단백질을 아지드 그룹과의 반응성을 통해 검출하는 것이 있다. 비단백질성 아미노산에 아지드 그룹을 도입하면, 이는 스타우딩거 반응에서 포스핀과 반응한다. 이 반응은 이미 살아있는 세포나 동물에서 다른 생체 분자를 표지하는 데 사용된 바 있다.[47]
바이오직교 화학 분야는 계속 확장되고 있으며, 단백체학 연구에 더 많은 응용 가능성을 제시하고 있다. 반응 속도가 빠른 방법은 적은 양의 반응물로도 효율적인 생체 접합을 가능하게 하지만, 케톤/알데히드 축합처럼 반응 속도가 느린 방법은 효과적이지만 높은 농도가 필요하여 비용 효율성이 떨어질 수 있다.
8. 2. 상호작용 단백체학 (Interaction proteomics)
많은 단백질은 세포 내에서 혼자 기능하지 않고 다른 단백질과 상호작용하며 복잡한 네트워크를 형성한다. 단백체학 연구의 중요한 목표 중 하나는 이러한 단백질 간 상호작용 네트워크를 밝히는 것이다. 어떤 단백질이 서로 상호작용하는지 알아내는 것은 새롭게 발견된 단백질의 기능을 추정하는 데 중요한 단서를 제공하며, 생명 현상을 시스템 수준에서 이해하는 데 필수적이다.단백질 간 상호작용을 연구하기 위해 다양한 실험 방법들이 개발되어 왔다. 전통적으로 널리 사용된 방법으로는 효모 세포를 이용하는 투-하이브리드 법이 있다. 최근에는 기술 발전에 힘입어 마이크로어레이, 친화성 크로마토그래피, 질량 분석법 등 더욱 정교하고 대량 분석에 적합한 새로운 방법들이 개발되어 활용되고 있다. 이러한 방법들은 특정 단백질과 결합하는 파트너 단백질을 동정하거나, 세포 내에서 형성되는 단백질 복합체의 구성 성분을 분석하는 데 사용된다.
8. 2. 1. 단백질-단백질 상호작용 연구 방법
단백질 간의 상호작용을 연구하는 것은 단백질의 기능을 이해하는 데 매우 중요하다. 단백체학에서는 다양한 기술을 활용하여 이러한 상호작용을 밝혀낸다.구조 단백체학은 단백질의 3차원 구조를 대규모로 분석하여 단백질 구조를 비교하고, 단백질이 서로 어떻게 상호작용하는지 보여준다.[65] 이를 통해 약물이 단백질에 결합하는 위치를 이해하는 데 도움을 받을 수 있다. 이러한 구조 분석은 X선 결정학, NMR 분광법, 냉동 전자 현미경 등의 기술을 사용하며,[65] 생물정보학 기술을 이용해 단백질 구조를 예측하고 상호작용을 모델링하기도 한다.[68]
단백질 마이크로어레이는 수천 개의 단백질 검출 기능을 배열하여 생물학적 샘플 내 단백질-단백질 상호작용과 같은 특성을 연구하는 데 사용된다.
살아있는 세포 내에서 일어나는 단백질 상호작용을 연구하기 위해 화학적 가교제를 사용하는 방법도 있다. 가교제는 세포에 도입되어 단백질-단백질, 단백질-DNA 및 기타 상호 작용을 고정(fix)하여 관련 상호작용을 보존하고 분석을 용이하게 한다.
단일 세포 분석 기술의 발전은 개별 세포 수준에서 단백질의 공변동(covariation)을 분석할 수 있게 해주었다. 이는 단백질 복합체 형성 같은 생물학적 과정을 반영하므로,[76] 단백질 상호작용 네트워크를 이해하는 데 기여한다.
이 외에도 친화성 단백체학(항체나 압타머 등 사용)[44]이나 질량 분석법 기반 기술들이 특정 단백질과 상호작용하는 파트너 단백질을 찾거나, 분리된 단백질 복합체의 구성 성분을 동정하는 데 간접적으로 활용될 수 있다.
8. 3. 발현 단백체학 (Expression proteomics)
발현 단백체학은 특정 조건이나 세포 상태에 따라 단백질의 발현 수준이 어떻게 달라지는지를 연구하는 단백체학의 한 분야이다. 이는 특정 자극이나 질병 상태에 대한 세포의 반응을 이해하는 데 중요한 정보를 제공한다. 다양한 기술이 단백질 발현량의 변화를 측정하고 비교하는 데 사용된다.가장 초기의 접근 방식 중 하나는 2차원 전기영동(2-DE)을 사용하여 서로 다른 샘플에서 단백질을 분리하는 것이다. 이 방법은 단백질을 등전점과 분자량에 따라 2차원으로 분리하여 겔 상에 스폿 형태로 나타낸다. 각 스폿의 염색 강도를 비교하여 단백질 발현량의 차이를 확인하고, 특정 스폿을 잘라내어 질량 분석법으로 해당 단백질을 동정할 수 있다. 그러나 2-DE는 발현량이 매우 낮거나 높은 단백질, 또는 특정 물리화학적 특성을 가진 단백질을 분리하기 어렵다는 한계가 있다.[41]
질량 분석법(MS) 기반 기술은 발현 단백체학에서 점차 중심적인 역할을 하고 있다. 특히, 안정 동위원소 표지 방법은 여러 샘플 간의 단백질 발현량을 정확하게 비교하는 데 유용하다.[42][43] 대표적인 예로 ICAT(동위원소 부호화 친화성 태그) 기술이 있다. 이 방법은 서로 다른 샘플의 단백질(주로 시스테인 잔기)을 질량이 다른 동위원소 태그로 표지한 후, 샘플을 혼합하여 질량 분석을 수행한다. 질량 분석 스펙트럼에서 나타나는 동위원소 태그 쌍의 신호 강도 비율을 통해 두 샘플 간 해당 단백질의 상대적인 양을 정량화할 수 있다. ICAT과 같은 동위원소 표지 기술은 세포 소기관이나 특정 단백질 복합체의 프로파일링 등 다양한 연구에 활용되고 있다.[41]
또 다른 정량적 방법으로는 형광 2차원 차등 겔 전기영동(2-D DIGE)이 있다.[34] 이 기술은 여러 샘플의 단백질을 서로 다른 형광 염료로 표지한 후, 하나의 2D 겔에서 동시에 분리하고 분석하여 샘플 간 발현량 차이를 정밀하게 측정할 수 있게 해준다.[34]
마이크로어레이 기술 또한 발현 단백체학에 활용된다. 특히, 역상 단백질 마이크로어레이(Reverse Phase Protein Microarray, RPPA)는 레이저 포획 미세 절개술(LCM)과 결합하여 특정 조직 부위나 세포 집단에서의 단백질 발현 및 변형 상태 변화를 민감하게 분석할 수 있다.[41] 예를 들어, 암 조직 내의 특정 세포 집단에서 신호 전달 분자의 변화를 추적하거나, 정상 조직과 암 조직 간의 단백질 발현 차이를 비교하여 진단 및 치료 전략 개발에 활용될 수 있다.[41]
발현 단백체학 연구는 다양한 생물학적 시스템을 이해하는 데 기여한다. 예를 들어, 살충제 처리가 벼멸구의 생식 관련 단백질 발현에 미치는 영향을 분석하여, 특정 단백질(Acps)의 발현 증가가 암컷의 번식력 증진과 관련 있음을 밝혀낸 연구가 있다.[35][36] 또한, 애기장대 페록시좀[37]이나 동물의 종양[60], 왕새우[40] 등 다양한 생물 및 시스템에서 단백질 발현 변화를 연구하는 데 활용되고 있다.
정량적 발현 단백체학 데이터는 세포 주기, 세포 분화, 발암 과정 등 다양한 생물학적 현상을 시스템 수준에서 이해하는 데 필수적이다.[55][56] 이러한 정보는 유전체학, 전사체학, 대사체학 등 다른 오믹스 데이터와 통합되어 생물학적 표현형을 더욱 포괄적으로 이해하는 데 기여한다. 예를 들어, ''암 단백체 아틀라스''는 암 게놈 아틀라스의 유전체 및 전사체 데이터와 연계하여 수천 개의 종양 샘플에 대한 정량적 단백질 발현 정보를 제공함으로써 암 연구에 중요한 자원을 제공한다.[79]
특히 인간 혈장 단백체 분석은 질병 진단 및 모니터링을 위한 바이오마커 발굴에 있어 중요하지만, 혈장 내 단백질 농도의 동적 범위가 매우 넓고(1010 이상) 복잡하여 기술적으로 매우 어려운 과제로 남아있다.[80][81] 그럼에도 불구하고, 기술 발전을 통해 혈장 단백체 프로파일링 연구가 활발히 진행되고 있으며, 염증 반응, 유전적 영향, 생활 습관 변화(예: 체중 감소) 등이 혈장 단백질 구성에 미치는 영향 등을 밝혀내고 있다.[82][83][84][85]
8. 4. 생체 지표 (Biomarker)
단백체학 연구의 중요한 응용 분야 중 하나는 특정 단백질을 질병 진단을 위한 생체 지표(Biomarker)로 활용하는 것이다. 특정 질병이 발생했을 때 양이 특이적으로 변하거나 새롭게 나타나는 단백질들이 다수 발견되었으며, 이는 질병을 조기에 진단하거나 진행 상황을 파악하는 데 도움을 준다. 이러한 생체 지표 단백질을 검출하고 정량하는 방법으로는 웨스턴 블롯, 면역 염색, ELISA, 질량 분석법 등이 사용된다.실제로 생체 지표를 활용하는 질병 진단의 예는 다음과 같다.
- 알츠하이머병: 환자의 뇌에서는 β-세크레타제 효소 농도가 증가하여 아밀로이드 단백질이 과도하게 생성 및 축적된다. 이 아밀로이드 침착물(플라크)은 면역 염색 등으로 확인할 수 있으며 알츠하이머병의 주요 병리적 특징이다. β-세크레타제 활성이나 아밀로이드 생성을 조절하는 것이 치료 전략으로 연구된다.
- 심장병: 여러 단백질이 심장 질환의 생체 지표로 활용된다. 예를 들어, 인터루킨6, 인터루킨8, 혈청 아밀로이드 A, 피브리노겐, 트로포닌 등이 있다. 특히 심장 근육 손상 시 혈액으로 방출되는 심장 트로포닌(cardiac troponin)은 급성 심근 경색 진단에 매우 중요한 지표이다. 심근 경색 발생 후 수 시간 내 혈중 농도가 증가하며, 시판되는 항체 기반 검사로 신속 진단이 가능하다.
- 암: 건강한 세포와 암세포의 단백질체(proteome)를 비교 분석하여 암 특이적 생체 지표를 발굴하는 연구가 활발하다. 예를 들어, 간세포암의 경우 특정 단백질 변화가 진단에 활용된다. 신장 관련 질환에서는 소변이 생체 지표 검출을 위한 중요한 시료가 될 수 있으며, 최근에는 소변 내 특정 폴리펩티드 분석을 통해 자각 증상 발현 전 질병 진단을 시도하는 연구도 진행 중이다.
계산 생물정보학 기술 발전 역시 생체 지표 연구에 기여한다. 예를 들어, 계산 예측 모델은 임신 중 모체 혈액 내 미량의 태아 유래 단백질 분석을 통해 태아 발달 상태를 비침습적으로 모니터링할 가능성을 제시했다.[71] 또한 정보 이론적 접근법은 특정 조직과 혈액, 소변 등 생체 유체 간의 단백질 정보를 통합 분석하여, 기존 방법으로 찾기 어려웠던 새로운 바이오마커를 발굴하고 임상적 유용성을 예측하는 데 활용된다.[72] 이러한 생체 지표 연구는 질병 조기 진단율을 높이고 더 효과적인 치료 전략 개발에 중요한 역할을 할 것으로 기대된다.
8. 4. 1. 분비체학 (Secretomics)
바이오직교 화학의 발전은 단백질 분석, 특히 세포 외부로 분비되는 단백질들을 연구하는 분비체학 분야에도 새로운 가능성을 열어주었다. 특정 생체 분자를 이용하여 단백질에 표지를 달아 추적하고 분석하는 방법들이 개발되고 있다.비단백질성 아미노산의 일종인 아지도호모알라닌(AHA)은 메티오닌을 대신하여 단백질 합성 과정에 참여할 수 있다. AHA 분자에는 특정 화학 반응을 통해 다른 분자(친화성 태그)를 붙일 수 있는 '손잡이'가 달려있다. 이 방법을 활용하면 세포 내에서 새로 합성되는 단백질, 특히 세포 밖으로 분비되는 단백질들을 선택적으로 표지하고 식별하는 데 도움을 받을 수 있다.[45] 이러한 기술은 세포가 특정 자극이나 교란에 반응하여 어떤 단백질을 분비하는지 알아내는 데 유용하게 사용될 수 있다.
분비 단백질 연구는 의학적으로도 매우 중요하다. 예를 들어, 인간 혈장에는 면역글로불린, 사이토카인, 단백질 호르몬 등 다양한 종류의 분비 단백질이 존재한다.[80] 이 단백질들은 우리 몸의 여러 조직과 기관의 상태를 반영하는 정보를 담고 있기 때문에, 혈액 검사를 통해 질병을 진단하거나 건강 상태를 파악하는 데 중요한 단서가 된다. 하지만 혈장에는 매우 많은 종류의 단백질이 다양한 농도로 존재하여(가장 많은 단백질과 가장 적은 단백질의 농도 차이가 1010 배 이상 나기도 한다[81]), 특정 분비 단백질을 정확하게 분석하고 정량하는 것은 여전히 단백체학 분야의 어려운 과제 중 하나로 남아있다.[41]
8. 5. 단백체유전체학 (Proteogenomics)
단백체유전체학은 유전체 및 전사체 정보를 활용하여 단백체 데이터를 분석하고 해석하는 연구 분야이다. 생물학적 시스템은 세포 주기, 세포 분화, 발암, 환경 등 다양한 요인의 영향을 받는다. 이러한 외부 자극이나 내부 변화에 대한 전사 및 번역 반응은 단백체 기능의 변화로 이어지는데, 단백체유전체학은 이러한 변화를 유전체 정보와 통합하여 분석한다.단백질 존재량의 변화를 단백체 전반에 걸쳐 파악하고 정량화하는 것은 생물학적 현상을 시스템 수준에서 보다 전체적으로 이해하는 데 매우 중요하다. 이러한 맥락에서 단백체학은 생물학적 표현형을 보다 포괄적으로 정의하려는 통합적 분석에서 유전체학, 전사체학, 후생유전체학, 대사체학 및 기타 -오믹스 접근 방식과 상호 보완적인 역할을 수행한다.[55][56]
예를 들어, ''암 단백체 아틀라스''(The Cancer Proteome Atlas, TCPA)는 암 게놈 아틀라스(The Cancer Genome Atlas, TCGA) 프로젝트에서 얻어진 전사체 및 유전체 데이터와 연계하여, 4,000개 이상의 종양 샘플에서 약 200가지 단백질의 정량적 발현 데이터를 제공한다.[79] 이처럼 유전체 및 전사체 정보와 통합된 심층적인 단백체 데이터 세트는 암 생물학, 발달 및 줄기 세포 생물학, 의학, 진화 생물학과 같은 다양한 연구 분야에서 중요한 자원으로 활용될 수 있다.
8. 6. 구조 단백체학 (Structural proteomics)
단백질 구조는 단백질의 3차원적인 형태를 의미하며, 단백질의 구조를 이해하는 것은 단백질의 상호작용과 기능을 파악하는 데 매우 중요하다. 구조 단백체학은 이러한 단백질의 3차원 구조를 효율적으로 결정하는 것을 목표로 한다.과거에는 단백질의 3차원 구조를 주로 X선 결정학이나 핵자기 공명 분광법(NMR)을 통해 결정했다. 하지만 2017년 이후 냉동 전자 현미경(Cryo-EM) 기술이 발전하면서 주요 기술로 부상했다. 냉동 전자 현미경은 X선 결정학에서 필요한 단백질 결정화의 어려움이나 NMR에서의 크기 제한 및 형태적 모호성 문제를 해결했으며, 2015년 기준으로 2.2Å 수준의 높은 분해능을 달성했다.[68]
실험적인 방법 외에도, 생물정보학 기술을 이용하여 단백질의 구조를 예측하고 모델링하는 컴퓨터 프로그램들이 개발되었다. 이 프로그램들은 아미노산 서열의 화학적 특성과 이미 알려진 단백질들의 구조적 특징을 바탕으로 대상 단백질의 3차원 모델을 예측한다. 이를 통해 과학자들은 더 큰 규모로 단백질 간의 상호작용을 모델링할 수 있다. 또한, 단백질 구조가 고정된 것이 아니라 유연하게 움직인다는 점을 고려하여 구조를 비교하고 예측하는 방법들도 개발되고 있다.[68]
단백질 구조 분석에서 중요한 고려 사항 중 하나는 번역 후 변형(PTM)이다. 많은 단백질 분석 프로그램들은 PTM을 고려하지 않고 설계되었으며,[69] 일부 프로그램이 PTM 정보를 단백질 식별에 활용하더라도, 이후 구조 분석에서는 이를 무시하는 경우가 많다. 그러나 PTM은 단백질의 최종 구조와 기능에 큰 영향을 미칠 수 있으므로 매우 중요하다.[69] 현재 PTM을 예측하는 프로그램은 있지만,[70] 실험적으로 확인된 PTM이 단백질 구조와 기능에 미치는 영향을 정확히 분석할 수 있는 새로운 계산 분석 방법(파이프라인)을 개발하기 위해 화학자, 생물학자, 컴퓨터 과학자들이 협력하고 있다.
9. 단백체학 정보학 (Proteome informatics)
단백체학 연구는 질량 분석법과 같은 고성능 기술을 통해 방대한 양의 데이터를 생성한다. 이렇게 생성된 복잡하고 거대한 데이터를 효과적으로 관리, 분석하고, 그 안에서 생물학적 의미를 찾아내기 위해서는 정보학(informatics)적 접근이 필수적이다.
단백체학 정보학은 컴퓨터 과학, 통계학, 생물정보학 등의 도구와 방법론을 활용하여 단백체 데이터를 처리하고 해석하는 분야이다. 이는 대용량 데이터의 처리 및 관리부터 단백질 식별, 정량 분석, 기능 예측, 단백질 간 상호작용 분석, 바이오마커 발굴, 그리고 다른 오믹스 데이터와의 통합 분석에 이르기까지 단백체학 연구의 전 과정에 걸쳐 핵심적인 역할을 수행한다. 이러한 분석을 위해 다양한 알고리즘과 소프트웨어, 데이터베이스가 개발되어 활용되고 있다. 단백체학 정보학의 구체적인 방법론과 응용 사례는 하위 섹션에서 더 자세히 다룬다.
9. 1. 생물정보학 (Bioinformatics)의 역할
생물정보학은 단백체학 연구에서 생성되는 방대한 양의 데이터를 분석하고 해석하는 데 필수적인 역할을 수행한다. 단백질 식별부터 구조 예측, 기능 분석, 바이오마커 발굴에 이르기까지 연구의 여러 단계에서 핵심적인 도구로 활용된다.- '''데이터 분석 및 단백질 식별:''' 질량 분석법 등 실험을 통해 얻어진 데이터를 생물정보학 알고리즘(예: Mascot, PEAKS, SEQUEST 등)을 사용하여 단백질 데이터베이스와 비교함으로써 어떤 단백질인지 식별한다. 또한, 단백질 서열 분석을 통해 상동성 검색을 수행하여 단백질의 기능을 예측하고, 단백질 간의 진화적 관계를 밝히는 데 도움을 준다.
- '''단백질 구조 예측 및 모델링:''' 실험적 방법 외에도, 생물정보학은 컴퓨터 프로그램을 이용하여 아미노산 서열 정보로부터 단백질의 3차원 구조를 예측하고 모델링하는 데 중요한 역할을 한다. 예측된 구조 정보는 단백질의 기능과 다른 분자와의 상호작용 방식을 이해하는 데 기여한다.[68]
- '''번역 후 변형(PTM) 분석 지원:''' 많은 단백질 분석 프로그램들이 번역 후 변형(PTM)을 고려하지 않지만[69], PTM은 단백질의 구조와 기능에 큰 영향을 미치므로 중요하다. 생물정보학은 PTM 발생 가능성을 예측하고[70], 실험적으로 확인된 PTM이 단백질 구조와 기능에 미치는 영향을 분석하고 이해하기 위한 계산 도구와 파이프라인 개발에 기여하고 있다.
- '''단백질 간 상호작용 및 기능 예측:''' 생물정보학 도구는 단백질 간의 상호작용 네트워크를 예측하고 모델링하는 데 사용된다. 또한, 단백질의 3차원 구조 정보를 활용하여 특정 단백질의 기능을 조절할 수 있는 약물 후보 물질을 컴퓨터 시뮬레이션을 통해 탐색하는 가상 리간드 스크리닝과 같은 연구에도 활용된다. 예를 들어 HIV의 증식에 필수적인 HIV-1 프로테아제의 활성을 억제하는 약물을 찾는 연구가 대표적이다.
- '''바이오마커 발굴:''' 계산 예측 모델은 질병 진단, 예후 예측, 치료 반응 모니터링 등에 활용될 수 있는 새로운 바이오마커를 발굴하는 데 중요한 역할을 한다. 예를 들어, 임신 중 태아에서 유래하여 산모 혈액으로 이동하는 단백질을 예측하여 비침습적 산전 진단 가능성을 탐색하거나[71], 조직과 생체 유체(예: 혈액) 간의 정보 흐름을 분석하는 정보 이론적 접근법을 통해 유망한 바이오마커 후보를 예측하고 검증 우선순위를 정하는 데 활용될 수 있다.[72]
- '''대규모 데이터 처리 및 통합 분석:''' 단백체학 연구는 방대한 양의 데이터를 생성하므로, 이를 효율적으로 처리, 분석, 관리하기 위해 생물정보학적 접근이 필수적이다. 또한, 단백체 데이터를 유전체학, 전사체학, 대사체학 등 다른 오믹스 데이터와 통합하여 생명 현상을 보다 전체적인 시스템 수준에서 이해하려는 연구에도 생물정보학이 핵심적인 역할을 한다.[55][56] 암 게놈 아틀라스와 연계된 ''암 단백체 아틀라스''[79]와 같이 여러 오믹스 데이터를 통합한 데이터베이스 구축은 관련 연구에 중요한 자원을 제공한다.
- '''기타 응용:''' 분산 컴퓨팅 프로젝트(예: World Community Grid)를 통해 전 세계의 컴퓨터 자원을 활용하여 단백질 구조 예측, 단백질 접힘, 약물 개발 등 복잡한 계산 문제를 해결하는 데에도 생물정보학이 기여하고 있다. 또한, 실험적 방법과 계산적 방법을 융합하여 연구를 수행하는 실험 생물정보학 분야도 단백체학 연구에 적용되고 있다.
9. 1. 1. 단백질 식별 (Protein identification)
단백체학에서 단백질을 연구하는 데는 여러 방법이 있다. 일반적으로 단백질은 항체를 사용하거나(면역 분석), 전기 영동 분리 또는 질량 분석법을 통해 검출(식별)할 수 있다. 복잡한 생물학적 샘플 분석 시에는, 샘플 내 분석물이 많아 정확한 검출 및 정량화가 어렵기 때문에, 매우 특이적인 항체를 사용한 정량적 도트 블롯 분석(QDB)이나 검출 전 생화학적 분리가 필요할 수 있다. 항체를 이용한 단백질 검출은 여전히 일반적이지만, 항체에 의존하지 않는 다른 방법들도 개발되었다. 이러한 방법들은 단백질 또는 펩타이드의 서열 결정이 가능하고, 처리량이 높으며, 항체가 없는 단백질도 식별할 수 있다는 장점이 있다.단백질 식별의 초기 방법 중 하나는 1967년 소개된 에드만 분해법으로, 하나의 펩타이드를 여러 단계의 화학적 분해를 거쳐 서열을 밝혀내는 방식이다. 현재는 처리량이 더 높은 기술들로 대체되었다.
최근에는 1980년대에 개발된 "연성 이온화" 방법인 매트릭스 보조 레이저 탈착/이온화법(MALDI) 및 전기분무 이온화법(ESI)의 발견으로 가능해진 질량 분석법 기반 기술이 주로 사용된다. 이는 분석 전 추가적인 분리가 종종 수행되는 탑다운 단백체학 및 바텀업 단백체학 워크플로우로 이어졌다. 복잡한 시료의 경우, 1차원 또는 2차원 전기 영동 분리를 통해 오프라인으로 시료 복잡성을 줄인 후 분석하거나, 역상 크로마토그래피로 펩타이드를 분리하고 ESI로 직접 이온화하는 온라인 방식(분리와 분석을 직접 연결)도 사용된다.
질량 분석 기반의 주요 식별 방법 중 하나는 고해상도 2차원 전기 영동으로 단백질을 분리한 후, 특정 단백질 스팟을 잘라내어 질량 분석법으로 식별하는 것이다. 그러나 2차원 전기 영동법은 발현 수준 차이가 크거나 특성이 다른 모든 단백질을 분리하기 어렵다는 한계가 있다.[41] 또 다른 접근 방식으로는 리처드 D. 스미스(Richard D. Smith)와 태평양 북서 국립 연구소(Pacific Northwest National Laboratory) 연구진이 개발한 정확한 질량 및 시간(AMT) 태그 접근 방식이 있다. 이는 직렬 질량 분석법 없이, 정밀하게 측정된 분리 시간과 질량 정보를 이용해 펩타이드와 단백질을 식별하여 처리량과 감도를 높인다.
항체 기반 정제와 질량 분석을 결합한 하이브리드 기술도 있다. 예를 들어, MSIA (질량 분석 면역 분석법)(1995년 개발)[32] 및 SISCAPA(안정 동위 원소 표준 캡처, Anti-Peptide Antibodies) 방법(2004년 소개)[33]은 특정 분석물을 항체로 포획한 후 질량 분석으로 동정 및 정량화한다.
친화성 단백체학은 항체나 기타 친화성 시약(예: 올리고뉴클레오티드 기반 압타머)을 단백질 특이적 검출 프로브로 사용하여 단백질을 식별한다.[44] 단백질 마이크로어레이 또한 단백질 식별 및 분석에 사용된다. 예를 들어, 항체 어레이는 다양한 항체를 배열하여 혈액 샘플 등에서 특정 항원을 검출한다. 여러 종류의 단백질을 배열하여 단백질 간 상호작용 등을 연구하는 기능적 단백체 어레이도 개발되었으나, 단백질 자체의 불안정성과 구조 유지의 어려움으로 인해 구현에 어려움이 있다.[41]
최근에는 바이오직교 화학 기법을 단백질 식별에 활용하려는 시도가 이루어지고 있다. 비단백질성 아미노산이나 특정 작용기를 가진 분자를 세포 내 단백질에 결합시켜 표지하고 검출하는 방식이다. 예를 들어, 아지도호모알라닌(AHA)은 메티오닌 대신 단백질에 삽입되어 새로 합성된 단백질을 식별하는 데 사용될 수 있다.[45] 케톤과 알데히드의 축합 반응[46]이나, 아지드 그룹과 포스핀의 스타우딩거 반응[47] 등도 단백질 표지 및 검출에 사용된다. 이러한 바이오직교 화학 반응들은 단백질체학 연구에 새로운 가능성을 제시하고 있다.
질량 분석법 등으로 얻어진 데이터는 생물정보학 알고리즘(예: Mascot, PEAKS, SEQUEST)을 사용하여 단백질 데이터베이스와 비교함으로써 어떤 단백질인지 식별하는 데 활용된다.
9. 1. 2. 단백질 구조 (Protein structure) 예측
단백질 구조는 단백질이 가지는 3차원적인 형태를 말한다. 단백질의 구조를 이해하는 것은 단백질의 상호작용과 기능을 파악하는 데 도움이 된다.과거에는 단백질의 3차원 구조를 알아내기 위해 주로 X선 결정학이나 핵자기 공명 분광법(NMR)과 같은 실험적 방법을 사용했다.
2017년 기준으로 냉동 전자 현미경(Cryo-EM)이 주요 기술로 부상했는데, 이는 X선 결정학에서의 결정화 어려움이나 NMR에서의 형태적 모호성 문제를 극복하는 데 유리하며, 2015년에는 2.2Å 수준의 해상도를 달성했다.
현재는 생물정보학 기술을 활용하여 컴퓨터 프로그램으로 단백질의 구조를 예측하고 모델링하는 것도 가능하다. 이러한 프로그램들은 아미노산 서열의 화학적 특성과 이미 구조가 밝혀진 다른 단백질들의 정보를 이용하여 대상 단백질의 3차원 모델을 예측한다. 이를 통해 과학자들은 더 큰 규모에서 단백질 간의 상호작용을 모델링할 수도 있다.
또한, 생명 공학자들은 단백질 구조의 유연성을 고려하여 비교 및 예측을 수행하는 방법을 개발하고 있다.[68]
단백질 분석에 사용되는 대부분의 프로그램은 번역 후 변형(PTM)을 거친 단백질을 고려하여 설계되지 않았다.[69] 일부 프로그램은 단백질 식별 과정에서 PTM 정보를 활용하기도 하지만, 추가적인 분석 단계에서는 해당 변형을 무시하는 경우가 많다. PTM은 단백질의 구조에 영향을 미칠 수 있으므로 이를 고려하는 것이 중요하다. 이 때문에 PTM에 대한 계산 분석 연구가 과학계의 주목을 받고 있으며, 현재 관련 프로그램들은 주로 예측 기능을 제공하는 수준이다.[70] 화학자, 생물학자, 컴퓨터 과학자들은 실험적으로 확인된 PTM이 단백질의 구조와 기능에 미치는 영향을 분석할 수 있는 새로운 파이프라인을 개발하고 도입하기 위해 협력하고 있다.
9. 1. 3. 번역 후 변형 (Post-translational modification) 예측
단백질 분석에 사용 가능한 대부분의 컴퓨터 프로그램은 번역 후 변형(Post-translational modification, PTM)을 겪은 단백질을 분석하도록 설계되지 않았다.[69] 일부 프로그램은 단백질 식별 과정에서 PTM을 고려하기도 하지만, 이후 추가적인 단백질 분석 시에는 해당 변형 정보를 무시하는 경우가 많다. 그러나 PTM은 단백질의 3차원 구조와 기능에 직접적인 영향을 미칠 수 있으므로 이를 고려하는 것이 중요하다.이러한 배경에서 번역 후 변형에 대한 계산 분석 및 예측 연구가 과학계의 주목을 받고 있다. 현재 개발된 프로그램들은 주로 PTM 발생 가능성을 예측하는 기능을 제공하는 수준이다.[70] 따라서 화학자, 생물학자, 컴퓨터 과학자들은 실험적으로 확인된 PTM 데이터와 계산 모델을 통합하여, PTM이 단백질 구조와 기능에 미치는 영향을 보다 정확하게 분석하고 예측할 수 있는 새로운 파이프라인 개발을 위해 협력하고 있다.
많은 세포 내 중요한 과정에서 단백질의 양적 변화보다는 PTM에 의한 기능 조절이 핵심적인 역할을 한다.[41] 따라서 PTM을 정확하게 모니터링하고 예측하는 것은 단백체 기능 연구에 필수적이지만, 아직 기술적으로 완전히 해결되지 않은 과제로 남아있다. 인산화나 당화와 같은 특정 PTM 유형을 분석하기 위한 특화된 방법들이 개발되고 있다.
9. 2. 전산 방법론 (Computational methods)의 활용
단백질 구조는 단백질의 3차원적인 형태를 의미하며, 이를 이해하는 것은 단백질의 상호작용과 기능을 파악하는 데 중요하다. 과거에는 X선 결정학과 핵자기 공명 분광법(NMR)을 통해서만 3차원 구조를 결정할 수 있었으나, 최근에는 냉동 전자 현미경 기술이 발전하여 결정화나 형태적 모호성 문제를 해결하고 있다. 더 나아가, 생물정보학 분야에서는 단백질의 아미노산 서열 정보와 알려진 단백질 구조 데이터를 바탕으로 3차원 구조를 예측하고 모델링하는 컴퓨터 프로그램들이 개발되었다. 이러한 프로그램들은 과학자들이 더 큰 규모로 단백질 상호작용을 모델링하는 것을 가능하게 하며, 단백질 구조의 유연성을 고려한 비교 및 예측 방법도 개발되고 있다.[68]하지만 현재 사용 가능한 대부분의 단백질 분석 프로그램은 번역 후 변형(PTM)을 거친 단백질 분석에 최적화되어 있지 않다.[69] 일부 프로그램은 단백질 식별 과정에서 PTM을 고려하기도 하지만, 이후 분석에서는 이를 무시하는 경우가 많다. PTM은 단백질의 구조와 기능에 큰 영향을 미치므로 이를 고려하는 것이 중요하며, 현재 PTM 관련 프로그램은 주로 예측 기능에 머물러 있다.[70] 따라서 화학자, 생물학자, 컴퓨터 과학자들이 협력하여 PTM이 단백질 구조와 기능에 미치는 영향을 실험적으로 검증하고 분석할 수 있는 새로운 파이프라인을 개발하고 있다.
컴퓨터를 활용한 또 다른 중요한 방법론은 "가상 리간드 스크리닝"이다. 이는 수백만 개의 저분자 화합물 데이터베이스에서 특정 단백질의 3차원 구조에 결합할 수 있는 후보 물질을 컴퓨터 시뮬레이션을 통해 탐색하는 기술이다. 이를 통해 질병과 관련된 단백질의 기능을 억제하는 새로운 약물 후보를 효율적으로 발굴할 수 있다. 대표적인 예로 HIV 증식에 필수적인 HIV-1 프로테아제의 활성을 억제하는 약물 탐색을 들 수 있다.
방대한 계산 자원이 필요한 단백질 연구를 위해 분산 컴퓨팅 기술도 활용된다. World Community Grid와 같은 프로젝트는 전 세계 수백만 대의 개인용 컴퓨터의 유휴 처리 능력을 모아 슈퍼컴퓨터급의 연산 능력을 확보한다. 이를 통해 HIV, 암, 단백질 접힘, 뎅기열 등 다양한 질병 연구와 관련된 복잡한 단백질 모델링 및 시뮬레이션을 수행하고 있으며, 이는 새로운 치료법 개발의 단서를 제공할 수 있다.
단백질 서열 분석 역시 생물정보학의 중요한 분야로, 컴퓨터 알고리즘(예: Mascot, PEAKS, SEQUEST)을 사용하여 질량 분석법 등으로 얻어진 실험 데이터를 기존 단백질 데이터베이스와 비교하여 단백질을 동정한다. 또한, 분석된 서열 정보를 바탕으로 단백질의 기능을 예측하고 다른 단백질과의 진화적 관계를 밝히는 연구도 수행된다.
실험 생물정보학은 실험적 방법과 생물정보학적 분석을 융합하여 단백질체학 연구를 수행하는 접근법이다.
9. 2. 1. 단백질 바이오마커 연구
계산 생물정보학 및 계산 방법은 단백질 바이오마커 연구에 활용된다. 계산 예측 모델[71]은 임신 중 태아에서 모체로 광범위하고 다양한 단백질 이동이 일어나며, 이는 모체의 전혈에서 비침습적으로 쉽게 검출될 수 있음을 보여주었다. 이러한 계산 접근 방식은 모체 혈액에서 태아 단백질을 분석할 때 풍부한 모체 단백질 때문에 발생하는 어려움을 극복하는 데 도움을 준다. 계산 모델은 모체 전혈에서 확인된 태아 유전자 전사체를 사용하여 만삭 신생아의 포괄적인 단백체학 네트워크를 만들 수 있다. 이러한 연구는 임산부의 혈액에서 검출된 태아 단백질이 발달 중인 태아의 다양한 조직과 기관에서 유래한다는 것을 보여준다. 단백체학 네트워크는 발달 과정을 나타내는 대리 변수 역할을 하며, 정상 및 비정상적인 태아 발달을 모니터링하는 데 사용될 수 있는 많은 바이오마커를 포함하고 있다.정보 이론적 프레임워크 또한 생체 유체 및 조직 정보를 통합하여 바이오마커 발견을 위해 도입되었다.[72] 이 접근 방식은 특정 생체 유체와 조직 간의 기능적 시너지 효과를 활용하여, 조직과 생체 유체를 개별적으로 고려했을 때는 얻기 어려웠던 임상적으로 의미 있는 결과를 도출할 수 있다. 조직-생체 유체를 정보 채널로 개념화함으로써 중요한 생체 유체 프록시(대리 지표)를 식별하고, 이를 임상 진단 개발에 활용할 수 있다. 후보 바이오마커는 조직-생체 유체 채널 간의 정보 전송 기준에 따라 예측되며, 중요한 생체 유체-조직 관계는 바이오마커의 임상적 유효성 검사 우선순위를 정하는 데 사용될 수 있다.[72]
단백체학의 성과 중 하나는 특정 단백질을 질병 진단을 위한 생체 지표로 사용하는 것이다. 특정 질병이 발생했을 때 발현되는 단백질들이 다수 발견되었으며, 이는 질병의 조기 진단에 활용될 수 있다. 이러한 단백질을 조사하는 방법으로는 웨스턴 블롯, 면역 염색, ELISA, 질량 분석법 등이 있다. 다음은 특정 생체 지표를 활용하여 실제로 진단에 사용되는 질병의 예이다.
- 알츠하이머병: β-세크레타제의 농도가 증가하면 아밀로이드가 대량으로 생성된다. 이 아밀로이드가 환자의 뇌에 플라크를 형성하여 알츠하이머병을 유발하는 것으로 알려져 있다. β-세크레타제의 활성을 억제하여 아밀로이드 생성을 줄이면 질병의 진행을 늦출 수 있을 것으로 기대된다. 아밀로이드 증가는 면역 염색을 통해 확인할 수 있다.
- 심장병: 여러 핵심 단백질이 심장병의 생체 지표로 사용된다. 예를 들어, 뇌혈관 장애의 표준 생체 지표에는 인터루킨6, 인터루킨8, 혈청 아밀로이드 A, 피브리노겐, 트로포닌 등이 있다. 심장 손상 후 3시간에서 12시간 사이에 심장 트로포닌 1 수치가 증가하며, 급성 심근 경색 발생 후 며칠 동안 높은 수치가 유지된다. 시판되는 항체를 이용한 검사를 통해 급성 심근 경색 발생 여부를 판정할 수 있다.
- 간세포암: 건강한 사람의 신장 세포와 암 환자의 신장 세포 단백질체를 비교하여 간세포암의 생체 지표를 발견하고 질병 판정에 사용하고 있다. 신장 관련 질병의 경우, 소변이 이러한 생체 지표를 검출하는 주요 재료가 된다. 최근에는 소변 내 폴리펩티드를 생체 지표로 사용하여 자각 증상이 나타나기 몇 주 전에 진단하는 것이 가능해졌다.
9. 2. 2. 정보 이론 (Information theory) 기반 접근
정보 이론적 틀은 생체 유체와 조직 정보를 통합하여 바이오마커 발견에 활용되기도 한다.[72] 이 접근 방식은 특정 생체 유체와 조직 사이의 기능적 시너지 효과를 이용하여, 각각을 개별적으로 분석했을 때는 얻기 어려웠던 임상적으로 의미 있는 결과를 도출할 수 있다. 조직과 생체 유체를 하나의 정보 채널로 간주하여 중요한 생체 유체 대리 지표(proxy)를 식별하고, 이를 임상 진단법 개발에 적용할 수 있다. 바이오마커 후보는 조직-생체 유체 채널 간의 정보 전달량을 기준으로 예측하며, 중요한 생체 유체-조직 관계는 바이오마커의 임상적 유효성 검증 우선순위를 정하는 데 사용될 수 있다.[72]10. 새로운 연구 동향
단백체학은 지난 10년간 다양한 접근 방식의 발전을 통해 꾸준히 발전해 왔다. 이 중 일부는 완전히 새로운 기술이며, 다른 일부는 기존 방법을 기반으로 개선된 것이다. 질량 분석법 기반 방법, 친화성 단백체학, 단백질 마이크로어레이는 단백질의 대규모 연구에 가장 일반적으로 사용되는 기술들이지만, 새로운 연구 동향은 이러한 기술들을 넘어서 확장되고 있다.
바이오직교 화학의 발전은 단백체 분석 분야에 새로운 가능성을 제시하고 있다. 이는 살아있는 세포나 유기체 내에서 특정 생체 분자와 선택적으로 반응하면서도 다른 생체 분자에는 영향을 주지 않는 화학 반응을 이용하는 접근법이다. 예를 들어, 비단백질성 아미노산이나 특정 작용기를 가진 분자를 세포 내 단백질에 표지(labeling)하여 특정 단백질의 합성, 위치, 상호작용 등을 추적하고 분석할 수 있다.[45] 아지도호모알라닌(AHA)과 같은 분자는 메티오닌 대신 단백질 합성에 사용되어 새로 합성된 단백질을 선택적으로 표지하고 분리하는 데 활용된다.[45] 또한 케톤이나 알데히드 작용기를 이용한 표지 방법이나[46], 아지드 그룹과 스타우딩거 반응을 이용한 표지 방법[47] 등 다양한 바이오직교 화학 반응이 단백체 연구에 적용되고 있다. 이러한 방법들은 특정 조건(예: 질병 상태, 외부 자극)에서 단백질의 동적인 변화를 연구하는 데 유용하다.
단백질 구조 연구에서도 새로운 기술들이 등장하고 있다. 과거 X선 결정학이나 핵자기 공명 분광법(NMR)에 의존했던 3차원 구조 분석은 냉동 전자 현미경(Cryo-EM) 기술의 발전으로 큰 변화를 맞이했다. Cryo-EM은 단백질을 결정화하기 어렵거나 NMR로 분석하기 어려운 크고 복잡한 단백질 복합체의 구조를 높은 해상도로 분석할 수 있게 해주었다.[68] 또한, 생물정보학과 컴퓨터 모델링 기술의 발달로 단백질의 아미노산 서열 정보만으로 3차원 구조를 예측하고, 단백질 간의 상호작용을 시뮬레이션하는 것이 가능해졌다.[68] 특히, 단백질 구조의 유연성(flexibility)을 고려한 분석 방법들이 개발되면서 보다 실제 생체 내 환경에 가까운 단백질의 동적인 특성을 이해하려는 연구가 진행 중이다.[68]
계산 생물정보학(Computational bioinformatics)의 활용 증가는 단백체 데이터 분석과 해석에 중요한 역할을 하고 있다. 대규모 단백체 데이터에서 의미 있는 정보를 추출하고, 특정 질병과 관련된 바이오마커를 발굴하는 데 계산 모델링이 활발히 이용된다. 예를 들어, 임신 중 태아에서 유래한 단백질이 모체 혈액으로 이동하는 현상을 예측하고, 이를 통해 비침습적인 산전 진단 가능성을 탐색하는 연구[71]나, 생체 유체와 조직 간의 정보 흐름을 분석하여 새로운 바이오마커 후보를 발굴하는 정보 이론적 접근법[72] 등이 시도되고 있다.
이 외에도 단백체학 연구는 여러 새로운 방향으로 나아가고 있다. 단백질의 절대적인 양을 정확하게 측정하는 기술, 다양한 번역 후 변형(PTM)을 포괄적으로 분석하고 그 기능을 이해하는 연구, 분석의 처리량(throughput)과 민감도(sensitivity)를 향상시키기 위한 기기 및 방법론 개발 등이 지속적으로 이루어지고 있다.[73] 또한, 세포 내 특정 위치나 다른 분자와의 상호작용 등 단백질이 실제 존재하는 환경(context) 속에서의 기능을 이해하기 위한 연구[41], 예를 들어 화학적 가교제를 사용하여 단백질 상호작용을 포착하는 방법이나, 살아있는 세포 내에서 단백질의 움직임과 변화를 실시간으로 관찰하는 이미징 기술 개발[41] 등도 중요한 연구 동향으로 주목받고 있다. 이러한 새로운 연구 동향들은 단백질의 복잡한 기능과 조절 메커니즘을 더욱 깊이 이해하고, 이를 바탕으로 질병 진단 및 치료법 개발에 기여할 것으로 기대된다.
10. 1. 절대 정량 (Absolute quantification)
단백체학에서 단백질의 절대 정량(Absolute quantification)은 중요한 목표이자 과제 중 하나로 여겨진다. 이는 건강한 세포와 질병 상태의 세포에서 단백질의 기능을 정확히 이해하는 데 필수적이기 때문이다.[73] 단백질의 절대적인 양을 측정하기 위해 다양한 방법들이 개발되고 활용되고 있다.질량 분석법(Mass spectrometry) 기반 기술은 단백질 정량에 널리 사용된다. 안정 동위원소 표지(stable isotope labeling)를 이용한 방법, 예를 들어 동위원소 부호화 친화성 태그(ICAT) 시약 등을 사용하는 방식은 두 개 이상의 샘플 간 단백질 양의 상대적인 변화를 비교하는 데 효과적이다.[42][43] 그러나 절대적인 양을 측정하기 위해서는 다른 접근 방식이 필요하다.
리처드 D. 스미스(Richard D. Smith)와 태평양 북서 국립 연구소(Pacific Northwest National Laboratory) 연구진이 개발한 정확한 질량 및 시간(AMT) 태그 접근 방식은 펩타이드 및 단백질 식별을 위해 정밀하게 측정된 분리 시간 정보와 매우 정확한 질량 측정을 활용한다. 이 방법은 직렬 질량 분석의 필요성을 줄여 처리량과 감도를 높이며, 잠재적으로 절대 정량에 기여할 수 있다. 또한, 특정 태그(tag)와 조합한 탠덤 질량 분석[41]이나, 유도 결합 플라즈마 질량 분석법(ICP-MS)을 태그와 함께 활용하면 극미량(아토몰, attomole) 수준의 단백질까지 초고감도로 정량하는 것이 가능하다.
항체(Antibody)를 이용한 방법도 정량에 사용된다. 매우 특이적인 항체를 사용하는 정량적 도트 블롯(QDB) 분석은 특정 단백질의 양을 측정할 수 있다. 또한, 레이저 포획 미세 절개술(Laser capture microdissection, LCM) 기술과 결합된 역상 단백질 마이크로어레이(Reverse phase protein microarray, RPPA)는 특정 세포 집단(예: 정상 세포와 암세포) 내에서 단백질의 상태 변화를 정량적으로 모니터링하는 데 유용하게 사용될 수 있다.[41]
하지만 단백질 절대 정량은 여전히 어려운 과제이다. 특히 인간 혈장과 같이 매우 복잡한 시료의 경우, 단백질 종류가 다양하고 그 양의 차이(동적 범위)가 1010 배 이상으로 매우 크기 때문에 정확한 정량이 어렵다.[80][81] 이러한 기술적 어려움에도 불구하고, 단백질의 절대 정량은 세포 시스템에 대한 깊이 있는 이해를 가능하게 하고, 질병 진단을 위한 바이오마커 발굴 등 다양한 응용 분야에서 중요성이 커지고 있다.[55][56]
10. 2. 번역 후 변형 (PTM) 연구
대부분의 단백질은 광범위한 번역 후 변형(Post-translational modification, PTM)을 겪을 수 있으며, 이는 단백체(Proteome)의 복잡성을 더욱 증가시키는 요인이다.[38][39] 실제로 RNA 스플라이싱과 단백질 분해 과정을 고려한 고유 단백질 종의 수는 약 5만 개에서 50만 개 사이로 추정되지만, 번역 후 변형까지 고려하면 전체 고유 인간 단백질의 수는 수백만 개에 이를 수 있다.[38][39]많은 세포 활동에서 단백질의 농도 변화보다는 번역 후 변형(PTM)을 통해 기능이 조절되는 경우가 많다.[41] 따라서 건강한 세포와 질병 세포에서 단백질 기능을 이해하기 위해서는 PTM을 모니터링하는 것이 중요하지만, 이는 단백체학 연구에서 여전히 해결해야 할 과제로 남아있다.[73][41] PTM을 모니터링하는 방법은 아직 충분히 개발되지 않은 영역이다.[41]
현재 사용 가능한 대부분의 단백질 분석 프로그램은 번역 후 변형을 거친 단백질 분석에 최적화되어 있지 않다.[69] 일부 프로그램은 단백질 식별 과정에서 PTM을 고려하기도 하지만, 이후의 분석에서는 해당 변형 정보를 무시하는 경우가 많다. PTM은 단백질의 3차원 구조에 영향을 미칠 수 있으므로[69], 이를 분석에 포함하는 것이 중요하다. 이러한 이유로 PTM에 대한 계산 분석 연구가 주목받고 있으며, 현재 관련 프로그램들은 주로 예측 기능을 제공한다.[70] 화학자, 생물학자, 컴퓨터 과학자들은 실험적으로 확인된 PTM이 단백질 구조와 기능에 미치는 영향을 분석할 수 있는 새로운 연구 방법론(파이프라인)을 개발하기 위해 협력하고 있다.[70]
번역 후 변형 연구는 단백질에 나타나는 PTM의 유형을 조사하는 것을 목표로 한다. 대부분의 단백질은 어떤 형태로든 변형을 겪으며, 특히 인산화나 당화와 같은 특정 PTM을 분석하기 위한 특화된 방법들이 개발되어 왔다.
10. 3. 단일 세포 분석 (Single-cell analysis)
정량 단백체학의 발전은 세포 시스템에 대한 더 심층적인 분석을 가능하게 할 것이다.[55][56] 단백체학의 또 다른 중요한 연구 분야는 단일 세포 분석[74][75]과 단일 세포 간의 단백질 공변동 분석[76]이다. 이러한 분석은 단백질 복합체 형성, 면역 기능[77], 세포 주기, 그리고 약물 저항성을 위한 암세포의 프라이밍과 같은 생물학적 과정을 이해하는 데 도움을 준다.[78]10. 4. 시스템 생물학 (Systems biology)
정량 단백체학의 발전은 세포 시스템에 대한 더 깊이 있는 분석을 가능하게 한다.[55][56] 최근에는 단일 세포 분석[74][75]과 단일 세포 간 단백질 변화의 동시 발생(공변동) 분석[76] 등이 새로운 연구 분야로 떠오르고 있다. 이러한 분석은 단백질 복합체 형성, 면역 기능[77], 세포 주기, 약물 저항성을 갖추려는 암세포의 준비 과정과 같은 생물학적 과정을 이해하는 데 도움을 준다.[78]생물학적 시스템은 세포 주기, 세포 분화, 발암, 환경 변화 등 다양한 외부 자극이나 내부 변화(교란)에 영향을 받는다. 이러한 교란에 대한 전사 및 번역 수준의 반응은 결국 단백체 기능의 변화로 이어져, 시스템이 자극에 어떻게 반응하는지를 결정한다. 따라서 단백체 전체에서 단백질 양의 변화를 파악하고 정량화하는 것은, 시스템 수준에서 생물학적 현상을 보다 전체적으로 이해하는 데 매우 중요하다.
이러한 관점에서 단백체학은 생물학적 표현형을 종합적으로 정의하려는 통합 분석에서 유전체학, 전사체학, 후생유전체학, 대사체학 및 기타 오믹스 접근 방식들과 상호 보완적인 역할을 수행한다. 예를 들어, 특정 조건(질병, 발생 단계 등)에서의 유전체, 전사체, 단백체 데이터를 통합 분석하면 개별 데이터만으로는 알 수 없었던 시스템 수준의 조절 기작이나 네트워크를 파악할 수 있다. 이처럼 질량 분석법 등을 활용하여 특정 세포, 조직, 생물 종에 대한 대규모 단백체 데이터를 구축하는 것은 다양한 생명과학 분야 연구에 중요한 기반을 제공한다.
10. 4. 1. 암 단백체 아틀라스 (Cancer Proteome Atlas)
단백체학은 생물학적 표현형을 보다 포괄적으로 이해하기 위해 유전체학, 전사체학, 후생유전체학, 대사체학 등 다른 오믹스 접근 방식과 함께 활용된다. 이러한 통합 분석의 대표적인 예시가 ''암 단백체 아틀라스'' (Cancer Proteome Atlas, CPTAC)이다. 암 단백체 아틀라스는 암 게놈 아틀라스(The Cancer Genome Atlas, TCGA) 프로젝트에서 얻어진 유전체 및 전사체 데이터와 연계하여, 4,000개가 넘는 종양 샘플에서 약 200여 종의 단백질에 대한 정량적 발현 정보를 제공한다.[79] 이러한 대규모 데이터는 질량 분석법 기반의 심층 분석(deep shotgun mass spectrometry) 등을 통해 구축되며, 암 생물학 연구뿐만 아니라 발달, 줄기 세포 생물학, 의학, 진화 생물학 등 다양한 생명과학 분야 연구에 중요한 자원으로 활용될 수 있다.10. 5. 인간 혈장 단백체 (Human plasma proteome) 연구
인간 혈장 단백체를 특성화하는 것은 단백체학 분야의 주요 목표 중 하나이지만, 동시에 모든 인간 조직 중에서 가장 어려운 단백체로 여겨진다.[80] 혈장에는 상주 단백질, 지혈 관련 단백질 외에도 면역글로불린, 사이토카인, 단백질 호르몬, 그리고 감염을 나타내는 분비 단백질 등이 포함되어 있다. 또한 혈액이 신체의 다양한 조직을 순환하면서 조직에서 누출된 단백질도 포함하게 된다. 이러한 특성 때문에 혈액은 모든 조직의 생리적 상태에 대한 정보를 담고 있으며, 쉽게 접근할 수 있다는 점과 결합하여 의학적 목적으로 매우 가치가 높다.그러나 혈장 단백체의 특성화는 매우 어려운 과제로 간주된다. 혈장 단백체 내 단백질 농도의 동적 범위는 가장 풍부한 단백질인 알부민과 가장 적은 단백질(일부 사이토카인 등) 사이에 1010 배 이상 차이가 나며, 이는 단백체학 연구의 주요 난제 중 하나이다.[81] 시간적, 공간적 역학 또한 인간 혈장 단백체 연구를 더욱 복잡하게 만든다. 일부 단백질은 다른 단백질보다 훨씬 빠르게 분해 및 생성되며(회전율 차이), 동맥과 정맥의 단백질 함량도 실질적으로 다를 수 있다. 이러한 모든 차이점 때문에 단순히 혈장 단백체의 목록을 작성하는 기본적인 작업조차도 매우 어렵게 느껴질 수 있다.
이러한 문제를 해결하기 위해서는 연구의 우선순위를 정하는 것이 필요하다. 예를 들어, 전체 단백체 중에서 진단 도구 개발에 가장 의미 있는 단백질 하위 집합을 찾아내는 것이 중요한 우선순위가 될 수 있다. 또한, 암은 단백질의 당화 증가와 관련이 있는 경우가 많으므로, 단백질의 당화된 형태에 초점을 맞춘 연구 방법도 유용할 수 있다. 병리학적 상태를 가장 잘 파악하기 위해서는 여러 지표를 동시에 분석하는 다중 매개변수 분석이 필요하며, 이러한 기술이 발전함에 따라 질병과 관련된 유전자 발현 변화와의 연관성을 지속적으로 밝혀나가야 한다.[41]
앞서 언급한 여러 어려움에도 불구하고, 기술 발전과 지속적인 개발 덕분에 최근 혈장 단백체 연구는 다시 활기를 띠고 있다. 특히 '혈장 단백체 프로파일링'이라는 기술의 등장은 이를 잘 보여준다.[82] 이러한 기술 발전을 통해 연구자들은 쥐 모델에서 염증 과정을 연구하고, 혈장 단백체의 유전적 영향을 조사하며, 체중 감소와 같은 일반적인 생활 방식 변화가 혈장 단백체에 미치는 영향을 밝혀내는 등의 성과를 거두고 있다.[83][84][85]
참조
[1]
논문
Proteome and proteomics: new technologies, new concepts, and new words
1998-08
[2]
논문
Proteomics: quantitative and physical mapping of cellular proteins
1999-03
[3]
논문
Comprehensive Proteomic Analysis of Mesenchymal Stem Cell Exosomes Reveals Modulation of Angiogenesis via Nuclear Factor-KappaB Signaling
2016-03
[4]
논문
The Human Genome Project: big science transforms biology and medicine
2013-09-13
[5]
논문
Protein analysis by shotgun/bottom-up proteomics
2013-04
[6]
논문
Initial recommendations for performing, benchmarking and reporting single-cell proteomics experiments
2023-03
[7]
논문
Single-cell protein analysis by mass spectrometry
2021-02
[8]
간행물
"[48] Two-dimensional polyacrylamide gel electrophoresis for separation of ribosomal proteins"
https://linkinghub.e[...]
Academic Press
1974-01-01
[9]
논문
Progress with gene-product mapping of the Mollicutes: Mycoplasma genitalium
1995-07
[10]
논문
Government backs proteome proposal
1995-12
[11]
웹사이트
APAF - The Australian Proteome Analysis Facility
http://www.proteome.[...]
Macquarie University
2017-02-06
[12]
논문
Proteomics: Concepts and applications in human medicine
2021-09-27
[13]
논문
Investigating the correspondence between transcriptomic and proteomic expression profiles using coupled cluster models
2008-12
[14]
논문
New frontiers in proteomics research: a perspective
2005-08
[15]
웹사이트
The major world of microRNAs
http://www.nature.co[...]
2003-05
[16]
논문
Global, in vivo, and site-specific phosphorylation dynamics in signaling networks
2006-11
[17]
논문
Proteomics for cancer biomarker discovery
2002-08
[18]
논문
Correlation between protein and mRNA abundance in yeast
1999-03
[19]
논문
Quantification of protein half-lives in the budding yeast proteome
2006-08
[20]
논문
Evaluation of multidimensional chromatography coupled with tandem mass spectrometry (LC/LC-MS/MS) for large-scale protein analysis: the yeast proteome
[21]
논문
Large-scale analysis of the yeast proteome by multidimensional protein identification technology
2001-03
[22]
논문
Repeatability and reproducibility in proteomic identifications by liquid chromatography-tandem mass spectrometry
2010-02
[23]
논문
Options and considerations when selecting a quantitative proteomics strategy
2010-07
[24]
논문
A Critical Review of Bottom-Up Proteomics: The Good, the Bad, and the Future of this Field
2020-07
[25]
논문
Proteomics Is Analytical Chemistry: Fitness-for-Purpose in the Application of Top-Down and Bottom-Up Analyses
2015-12
[26]
논문
Spectral quality overrides software score-A brief tutorial on the analysis of peptide fragmentation data for mass spectrometry laymen
2021-02
[27]
논문
Good mass spectrometry and its place in good science
2012-06
[28]
논문
Selection and identification of single domain antibody fragments from camel heavy-chain antibodies
1997-09
[29]
논문
DARPins: a new generation of protein therapeutics
2008-08
[30]
논문
Aptamers: an emerging class of molecules that rival antibodies in diagnostics
1999-09
[31]
논문
The Simoa HD-1 Analyzer: A Novel Fully Automated Digital Immunoassay Analyzer with Single-Molecule Sensitivity and Multiplexing
2016-08
[32]
논문
Mass spectrometric immunoassay
1995-04
[33]
웹사이트
SISCAPA, Stable Isotope Standard Capture with Anti-Peptide Antibodies
https://www.broadins[...]
2015
[34]
논문
Validation and development of fluorescence two-dimensional differential gel electrophoresis proteomics technology
2001-03
[35]
논문
Insecticide-induced increase in the protein content of male accessory glands and its effect on the fecundity of females in the brown planthopper, ''Nilaparvata lugens'' Stål (Hemiptera: Delphacidae)
2010-11
[36]
논문
Proteomic analysis of insecticide triazophos-induced mating-responsive proteins of Nilaparvata lugens Stål (Hemiptera: Delphacidae)
2011-10
[37]
논문
Toward a definition of the complete proteome of plant peroxisomes: Where experimental proteomics must be complemented by bioinformatics
2011-05
[38]
논문
Antibody-based proteomics for human tissue profiling
2005-04
[39]
논문
Modification-specific proteomics: characterization of post-translational modifications by mass spectrometry
2004-02
[40]
논문
Proteomic analysis of differentially expressed protein in hemocytes of wild giant freshwater prawn Macrobrachium rosenbergii infected with infectious hypodermal and hematopoietic necrosis virus (IHHNV)
2015-09
[41]
논문
Systems biology, proteomics, and the future of health care: toward predictive, preventative, and personalized medicine
[42]
간행물
Quantitative Mass Spectrometry-Based Proteomics: An Overview
Springer US
2021
[43]
간행물
Quantitative Mass Spectrometry-Based Proteomics: An Overview
https://link.springe[...]
Humana Press
2023-04-14
[44]
논문
Affinity proteomics: the role of specific binding reagents in human proteome analysis
2012-08
[45]
논문
Selective enrichment of newly synthesized proteins for quantitative secretome analysis
2012-10
[46]
논문
Bioorthogonal reactions for labeling proteins
2014-01
[47]
논문
The Future of Bioorthogonal Chemistry
2018-08
[48]
논문
Redefining clinical trials: the age of personalized medicine
2012-03
[49]
논문
Role of jasmonate in the rice (Oryza sativa L.) self-defense mechanism using proteome analysis
2000-07
[50]
논문
New insights into plant responses to the attack from insect herbivores
[51]
논문
Proteome Analysis of Rice (Oryza sativa L.) Mutants Reveals Differentially Induced Proteins during Brown Planthopper (Nilaparvata lugens) Infestation
2013-02
[52]
논문
How chemoproteomics can enable drug discovery and development
2012-01
[53]
서적
Chemical Genomics and Proteomics
2012
[54]
논문
Surface plasmon resonance mass spectrometry in proteomics
2008-06
[55]
논문
Mass spectrometry-based proteomics and network biology
2012-07-07
[56]
논문
Mass spectrometry-based proteomics for systems biology
2012-08
[57]
논문
What are biomarkers?
2010-11
[58]
논문
Biomarkers and surrogate endpoints: preferred definitions and conceptual framework
2001-03
[59]
논문
Proteomics in veterinary medicine: applications and trends in disease pathogenesis and diagnostics
2014-03
[60]
논문
Proteome of metastatic canine mammary carcinomas: similarities to and differences from human breast cancer
2010-12
[61]
논문
Increased expression of BRCA2 and RAD51 in lymph node metastases of canine mammary adenocarcinomas
2009-05
[62]
논문
Approaches to the study of the cell secretome
2007-04
[63]
논문
Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation
2007-09
[64]
논문
Comparative proteogenomics: combining mass spectrometry and comparative genomics to analyze multiple genomes
2008-07
[65]
웹사이트
What is Proteomics?
http://www.proteomic[...]
ProteoConsult
[66]
웹사이트
UniProt
https://www.uniprot.[...]
[67]
웹사이트
ExPASy - PROSITE
http://prosite.expas[...]
[68]
논문
A local average distance descriptor for flexible protein structure comparison
2014-04
[69]
논문
A systematic framework for molecular dynamics simulations of protein post-translational modifications
2013-07
[70]
논문
Vienna-PTM web server: a toolkit for MD simulations of protein post-translational modifications
2013-07
[71]
논문
High-throughput discovery and characterization of fetal protein trafficking in the blood of pregnant women
2009-12
[72]
서적
Biocomputing 2008
[73]
논문
Instrumentation at the Leading Edge of Proteomics
https://pubs.acs.org[...]
2024-05-21
[74]
논문
Scaling Up Single-Cell Proteomics
2022-01
[75]
논문
Increasing the throughput of sensitive proteomics by plexDIA
2022-07
[76]
논문
Learning from natural variation across the proteomes of single cells
2022-01
[77]
논문
Prioritized single-cell proteomics reveals molecular and functional polarization across primary macrophages
2022-03-18
[78]
논문
Exploring functional protein covariation across single cells using nPOP
2022-12
[79]
논문
TCPA: a resource for cancer functional proteomics data
2013-11
[80]
논문
The clinical plasma proteome: a survey of clinical assays for proteins in plasma and serum
2010-02
[81]
논문
Six decades searching for meaning in the proteome
2014-07
[82]
논문
Plasma Proteome Profiling to Assess Human Health and Disease
2016-03
[83]
논문
Large-scale inference of protein tissue origin in gram-positive sepsis plasma using quantitative targeted proteomics
2016-01
[84]
논문
Proteomics reveals the effects of sustained weight loss on the human plasma proteome
2016-12
[85]
논문
Quantitative variability of 342 plasma proteins in a human twin population
2015-02
[86]
논문
Proteome and proteomics: new technologies, new concepts, and new words
[87]
논문
Proteomics: quantitative and physical mapping of cellular proteins
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com