단백질 정보 은행
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
단백질 정보 은행(PDB)은 단백질 및 핵산과 같은 생체 고분자의 3차원 구조 정보를 담고 있는 데이터베이스이다. 1971년 브룩헤이븐 국립 연구소와 케임브리지 결정학 데이터 센터의 공동 사업으로 시작되었으며, 이후 RCSB PDB, PDBe, PDBj, BMRB를 포함하는 wwPDB(Worldwide Protein Data Bank)로 발전하여 국제적인 협력 체제를 갖추었다. PDB는 X선 회절, NMR, 전자 현미경 등의 실험 방법을 통해 얻어진 구조 정보를 제공하며, 매주 업데이트된다. 2023년 1월 기준 200,000개 이상의 구조가 등록되어 있으며, PDB는 단백질 구조 연구 및 생명 과학 분야에 널리 활용된다.
더 읽어볼만한 페이지
- 생물정보학 데이터베이스 - 피시베이스
피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다. - 생물정보학 데이터베이스 - 질병 데이터베이스
질병 데이터베이스는 질병, 약물, 증상 등 8,500여 개의 의학 관련 항목을 포함하며, 항목 간 관계 설정, 외부 웹 리소스 연결, 통합 의학 언어 시스템 매핑을 통해 구성된다. - 생물학 데이터베이스 - 피시베이스
피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다. - 생물학 데이터베이스 - ChEMBL
ChEMBL은 약물 표적에 대한 화합물 생체 활성 데이터베이스로서, 신약 개발 과정의 선도 물질 식별을 위한 화합물 스크리닝 라이브러리 구축에 활용되며, 웹 인터페이스나 파일 전송 프로토콜을 통해 접근 가능하다. - 단백질 구조 - 메틸화
메틸화는 메틸기를 분자에 첨가하는 과정으로, 생물학에서 유전자 발현 조절 등 생명현상에 관여하고 유기화학에서 유기 합성에 활용되며, 다양한 생물종에 존재하는 중요한 생리적 과정이다. - 단백질 구조 - 녹색 형광 단백질
녹색 형광 단백질(GFP)은 해파리에서 발견된 단백질로, 특정 파장의 빛을 흡수하여 녹색 형광을 방출하며, 자체 발색단 형성 능력과 유전자 조작을 통한 개량형 개발로 생물학 연구에서 리포터 유전자로 널리 사용되지만, 실험 결과 해석 시 주의가 필요하고 대체 기술 또한 개발 중이다.
단백질 정보 은행 | |
---|---|
개요 | |
설명 | 국제적인 대형 생물 분자 공개 데이터베이스 |
관련 분야 | 단백질 구조 X선 결정학 NMR 구조 결정 |
센터 | wwPDB |
표준 | mmCIF PDB |
라이선스 | wwPDB.org의 사용 정책을 따름 |
PMID | 30357364 |
URL | wwPDB ebi.ac.uk rcsb.org bmrb.io pdbj.org |
2. 역사
PDB는 1971년 10월 네이처 뉴 바이올로지에 영국 케임브리지 결정학 데이터 센터와 미국 브룩헤이븐 국립 연구소의 공동 사업으로 발표되었다.[9] PDB가 처음 설립될 때에는 오직 7개의 단백질 구조만을 보유하고 있었다. 그 후 단백질 구조의 숫자는 지수적으로 증가했으며, 그 추세는 꺾일 기미를 보이지 않고 있다.
PDB는 X선 회절을 통해 결정된 단백질 구조 데이터가 증가하고, 브룩헤이븐 래스터 디스플레이(BRAD)를 통해 이러한 단백질 구조를 3차원으로 시각화할 수 있게 되면서 시작되었다. 1969년, 브룩헤이븐 국립 연구소의 월터 해밀턴의 후원을 받아 텍사스 A&M 대학교의 에드가 마이어는 원자 좌표 파일을 공통 형식으로 저장하여 기하학적 및 그래픽 평가에 사용할 수 있도록 하는 소프트웨어를 개발하기 시작했다. 1971년 마이어의 프로그램 중 하나인 SEARCH를 통해 연구자들은 원격으로 데이터베이스에 접근하여 단백질 구조를 연구할 수 있었다.[8]
이후 PDB는 BNL PDB, RCSB PDB, wwPDB 시기를 거치며 발전해왔다.
2. 1. BNL PDB 시기 (1971년 ~ 1998년)
1971년에 미국의 브룩헤이븐 국립 연구소(BNL)와 영국의 The Cambridge Crystallographic Data Centre (CCDC)가 공동으로 PDB를 설립했고, PDB에 대한 데이터 등록은 브룩헤이븐 국립 연구소가 단독으로 수행했다.[9] 설립 이후 PDB 데이터의 자기 테이프를 통한 공개는 브룩헤이븐 국립 연구소와 CCDC에 의해 이루어졌지만, 1976년에 도쿄 대학 대형 계산기 센터도 이에 참여했다. 1979년부터는 자기 테이프를 통한 일본 국내 데이터 배포 활동은 오사카 대학 단백질 연구소가 담당하게 되었다.[8]2. 2. RCSB PDB 시기 (1998년 ~ 2003년)
1998년에 PDB는 브룩헤이븐 국립 연구소에서 [http://home.rcsb.org/ 구조 생물 정보학 연구 협동체](RCSB)로 이관되었다.[10][11] RCSB는 PDB의 등록 및 마스터 파일 관리를 담당하게 되었다. 이와 동시에 유럽에서는 EMBL-EBI에 Macromolecular Structure Database가 설립되어, BNL과 공동 개발한 Autodep 시스템을 이용해 데이터 등록을 시작했다. 2000년에는 오사카 대학 단백질 연구소가 RCSB PDB와 협력하여 아시아 지역의 데이터 등록 접수를 시작했다.2. 3. wwPDB 시기 (2003년 ~ 현재)
2003년, wwPDB(Worldwide Protein Data Bank)가 설립되면서 PDB는 국제적인 기구가 되었다. 창립 멤버는 PDBe(유럽),[3] RCSB PDB (미국), PDBj (일본)이다.[4] BMRB[13]는 2006년에 합류했다. wwPDB의 네 멤버는 PDB 데이터의 기탁, 데이터 처리 및 배포 센터 역할을 할 수 있다. 데이터 처리는 wwPDB 직원이 제출된 각 항목을 검토하고 주석을 추가한다는 것을 의미한다.[14] 그런 다음 데이터의 타당성을 자동으로 확인한다. (이 유효성 검사 소프트웨어의 소스 코드[15]는 무료로 대중에게 공개되었다.)wwPDB는 다음 4개의 기관으로 구성된다.
기관명 | 국가 | 약칭 | 비고 |
---|---|---|---|
일본 단백질 구조 데이터 뱅크 | 일본 | PDBj | |
구조 생물 정보학 연구 공동체 | 미국 | RCSB PDB | |
유럽 단백질 구조 데이터 뱅크 | 영국 | PDBe | |
생물학적 자기 공명 데이터 뱅크 | 미국 | BMRB | 2006년 합류 |
wwPDB는 2003년에 결성되었으며, 2006년 미국의 RCSB PDB, 유럽의 MSD-EBI, 일본의 PDBj, 미국의 BMRB가 참여하여 4개 기관으로 구성되었다.
wwPDB의 역할은 PDB의 생체 고분자의 입체 구조를 축적한 단일 데이터베이스를 보존하고 PDB 데이터베이스를 전 세계 연구자 커뮤니티에 무상으로 공개하고 이용할 수 있도록 하는 것이다. wwPDB에서는 통일된 기준에 따른 데이터 등록이 이루어져 완전히 동일한 데이터를 공개하고 있지만, 데이터 검색 서비스와 데이터 배포 방법에는 자유도가 있어, 각 거점 고유의 서비스를 제공하고 있다.
3. 구성원
wwPDB의 역할은 PDB에 축적된 생체 고분자의 입체 구조 데이터를 전 세계 연구자에게 무료로 제공하는 것이다.
3. 1. PDBj (Protein Data Bank Japan)
PDBj (Protein Data Bank Japan)는 일본 오사카 대학 단백질 연구소에서 운영하며, 구조 생물 정보학 연구 공동체(RCSB PDB), 유럽 단백질 구조 데이터 뱅크(PDBe), 생체 분자 자기 공명 데이터 뱅크(BMRB)와 협력하여 고분자 입체 구조 및 관련 툴을 제공한다. PDBj는 일본 과학기술진흥기구 바이오사이언스데이터베이스센터(JST-NBDC)의 지원을 받는다.
4. 데이터 및 파일 형식
PDB는 mmCIF, PDB, PDBML(XML) 등 다양한 형식으로 데이터를 제공한다.[20][22]
처음 사용된 파일 형식은 PDB 파일 형식이었다. 이 형식은 컴퓨터 천공 카드의 너비 때문에 한 줄에 80자로 제한되었다. 1996년경부터는 CIF 형식의 확장인 "거대 분자 결정학 정보 파일" 형식(mmCIF)이 도입되었다. mmCIF는 2014년에 PDB 아카이브의 표준 형식이 되었다.[20] 2019년에는 wwPDB가 결정학적 방법의 기탁을 mmCIF 형식으로만 받겠다고 발표했다.[21]
PDBML은 PDB의 XML 버전으로, 2005년에 발표되었다.[22] 구조 파일은 이 세 가지 형식 중 하나로 다운로드할 수 있지만, 점점 더 많은 구조가 레거시 PDB 형식에 맞지 않는다. 개별 파일은 인터넷 URL을 통해 그래픽 패키지로 쉽게 다운로드할 수 있다.
- PDB 형식 파일: `http://www.pdb.org/pdb/files/4hhb.pdb.gz` 또는 `http://pdbe.org/download/4hhb`
- PDBML(XML) 파일: `http://www.pdb.org/pdb/files/4hhb.xml.gz` 또는 `http://pdbe.org/pdbml/4hhb`
여기서 `4hhb`는 PDB 식별자이다. PDB에 게시된 각 구조는 4자리의 영숫자 식별자인 PDB ID를 받는다. 같은 분자가 다른 환경이나 컨포메이션을 가질 경우, 여러 개의 PDB ID를 가질 수 있다.
5. 데이터 보기
PDB 데이터는 VMD, RasMol, PyMOL, Jmol 등의 다양한 생체분자 시각화 프로그램을 통해 확인할 수 있다.[16] STING과 같은 웹 기반 소프트웨어나 시리우스와 같은 데스크톱 기반 소프트웨어도 단백질 구조를 시각화하고 분석하는 데 사용된다. RCSB PDB는 교육, 구조적유전학, 관련 소프트웨어를 위한 자료도 제공한다.
PDB 파일을 시각화해서 볼 수 있는 프로그램들은 다음과 같다.
- 파이몰: [http://pymol.sourceforge.net/ PyMol Home Page]
- 시리우스: [https://web.archive.org/web/20070613132108/http://sirius.sdsc.edu/ Sirius Home Page]
- [https://web.archive.org/web/20070722220802/http://www.cbi.cnptia.embrapa.br/SMS/ STING]
- 라스몰: [http://www.openrasmol.org/ RasMol Home Page]
- [https://web.archive.org/web/20070427185441/http://garlic.mefos.hr/garlic/ Garlic]
- [http://www.expasy.ch/spdbv/mainpage.html Swiss-PDB Viewer]
- [http://web.mit.edu/star/biochem StarBiochem]: 자바로 짜여진 통합 단백질 정보 은행 검색을 할 수 있는 PDB 뷰어
PDB의 3차원 구조 데이터는 다음과 같은 생체 물질 시각화 소프트웨어를 사용하여 볼 수 있다.
- RasMol: 로저 세일(Roger Sayle)에 의해 개발되었다.
- Jmol: 자바로 개발되었다. 웹 페이지 내에서 자바 애플릿으로 사용할 수도 있다.
- PyMOL: 파이썬으로 개발되었다.
- Chime: 웹 브라우저의 플러그인으로 사용할 수 있다.
- 웹 브라우저 VRML 플러그인
- STING: 브라질의 구조 생물 정보학 그룹(Structural Bioinformatics Group)에 의해 개발되었다. 단백질 구조 분석 기능을 갖추고 있다.
- [http://www.pdbj.org/jv/index_j.html jV]: 일본 단백질 구조 데이터 뱅크(PDBj)의 활동 중 하나로 자바로 개발되었다. 웹 페이지 내에서 자바 애플릿으로 사용할 수도 있다.
구조 생물 정보학 연구 공동체(RCSB PDB)의 웹사이트에서는 교육 및 구조 유전체학에 관한 자료와 관련 소프트웨어를 제공하고 있으며, 다음은 그 예시이다.
- [http://www.cbi.cnptia.embrapa.br/SMS STING]
- RasMol
- [http://www.bernstein-plus-sons.com/software/rasmol/ RasMol]
- [http://www.openrasmol.org/ RasMol과 OpenRasMol]
- PyMOL: [http://pymol.sourceforge.net/]
- [http://jmol.sourceforge.net/ Jmol]
- [http://garlic.mefos.hr/garlic/ Garlic]
- [http://www.expasy.ch/spdbv/mainpage.html Swiss-PDB Viewer]
- [https://pdbj.org/jv/index_j.html jV](PDBj Viewer)
6. 통계
PDB는 1971년 설립 이후 지수적으로 성장해 왔다. 2007년 7월 26일 당시 44,476개의 단백질, 핵산, 단백질-핵산 복합체 등의 구조가 등재되어 있었고, 2012년 6월 14일에는 82,347개, 2023년 1월 10일 기준으로는 200,069개의 구조 데이터가 등록되어 있다.[17]
PDB에 등록된 구조 데이터는 연도별, 분석 방법별로 다음과 같이 분류할 수 있다.
연도 | 단백질 | 핵산 | 단백질-핵산 복합체 | 기타 | 총계 |
---|---|---|---|---|---|
2007년 7월 26일 | 44,476 | 44,476 | |||
2012년 6월 14일 | 76,220 | 2,382 | 3,722 | 23 | 82,347 |
2014년 6월 3일 | 93,258 | 2,672 | 4,738 | 25 | 100,693 |
2023년 1월 10일 | 173,900 | 4,091 | 11,212 | 202 | 200,069 |
실험 방법 | 단백질만 | 올리고당 포함 단백질 | 단백질/핵산 복합체 | 핵산만 | 기타 | 올리고당만 | 총계 |
---|---|---|---|---|---|---|---|
X선 회절 | 152,277 | 8,969 | 8,027 | 2,566 | 163 | 11 | 172,013 |
NMR | 12,104 | 32 | 281 | 1,433 | 31 | 6 | 13,887 |
전자 현미경 | 9,226 | 1,633 | 2,898 | 77 | 8 | 0 | 13,842 |
하이브리드 | 189 | 7 | 6 | 12 | 0 | 1 | 215 |
중성자 | 72 | 1 | 0 | 2 | 0 | 0 | 75 |
기타 | 32 | 0 | 0 | 1 | 0 | 4 | 309 |
총계: | 173,900 | 10,642 | 11,212 | 4,091 | 202 | 22 | 200,069 |
대부분의 구조는 X선 회절법으로 결정되었으며, NMR 분광법, 전자 현미경 등으로 결정된 구조도 포함된다.[16]
역사적으로 PDB의 구조 수는 1982년 100개, 1993년 1,000개, 1999년 10,000개, 2014년 100,000개, 2023년 1월 200,000개로 대략 지수적으로 증가했다.[18][19]
참조
[1]
간행물
Protein Data Bank: the single global archive for 3D macromolecular structure data
[2]
웹사이트
wwPDB: Usage Policies
https://www.wwpdb.or[...]
2024-04-16
[3]
웹사이트
PDBe home < Node < EMBL-EBI
http://www.pdbe.org/
[4]
웹사이트
Protein Data Bank Japan – PDB Japan – PDBj
http://www.pdbj.org/
[5]
웹사이트
RCSB PDB: Homepage
http://www.rcsb.org/
[6]
간행물
The Protein Data Bank: a historical perspective
http://journals.iucr[...]
2008-01
[7]
간행물
PDBsum: a Web-based database of summaries and analyses of all PDB structures
1997-12
[8]
간행물
The first years of the Protein Data Bank
Cambridge University Press
[9]
간행물
Protein Data Bank
[10]
간행물
The Protein Data Bank
2000-01
[11]
웹사이트
Research Collaboratory for Structural Bioinformatics
http://home.rcsb.org[...]
Research Collaboratory for Structural Bioinformatics
[12]
웹사이트
RCSB PDB Newsletter Archive
http://www.rcsb.org/[...]
RCSB Protein Data Bank
[13]
웹사이트
Biological Magnetic Resonance Bank
http://www.bmrb.wisc[...]
[14]
서적
Linking Enterprise Data
Springer US
[15]
웹사이트
PDB Validation Suite
http://sw-tools.pdb.[...]
[16]
간행물
Protein Data Bank: the single global archive for 3D macromolecular structure data
2019-01
[17]
웹사이트
PDB Current Holdings Breakdown
http://www.rcsb.org/[...]
RCSB
2007-07-02
[18]
간행물
Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures
[19]
웹사이트
PDB Statistics: Overall Growth of Released Structures Per Year
https://www.rcsb.org[...]
2023-01-12
[20]
웹사이트
wwPDB: File Formats and the PDB
https://www.wwpdb.or[...]
2020-04-01
[21]
웹사이트
wwPDB: 2019 News
https://www.wwpdb.or[...]
[22]
간행물
PDBML: the representation of archival macromolecular structure data in XML
2005-04
[23]
웹사이트
ICM-Browser
http://www.molsoft.c[...]
Molsoft L.L.C.
2013-04-06
[24]
웹사이트
Swiss PDB Viewer
http://www.expasy.ch[...]
Swiss Institute of Bioinformatics
2013-04-06
[25]
웹사이트
STAR: Biochem - Home
http://web.mit.edu/s[...]
[26]
웹사이트
VisProt3DS
http://www.molsystem[...]
Molecular Systems Ltd
2013-04-06
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com