PDB (파일 형식)
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
PDB 파일 형식은 단백질이나 핵산의 원자 좌표를 교환하기 위해 1972년에 개발된 사람이 읽을 수 있는 파일 형식이다. 이 파일 형식은 고정된 열 너비 형식을 사용하며, 원자 위치, 서열 정보, 구조, 연구자 정보 등을 포함한다. PDB 형식은 단백질 외에도 인공 중합체 등 다른 분자 구조를 설명하는 데 사용되지만, 몇 가지 문제점이 있어 개선 노력이 진행되었다. 이 형식을 지원하는 다양한 분자 시각화 소프트웨어가 존재하며, NCBI, 유럽생물정보학연구소, RCSB 등에서 관련 프로젝트가 진행되었다.
더 읽어볼만한 페이지
- 생물정보학 데이터베이스 - 피시베이스
피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다. - 생물정보학 데이터베이스 - 질병 데이터베이스
질병 데이터베이스는 질병, 약물, 증상 등 8,500여 개의 의학 관련 항목을 포함하며, 항목 간 관계 설정, 외부 웹 리소스 연결, 통합 의학 언어 시스템 매핑을 통해 구성된다. - 생물학 데이터베이스 - 피시베이스
피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다. - 생물학 데이터베이스 - ChEMBL
ChEMBL은 약물 표적에 대한 화합물 생체 활성 데이터베이스로서, 신약 개발 과정의 선도 물질 식별을 위한 화합물 스크리닝 라이브러리 구축에 활용되며, 웹 인터페이스나 파일 전송 프로토콜을 통해 접근 가능하다. - 파일 포맷 - 바로 가기
바로 가기는 운영체제에서 파일, 폴더, 프로그램, 웹 페이지에 대한 참조를 제공하는 기능 및 파일로, 사용자들이 원본에 빠르게 접근하도록 GUI 환경의 사용성을 향상시킨다. - 파일 포맷 - EXE
EXE 파일 형식은 운영 체제에 따라 다양한 종류가 있는 실행 파일의 한 형태로, DOS MZ 실행 파일에서 PE, PE32+까지 발전해 왔으며, 코드, 데이터, 스택을 별도 관리하고 재배치 항목을 통해 실행 환경에 유연하게 대응하는 특징을 가진다.
PDB (파일 형식) - [IT 관련 정보]에 관한 문서 | |
---|---|
개요 | |
종류 | 화학 파일 포맷 |
대상 | 분자 3차원 구조, 단백질 3차원 구조 |
상세 정보 | |
파일 확장자 | .pdb, .ent, .brk |
MIME 형식 | chemical/x-pdb |
개발자 | 단백질 데이터 뱅크 |
확장 형식 | mmCIF |
2. 역사
PDB는 시간이 지나면서 많은 변화와 교정을 거쳤다. PDB 파일 형식의 시초는 컴퓨터 천공 카드의 폭에 의해 기록되었다.[2][3] PDB 파일 형식의 마지막 업데이트는 2012년 11월 버전 3.30이었다.[6]
2. 1. 초기 형태
PDB 파일 형식은 1972년에 개발되었으며,[2][3] 연구자들이 데이터베이스 시스템을 통해 주어진 단백질의 원자 좌표를 교환할 수 있도록 하는, 사람이 읽을 수 있는 파일 형식이다. 고정된 열 너비 형식은 80 또는 140[4] 열로 제한되며, 이는 이전에 좌표 교환에 사용되었던 천공 카드의 폭을 기반으로 한다.[5]2. 2. 업데이트
PDB는 시간이 지나면서 많은 변화와 수정을 거쳤다. PDB 파일 형식의 시초는 컴퓨터 천공 카드의 폭에 의해 기록되었다.[2][3] 1972년에 개발된 PDB 파일 형식은 연구자들이 데이터베이스 시스템을 통해 주어진 단백질의 원자 좌표를 교환할 수 있도록 하는 사람이 읽을 수 있는 파일 형식이다. 고정된 열 너비 형식은 80 또는 140[4] 열로 제한되며, 이는 이전에 좌표 교환에 사용되었던 컴퓨터 펀치 카드의 너비를 기반으로 한다.[5] 수년에 걸쳐 파일 형식은 많은 변화와 수정을 거쳤다. PDB 파일 형식의 마지막 업데이트는 2012년 11월 버전 3.30이었다.[6]3. 파일 구조 및 내용
PDB 파일은 원자들의 위치 정보, 서열 정보, 그리고 구조를 결정하고 주석을 단 연구자들에 대한 정보를 포함한다. 파일에는 파일의 정보를 이해하는 데 필요한 추가 정보가 포함될 수 있다.[7]
PDB 형식은 단백질이나 핵산의 구조뿐만 아니라 인공중합체와 같은 다른 분자의 구조를 설명하는 데에도 사용된다.[7]
PDB 파일은 일반적으로 단백질을 설명하는 데 사용되며, 수백에서 수천 줄의 코드로 구성된다. 주요 레코드로는 HEADER, TITLE, AUTHOR, REMARK, SEQRES, ATOM, HETATM 등이 있으며, 각 레코드는 특정한 정보를 담고 있다. 이러한 레코드들에 대한 자세한 설명은 "주요 레코드" 하위 섹션에서 확인할 수 있다.
3. 1. 주요 레코드
PDB 파일은 전형적인 단백질을 설명하는 수백에서 수천 줄로 구성되어 있다. 다음은 합성 http://www.rcsb.org/pdb/files/1mbs.pdb 콜라겐 유사 펩타이드의 구조를 설명하는 파일에서 가져온 예시이다.- HEADER, TITLE 및 AUTHOR 레코드: 구조를 정의한 연구자에 대한 정보를 제공한다. 다른 유형의 정보를 제공하기 위해 수많은 다른 유형의 레코드를 사용할 수 있다.
- REMARK 레코드: 자유 형식 주석을 포함할 수 있지만 표준화된 정보도 수용한다. 예를 들어, `REMARK 350 BIOMT` 레코드는 실험적으로 관찰된 멀티머의 좌표를 단일 반복 단위의 명시적으로 지정된 좌표에서 계산하는 방법을 설명한다.
- SEQRES 레코드: 이 예에서는 매우 짧지만 일반적으로 여러 줄에 걸쳐 있는 세 개의 펩타이드 사슬(A, B 및 C로 명명됨)의 서열을 제공한다.
- ATOM 레코드: 단백질의 일부인 원자의 좌표를 설명한다. 예를 들어, 위의 첫 번째 ATOM 줄은 펩타이드 사슬 A의 첫 번째 잔기의 알파-N 원자를 설명하며, 이는 프롤린 잔기이다. 처음 세 개의 부동 소수점 숫자는 x, y 및 z 좌표이며, 단위는 옹스트롬이다.[7] 다음 세 열은 점유율, 온도 인자 및 원소 이름이다.
- HETATM 레코드: 단백질 분자의 일부가 아닌 헤테로원자의 좌표를 설명한다.
3. 2. 기타 정보
이 파일은 원자들의 위치 정보, 서열 정보, 그리고 구조를 정하고 주석을 단 연구자들에 대한 정보를 포함한다. 파일 상의 정보를 이해하는 데 필요한 추가적인 정보가 수록될 수 있다.[7]PDB 형식은 단백질이나 핵산의 구조에만 사용되지 않고, 인공중합체 등 다른 분자의 구조를 설명하는 데에도 적용된다.[7]
전형적인 단백질을 설명하는 PDB 파일은 수백에서 수천 줄로 구성된다. 다음은 합성 http://www.rcsb.org/pdb/files/1mbs.pdb 콜라겐 유사 펩타이드의 구조를 설명하는 파일의 일부이다.[7]
- HEADER, TITLE, AUTHOR 레코드: 구조를 정의한 연구자에 대한 정보를 제공한다. 다른 유형의 정보를 제공하기 위해 여러 유형의 레코드를 사용할 수 있다.[7]
- REMARK 레코드: 자유 형식 주석을 포함할 수 있지만 표준화된 정보도 포함한다. 예를 들어, `REMARK 350 BIOMT` 레코드는 실험적으로 관찰된 멀티머의 좌표를 단일 반복 단위의 명시적으로 지정된 좌표에서 계산하는 방법을 설명한다.[7]
- SEQRES 레코드: 세 개의 펩타이드 사슬(A, B, C)의 서열을 제공한다. 일반적으로 여러 줄에 걸쳐 있다.[7]
- ATOM 레코드: 단백질의 일부인 원자의 좌표를 설명한다. 예를 들어, 펩타이드 사슬 A의 첫 번째 잔기인 프롤린 잔기의 알파-N 원자를 설명하는 경우, 처음 세 개의 부동 소수점 숫자는 x, y, z 좌표이며, 단위는 옹스트롬이다. 다음 세 열은 점유율, 온도 인자, 원소 이름이다.[7]
- HETATM 레코드: 단백질 분자의 일부가 아닌 헤테로원자의 좌표를 설명한다.[7]
4. 활용
PDB 서식은 단백질이나 핵산의 구조뿐만 아니라 인공중합체와 같은 다른 분자의 구조를 설명하는 데에도 적용된다.
4. 1. 문제점 및 개선
PDB는 시간이 지나면서 많은 변화와 교정을 거쳐 왔다. PDB 파일 형식의 시초는 컴퓨터 천공 카드의 폭에 의해 기록되었다. 이 외에도 PDB 서식은 단백질이나 핵산의 구조에 한해서만 사용되지 않고, 기타 다른 분자, 가령 인공중합체 등의 구조를 설명하는 데에도 적용되고 있다. 이 PDB 형식은 많은 문제의 원인이 되었고, 그 결과 몇 개의 '대청소' 프로젝트가 생겨났다.4. 2. 분자 시각화 소프트웨어
- 아테나
- [http://bioblender.org/ Bioblender]
- [https://www.ccp4.ac.uk/MG/ CCP4MG]
- [http://www.cuemol.org/en/ CueMol]
- QuteMol
- Gabedit
- [https://www.scienomics.com/maps-platform/ MAPS (Materials and Processes Simulations) 플랫폼]
- [https://www.ovito.org/ OVITO (Open Visualization Tool)]
- WHAT IF
- Yasara
- [http://www.al-nasir.com/www/Jamie/Zeus/ Zeus 분자 시각화]
- [http://epmv.scripps.edu ePMV]
- [http://www.baaden.ibpc.fr/umol/ UnityMol]
- [http://www.blender.org 블렌더] (확장 기능 설치 필요)
- [http://www.sidefx.com 후디니]
- [https://threejs.org/docs/index.html?q=pd#examples/en/loaders/PDBLoader three.js]
4. 2. 1. 대표적인 소프트웨어
- SAMSON
- BALLView
- Chimera
- Cn3D
- Coot
- Jmol
- Molden
- Molekel
- PyMOL
- RasMol
- UGENE
- VisIt
- VMD
- Discovery Studio
- ParaView
5. 외부 프로젝트
PDB 파일 형식과 관련된 주요 외부 프로젝트는 다음과 같다.
- 미국 국립생물정보센터의 [https://web.archive.org/web/20060703022313/http://ncbi.nih.gov/Structure/MMDB/mmdb.shtml 분자 모델링 데이터베이스]
- 유럽생물정보학연구소의 [http://www.ebi.ac.uk/msd/ 거대분자 구조 데이터베이스]
- 단백질 자료 은행의 [https://web.archive.org/web/20051223100219/http://www.rcsb.org/pdb/uniformity/index.html 자료 균일화 프로젝트]
5. 1. 주요 프로젝트
- 미국 국립생물정보센터의 [https://web.archive.org/web/20060703022313/http://ncbi.nih.gov/Structure/MMDB/mmdb.shtml 분자 모델링 데이터베이스]
- 유럽생물정보학연구소의 [http://www.ebi.ac.uk/msd/ 거대분자 구조 데이터베이스]
- 단백질 자료 은행의 [https://web.archive.org/web/20051223100219/http://www.rcsb.org/pdb/uniformity/index.html 자료 균일화 프로젝트]
참조
[1]
논문
The Protein Data Bank archive as an open data resource
https://doi.org/10.1[...]
2014-10-01
[2]
웹사이트
wwPDB: File Format
https://www.wwpdb.or[...]
[3]
웹사이트
PROTEIN DATABASE FILE RECORD FORMATS
https://cdn.rcsb.org[...]
2024-06-09
[4]
웹사이트
PROTEIN DATABASE FILE RECORD FORMATS
https://cdn.rcsb.org[...]
2024-06-09
[5]
논문
The Protein Data Bank: a historical perspective.
https://www.ncbi.nlm[...]
[6]
웹사이트
wwPDB: File Formats and the PDB
https://www.wwpdb.or[...]
2024-01-15
[7]
웹사이트
wwPDB Format version 3.3: Coordinate Section
http://www.wwpdb.org[...]
2012-03-23
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com