맨위로가기

PDB (파일 형식)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

PDB 파일 형식은 단백질이나 핵산의 원자 좌표를 교환하기 위해 1972년에 개발된 사람이 읽을 수 있는 파일 형식이다. 이 파일 형식은 고정된 열 너비 형식을 사용하며, 원자 위치, 서열 정보, 구조, 연구자 정보 등을 포함한다. PDB 형식은 단백질 외에도 인공 중합체 등 다른 분자 구조를 설명하는 데 사용되지만, 몇 가지 문제점이 있어 개선 노력이 진행되었다. 이 형식을 지원하는 다양한 분자 시각화 소프트웨어가 존재하며, NCBI, 유럽생물정보학연구소, RCSB 등에서 관련 프로젝트가 진행되었다.

더 읽어볼만한 페이지

  • 생물정보학 데이터베이스 - 피시베이스
    피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다.
  • 생물정보학 데이터베이스 - 질병 데이터베이스
    질병 데이터베이스는 질병, 약물, 증상 등 8,500여 개의 의학 관련 항목을 포함하며, 항목 간 관계 설정, 외부 웹 리소스 연결, 통합 의학 언어 시스템 매핑을 통해 구성된다.
  • 생물학 데이터베이스 - 피시베이스
    피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다.
  • 생물학 데이터베이스 - ChEMBL
    ChEMBL은 약물 표적에 대한 화합물 생체 활성 데이터베이스로서, 신약 개발 과정의 선도 물질 식별을 위한 화합물 스크리닝 라이브러리 구축에 활용되며, 웹 인터페이스나 파일 전송 프로토콜을 통해 접근 가능하다.
  • 파일 포맷 - 바로 가기
    바로 가기는 운영체제에서 파일, 폴더, 프로그램, 웹 페이지에 대한 참조를 제공하는 기능 및 파일로, 사용자들이 원본에 빠르게 접근하도록 GUI 환경의 사용성을 향상시킨다.
  • 파일 포맷 - EXE
    EXE 파일 형식은 운영 체제에 따라 다양한 종류가 있는 실행 파일의 한 형태로, DOS MZ 실행 파일에서 PE, PE32+까지 발전해 왔으며, 코드, 데이터, 스택을 별도 관리하고 재배치 항목을 통해 실행 환경에 유연하게 대응하는 특징을 가진다.
PDB (파일 형식) - [IT 관련 정보]에 관한 문서
개요
종류화학 파일 포맷
대상분자 3차원 구조, 단백질 3차원 구조
상세 정보
파일 확장자.pdb, .ent, .brk
MIME 형식chemical/x-pdb
개발자단백질 데이터 뱅크
확장 형식mmCIF

2. 역사

PDB는 시간이 지나면서 많은 변화와 교정을 거쳤다. PDB 파일 형식의 시초는 컴퓨터 천공 카드의 폭에 의해 기록되었다.[2][3] PDB 파일 형식의 마지막 업데이트는 2012년 11월 버전 3.30이었다.[6]

2. 1. 초기 형태

PDB 파일 형식은 1972년에 개발되었으며,[2][3] 연구자들이 데이터베이스 시스템을 통해 주어진 단백질의 원자 좌표를 교환할 수 있도록 하는, 사람이 읽을 수 있는 파일 형식이다. 고정된 열 너비 형식은 80 또는 140[4] 열로 제한되며, 이는 이전에 좌표 교환에 사용되었던 천공 카드의 폭을 기반으로 한다.[5]

2. 2. 업데이트

PDB는 시간이 지나면서 많은 변화와 수정을 거쳤다. PDB 파일 형식의 시초는 컴퓨터 천공 카드의 폭에 의해 기록되었다.[2][3] 1972년에 개발된 PDB 파일 형식은 연구자들이 데이터베이스 시스템을 통해 주어진 단백질의 원자 좌표를 교환할 수 있도록 하는 사람이 읽을 수 있는 파일 형식이다. 고정된 열 너비 형식은 80 또는 140[4] 열로 제한되며, 이는 이전에 좌표 교환에 사용되었던 컴퓨터 펀치 카드의 너비를 기반으로 한다.[5] 수년에 걸쳐 파일 형식은 많은 변화와 수정을 거쳤다. PDB 파일 형식의 마지막 업데이트는 2012년 11월 버전 3.30이었다.[6]

3. 파일 구조 및 내용

PDB 파일은 원자들의 위치 정보, 서열 정보, 그리고 구조를 결정하고 주석을 단 연구자들에 대한 정보를 포함한다. 파일에는 파일의 정보를 이해하는 데 필요한 추가 정보가 포함될 수 있다.[7]

PDB 형식은 단백질이나 핵산의 구조뿐만 아니라 인공중합체와 같은 다른 분자의 구조를 설명하는 데에도 사용된다.[7]

PDB 파일은 일반적으로 단백질을 설명하는 데 사용되며, 수백에서 수천 줄의 코드로 구성된다. 주요 레코드로는 HEADER, TITLE, AUTHOR, REMARK, SEQRES, ATOM, HETATM 등이 있으며, 각 레코드는 특정한 정보를 담고 있다. 이러한 레코드들에 대한 자세한 설명은 "주요 레코드" 하위 섹션에서 확인할 수 있다.

3. 1. 주요 레코드

PDB 파일은 전형적인 단백질을 설명하는 수백에서 수천 줄로 구성되어 있다. 다음은 합성 http://www.rcsb.org/pdb/files/1mbs.pdb 콜라겐 유사 펩타이드의 구조를 설명하는 파일에서 가져온 예시이다.

  • HEADER, TITLE 및 AUTHOR 레코드: 구조를 정의한 연구자에 대한 정보를 제공한다. 다른 유형의 정보를 제공하기 위해 수많은 다른 유형의 레코드를 사용할 수 있다.
  • REMARK 레코드: 자유 형식 주석을 포함할 수 있지만 표준화된 정보도 수용한다. 예를 들어, `REMARK 350 BIOMT` 레코드는 실험적으로 관찰된 멀티머의 좌표를 단일 반복 단위의 명시적으로 지정된 좌표에서 계산하는 방법을 설명한다.
  • SEQRES 레코드: 이 예에서는 매우 짧지만 일반적으로 여러 줄에 걸쳐 있는 세 개의 펩타이드 사슬(A, B 및 C로 명명됨)의 서열을 제공한다.
  • ATOM 레코드: 단백질의 일부인 원자의 좌표를 설명한다. 예를 들어, 위의 첫 번째 ATOM 줄은 펩타이드 사슬 A의 첫 번째 잔기의 알파-N 원자를 설명하며, 이는 프롤린 잔기이다. 처음 세 개의 부동 소수점 숫자는 x, y 및 z 좌표이며, 단위는 옹스트롬이다.[7] 다음 세 열은 점유율, 온도 인자 및 원소 이름이다.
  • HETATM 레코드: 단백질 분자의 일부가 아닌 헤테로원자의 좌표를 설명한다.

3. 2. 기타 정보

이 파일은 원자들의 위치 정보, 서열 정보, 그리고 구조를 정하고 주석을 단 연구자들에 대한 정보를 포함한다. 파일 상의 정보를 이해하는 데 필요한 추가적인 정보가 수록될 수 있다.[7]

PDB 형식은 단백질이나 핵산의 구조에만 사용되지 않고, 인공중합체 등 다른 분자의 구조를 설명하는 데에도 적용된다.[7]

전형적인 단백질을 설명하는 PDB 파일은 수백에서 수천 줄로 구성된다. 다음은 합성 http://www.rcsb.org/pdb/files/1mbs.pdb 콜라겐 유사 펩타이드의 구조를 설명하는 파일의 일부이다.[7]

  • HEADER, TITLE, AUTHOR 레코드: 구조를 정의한 연구자에 대한 정보를 제공한다. 다른 유형의 정보를 제공하기 위해 여러 유형의 레코드를 사용할 수 있다.[7]
  • REMARK 레코드: 자유 형식 주석을 포함할 수 있지만 표준화된 정보도 포함한다. 예를 들어, `REMARK 350 BIOMT` 레코드는 실험적으로 관찰된 멀티머의 좌표를 단일 반복 단위의 명시적으로 지정된 좌표에서 계산하는 방법을 설명한다.[7]
  • SEQRES 레코드: 세 개의 펩타이드 사슬(A, B, C)의 서열을 제공한다. 일반적으로 여러 줄에 걸쳐 있다.[7]
  • ATOM 레코드: 단백질의 일부인 원자의 좌표를 설명한다. 예를 들어, 펩타이드 사슬 A의 첫 번째 잔기인 프롤린 잔기의 알파-N 원자를 설명하는 경우, 처음 세 개의 부동 소수점 숫자는 x, y, z 좌표이며, 단위는 옹스트롬이다. 다음 세 열은 점유율, 온도 인자, 원소 이름이다.[7]
  • HETATM 레코드: 단백질 분자의 일부가 아닌 헤테로원자의 좌표를 설명한다.[7]

4. 활용

PDB 서식은 단백질이나 핵산의 구조뿐만 아니라 인공중합체와 같은 다른 분자의 구조를 설명하는 데에도 적용된다.

4. 1. 문제점 및 개선

PDB는 시간이 지나면서 많은 변화와 교정을 거쳐 왔다. PDB 파일 형식의 시초는 컴퓨터 천공 카드의 폭에 의해 기록되었다. 이 외에도 PDB 서식은 단백질이나 핵산의 구조에 한해서만 사용되지 않고, 기타 다른 분자, 가령 인공중합체 등의 구조를 설명하는 데에도 적용되고 있다. 이 PDB 형식은 많은 문제의 원인이 되었고, 그 결과 몇 개의 '대청소' 프로젝트가 생겨났다.

4. 2. 분자 시각화 소프트웨어


  • 아테나
  • [http://bioblender.org/ Bioblender]
  • [https://www.ccp4.ac.uk/MG/ CCP4MG]
  • [http://www.cuemol.org/en/ CueMol]
  • QuteMol
  • Gabedit
  • [https://www.scienomics.com/maps-platform/ MAPS (Materials and Processes Simulations) 플랫폼]
  • [https://www.ovito.org/ OVITO (Open Visualization Tool)]
  • WHAT IF
  • Yasara
  • [http://www.al-nasir.com/www/Jamie/Zeus/ Zeus 분자 시각화]
  • [http://epmv.scripps.edu ePMV]
  • [http://www.baaden.ibpc.fr/umol/ UnityMol]
  • [http://www.blender.org 블렌더] (확장 기능 설치 필요)
  • [http://www.sidefx.com 후디니]
  • [https://threejs.org/docs/index.html?q=pd#examples/en/loaders/PDBLoader three.js]

4. 2. 1. 대표적인 소프트웨어


  • SAMSON
  • BALLView
  • Chimera
  • Cn3D
  • Coot
  • Jmol
  • Molden
  • Molekel
  • PyMOL
  • RasMol
  • UGENE
  • VisIt
  • VMD
  • Discovery Studio
  • ParaView

5. 외부 프로젝트

PDB 파일 형식과 관련된 주요 외부 프로젝트는 다음과 같다.


  • 미국 국립생물정보센터의 [https://web.archive.org/web/20060703022313/http://ncbi.nih.gov/Structure/MMDB/mmdb.shtml 분자 모델링 데이터베이스]
  • 유럽생물정보학연구소의 [http://www.ebi.ac.uk/msd/ 거대분자 구조 데이터베이스]
  • 단백질 자료 은행의 [https://web.archive.org/web/20051223100219/http://www.rcsb.org/pdb/uniformity/index.html 자료 균일화 프로젝트]

5. 1. 주요 프로젝트


  • 미국 국립생물정보센터의 [https://web.archive.org/web/20060703022313/http://ncbi.nih.gov/Structure/MMDB/mmdb.shtml 분자 모델링 데이터베이스]
  • 유럽생물정보학연구소의 [http://www.ebi.ac.uk/msd/ 거대분자 구조 데이터베이스]
  • 단백질 자료 은행의 [https://web.archive.org/web/20051223100219/http://www.rcsb.org/pdb/uniformity/index.html 자료 균일화 프로젝트]

참조

[1] 논문 The Protein Data Bank archive as an open data resource https://doi.org/10.1[...] 2014-10-01
[2] 웹사이트 wwPDB: File Format https://www.wwpdb.or[...]
[3] 웹사이트 PROTEIN DATABASE FILE RECORD FORMATS https://cdn.rcsb.org[...] 2024-06-09
[4] 웹사이트 PROTEIN DATABASE FILE RECORD FORMATS https://cdn.rcsb.org[...] 2024-06-09
[5] 논문 The Protein Data Bank: a historical perspective. https://www.ncbi.nlm[...]
[6] 웹사이트 wwPDB: File Formats and the PDB https://www.wwpdb.or[...] 2024-01-15
[7] 웹사이트 wwPDB Format version 3.3: Coordinate Section http://www.wwpdb.org[...] 2012-03-23



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com