맨위로가기

KEGG

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

KEGG는 유전자, 단백질, RNA, 화학 화합물 등을 통합하는 경로 지도를 제공하는 데이터베이스이다. KEGG PATHWAY, KEGG BRITE, KEGG GENES, KEGG GENOME, KEGG LIGAND, KEGG DISEASE, KEGG DRUG, KEGG ENVIRON 등의 데이터베이스로 구성되어 있으며, 대사, 유전 정보 처리, 환경 정보 처리, 세포 과정, 유기체 시스템, 질병, 신약 개발 등 다양한 정보를 포함한다. 2011년부터 FTP 다운로드에 구독 모델을 도입했으며, 웹사이트는 무료로 이용 가능하다.

더 읽어볼만한 페이지

  • 시스템 생물학 - 바이오펑크
    바이오펑크는 사이버펑크의 하위 장르로, 유전자 재조합 기술 발전 이후의 근미래 사회에서 생명공학 혁명의 결과와 사회 변화를 다루며, 전체주의 정부나 거대 기업이 생명공학을 악용하는 디스토피아적 배경 속에서 인체 실험 결과물의 투쟁을 묘사하고 생명윤리, 사회 정의, 인간성에 대한 철학적 질문을 제기한다.
  • 시스템 생물학 - 세포 신호전달
    세포 신호전달은 세포가 환경 변화에 적응하고 다른 세포와 소통하기 위해 사용하는 복잡한 과정이며, 수용체를 통해 신호를 감지하고 다양한 신호전달 경로를 통해 세포의 생리학적 활동을 조절한다.
  • 생물정보학 데이터베이스 - 피시베이스
    피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다.
  • 생물정보학 데이터베이스 - 질병 데이터베이스
    질병 데이터베이스는 질병, 약물, 증상 등 8,500여 개의 의학 관련 항목을 포함하며, 항목 간 관계 설정, 외부 웹 리소스 연결, 통합 의학 언어 시스템 매핑을 통해 구성된다.
  • 생물학 데이터베이스 - 피시베이스
    피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다.
  • 생물학 데이터베이스 - ChEMBL
    ChEMBL은 약물 표적에 대한 화합물 생체 활성 데이터베이스로서, 신약 개발 과정의 선도 물질 식별을 위한 화합물 스크리닝 라이브러리 구축에 활용되며, 웹 인터페이스나 파일 전송 프로토콜을 통해 접근 가능하다.
KEGG
데이터베이스 정보
명칭KEGG (교토 유전자 및 게놈 백과사전)
영어 명칭Kyoto Encyclopedia of Genes and Genomes
설명게놈 해독을 위한 생물정보학 자원
범위모든 생물
센터교토 대학
연구실http://kanehisa.jp/
책임자金久實 (미노루 가네히사)
PMID10592173
발표 연도1995년
포맷해당 없음
URLhttp://www.kegg.jp/
다운로드해당 없음
웹 서비스REST http://www.kegg.jp/kegg/rest/ 참조
SQL해당 없음
SPARQL해당 없음
웹 앱http://www.kegg.jp/kegg/mapper.html
독립 실행형해당 없음
라이선스해당 없음
버전 관리해당 없음
업데이트 빈도해당 없음
큐레이션해당 없음
북마크해당 없음
버전해당 없음

2. KEGG의 데이터베이스

KEGG PATHWAY 데이터베이스는 분자 간 상호작용 네트워크를 보여주는 핵심 데이터베이스이다. 여기에는 유전자, 화학 화합물, 화학 반응, 질병 정보 등이 연결되어 있으며, 다음과 같이 분류된다.[13]


  • 대사
  • 유전 정보 처리
  • 환경 정보 처리
  • 세포 과정
  • 생체 시스템
  • 인간 질환
  • 신약 개발

2. 1. 시스템 정보

KEGG PATHWAY 데이터베이스는 KEGG 자원의 핵심으로, 유전자, 단백질, RNA, 화학 화합물, 글리칸, 화학 반응, 질병 유전자 및 약물 표적을 포함한 많은 개체를 통합하는 경로 맵의 모음이며, KEGG의 다른 데이터베이스에 개별 항목으로 저장된다.[13] 경로 맵은 다음과 같이 분류된다.

대사 섹션에는 일반 대사 경로 맵 외에도 대사의 전반적인 모습을 보여주는 글로벌 맵이 포함되어 있다. KEGG 모듈은 특정 유기체 그룹과 분자 복합체 사이에서 보존되는 하위 경로와 같이 경로 맵 내에서 더 긴밀한 기능 단위를 나타낸다. KEGG BRITE는 유전자, 단백질, 유기체, 질병, 약물, 화학 화합물 등 다양한 개체의 계층적 분류를 포함하는 온톨로지 데이터베이스이다.

2. 2. 유전체 정보

KEGG GENES 데이터베이스는 유전자/단백질 수준의 정보를 포함하고, KEGG GENOME 데이터베이스는 유기체 수준의 정보를 포함한다.[5] KEGG GENES 데이터베이스는 완전 해독된 게놈에 대한 유전자 세트로 구성되며, 각 유전자는 KEGG 경로 지도, KEGG 모듈 및 BRITE 계층 구조에 해당하는 형태로 주석이 부여된다.

이러한 주석은 오소로그 개념을 사용하여 이루어진다. KEGG 경로 지도는 특정 유기체에서 실험적 증거를 바탕으로 작성되었지만, 다른 유기체들도 기능적으로 동일한 유전자, 즉 오소로그(ortholog) 유전자 또는 오소로그로 구성된 동일한 경로를 공유하는 경우가 많기 때문에 다른 유기체에도 적용할 수 있도록 설계되었다. KEGG GENES 데이터베이스의 모든 유전자는 KEGG ORTHOLOGY (KO) 데이터베이스에서 이러한 오소로그로 그룹화된다. KEGG 경로 지도뿐만 아니라 KEGG 모듈과 BRITE 계층 구조의 노드(유전자 산물)는 KO 식별자를 가지므로, KEGG의 게놈 주석 절차를 통해 게놈의 유전자가 KO 식별자로 주석 처리되면 일치가 설정된다.[4]

2. 3. 화학 정보

KEGG 대사 경로 지도는 대사 네트워크의 두 가지 측면, 즉 게놈이 암호화한 효소가 연속적인 반응을 촉매하는 방법의 게놈 네트워크와 이러한 반응에 의해 기질과 생성물의 화학 구조가 변환되는 화학 네트워크를 나타내도록 그려진다.[6]

화학 정보 범주의 데이터베이스는 KEGG LIGAND라고 통칭되며, 다음을 포함한다.[7]

데이터베이스설명
KEGG COMPOUND화학 화합물
KEGG REACTION화학 반응
KEGG ENZYME효소 명명법의 반응
KEGG GLYCAN[8]당류
RPAIR(반응물 쌍 정렬) 및 RCLASS(반응 클래스)[9]보조 반응 데이터베이스



KEGG COMPOUND는 대사 산물 외에도 이물질과 같은 다양한 화합물을 포함하도록 확장되었다.

2. 4. 건강 정보

KEGG에서 질병은 유전적 요인과 환경적 요인의 교란 물질에 의해 발생하는 생물학적 시스템의 교란된 상태로 간주되며, 약물은 다양한 유형의 교란 물질로 간주된다.[10] KEGG DISEASE 데이터베이스는 질병의 알려진 유전적 요인과 환경적 요인을 목록화한다.

KEGG DRUG 데이터베이스에는 일본, 미국 및 유럽에서 승인된 의약품(approved drug)의 활성 성분(active ingredient)이 포함되어 있다. 생약(Crude drug) 및 기타 건강 관련 물질은 KEGG ENVIRON 데이터베이스에 저장된다. 건강 정보 관련 데이터베이스는 KEGG MEDICUS라고 통칭되며, 일본에서 판매되는 모든 약물의 첨부 문서(package insert)도 포함된다.

3. 구독 모델

2011년 7월, KEGG는 정부 지원금의 대폭적인 삭감으로 인해 FTP 다운로드에 대한 구독 모델을 도입했다. KEGG는 웹사이트를 통해 계속해서 무료로 이용 가능하지만, 구독 모델 도입은 바이오인포매틱스 데이터베이스의 지속 가능성에 대한 논의를 불러일으켰다.[14][15]

참조

[1] 논문 KEGG: Kyoto Encyclopedia of Genes and Genomes
[2] 논문 A database for post-genome analysis
[3] 논문 From genomics to chemical genomics: new developments in KEGG
[4] 논문 Data, information, knowledge and principle: back to metabolism in KEGG
[5] 논문 Whole-genome random sequencing and assembly of Haemophilus influenzae Rd
[6] 논문 Chemical and genomic evolution of enzyme-catalyzed reaction networks
[7] 논문 LIGAND database for enzymes, compounds and reactions
[8] 논문 KEGG as a glycome informatics resource
[9] 논문 Modular architecture of metabolic pathways revealed by conserved sequences of reactions
[10] 논문 KEGG for representation and analysis of molecular networks involving diseases and drugs
[11] 논문 The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection
[12] 뉴스 Popular plant database set to charge users http://www.nature.co[...]
[13] 웹사이트 パスウェイ一覧 https://www.genome.j[...]
[14] 웹사이트 Plea from KEGG https://www.kegg.jp/[...]
[15] 웹사이트 KEGG FTP subscription https://www.bioinfor[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com