유전자 온톨로지
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
유전자 온톨로지(Gene Ontology, GO)는 유전자 산물의 속성을 나타내는 정의된 용어의 온톨로지를 제공하는 프로젝트이다. 1998년 초파리, 생쥐, 사카로미세스 세레비지애의 게놈 연구 컨소시엄에 의해 처음 구축되었으며, 세포 구성 요소, 분자 기능, 생물학적 과정의 세 가지 영역을 다룬다. GO는 유향 비순환 그래프 구조를 가지며, 용어 이름, 고유 식별자, 정의, 영역을 포함한다. GO 용어는 생물학적 과정, 세포 구성 요소, 분자 기능의 세 가지 범주로 나뉘며, 유전자 산물에 대한 데이터를 캡처하는 GO 주석은 GO 용어를 사용하여 유전자 산물 식별자, 참고 자료, 증거 코드 등을 포함한다. GO 컨소시엄은 AmiGO와 OBO-Edit과 같은 다양한 도구를 제공하며, 생물학 데이터베이스 및 연구 그룹이 참여하여 주석 데이터, 온톨로지 개발, 도구 개발에 기여한다.
더 읽어볼만한 페이지
- 온톨로지 - 지칭어
지칭어는 특정 대상을 명확히 지칭하는 용어로, 한국어에서는 다양한 형태가 존재하며, 프로젝트 관리에서는 참조 조건의 의미로 프로젝트 목표와 범위를 정의하는 데 사용된다. - 온톨로지 - Cyc
Cyc는 더글러스 레너트가 시작한 인공지능 프로젝트로, 인간 수준의 지식을 컴퓨터에 구축하는 것을 목표로 지식베이스와 추론 엔진을 활용하며, 다양한 분야에 응용되었으나 데이터 구축의 어려움으로 비판받기도 했다. - 생물학 데이터베이스 - 피시베이스
피시베이스는 다니엘 파울리가 고안하고 라이너 프로제와 협력하여 개발, 웹에서 출시된 전 세계 어류 정보를 제공하는 가장 크고 널리 사용되는 온라인 데이터베이스로, 유생 단계 정보는 LarvalBase, 경골어류 외 수생 생물 정보는 SeaLifeBase를 통해 보완되며 어류 연구, 수산 자원 관리, 교육 등 다양한 분야에서 활용된다. - 생물학 데이터베이스 - ChEMBL
ChEMBL은 약물 표적에 대한 화합물 생체 활성 데이터베이스로서, 신약 개발 과정의 선도 물질 식별을 위한 화합물 스크리닝 라이브러리 구축에 활용되며, 웹 인터페이스나 파일 전송 프로토콜을 통해 접근 가능하다.
| 유전자 온톨로지 |
|---|
2. 역사
유전자 온톨로지는 1998년 초파리, 생쥐, 사카로미세스 세레비지애의 세 가지 모델 생물 게놈 연구자 컨소시엄에 의해 처음 구축되었다.[5] 이후 많은 다른 모델 생물 데이터베이스들이 유전자 온톨로지 컨소시엄에 참여하여 주석 데이터, 온톨로지 개발, 도구 개발에 기여하고 있다.[6] 2019년 7월 현재, GO는 44,945개의 용어를 포함하고 있으며, 4,467개의 서로 다른 생물체에 대한 6,408,283개의 주석이 있다.[6] GO는 생물정보학 분야에서 표준 도구로 자리 잡았다.[6]
2. 1. GO의 목표
3. 용어 및 온톨로지
실용적인 관점에서, 온톨로지는 우리가 아는 것에 대한 표현이다. "온톨로지"는 감지하거나 직접 관찰할 수 있는 대상과 그 대상 간의 관계에 대한 표현으로 구성된다.
생물학 및 관련 분야에는 보편적인 표준 용어가 없으며, 용어 사용은 종, 연구 분야 또는 특정 연구 그룹에 따라 다를 수 있다. 이는 데이터 통신 및 공유를 더욱 어렵게 만든다. 유전자 온톨로지 프로젝트는 유전자 산물 속성을 나타내는 정의된 용어의 온톨로지를 제공한다. 이 온톨로지는 세 가지 영역을 다룬다.
- 세포 구성 요소, 세포 또는 그 세포외 환경의 부분;
- 분자 수준에서 유전자 산물의 기본 활동, 예를 들어 결합 또는 촉매작용;
- 생물학적 과정, 통합된 생명체 단위(세포, 조직, 기관, 생물체)의 기능과 관련된 정의된 시작과 끝을 가진 작용 또는 분자 사건의 집합.
온톨로지 내 각 GO 용어는 단어 또는 단어 문자열일 수 있는 용어 이름, 고유한 영숫자 식별자, 인용된 출처가 있는 정의 및 해당 용어가 속한 영역을 나타내는 온톨로지를 갖는다. 용어는 용어 이름과 정확히 동일하거나, 더 넓거나, 더 좁거나, 관련된 동의어를 가질 수 있으며, 다른 데이터베이스의 동등한 개념에 대한 참조, 용어 의미 또는 사용에 대한 주석을 가질 수도 있다. GO 온톨로지는 유향 비순환 그래프로 구성되어 있으며, 각 용어는 동일한 도메인 내의 하나 이상의 다른 용어와, 때로는 다른 도메인과의 정의된 관계를 갖는다. GO 어휘는 종에 중립적으로 설계되었으며 원핵생물 및 진핵생물, 단세포 및 다세포 생물에 적용할 수 있는 용어를 포함한다.
GO는 정적이지 않으며, 연구 및 주석 커뮤니티의 구성원뿐만 아니라 GO 프로젝트에 직접 참여하는 사람들로부터 추가, 수정 및 변경 사항이 제안되고 요청된다.[8] 예를 들어, 주석자는 대사 경로를 나타내는 특정 용어를 요청할 수 있으며, 온톨로지의 일부는 커뮤니티 전문가의 도움을 받아 수정될 수 있다(예:[9]). 제안된 편집 사항은 온톨로지 편집자가 검토하여 적절한 경우 구현된다.
GO 온톨로지 및 주석 파일은 여러 형식으로 GO 웹사이트에서 무료로 제공되거나 GO 브라우저 AmiGO를 사용하여 온라인으로 액세스할 수 있다.[6] 유전자 온톨로지 프로젝트는 또한 용어를 다른 분류 시스템에 매핑한 것을 다운로드할 수 있도록 제공한다.
3. 1. GO 용어의 세 가지 범주
GO에서 정의된 용어는 GO 용어라고 불린다. GO 용어는 세 가지 범주로 나뉜다.- 생물학적 과정 (바이올로지컬 프로세스/biological process영어)
- 세포 구성 요소 (셀룰러 컴포넌트/cellular component영어)
- 분자 기능 (몰리큘러 펑션/molecular function영어)
컴퓨터에서 GO의 데이터는 유향 비순환 그래프 (, DAG)라고 불리는 자료 구조를 사용하여 기술할 수 있다. DAG의 특성상, XML과의 친화성이 매우 높기 때문에, 주석과 함께 XML-RDF 형식으로도 제공된다.
3. 2. GO 온톨로지의 구조
GO에서 정의된 용어는 GO 용어영어라고 불린다. GO 용어는 세 가지 카테고리로 나뉜다.- biological process영어 (생물학적 과정)
- cellular component영어 (세포 구성 요소)
- directed acyclic graph/molecular function}} (분자 기능)
컴퓨터에서 GO의 데이터는 유향 비순환 그래프 ({{lang-en-short영어, DAG)라고 불리는 자료 구조를 사용하여 기술할 수 있다. DAG의 특성상, XML과의 친화성이 높기 때문에, 주석과 함께 XML-RDF 형식으로도 제공된다.
3. 3. GO 용어의 예시
락타아제 활성(GO:0000016)은 "젖당 + H2O = D-글루코스 + D-갈락토스"의 반응을 촉매하는 분자 기능이다.[10] 락타아제-플로리진 가수분해효소 활성, 유당 갈락토하이드롤라제 활성이라고도 불린다.[10] 이 활성은 EC:3.2.1.108, MetaCyc:LACTASE-RXN, Reactome:20536에서 확인할 수 있으며, O-글리코실 화합물을 가수분해하는 가수분해효소 활성(GO:0004553)의 하위 분류에 속한다.[10]3. 4. GO 용어의 관리
4. 주석 (Annotation)
게놈 주석은 유전자 산물에 대한 데이터를 캡처하는 행위를 포함하며, GO 주석은 이를 위해 GO의 용어를 사용한다.[19] GO 큐레이터의 주석은 GO 웹사이트에서 통합 및 배포되며, 여기에서 직접 다운로드하거나 AmiGO를 사용하여 온라인으로 볼 수 있다.[19]
GO 주석에는 유전자 산물 식별자 및 관련 GO 용어 외에도 최소한 다음 데이터가 포함된다.[19]
- 주석을 만드는 데 사용된 ''참고 자료''(예: 학술 논문)
- 주석의 근거가 되는 증거 유형을 나타내는 ''증거 코드''
- 주석의 날짜 및 작성자
GO 용어 및 사용된 증거에 따라 지원 정보와 기능이 관찰되는 조건과 같은 보충 정보도 GO 주석에 포함될 수 있다. 증거 코드는 수동 및 자동 주석 방법을 모두 다루는 증거 코드 온톨로지(Evidence Code Ontology)라는 통제된 어휘의 코드에서 나온다.[11] 예를 들어, '추적 가능한 작성자 진술'(TAS)은 큐레이터가 출판된 과학 논문을 읽었으며 해당 주석에 대한 메타데이터에 해당 논문에 대한 인용이 포함되어 있음을 의미하고, '서열 유사성에서 추론됨'(ISS)은 사람 큐레이터가 서열 유사성 검색의 출력을 검토하여 생물학적으로 의미가 있음을 확인했음을 의미한다. 자동화된 프로세스의 주석에는 '전자 주석에서 추론됨'(IEA) 코드가 제공된다.[12] 2010년에는 모든 GO 주석의 98% 이상이 큐레이터가 아닌 계산 방식으로 추론되었지만, 2019년 7월 2일 현재 모든 GO 주석의 약 30%만이 계산 방식으로 추론되었다.[12][13]
GO 컨소시엄은 이러한 주석은 사람이 확인하지 않기 때문에 약간 덜 신뢰할 수 있는 것으로 간주하며, 일반적으로 더 높은 수준의 덜 자세한 용어를 사용한다. 전체 주석 데이터 세트는 GO 웹사이트에서 다운로드할 수 있다. 주석 개발을 지원하기 위해 GO 컨소시엄은 워크숍을 제공하고 새로운 큐레이터 및 개발자 그룹을 멘토링한다.
많은 머신 러닝 알고리즘이 Gene Ontology 주석을 예측하기 위해 설계 및 구현되었다.[14][15]
4. 1. GO 주석의 구성 요소
4. 2. 증거 코드 (Evidence Code)
4. 3. 주석의 예시
심장 근육 액틴 알파 1 (UniProtKB:P68032)은 생물학적 과정인 심장 수축(GO:0060047)에 관여한다.[16] 이러한 사실은 돌연변이 표현형에서 추론(IMP)되었다는 증거 코드를 통해 알 수 있다.[16] 이 주석은 2008년 6월 6일 UniProtKB에 의해 할당되었으며, 참고 문헌은 PMID 17611253이다.[16]5. 도구 (Tools)
유전자 온톨로지 프로젝트는 데이터를 사용하는 다양한 온라인 및 다운로드 가능한 도구를 제공한다.[17] GO 컨소시엄은 AmiGO와 OBO-Edit 두 가지 도구를 개발하고 지원한다.
AmiGO[18][19]는 온톨로지 및 유전자 산물 주석 데이터를 검색, 탐색 및 시각화할 수 있는 웹 기반 애플리케이션이다. BLAST 도구,[20] 대규모 데이터 세트 분석 도구,[21][22] GO 데이터베이스 직접 검색 인터페이스를 갖추고 있다.[23] AmiGO는 GO 컨소시엄에서 제공하는 데이터 접근을 위해 GO 웹사이트에서 온라인으로 사용하거나, GO 데이터베이스 스키마를 사용하는 모든 데이터베이스(예:[24])에서 로컬 사용을 위해 다운로드하여 설치할 수 있다. 무료 오픈 소스 소프트웨어이며 go-dev 소프트웨어 배포의 일부로 제공된다.[25]
OBO-Edit은 유전자 온톨로지 컨소시엄에서 개발 및 유지 관리하는 오픈 소스, 플랫폼 독립적인 온톨로지 편집기이다.[26] 자바로 구현되었으며 온톨로지를 표시하고 편집하기 위해 그래프 지향 방식을 사용한다. OBO-Edit은 포괄적인 검색 및 필터 인터페이스를 포함하며, 용어의 하위 집합을 렌더링하여 시각적으로 구별할 수 있는 옵션을 제공한다. 사용자 인터페이스는 사용자 선호도에 따라 맞춤 설정할 수 있다. OBO-Edit은 기존 관계와 속성을 기반으로 명시적으로 언급되지 않은 링크를 추론할 수 있는 추론기를 가지고 있다. 생물 의학 온톨로지를 위해 개발되었지만, OBO-Edit은 모든 온톨로지를 보고, 검색하고, 편집하는 데 사용할 수 있다. 이 도구는 무료로 다운로드할 수 있다.[25]
5. 1. AmiGO
5. 2. OBO-Edit
6. 컨소시엄 (Consortium)
유전자 온톨로지 컨소시엄은 유전자 온톨로지 프로젝트에 적극적으로 참여하는 일련의 생물학 데이터베이스 및 연구 그룹을 말한다.[13] 여기에는 여러 모델 생물체 데이터베이스와 다중 종 단백질 데이터베이스, 소프트웨어 개발 그룹 및 전담 편집국이 포함된다.
참조
[1]
논문
The Gene Ontology project in 2008
2008-01
[2]
서적
The Gene Ontology Handbook
[3]
서적
The Gene Ontology Handbook
[4]
논문
The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration
2007-11
[5]
논문
Gene ontology: tool for the unification of biology. The Gene Ontology Consortium
2000-05
[6]
웹사이트
The Gene Ontology Resource
http://www.geneontol[...]
Gene Ontology Consortium
[7]
논문
An ontological analysis of some biological ontologies
[8]
서적
The Gene Ontology Handbook
Springer (New York)
[9]
논문
Ontology development for biological systems: immunology
2007-04
[10]
웹사이트
AmiGO 2 Manual: Term Page
http://wiki.geneonto[...]
2013-07-10
[11]
웹사이트
Evidence Code Ontology
http://www.evidenceo[...]
Evidence Code Ontology
[12]
논문
The what, where, how and why of gene ontology--a primer for bioinformaticians
2011-11
[13]
웹사이트
The GO Consortium
http://www.geneontol[...]
2009-03-16
[14]
논문
Computational algorithms to predict Gene Ontology annotation
2013-06
[15]
서적
The Gene Ontology Handbook
Springer (New York)
[16]
웹사이트
AmiGO: P68032 Associations
http://amigo.geneont[...]
2009-03-16
[17]
논문
SerbGO: searching for the best GO tool
2008-07
[18]
논문
AmiGO: online access to ontology and annotation data
2009-01
[19]
문서
AmiGO--the current official web-based set of tools for searching and browsing the Gene Ontology database
http://amigo.geneont[...]
[20]
웹사이트
AmiGO BLAST tool
http://amigo.geneont[...]
2009-03-13
[21]
웹사이트
AmiGO Term Enrichment tool
http://amigo.geneont[...]
[22]
웹사이트
AmiGO Slimmer
http://amigo.geneont[...]
[23]
웹사이트
GOOSE
http://berkeleybop.o[...]
[24]
웹사이트
Plant Ontology Consortium
http://plantontology[...]
2009-03-16
[25]
웹사이트
Gene Ontology downloads at SourceForge
http://sourceforge.n[...]
2009-03-16
[26]
논문
OBO-Edit--an ontology editor for biologists
2007-08
[27]
논문
The Gene Ontology project in 2008
2008-01
[28]
서적
The Gene Ontology Handbook
[29]
서적
The Gene Ontology Handbook
[30]
논문
The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration
2007-11
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com