군유전체학
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
군유전체학은 특정 환경에 존재하는 모든 미생물의 유전체, 즉 메타게놈을 연구하는 학문이다. 전통적인 염기 서열 분석의 한계를 극복하고 배양 불가능한 미생물까지 포함하여, 환경 내 미생물 군집의 다양성과 기능을 분석한다. 1980년대 초 PCR 기술을 활용한 연구를 시작으로, 샷건 시퀀싱과 고처리량 시퀀싱 기술의 발전을 통해 메타게놈 분석이 이루어졌다. 군유전체학은 생물정보학 분석을 통해 서열 전처리, 조립, 유전자 예측, 종 다양성 분석, 데이터 통합 및 비교 등의 과정을 거쳐, 농업, 바이오 연료, 생명공학, 생태학, 환경 정화, 인간 마이크로바이옴, 감염병 진단 등 다양한 분야에 응용된다.
더 읽어볼만한 페이지
- 환경미생물학 - GFAJ-1
GFAJ-1은 고농도 비소 환경에서 생장하며 비소를 이용하여 생장할 수 있다는 논란이 있었던 박테리아이다. - 환경미생물학 - 정족수 감지
정족수 감지는 세균이 개체 수에 따라 유전자 발현을 조절하는 세포 간 통신 방식이며, 오토인듀서를 분비하여 주변 세균과 소통하고, 생물막 형성, 독소 생성 등 다양한 행동을 조절하며, 의학, 농업, 환경 분야에서 응용 연구가 진행된다. - 유전체학 - 발현체학
- 유전체학 - 유전형 분석
유전자형 분석은 DNA 염기 서열 분석, RFLP, PCR, DNA 마이크로어레이 등 다양한 기술을 통해 유전형을 파악하는 방법으로 질병 진단, 품종 개량 등 여러 분야에 활용되며 윤리적 문제와 사회적 영향을 동반하지만, 혁신적인 변화를 가져올 것으로 예상되는 기술이다. - 생물학 - 균근
균근은 식물 뿌리와 균류 사이의 공생체로, 식물에게 물과 영양분을 공급하고 식물은 광합성 산물을 제공하며, 농업, 산림 복원 등 다양한 분야에서 활용될 수 있다. - 생물학 - 생명
생명은 환경 속에서 자기 유지, 증진, 강화를 하는 특징으로 정의되나 논쟁적이며, 항상성 유지, 세포 구조, 물질대사, 성장, 적응, 자극 반응, 생식 능력을 포함하고, 자기 복제와 진화로 유지되는 열린 열역학계로 설명되며, 기원은 약 40억 년 전으로 추정되고, 진화와 멸종이 공존하며, 바이러스, 외계 생명체, 인공 생명 연구가 진행 중이다.
군유전체학 | |
---|---|
개요 | |
분야 | 유전체학, 미생물학 |
정의 | 환경 샘플에서 직접 추출한 유전 물질의 연구 |
관련 용어 | 메타유전체, 생물정보학, 군집 구조 분석, 분류군 예측, 기능 유전자 주석 달기 |
접근 방식 | |
주요 방법 | 16S rRNA 유전자 증폭 서열 분석 전장 메타게놈 샷건 시퀀싱 |
분석 | 분류군 프로파일링 유전자 존재량 분석 기능적 통찰력 |
응용 분야 | |
환경 연구 | 미생물 생태학 생지화학 순환 오염 연구 |
인간 건강 | 인간 마이크로바이옴 연구 질병 진단 약물 개발 |
농업 | 토양 건강 식물 성장 촉진 생물 비료 개발 |
생명공학 | 새로운 효소 발견 생물 전환 생물 정화 |
기술 | |
시퀀싱 기술 | 샷건 시퀀싱 표적 증폭 시퀀싱 메타-트랜스크립토믹스 |
분석 도구 | 생물정보학 파이프라인 데이터베이스 통계적 방법 |
과제 및 미래 방향 | |
과제 | 데이터 분석 계산 자원 데이터 표준화 |
미래 방향 | 단일 세포 메타게놈 분석 메타게놈 편집 합성 생물학 |
2. 역사
초기 군유전체학 연구는 전통적인 염기 서열 분석 방법에서 출발했다. 이 방법은 동일한 세포를 배양하여 DNA를 얻는 방식이었으나, 배양이 불가능하여 염기 서열 분석이 어려운 미생물이 환경에 많다는 한계가 있었다. 초기 연구는 종 내에서는 짧고 보존되지만, 종 간에는 차이가 있는 16S 리보솜 RNA (rRNA) 서열에 초점을 맞추었다. 그 결과, 배양된 종에 속하지 않는 많은 16S rRNA 서열이 발견되었고, 이는 알려지지 않은 수많은 유기체가 존재함을 시사했다. 환경에서 직접 채취한 리보솜 RNA 유전자 조사를 통해, 미생물 배양 기반 방법으로는 시료 내 세균 및 고세균 종의 1% 미만만이 발견된다는 사실이 밝혀졌다.
1980년대 초, 노먼 R. 페이스와 동료들은 PCR을 사용하여 리보솜 RNA 서열의 다양성을 탐구하는 분자 생물학 연구를 수행했다. 이러한 연구를 통해 페이스는 1985년에 환경 시료에서 직접 DNA를 복제하는 아이디어를 제안했다.[1] 1991년에는 페이스와 동료들이 환경 시료에서 대량의 DNA를 분리하고 복제한 최초의 보고서를 발표했다. 이 방법은 고도로 보존된 비암호화 DNA 유전자 탐구에 국한되었지만, 배양 방법으로 알려진 것보다 다양성이 훨씬 더 복잡하다는 초기 미생물 형태학 기반 관찰을 뒷받침했다.
1995년, 힐리는 잔디를 말려서 실험실에서 배양한 복잡한 환경 유기체 배양체로 구성된 "동물 유전자 라이브러리"에서 기능성 유전자의 메타게놈적 분리를 보고했다. 이후 에드워드 델롱은 해양 생물학 시료에서 라이브러리를 구축하고 16S 서열을 기반으로 환경 계통 발생학의 토대를 마련하는 연구를 발표했다.
2002년, 마야 브레이트바트와 포레스트 로허는 환경 샷건 시퀀싱을 사용하여 200리터의 해수에 5000가지 이상의 서로 다른 바이러스가 포함되어 있다는 것을 보여주었다. 이후 연구에서 인간의 배설물에는 천 개 이상의 바이러스 종이 있으며, 해양 퇴적물 1킬로그램당 백만 가지의 서로 다른 바이러스와 박테리오파지가 존재한다는 것이 밝혀졌다. 이 연구들에서 발견된 바이러스는 거의 대부분 새로운 종이었다.
2004년, 캘리포니아 대학교 버클리와 공동 게놈 연구소의 진 타이슨, 질 밴필드 등은 산성 광산 배수 시스템에서 추출한 DNA의 염기 서열을 분석했다. 이들은 배양이 어려웠던 소수의 세균 및 고세균에 대한 완전하거나 거의 완전한 게놈을 얻을 수 있었다.
2003년부터 크레이그 벤터는 글로벌 해양 샘플링 원정 (GOS)을 이끌며 전 세계를 순회하며 메타게놈 시료를 수집했다. 사르가소 해에서 수행된 파일럿 프로젝트에서는 148가지 유형의 세균을 포함하여 거의 2000가지의 서로 다른 종에서 DNA를 발견했다. 벤터는 미국 서부 해안을 탐사하고, 2006년에는 발트 해, 지중해, 흑해 탐사를 위한 2년간의 원정을 완료했다. 이 데이터 분석 결과, '풍요와 기근' 환경 조건에 적응한 유기체 집단과, 주로 플랑크톤으로 구성된, 상대적으로 적지만 더 풍부하고 널리 분포하는 두 번째 집단이 나타났다.
2005년, 펜실베이니아 주립 대학교의 스테판 C. 슈스터와 동료들은 고처리량 시퀀싱으로 생성된 환경 시료의 첫 번째 서열을 발표했다. 이들은 454 라이프 사이언스에서 개발한 대량의 병렬 파이로시퀀싱을 사용했다. 2006년에는 샌디에이고 주립 대학교의 로버트 에드워즈, 포레스트 로허 등이 이 분야의 또 다른 초기 논문을 발표했다.
2. 1. 용어의 기원
"메타게노믹스"라는 용어는 1998년 조 핸들스먼(Jo Handelsman), 로버트 M. 굿먼(Robert M. Goodman), 미셸 R. 론돈(Michelle R. Rondon), 존 클라디(Jon Clardy), 션 F. 브래디(Sean F. Brady)에 의해 처음 사용되었으며, 출판물에 처음 등장했다. 메타게놈이라는 용어는 환경에서 시퀀싱된 유전자 집합을 단일 게놈 연구와 유사한 방식으로 분석할 수 있다는 아이디어를 나타냈다. 2005년, 캘리포니아 대학교 버클리(University of California, Berkeley)의 연구원인 케빈 첸(Kevin Chen)과 리오르 파처(Lior Pachter)는 메타게노믹스를 "개별 종의 분리 및 실험실 배양 없이 현대 게놈 기술을 적용하는 것"으로 정의했다.메타게놈이라는 용어는 "게놈"에 고차원을 나타내는 "메타"라는 단어를 붙여서 명명되었다.[48] 단일 생물의 게놈을 연구하는 것과 마찬가지로, 환경에서 게놈의 유전자 배열을 수집하여 묶어서 (메타적으로) 분석하는 것이 가능하다는 생각에서 유래되었다. 1998년에 조 핸들스먼, 존 클라디, 로버트 M. 굿먼, 션 F 브래디 등이 처음 논문에서 사용했다.[48] 2005년에 케빈 첸과 리오르 파처는 메타게놈 분석을 "개별 균을 연구실 내에서 분리하거나 배양할 필요가 없는 현대 게놈 기술의 응용 분야"로 정의했다.[49]
2. 2. 초기 연구
전통적인 염기 서열 분석은 동일한 세포를 배양하여 DNA를 얻는 것으로 시작한다. 그러나 초기 메타게놈 연구를 통해 배양할 수 없고, 따라서 염기 서열 분석도 할 수 없는 미생물이 환경에 많이 존재한다는 것이 밝혀졌다. 이러한 초기 연구는 종 내에서는 짧고 보존되어 있지만, 종 간에는 차이가 있는 16S 리보솜 RNA (rRNA) 서열에 초점을 맞추었다. 그 결과, 배양된 종에 속하지 않는 많은 16S rRNA 서열이 발견되어, 알려지지 않은 수많은 유기체가 존재함을 나타냈다. 환경에서 직접 채취한 이러한 리보솜 RNA 유전자 조사를 통해, 미생물 배양 기반 방법으로는 시료 내 세균 및 고세균 종의 1% 미만만이 발견된다는 사실이 밝혀졌다. 이처럼 이전에 간과되었던 미생물의 대다수를 보여준 발견이 메타게놈학에 대한 관심의 많은 부분을 차지하게 되었다.1980년대 초, 노먼 R. 페이스와 동료들은 PCR을 사용하여 리보솜 RNA 서열의 다양성을 탐구하는 초기 분자 생물학 연구를 수행했다. 이러한 획기적인 연구를 통해 얻은 통찰력으로, 페이스는 1985년에 환경 시료에서 직접 DNA를 복제하는 아이디어를 제안했다.[1] 1991년, 페이스와 동료들은 환경 시료에서 대량의 DNA를 분리하고 복제한 최초의 보고서를 발표했는데, 이는 페이스가 인디애나 대학교 생물학과에 재직 중일 때였다. 이 방법론은 고도로 보존된 비암호화 DNA 유전자 탐구에 국한되었지만, 배양 방법으로 알려진 것보다 다양성이 훨씬 더 복잡하다는 초기 미생물 형태학 기반 관찰을 뒷받침했다. 1995년, 힐리는 잔디를 말려서 실험실에서 배양한 복잡한 환경 유기체 배양체로 구성된 "동물 유전자 라이브러리"에서 기능성 유전자의 메타게놈적 분리를 보고했다. 페이스 연구실을 떠난 후 에드워드 델롱은 이 분야에서 계속 활동하며, 해양 생물학 시료에서 라이브러리를 구축하는 것을 시작으로 서명 16S 서열을 기반으로 한 환경 계통 발생학의 토대를 마련한 연구를 발표했다.
2002년, 마야 브레이트바트, 포레스트 로허와 동료들은 환경 샷건 시퀀싱을 사용하여 200리터의 해수에 5000가지 이상의 서로 다른 바이러스가 포함되어 있다는 것을 보여주었다. 후속 연구에서는 인간의 배설물에 천 개 이상의 바이러스 종이 있으며, 해양 퇴적물 1킬로그램당 아마도 백만 가지의 서로 다른 바이러스가 존재하며, 많은 박테리오파지가 포함되어 있다는 것을 보여주었다. 이러한 연구에서 발견된 바이러스는 거의 대부분 새로운 종이었다. 2004년, 캘리포니아 대학교 버클리와 공동 게놈 연구소의 진 타이슨, 질 밴필드 및 동료들은 산성 광산 배수 시스템에서 추출한 DNA의 염기 서열을 분석했다. 이 연구를 통해 이전에 배양하려는 시도에 저항했던 소수의 세균 및 고세균에 대한 완전하거나 거의 완전한 게놈을 얻을 수 있었다.
2003년부터 휴먼 게놈 프로젝트의 민간 자금 지원 병렬 프로젝트의 리더였던 크레이그 벤터는 글로벌 해양 샘플링 원정 (GOS)을 이끌어 전 세계를 순회하며 여정 전반에 걸쳐 메타게놈 시료를 수집했다. 이 모든 시료는 새로운 게놈을 식별하기 위해 샷건 시퀀싱을 사용하여 염기 서열 분석을 했다. 사르가소 해에서 수행된 파일럿 프로젝트에서는 이전에 한 번도 보지 못한 148가지 유형의 세균을 포함하여 거의 2000가지의 서로 다른 종에서 DNA가 발견되었다. 벤터는 미국 서부 해안을 철저히 탐사했고, 2006년에는 발트 해, 지중해, 흑해를 탐사하기 위한 2년 간의 원정을 완료했다. 이 여정 동안 수집된 메타게놈 데이터를 분석한 결과, '풍요와 기근'의 환경 조건에 적응한 분류군으로 구성된 유기체 집단과 상대적으로 적지만 더 풍부하고 널리 분포하는 분류군으로 구성된 두 번째 집단이 나타났으며, 주로 플랑크톤으로 구성되었다.
2005년, 펜실베이니아 주립 대학교의 스테판 C. 슈스터와 동료들은 고처리량 시퀀싱으로 생성된 환경 시료의 첫 번째 서열을 발표했는데, 이 경우 454 라이프 사이언스에서 개발한 대량의 병렬 파이로시퀀싱이었다. 이 분야의 또 다른 초기 논문은 2006년에 샌디에이고 주립 대학교의 로버트 에드워즈, 포레스트 로허와 동료들에 의해 게재되었다.
2. 3. 샷건 시퀀싱과 고처리량 시퀀싱의 발전
생물정보학의 발전, DNA 증폭(PCR)법의 개선, 그리고 컴퓨터 능력의 급증으로 인해 환경 샘플에서 얻을 수 있는 DNA 염기 서열의 분석 능력이 비약적으로 향상되어, 샷건 시퀀싱을 메타게놈 샘플에 적용하는 것이 가능해졌다. 이는 전체 메타게놈 샷건 시퀀싱(WMGS, Whole Metagenome Shotgun Sequence)이라고도 불린다[62]。인간 게놈 프로젝트를 포함한 대부분의 전체 게놈 해독 연구에서는 배양 미생물의 DNA를 무작위로 짧게 절단하고, 이 DNA 단편들을 대량으로 시퀀싱하여 얻어진 염기 서열 정보의 어셈블리를 거쳐 컨센서스 염기 서열을 재구성한다[63]。이러한 샷건 시퀀싱을 메타게놈 분석에 적용하면, 환경 샘플 내에 존재하는 세균총에서 유래하는 게놈 염기 서열을 계통적으로 얻을 수 있다. 역사적으로는, 이러한 샷건 시퀀스를 쉽게 하기 위해 BAC 등을 이용한 클론 라이브러리가 사용되어 왔다. 샷건 시퀀스를 분석함으로써, 세균총 내에서 어떤 계통군의 생물이 존재하고, 어떤 대사 프로세스가 진행되고 있는지 등을 밝힐 수 있다.
원리적으로 환경 샘플 내에 포함된 각 미생물 계통의 세포량 차이에 따라 회수되는 DNA 양도 달라지기 때문에, 그 환경 샘플 내에서 가장 많이 존재하는 생물종(우점종)은 대량으로 시퀀싱되어 염기 서열 정보도 많이 얻을 수 있다. 따라서 우점종에 대해서는 전체 길이의 게놈 염기 서열을 얻는 것도 가능하다[57]。반면, 존재량이 적은 생물종(희소종)에서는 분석에 충분한 양의 염기 서열 정보를 얻을 수 없을 가능성이 있으며, 그러한 희소 생물종의 게놈을 완전히 결정하기 위해서는 더 높은 커버리지가 필요하며, 더불어 매우 많은 샘플이 필요하게 된다. 이는 반대로 샷건 시퀀스가 원리적으로 완전 무작위로 DNA 단편의 시퀀싱을 수행하기 때문에, 기존의 배양 기반의 방법으로는 간과되었던 미배양 미생물 계통이라도 크고 작은 게놈 정보를 얻을 수 있다는 것을 의미하기도 한다.
오늘날에는 차세대 염기서열 분석기(고처리량 염기서열 분석 기술)의 등장과 발전에 따라 클로닝 단계를 생략하고 시퀀스 데이터의 수율을 증가시키는 것이 가능해졌다. 차세대 시퀀스를 사용하여 수행된 최초의 메타게놈 연구에서는 454 파이로시퀀싱이 이용되었다[60]。이후, Ion Torrent Personal Genome Machine, Illumina MiSeq, HiSeq, Applied Biosystems SOLiD 시스템 등이 등장하여 메타게놈 분석에 이용되게 되었다[64]。
이러한 차세대 DNA 시퀀싱 기술로 얻을 수 있는 리드는 생어 시퀀싱보다 짧다. 구체적으로, 생어법에서는 750bp 정도의 리드를 얻을 수 있는 데 비해, Ion Torrent PGM System 및 454 파이로시퀀싱에서는 약 400bp, Illumina MiSeq에서는 최대 600bp, SOLiD는 25-75bp 정도이다(2008년 카탈로그 스펙 값)[65]。 반면에, 차세대 시퀀싱에서는 압도적으로 많은 양의 DNA 서열을 읽을 수 있으며, 구체적으로 454 파이로시퀀스에서는 200~500Mb, Illumina 플랫폼에서는 20~50Gb의 서열 정보를 배출하며(2009년 카탈로그 스펙 값), 이 값은 매년 증가하고 있다[66]。
3. 시퀀싱 기술
최근 분자 생물학 기술의 발전으로 세균 인공 염색체(BAC)를 이용한 라이브러리 구축이 가능해지면서, 환경 샘플에서 수천 염기쌍보다 긴 DNA 염기 서열을 회수하는 것이 가능해졌다. 생물정보학의 발전, DNA 증폭 기술의 개선, 그리고 계산 능력의 증가는 환경 시료에서 회수된 DNA 염기서열 분석에 크게 기여했으며, 샷건 시퀀싱을 메타게놈 시료에 적용할 수 있게 했다.
고처리량 염기서열 분석은 DNA를 클로닝할 필요가 없어 환경 시료 채취의 주요 편향과 병목 현상 중 하나를 제거한다는 장점이 있다. 2010년에는 PacBio RS가 출시되면서, 차세대 염기서열 분석기보다 더 긴 리드를 읽을 수 있는 3세대 염기서열 분석기가 등장했다. 이러한 기술은 긴 리드의 샷건 시퀀스 획득과 효율적인 게놈 어셈블리를 가능하게 한다.[67] 또한, 샷건 시퀀스와 염색체 구조 포획 기술을 활용한 Hi-C법을 조합하여 미생물 게놈의 어셈블리를 효율화하는 연구도 보고되고 있다.[68] 퍼시픽 바이오사이언스의 PacBio RSII 및 PacBio Sequel을 포함한 장기 판독 염기서열 분석 기술과 옥스퍼드 나노포어 테크놀로지스의 Nanopore MinION, GridION, PromethION은 조립 과정을 용이하게 할 수 있는 긴 샷건 염기서열 판독값을 얻는 또 다른 선택이다.[4]
3. 1. 샷건 메타게노믹스

샷건 메타게노믹스는 샷건 시퀀싱 기법을 활용하여 군유전체(메타게놈)를 분석하는 방법이다.
과거에는 환경 샘플에서 수천 염기쌍보다 긴 DNA 단편을 회수하는 것이 어려웠지만, 분자 복제를 위한 벡터인 세균 인공 염색체(BAC)가 개발되면서 라이브러리 구축이 가능해졌다. 그러나 종래의 클로닝을 이용한 라이브러리는 망라성에 한계가 있어 군집의 구조를 올바르게 평가하기 어려웠다.
최근 생물정보학의 발전, DNA 증폭 (PCR) 기술의 개선, 그리고 계산 능력의 증가는 환경 시료에서 회수된 DNA 염기서열 분석에 크게 기여했으며, 샷건 시퀀싱을 메타게놈 시료에 적용할 수 있게 했다(전체 메타게놈 샷건 또는 WMGS 시퀀싱이라고도 함).[62] 이 방식은 DNA를 무작위로 절단하여 많은 짧은 서열을 분석하고, 이를 서열 조립하여 합의 서열로 재구성한다.[63] 샷건 시퀀싱은 환경 시료에 존재하는 유전자를 밝혀낸다.
고속 시퀀싱 기술의 발전으로 클로닝 단계 없이 더 많은 시퀀싱 데이터를 얻을 수 있게 되었다. 샷건 메타게노믹스는 어떤 유기체가 존재하는지, 그리고 해당 군집에서 어떤 대사 과정이 가능한지에 대한 정보를 제공한다.
환경에서 DNA를 수집하는 과정은 통제되지 않기 때문에, 환경 시료에서 가장 풍부한 유기체가 결과적인 시퀀스 데이터에서 가장 많이 표현된다. 충분히 대표되지 않는 군집 구성원의 게놈을 완전히 해독하려면 매우 큰 시료가 필요할 수 있다.[57] 반면, 샷건 시퀀싱의 무작위적 특성으로 인해, 기존의 배양 기술로는 간과될 수 있는 많은 유기체가 최소한 일부 작은 서열 세그먼트로라도 표현될 것이다.
3. 2. 고처리량 시퀀싱
고처리량 염기서열 분석(HTS)은 염기서열 분석 전에 DNA를 클로닝할 필요가 없어 환경 시료 채취의 주요 편향과 병목 현상 중 하나를 제거한다는 장점이 있다. 최초의 메타게놈 연구는 대량 병렬 454 파이로시퀀싱을 사용하여 수행되었다. 환경 시료 채취에 일반적으로 적용되는 다른 세 가지 기술은 이온 토런트 개인 게놈 머신, 일루미나 MiSeq 또는 HiSeq, Applied Biosystems SOLiD 시스템이다.이러한 DNA 염기서열 분석 기술은 생어 염기서열 분석보다 짧은 단편을 생성한다. 이온 토런트 PGM 시스템과 454 파이로시퀀싱은 일반적으로 ~400bp 판독값을 생성하고, 일루미나 MiSeq는 400-700bp 판독값을 생성하며(페어드 엔드 옵션 사용 여부에 따라 다름), SOLiD는 25–75bp 판독값을 생성한다. 역사적으로 이러한 판독 길이는 ~750bp의 일반적인 생어 염기서열 분석 판독 길이보다 상당히 짧았지만, 일루미나 기술은 이 기준에 빠르게 근접하고 있다. 그러나 이러한 제약은 훨씬 더 많은 수의 염기서열 판독값으로 보완된다. 2009년에는 파이로시퀀싱된 메타게놈이 200–500 메가베이스를 생성했고, 일루미나 플랫폼은 약 20–50기가베이스를 생성했지만, 이러한 출력량은 최근 몇 년 동안 기하급수적으로 증가했다.
오늘날에는 차세대 염기서열 분석기(고처리량 염기서열 분석 기술)의 등장과 발전에 따라 클로닝 단계를 생략하고 시퀀스 데이터의 수율을 증가시키는 것이 가능해졌다. 차세대 시퀀스를 사용하여 수행된 최초의 메타게놈 연구에서는 454 파이로시퀀싱이 이용되었다.[60] 이후, Ion Torrent Personal Genome Machine 및 Illumina MiSeq, HiSeq, Applied Biosystems SOLiD 시스템 등이 등장하여 메타게놈 분석에 이용되게 되었다.[64]
기술 | 리드 길이 | 특징 |
---|---|---|
생어 염기서열 분석 | ~750bp | |
Ion Torrent PGM System | ~400bp | |
454 파이로시퀀싱 | ~400bp | |
Illumina MiSeq | 최대 600bp | |
Applied Biosystems SOLiD | 25-75bp | 대량의 DNA 서열 판독 가능 (2009년 기준 454 파이로시퀀스는 200~500Mb, Illumina 플랫폼은 20~50Gb, 매년 증가)[66] |
2010년에 PacBio RS가 출시된 것을 시작으로, 차세대 염기서열 분석기보다 더 긴 롱 리드를 읽을 수 있는, 이른바 3세대 염기서열 분석기가 PacBio사(단분자 실시간 시퀀싱)나 Nanopore사에서 등장했다. 이러한 3세대 시퀀싱 기술을 메타게놈 분석에 응용함으로써, 롱 리드의 샷건 시퀀스 획득과 더욱 효율적인 게놈 어셈블리가 가능해질 것으로 생각된다.[67] 또한, 샷건 시퀀스와 Chromosome conformation capture|한국어=염색체 구조 포획영어 기술을 활용한 Hi-C법을 조합하여, 같은 세포 내에서 근접하는 DNA 단편의 정보를 얻을 수 있으며, 이 정보를 활용하여 미생물 게놈의 어셈블리를 효율화하는 연구도 보고되고 있다.[68]
퍼시픽 바이오사이언스의 PacBio RSII 및 PacBio Sequel을 포함한 장기 판독 염기서열 분석 기술과 옥스퍼드 나노포어 테크놀로지스의 Nanopore MinION, GridION, PromethION은 조립 과정을 용이하게 할 수 있는 긴 샷건 염기서열 판독값을 얻는 또 다른 선택이다.[4]
4. 생물정보학 분석
메타게놈 실험으로 생성된 데이터는 방대하고 본질적으로 잡음이 많으며, 최대 10,000종을 나타내는 조각난 데이터를 포함한다. 소의 반추위 메타게놈 시퀀싱은 의 뉴클레오타이드 서열 데이터를 생성했으며, 인간 장 미생물군집 유전자 카탈로그는 의 서열 데이터에서 조립된 330만 개의 유전자를 확인했다. 이러한 데이터 세트에서 유용한 생물학적 정보를 수집, 큐레이션 및 추출하는 것은 연구자에게 상당한 계산적 과제를 제시한다.[6]
메타게놈 데이터는 방대한 양의 서열 데이터와 메타데이터의 복잡성으로 인해 분석에 어려움이 있다. 메타데이터에는 샘플의 3차원 지리 및 환경 특징, 샘플 부지에 대한 물리적 데이터, 샘플링 방법론에 대한 자세한 정보가 포함된다. 이러한 정보는 재현성을 보장하고 후속 분석을 가능하게 하기 위해 필요하며, 유전자온라인 데이터베이스(GOLD)와 같은 특수 데이터베이스에 표준화된 데이터 형식으로 저장되어 관리된다.
메타데이터와 서열 데이터를 통합하고, 다양한 데이터 세트를 비교 분석하기 위해 여러 도구들이 개발되었다. 예를 들어, 아르곤 국립 연구소와 시카고 대학교의 팀은 2007년에 Metagenomics Rapid Annotation using Subsystem Technology 서버(MG-RAST)를 출시하여 메타게놈 데이터 세트 분석을 위한 커뮤니티 리소스를 제공했다. 2012년 6월 기준으로 이상의 DNA가 분석되었으며, MG-RAST 내에서 비교 가능한 10,000개 이상의 공개 데이터 세트가 무료로 제공된다. 또한, 통합 미생물 유전자/메타게놈(IMG/M) 시스템은 [http://img.jgi.doe.gov/cgi-bin/w/main.cgi 통합 미생물 유전자](IMG) 시스템 및 [http://jgi.doe.gov/programs/GEBA/index.html 세균 및 고세균 유전체 백과사전(GEBA)] 프로젝트에서 포함된 참조 분리 유전체를 기반으로 메타게놈 서열을 기반으로 한 미생물 군집의 기능적 분석을 위한 도구 모음을 제공한다.
MEGAN(MEta Genome ANalyzer)은 고처리량 메타게놈 샷건 데이터를 분석하기 위한 독립형 도구 중 하나였다. 2005년에 발표된 이 프로그램의 첫 번째 버전은 매머드 뼈에서 얻은 DNA 서열의 메타게놈 컨텍스트를 분석하는 데 사용되었다. 이 도구는 참조 데이터베이스에 대한 BLAST 비교를 기반으로 작동하며, 간단한 최저 공통 조상(LCA) 알고리즘을 사용하여 읽기를 NCBI 분류군의 노드에 배치하거나, [http://www.theseed.org/wiki/Main_Page SEED] 또는 KEGG 분류군의 노드에 배치하여 분류학적 및 기능적 분류를 모두 수행한다.
빠르고 저렴한 시퀀싱 장비의 출현으로 DNA 서열 데이터베이스가 기하급수적으로 증가함에 따라, 더 빠르고 효율적인 도구가 필요하게 되었다. MG-RAST 또는 MEGAN과 같은 BLAST 기반 접근 방식은 대규모 샘플을 주석 처리하는 데 시간이 오래 걸리기 때문에(예: 소/중형 데이터 세트/샘플을 처리하는 데 몇 시간 소요), 더욱 저렴하고 강력한 서버를 활용한 초고속 분류기들이 등장했다. 이러한 도구들은 매우 빠른 속도로 분류학적 주석을 수행할 수 있다. 예를 들어, CLARK는 분당 3,200만 개의 메타게놈 단일 리드를 정확하게 분류할 수 있으며, 10억 개의 단일 리드로 구성된 매우 큰 데이터 세트/샘플도 약 30분 안에 처리할 수 있다.
고대 DNA를 포함하는 샘플의 경우, 해당 샘플의 특성(고대 DNA 손상)과 관련된 불확실성 때문에[14] 보수적인 유사성 추정치를 생성할 수 있는 빠른 도구(FALCON)가 제공되었다. FALCON은 메모리 및 속도 성능에 영향을 미치지 않으면서 완화된 임계값과 편집 거리를 사용할 수 있다.
4. 1. 서열 전처리
메타게놈 데이터 분석의 첫 단계는 중복되거나 품질이 낮은 서열, 그리고 사람을 포함한 진핵생물에서 유래한 것으로 보이는 서열을 제거하는 사전 필터링 단계를 거친다.[7][8] 혼입된 진핵생물 게놈 DNA 서열을 제거하는 데에는 Eu-Detect나 DeConseq 등의 도구를 사용할 수 있다.[9][10]4. 2. 서열 조립
어셈블리란 짧은 DNA 배열을 연결하여 게놈 배열의 부분적인 배열을 얻는 것을 말한다. 또한, 원래 단편보다 긴 배열을 콘티그라고 한다. 게놈 프로젝트나 군유전체 프로젝트에서 다루는 DNA 배열 데이터의 기본적인 구조는 같지만, 전자는 단일 종 유래의 배열 데이터를 더 높은 커버리지로 얻기 용이한 반면, 후자는 서로 다른 생물 종 유래의 배열이 섞여 있어 데이터의 중복성이 매우 낮다(데이터 세트에서 동일한 배열이 낮은 빈도로만 나타난다). 게다가, 2세대 시퀀싱 기술은 리드 길이가 짧기 때문에 게놈 어셈블리에서 오류(미스 어셈블리)가 빈번하게 발생하고, 얻어진 결과의 신뢰성이 낮아질 수 있다. 특히 전이인자 등에 대표되는 게놈 내의 반복 서열은 이러한 미스 어셈블리를 유발하기 쉽다.[77] 또한, 서로 다른 복수 종 유래의 배열을 잘못 어셈블리해 이른바 키메라 콘티그를 만들어내는 미스 어셈블리도 일어날 수 있다.[78]이러한 오류를 최소화하고 가능한 한 길게 어셈블리가 연결되도록 다양한 도구(어셈블러)가 현재도 개발되고 있다. 많은 어셈블러는 정밀도를 향상시키기 위해 일루미나의 Paired-end tag|페어 엔드 리드영어 정보를 이용한다. Phrap영어나 Celera Assembler 등의 일부 프로그램은 단일 게놈을 어셈블하기 위해 설계되었지만, 그럼에도 불구하고 메타게놈 데이터 세트에서도 양호한 어셈블리 결과를 생성하는 것으로 경험적으로 알려져 있다.[79] Velvet assembler|Velvet영어 등의 다른 프로그램은 내부적으로 De Bruijn graph|de Bruijn 그래프영어 알고리즘을 사용하고 있으며, 2세대 시퀀서에서 생성되는 쇼트 리드를 위해 최적화되어 있다.[80][81] 레퍼런스 게놈을 사용하여 어셈블리를 개선하는 접근법도 제안되었지만, 이 방법은 이미 게놈이 읽혀진 제한된 미생물 계통에만 적용할 수 있다.[77] 어셈블리가 생성된 후, 해당 콘티그가 어떤 계통에서 유래되었는지를 추정하는 것도 기술적인 과제이다.[78]
4. 3. 유전자 예측
메타게놈 분석 파이프라인은 조립된 컨티그에서 코딩 영역을 주석 처리하는 데 두 가지 접근 방식을 사용한다. 첫 번째 접근 방식은 일반적으로 BLAST 검색을 통해 이미 염기서열 데이터베이스에 공개되어 있는 유전자와의 상동성을 기반으로 유전자를 식별하는 것이다. 이러한 유형의 접근 방식은 MEGAN4 프로그램에서 구현된다. 두 번째는, ''ab initio'' 방식은 관련된 유기체의 유전자 훈련 세트를 기반으로 염기 서열의 고유한 특징을 사용하여 코딩 영역을 예측한다. 이것은 GeneMark 및 GLIMMER와 같은 프로그램에서 사용되는 접근 방식이다. ''ab initio'' 예측의 주요 장점은 염기 서열 데이터베이스에 상동성이 없는 코딩 영역을 감지할 수 있다는 것이다. 그러나 비교를 위해 사용 가능한 인접한 게놈 DNA의 큰 영역이 있을 때 가장 정확하다. 유전자 예측은 일반적으로 분류 후에 수행된다.[5]조립된 컨센서스 서열(컨티그)로부터 유전자 서열(코딩 영역)을 주석하는 방법으로는 크게 두 가지 접근 방식이 있다.[77] 첫 번째는 BLAST 등의 도구를 사용한 서열 유사성 검색을 통해 서열 데이터베이스에 공개된 유전자와의 서열 유사성에 기반하여 유전자를 식별하는 방법이다. 이 방법은 예를 들어 MEGAN 4에서 구현되고 있다.[82] 두 번째 방법으로는, 관련 생물종(즉, 원핵생물 또는 진핵생물)에서 유래된 기존 서열 정보를 바탕으로 유전자 서열에 관한 특징량을 학습하고, 컨티그 서열로부터 직접 유전자 영역을 예측하는 방법이다. 예를 들어 GeneMark영어나 GLIMMER영어 등의 프로그램에서 채택하고 있다.[83] 이 ''ab initio'' 예측 방법은 서열 데이터베이스에 유사한 것이 없는 새로운 코딩 영역도 검출할 수 있다.[79] 그 후, 예측된 유전자 서열을 바탕으로 공공 유전자 데이터베이스를 이용한 서열 유사성 검색을 수행하여 해당 유전자가 가진 기능을 추정하는 것이 일반적이다.
4. 4. 종 다양성 분석 (비닝)
유전자 주석은 "무엇"을 제공하는 반면, 종 다양성 측정은 "누구"를 제공한다. 메타게놈에서 군집 구성과 기능을 연결하기 위해, 염기 서열은 빈닝(binning)되어야 한다. ''빈닝''은 특정 염기 서열을 유기체와 연결하는 과정이다.유사성 기반 빈닝에서, BLAST와 같은 방법은 기존의 공개 데이터베이스에서 계통 발생 마커 또는 유사한 염기 서열을 빠르게 검색하는 데 사용된다. 이 접근 방식은 MEGAN에서 구현된다. 또 다른 도구인 PhymmBL은 보간된 마르코프 모델을 사용하여 리드를 할당한다. [http://huttenhower.sph.harvard.edu/metaphlan MetaPhlAn]과 AMPHORA는 계산 성능이 향상된 유기체 상대 풍부도를 추정하기 위해 고유한 분류군 특정 마커를 기반으로 하는 방법이다. [https://motu-tool.org/ mOTUs] 및 MetaPhyler와 같은 다른 도구는 원핵생물 종을 프로파일링하기 위해 보편적인 마커 유전자를 사용한다. [https://motu-tool.org/ mOTUs 프로파일러]를 사용하면 참조 게놈 없이도 종을 프로파일링하여 미생물 군집 다양성 추정을 개선할 수 있다. [https://github.com/seqan/slimm SLIMM]과 같은 최근 방법은 개별 참조 게놈의 리드 커버리지 랜드스케이프를 사용하여 위양성(false-positive) 결과를 최소화하고 신뢰할 수 있는 상대 풍부도를 얻는다.
조성 기반 빈닝에서는 올리고뉴클레오티드 빈도 또는 코돈 사용 편향과 같은 염기 서열의 고유한 특징을 사용한다. 일단 염기 서열이 빈닝되면, 다양성과 풍부도에 대한 비교 분석을 수행할 수 있다.
빈닝 후, 조립된 컨티그(contig)는 각 빈닝 도구의 최대한의 능력으로 각 유기체의 종과 유사한 집합을 나타내는 "빈(bin)"으로 수집된다(참조: 작동 분류 단위). 각 빈은 포함된 모든 염기 서열이 표현되는 유기체의 게놈에서 파생된 것으로 간주될 수 있으므로 ''메타게놈 조립 게놈''(MAG)으로 구성된다. CheckM 및 BUSCO와 같은 단일 사본 유전자 기반 도구는 MAG의 완전성 백분율 및 오염 백분율을 추정하는 데 사용할 수 있다.[13]
4. 5. 데이터 통합 및 비교 메타게놈학
메타게놈 실험으로 생성된 데이터는 방대하고 잡음이 많으며, 최대 10,000종을 나타내는 조각난 데이터를 포함한다. 소의 반추위 메타게놈 시퀀싱은 의 뉴클레오티드 서열 데이터를 생성했으며, 인간 장 미생물군집 유전자 카탈로그는 의 서열 데이터에서 조립된 330만 개의 유전자를 확인했다. 이러한 데이터 세트에서 유용한 생물학적 정보를 수집, 큐레이션 및 추출하는 것은 상당한 계산적 과제를 제시한다.[6]방대한 양의 서열 데이터는 메타게놈 프로젝트와 관련된 메타데이터의 복잡성으로 인해 더욱 어려운 과제가 되고 있다. 메타데이터에는 샘플의 3차원(깊이 또는 높이 포함) 지리 및 환경 특징, 샘플 부지에 대한 물리적 데이터, 샘플링 방법론에 대한 자세한 정보가 포함된다. 이 정보는 재현성을 보장하고 후속 분석을 가능하게 하기 위해 필요하며, 그 중요성 때문에 메타데이터와 공동 데이터 검토 및 관리는 유전자온라인 데이터베이스(Genomes OnLine Database, GOLD)와 같은 특수 데이터베이스에 위치한 표준화된 데이터 형식을 필요로 한다.
메타데이터와 서열 데이터를 통합하여 여러 생태 지수를 사용하여 다양한 데이터 세트를 비교 분석할 수 있도록 여러 도구가 개발되었다. 2007년, Folker Meyer와 Robert Edwards 및 아르곤 국립 연구소와 시카고 대학교의 팀은 메타게놈 데이터 세트 분석을 위한 커뮤니티 리소스인 Metagenomics Rapid Annotation using Subsystem Technology 서버(MG-RAST)를 출시했다. 2012년 6월 기준으로 이상의 DNA가 분석되었으며, MG-RAST 내에서 비교할 수 있는 10,000개 이상의 공개 데이터 세트가 무료로 제공된다. 8,000명 이상의 사용자가 현재 MG-RAST에 총 50,000개의 메타게놈을 제출했다. 통합 미생물 유전자/메타게놈(IMG/M) 시스템 또한 [http://img.jgi.doe.gov/cgi-bin/w/main.cgi 통합 미생물 유전자](IMG) 시스템 및 [http://jgi.doe.gov/programs/GEBA/index.html 세균 및 고세균 유전체 백과사전(GEBA)] 프로젝트에서 포함된 참조 분리 유전체를 기반으로 메타게놈 서열을 기반으로 한 미생물 군집의 기능적 분석을 위한 도구 모음을 제공한다.
고처리량 메타게놈 샷건 데이터를 분석하기 위한 최초의 독립형 도구 중 하나는 MEGAN(MEta Genome ANalyzer)이었다. 이 프로그램의 첫 번째 버전은 2005년에 매머드 뼈에서 얻은 DNA 서열의 메타게놈 컨텍스트를 분석하는 데 사용되었다. 이 도구는 참조 데이터베이스에 대한 BLAST 비교를 기반으로, 간단한 최저 공통 조상(LCA) 알고리즘을 사용하여 읽기를 NCBI 분류군의 노드에 배치하거나, 각각 [http://www.theseed.org/wiki/Main_Page SEED] 또는 KEGG 분류군의 노드에 배치하여 분류학적 및 기능적 분류를 모두 수행한다.
빠르고 저렴한 시퀀싱 장비의 출현으로 DNA 서열 데이터베이스는 기하급수적으로 증가하고 있으며(예: NCBI GenBank 데이터베이스 ), 고처리량 시퀀싱에 발맞추기 위해 더 빠르고 효율적인 도구가 필요하다. MG-RAST 또는 MEGAN과 같은 BLAST 기반 접근 방식은 대규모 샘플을 주석 처리하는 데 느리게 실행되기 때문이다(예: 소/중형 데이터 세트/샘플을 처리하는 데 몇 시간 소요됨 ). 따라서 더욱 저렴한 강력한 서버 덕분에 초고속 분류기가 최근 등장했다. 이러한 도구는 매우 빠른 속도로 분류학적 주석을 수행할 수 있다. 예를 들어 CLARK (CLARK의 저자에 따르면, "분당 3,200만 개의 메타게놈 단일 리드를 정확하게 분류"할 수 있다)는 빠른 속도로, 10억 개의 단일 리드로 구성된 매우 큰 데이터 세트/샘플을 약 30분 안에 처리할 수 있다.
고대 DNA를 포함하는 샘플의 가용성이 증가하고 해당 샘플의 특성(고대 DNA 손상)과 관련된 불확실성으로 인해,[14] 보수적인 유사성 추정치를 생성할 수 있는 빠른 도구가 제공되었다. FALCON의 저자에 따르면, 메모리 및 속도 성능에 영향을 미치지 않고 완화된 임계값과 편집 거리를 사용할 수 있다.
메타게놈 간의 비교 분석은 복잡한 미생물 군집의 기능과 숙주 건강에서의 역할에 대한 추가적인 통찰력을 제공할 수 있다. 메타게놈 간의 쌍별 또는 다중 비교는 염기 서열 조성( GC 함량 또는 게놈 크기 비교), 분류학적 다양성 또는 기능적 보완 수준에서 수행할 수 있다. 군집 구조와 계통 발생적 다양성의 비교는 16S rRNA 및 기타 계통 발생 표지 유전자 또는—다양성이 낮은 군집의 경우—메타게놈 데이터 세트에서 게놈 재구성을 기반으로 수행할 수 있다. 메타게놈 간의 기능적 비교는 COG 또는 KEGG와 같은 참조 데이터베이스에 대해 염기 서열을 비교하고, 범주별로 풍부도를 표로 작성하고, 통계적 유의미성에 대한 차이점을 평가하여 수행할 수 있다. 이 유전자 중심적 접근 방식은 분류군보다는 전체 ''군집''의 기능적 보완을 강조하며, 기능적 보완이 유사한 환경 조건에서 유사함을 보여준다. 결과적으로 메타게놈 샘플의 환경적 맥락에 대한 메타데이터는 비교 분석에서 특히 중요하며, 연구자에게 서식지가 군집 구조와 기능에 미치는 영향을 연구할 수 있는 능력을 제공한다.
또한, 여러 연구에서 다양한 미생물 군집 간의 차이점을 식별하기 위해 올리고뉴클레오타드 사용 패턴을 활용해 왔다. 이러한 방법론의 예로는 Willner et al.의 이염기체 상대 풍부도 접근법[15]과 Ghosh et al.의 HabiSign 접근법이 있다.[16] 이 후자의 연구는 또한 사염기체 사용 패턴의 차이가 특정 서식지에서 기원하는 유전자(또는 메타게놈 리드)를 식별하는 데 사용될 수 있음을 나타냈다. 또한 TriageTools 또는 Compareads와 같은 일부 방법은 두 개의 리드 세트 간의 유사한 리드를 감지한다. 리드에 적용되는 유사성 척도는 리드 쌍이 공유하는 길이가 ''k''인 동일한 단어의 수를 기반으로 한다.
비교 메타게놈학의 주요 목표는 특정 특성을 주어진 환경에 부여하는 데 책임이 있는 미생물 그룹을 식별하는 것이다. 그러나, 시퀀싱 기술의 문제로 인해 metagenomeSeq와 같은 인공물을 고려해야 한다. 다른 사람들은 상주하는 미생물 그룹 간의 미생물 간 상호 작용을 특징지었다. Kuntal et al.에 의해 개발된 GUI 기반 비교 메타게놈 분석 응용 프로그램인 Community-Analyzer가 있다.[17] 이 응용 프로그램은 분석된 미생물 군집의 차이점(분류학적 구성 측면에서)을 빠르게 시각화할 뿐만 아니라 내재된 미생물 간 상호 작용에 대한 통찰력을 제공하는 상관 관계 기반 그래프 레이아웃 알고리즘을 구현한다. 특히, 이 레이아웃 알고리즘은 다양한 분류군의 풍부도 값을 단순히 비교하는 대신, 가능한 미생물 간 상호 작용 패턴을 기반으로 메타게놈을 그룹화할 수 있게 해준다. 또한 이 도구는 사용자가 미생물군 전체에서 표준 비교 분석을 수행할 수 있도록 하는 여러 대화형 GUI 기반 기능을 구현한다.
5. 응용 분야
군유전체학은 의학, 공학, 농업, 지속 가능성 및 생태학 분야의 실질적인 과제를 해결하는 데 적용될 수 있다.[24] 메타게놈 분석은 의학, 공학, 농업, 생태학, 식품 과학 등 다양한 분야에 응용되어 과제 해결에 기여할 가능성이 있다.
자연 환경이나 바이오리액터와 같은 인공 환경에서는 많은 세균 군집이 분업적(공생적)인 대사 활동을 한다. 예를 들어, 어떤 생물 종이 생산하는 대사 폐기물이 다른 생물의 대사 산물의 기반(먹이)이 되는 관계가 종종 나타난다.[109] 메탄 생성 바이오리액터에서는 기능적인 안정성을 확보하면서 원료를 완전히 메탄으로 분해하기 위해 몇몇 공생 종(Syntrophobacterales 및 Synergistia)을 공존시킬 필요가 있다.[110]
마이크로어레이 등 유전자 연구나 프로테오믹스에 의한 유전자 발현 측정을 통해 종의 경계를 넘어 대사 네트워크를 연결할 수 있다. 이러한 연구에서는 어떤 기능 단백질이 어떤 계통군, 종, 주 등에서 보유하고 있는지에 대한 상세한 지식이 필요하다. 따라서 메타게놈 분석으로 얻을 수 있는 군집의 게놈 정보는 메타볼로믹스나 프로테오믹스에 의한 대사 네트워크 분석에서도 중요한 정보가 된다.[111]
군유전체학의 구체적인 응용 분야는 다음과 같다.
- '''농업''': 농작물 및 가축의 질병 감지를 개선하고, 미생물과 식물 간의 관계를 활용하여 작물 건강을 향상시키는 향상된 농업 방식을 적용하는 데 기여한다.
- '''바이오 연료''': 복잡한 미생물 군집에 대한 메타게놈 분석은 글리코사이드 가수분해 효소와 같이 바이오 연료 생산에 산업적으로 적용할 수 있는 효소를 표적 유전자 스크리닝하는 데 사용된다.
- '''생명공학''': 공업용 및 정밀 화학 물질, 농약 및 의약품의 개발을 가능하게 했으며, 여기서 효소 촉매 입체 선택적 합성의 이점이 점점 더 인식되고 있다.
- '''생태학''': 환경 군집의 기능적 생태에 대한 귀중한 통찰력을 제공한다.
- '''환경 정화''': 오염 물질이 생태계에 미치는 영향을 감시하고 오염된 환경을 정화하기 위한 전략을 개선한다.
- '''인간 마이크로바이옴''': 인간 마이크로바이옴의 변화가 인간의 건강과 연관될 수 있는지 연구한다.
- '''감염병 진단''': 환자 검체에서 발견된 유전 물질을 데이터베이스와 비교하여 감염을 진단한다.
- '''아보바이러스 감시''': 모기나 진드기 같은 흡혈 곤충에 의해 옮겨지는 병원체의 다양성과 생태를 파악한다.
5. 1. 농업
토양은 식물이 자라는 곳으로, 1g의 토양에는 약 109~1010개의 미생물 세포가 서식하며, 이는 약 1기가베이스의 염기 서열 정보를 포함한다. 토양에 서식하는 미생물 군집은 과학계에 알려진 가장 복잡한 것 중 하나이며, 경제적 중요성에도 불구하고 여전히 제대로 이해되지 않고 있다. 미생물 컨소시엄은 질소 고정, 영양 순환, 질병 억제, 시데로포어에 의한 철분 및 기타 금속의 격리와 같이 식물 성장을 돕는 다양한 생태계 서비스 역할을 수행한다.기능적 메타게놈 전략은 이러한 미생물 군집의 배양 독립적인 연구를 통해 식물과 미생물 간의 상호 작용을 탐구하는 데 사용되고 있다.[25] 메타게놈 접근 방식은 이전에 배양되지 않았거나 희귀한 군집 구성원의 영양 순환 및 식물 성장에 대한 역할을 파악함으로써, 농작물 및 가축의 질병 감지를 개선하고, 미생물과 식물 간의 관계를 활용하여 작물 건강을 향상시키는 향상된 농업 방식을 적용하는 데 기여할 수 있다.
5. 2. 바이오 연료
바이오 연료는 옥수수 줄기나 스위치그래스와 같은 바이오매스에 포함된 셀룰로스를 셀룰로스계 에탄올로 변환하여 얻어지는 연료이다.[92] 이 변환 과정에서는 미생물 군집(컨소시엄)의 활동에 의해 셀룰로스가 당으로 변환되고, 그 후 당이 발효되어 에탄올이 된다. 또한, 메탄 생성균에 의한 메탄이나 바이오수소 등 다양한 바이오에너지원도 미생물이 생성한다.[92]
바이오매스를 효율적으로 분해하고 산업 규모로 바이오 연료를 생산하기 위해서는 더 높은 생산성과 저비용의 새로운 효소가 필요하다.[70] 복잡한 미생물 군집에 대한 메타게놈 분석은 글리코사이드 가수분해 효소와 같이 바이오 연료 생산에 산업적으로 적용할 수 있는 효소를 표적 유전자 스크리닝하는데 사용될 수 있다.[126] 또한, 이러한 미생물 군집이 어떻게 기능하는지에 대한 지식은 이를 제어하는 데 필요하며, 메타게놈학은 이를 이해하는 데 핵심적인 도구이다. 메타게놈 분석을 통해 바이오가스 발효조[127]나 잎꾼개미와 공생 곰팡이[128]와 같은 수렴 진화 미생물 시스템 간의 비교 분석이 가능하다.
5. 3. 생명공학
미생물 군집은 경쟁과 의사소통에 사용되는 광범위한 생물학적 활성 화학 물질을 생성한다. 오늘날 사용되는 많은 약물은 원래 미생물에서 발견되었으며, 배양할 수 없는 미생물의 풍부한 유전 자원을 채취하는 최근의 진전으로 새로운 유전자, 효소 및 천연 물질의 발견으로 이어졌다. 군유전체학의 적용은 공업용 및 정밀 화학 물질, 농약 및 의약품의 개발을 가능하게 했으며, 여기서 효소 촉매 입체 선택적 합성의 이점이 점점 더 인식되고 있다.군유전체 데이터의 생물 탐사에는 두 가지 유형의 분석이 사용된다. 즉, 발현된 특성에 대한 기능 중심 스크리닝과 관심 DNA 염기 서열에 대한 서열 중심 스크리닝이다. 기능 중심 분석은 원하는 특성 또는 유용한 활성을 발현하는 클론을 식별한 다음 생화학적 특성 분석 및 서열 분석을 수행하는 것을 목표로 한다. 이 접근 방식은 적절한 스크리닝의 가용성, 그리고 원하는 특성이 숙주 세포에서 발현되어야 한다는 요구 사항에 의해 제한된다. 또한, 발견률이 낮고(스크리닝된 1,000개 클론당 1개 미만) 노동 집약적인 특성으로 인해 이 접근 방식이 더욱 제한된다. 반대로, 서열 중심 분석은 보존된 서열을 사용하여 PCR 프라이머를 설계하여 관심 서열에 대한 클론을 스크리닝한다. 클로닝 기반 접근 방식과 비교하여, 서열 전용 접근 방식을 사용하면 필요한 실험 작업의 양이 더욱 줄어든다. 대규모 병렬 시퀀싱의 적용은 또한 생성되는 서열 데이터의 양을 크게 증가시키며, 이는 고처리량 생물 정보학 분석 파이프라인을 필요로 한다. 스크리닝에 대한 서열 중심 접근 방식은 공개 서열 데이터베이스에 존재하는 유전자 기능의 범위와 정확성에 의해 제한된다. 실제로, 실험은 관심 기능, 스크리닝할 샘플의 복잡성 및 기타 요소를 기반으로 기능 기반 접근 방식과 서열 기반 접근 방식을 조합하여 사용한다. 약물 발견을 위한 생명 공학으로서의 군유전체학을 사용하여 성공한 사례는 말라시딘 항생제로 설명된다.[26]
5. 4. 생태학
메타게노믹스는 환경 군집의 기능적 생태에 대한 귀중한 통찰력을 제공한다.[27] 오스트레일리아 바다사자 배설물에서 발견되는 박테리아 컨소시엄의 메타게놈 분석 결과, 영양소가 풍부한 바다사자 배설물이 연안 생태계의 중요한 영양 공급원일 수 있다는 사실이 밝혀졌다. 이는 배설물과 동시에 배출되는 박테리아가 배설물 속의 영양소를 먹이 사슬에 흡수될 수 있는 생물학적 이용 가능 형태로 분해하는 데 능숙하기 때문이다.[28]DNA 시퀀싱은 수역,[29] 공기에서 걸러진 잔해, 흙 샘플, 또는 동물의 배설물[30]에 존재하는 종을 식별하고, 혈액 식사에서 식단 항목을 감지하는 데 더 광범위하게 사용될 수 있다.[31] 이는 침입종 및 멸종 위기종의 범위를 설정하고 계절별 개체수를 추적하는 데 활용 가능하다.
자연 환경이나 인공 환경(바이오리액터 등)에서는 많은 세균 커뮤니티가 분업적(공생적)인 대사 활동을 한다. 예를 들어 어떤 생물 종이 생산하는 대사 폐기물이 다른 생물의 대사 산물의 기반(먹이)이 되는 관계가 종종 나타난다.[109] 메탄 생성 바이오리액터에서는 기능적인 안정성을 확보하면서 원료를 완전히 메탄으로 분해하기 위해 몇몇 공생 종(Syntrophobacterales 및 Synergistia)을 공존시킬 필요가 있다.[110]
마이크로어레이 등 유전자 연구나 프로테오믹스에 의한 유전자 발현 측정을 통해 종의 경계를 넘어 대사 네트워크를 연결할 수 있다. 이러한 연구에서는 어떤 기능 단백질이 어떤 계통군, 종, 주 등에서 보유하고 있는지에 대한 상세한 지식이 필요하다. 따라서 메타게놈 분석으로 얻을 수 있는 커뮤니티의 게놈 정보는 메타볼로믹스나 프로테오믹스에 의한 대사 네트워크 분석에서도 중요한 정보가 된다.[111]
5. 5. 환경 정화
군유전체학은 오염 물질이 생태계에 미치는 영향을 감시하고 오염된 환경을 정화하기 위한 전략을 개선할 수 있다. 미생물 군집이 오염 물질에 대처하는 방식에 대한 이해가 높아지면 오염된 부지가 오염으로부터 회복할 가능성에 대한 평가가 개선되고 생물 증강 또는 생물 자극 실험이 성공할 가능성이 높아진다.메타게놈 분석은 생태계에 대한 오염 물질의 영향을 모니터링하고, 오염된 환경을 정화하기 위한 전략 수립에 활용할 수 있다. 구체적으로는 오염 환경에 서식하는 미생물 군집이 어떻게 오염 물질에 대처하는지(대사적으로 분해하는지, 무력화하는지 등)를 규명함으로써 오염 환경의 평가 방법을 향상시키거나, 생물학적인 오염 물질 제거, 즉 생물 정화 기술 개발로 이어진다고 여겨진다.
5. 6. 인간 마이크로바이옴
인간 마이크로바이옴 이니셔티브는 최소 250명의 개인으로부터 15~18개 신체 부위의 미생물 군집을 특징짓는 것을 목표로 한다. 이는 핵심 인간 마이크로바이옴이 존재하는지, 인간 마이크로바이옴의 변화가 인간의 건강과 연관될 수 있는지, 그리고 이러한 목표를 지원하기 위한 새로운 기술 및 생물정보학 도구를 개발하는 것을 주요 목표로 한다.MetaHit (Metagenomics of the Human Intestinal Tract) 프로젝트는 건강한 사람, 과체중인 사람, 과민성 대장 증후군 환자를 포함한 덴마크와 스페인 출신의 124명의 개인을 대상으로 위장관 박테리아의 깊이와 계통 발생적 다양성을 분류하는 연구를 진행했다.[32] 이 연구에서는 박테로이데테스(Bacteroidetes)와 페르미큐테스(Firmicutes)의 두 박테리아 문(門)이 원위부 장내 박테리아의 90% 이상을 구성한다는 것과, 장 내에서 발견된 상대적 유전자 빈도를 사용하여 장 건강에 매우 중요한 1,244개의 메타게놈 클러스터를 식별했다. 과민성 대장 증후군 환자는 그렇지 않은 개인보다 25% 적은 유전자와 낮은 박테리아 다양성을 나타냈으며, 이는 장내 생물 군집 다양성의 변화가 이 질환과 관련될 수 있음을 나타낸다.[32]
이러한 연구는 몇 가지 잠재적으로 가치 있는 의학적 응용을 강조하지만, 읽기 데이터의 31~48.8%만이 194개의 공개된 인간 장내 박테리아 게놈에 정렬될 수 있었고 7.6~21.2%는 GenBank에서 사용할 수 있는 박테리아 게놈에 정렬될 수 있었다. 이는 새로운 박테리아 게놈을 포착하기 위해 훨씬 더 많은 연구가 필요하다는 것을 나타낸다.[33]
인간 마이크로바이옴 프로젝트 (HMP)는 고처리량 DNA 시퀀싱을 사용하여 장내 미생물 군집을 분석했다. HMP는 개별 미생물 종과는 달리, 많은 대사 과정이 다양한 빈도로 모든 신체 서식지에 존재한다는 것을 보여주었다. 102명 개인의 7개 주요 신체 부위에서 추출한 649개 메타게놈의 미생물 군집이 인간 마이크로바이옴 프로젝트의 일부로 연구되었으며, 메타게놈 분석은 마이크로바이옴 내에서 168개의 기능 모듈과 196개의 대사 경로 간의 틈새 특이적 풍부도의 변화를 밝혀냈다. HMP는 메타게놈의 진단 및 근거 기반 의학에서의 유용성을 밝혀냈으며, 맞춤 의학 분야의 많은 시급한 문제들을 해결하는 강력한 도구임을 보여준다.[34]
5. 7. 감염병 진단
임상 메타게놈 시퀀싱은 환자 검체에서 발견된 유전 물질을 알려진 모든 미세한 인간 병원체 데이터베이스 및 수천 개의 다른 세균, 바이러스, 곰팡이, 기생충, 그리고 항생제 내성 유전자 서열과 관련된 임상 표현형 데이터베이스와 비교하여 감염을 진단하는 유망한 방법이다.[36]감염증을 진단하고 그 근본 원인을 특정하는 것은 어려운 경우가 많다. 예를 들어 뇌염 사례의 절반 이상은 최첨단 임상 검사법을 사용한 광범위한 검사에도 불구하고 병원체를 동정할 수 없다. 메타게놈 분석은 환자의 샘플에 포함된 유전 물질을 수천 개의 세균, 바이러스, 기타 병원체의 게놈 데이터가 포함된 데이터베이스와 비교하여 고감도로 감염을 진단할 수 있어 진단 기법으로 응용이 기대된다.[136] 실제로, COVID-19 초기 유행 시기에는 차세대 시퀀서에 의한 망라적 유전자 검출법으로 SARS-CoV-2가 검출되었다.[137]
5. 8. 아보바이러스 감시
메타게놈학은 모기나 진드기 같은 흡혈 (피를 먹는) 곤충에 의해 옮겨지는 병원체의 다양성과 생태를 파악하는 데 매우 유용한 도구였다.[37][38][39] 공중 보건 관계자와 기관에서 아보바이러스 감시를 위해 메타게놈학을 일상적으로 사용한다.[40][41]5. 9. 기타 응용
군유전체 또는 메타게놈(metagenome)은 흙, 동물의 장, 광도, 고립된 지역 등 특정 환경 내의 모든 바이러스, 세균, 곰팡이 등을 포함하는 유전체의 총합을 의미한다. 이는 주로 배양이 어려운 미생물을 분석하기 위해 대량의 서열 해석기를 사용하여 한꺼번에 많은 미생물을 동정하는 유전체 개념으로 사용된다.메타게놈은 한 종의 유전체가 아니라, 한 환경 단위에 존재하는 모든 종의 유전체를 지칭하며, 일종의 혼합유전체라고 할 수 있다. 이는 오믹스적 생물학 발전 과정에서 나온 용어로, 한 종을 기능적으로 정의할 때 기존의 한 종뿐만 아니라 다양한 종이 상호작용하여 완전한 종을 구성한다는 관점을 반영한다. 기술적으로는 빠른 서열 해석법을 이용하여 종에 관계없이 모든 DNA, RNA를 해석하고, 한 환경 내에서 모든 종을 동정하며, 상호작용 및 대사 작용을 규명하는 기법의 대상이다.
참조
[1]
서적
Advances in Microbial Ecology
Springer US
1986
[2]
논문
Metagenomics - a guide from sampling to data analysis
2012-02
[3]
논문
Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen
2018-02
[4]
논문
Metagenomics and Bioinformatics in Microbial Ecology: Current Status and Beyond
2016-09
[5]
논문
Metagenomic approaches in microbial ecology: an update on whole-genome and marker gene sequencing analyses
2020
[6]
논문
Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies
2015
[7]
논문
Assessment of metagenomic assembly using simulated next generation sequencing data
2012-02-23
[8]
논문
Filtering duplicate reads from 454 pyrosequencing data
2013-04
[9]
논문
Eu-Detect: an algorithm for detecting eukaryotic sequences in metagenomic data sets
2011-09
[10]
논문
Fast identification and removal of sequence contamination from genomic and metagenomic datasets
2011-03
[11]
논문
MetaVelvet: an extension of Velvet assembler to de novo metagenome assembly from short sequence reads
2012-11
[12]
논문
Velvet: algorithms for de novo short read assembly using de Bruijn graphs
2008-05
[13]
논문
Minimum information about a single amplified genome (MISAG) and a metagenome-assembled genome (MIMAG) of bacteria and archaea
2017-08
[14]
간행물
FALCON: a method to infer metagenomic composition of ancient DNA
2018-02
[15]
논문
Metagenomic signatures of 86 microbial and viral metagenomes
2009-07
[16]
논문
HabiSign: a novel approach for comparison of metagenomes and rapid identification of habitat-specific sequences
2011
[17]
논문
Community-analyzer: a platform for visualizing and comparing microbial community structure across microbiomes
2013-10
[18]
논문
Uncovering Earth's virome
http://www.escholars[...]
2016-08
[19]
논문
IMG/VR: a database of cultured and uncultured DNA Viruses and retroviruses
2017-01
[20]
논문
IMG/VR v.2.0: an integrated data management and analysis system for cultivated and environmental viral genomes
2019-01
[21]
논문
Nontargeted virus sequence discovery pipeline and virus clustering for metagenomic data
https://escholarship[...]
2017-08
[22]
논문
Giant viruses of the Kutch Desert
2016-03
[23]
논문
The "Giant Virus Finder" discovers an abundance of giant viruses in the Antarctic dry valleys
2017-06
[24]
논문
The World Within Us
http://claudiacopela[...]
2017-09
[25]
논문
Pivotal roles of phyllosphere microorganisms at the interface between plant functioning and atmospheric trace gas dynamics
2015-05-22
[26]
논문
Culture-independent discovery of the malacidins as calcium-dependent antibiotics with activity against multidrug-resistant Gram-positive pathogens
2018-04
[27]
논문
Toward molecular trait-based ecology through integration of biogeochemical, geographical and metagenomic data
2011-03
[28]
논문
High nutrient transport and cycling potential revealed in the microbial metagenome of Australian sea lion (Neophoca cinerea) faeces
[29]
웹사이트
What's Swimming in the River? Just Look For DNA
https://www.npr.org/[...]
2013-07-24
[30]
논문
Metagenomics: A viable tool for reconstructing herbivore diet
2021-05-25
[31]
논문
A two-step metagenomics approach for the identification and mitochondrial DNA contig assembly of vertebrate prey from the blood meals of common vampire bats (Desmodus rotundus)
https://mbmg.pensoft[...]
2022-07-04
[32]
논문
A human gut microbial gene catalogue established by metagenomic sequencing
2010
[33]
논문
A human gut microbial gene catalogue established by metagenomic sequencing
2010-03
[34]
논문
PLOS Computational Biology: Metabolic Reconstruction for Metagenomic Data and Its Application to the Human Microbiome
[35]
논문
Taking metagenomics under the wings
https://www.nature.c[...]
2022-05-11
[36]
논문
Clinical metagenomics
2019
[37]
논문
Mapping the virome in wild-caught Aedes aegypti from Cairns and Bangkok.
[38]
논문
Targeted Metagenomics Offers Insights into Potential Tick-Borne Pathogens.
[39]
논문
Uncovering the Worldwide Diversity and Evolution of the Virome of the Mosquitoes Aedes aegypti and Aedes albopictus.
[40]
논문
Sensitivity and specificity of metatranscriptomics as an arbovirus surveillance tool.
[41]
논문
Metagenomic arbovirus detection using MinION nanopore sequencing.
[42]
간행물
「海洋における環境ゲノミクス」『地球環境』 Vol.16 No.1 p,71-79
2011
[43]
서적
難培養微生物の利用技術
シーエムシー出版
2010
[44]
논문
Environmental Shotgun Sequencing: Its Potential and Challenges for Studying the Hidden World of Microbes
http://dx.plos.org/1[...]
2007-03-13
[45]
논문
Comparative analysis of amplicon and metagenomic sequencing methods reveals key features in the evolution of animal metaorganisms
https://microbiomejo[...]
2019-12
[46]
웹사이트
イルミナ「総説:メタゲノム研究」
https://jp.illumina.[...]
2020-03-23
[47]
서적
今すぐ始める! メタゲノム解析 実験プロトコール
https://www.worldcat[...]
羊土社
2016
[48]
논문
Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products
https://www.ncbi.nlm[...]
1998-10
[49]
논문
Bioinformatics for Whole-Genome Shotgun Sequencing of Microbial Communities
2005
[50]
논문
Impact of Culture-Independent Studies on the Emerging Phylogenetic View of Bacterial Diversity
https://www.ncbi.nlm[...]
1998-09
[51]
논문
Rapid determination of 16S ribosomal RNA sequences for phylogenetic analyses
https://www.ncbi.nlm[...]
1985-10
[52]
서적
Advances in Microbial Ecology
https://doi.org/10.1[...]
Springer US
1986
[53]
논문
Analysis of a marine picoplankton community by 16S rRNA gene cloning and sequencing.
https://jb.asm.org/c[...]
1991
[54]
논문
Direct isolation of functional genes encoding cellulases from the microbial consortia in a thermophilic, anaerobic digester maintained on lignocellulose
http://link.springer[...]
1995-09
[55]
논문
Characterization of uncultivated prokaryotes: isolation and analysis of a 40-kilobase-pair genome fragment from a planktonic marine archaeon.
https://jb.asm.org/c[...]
1996
[56]
논문
Genomic analysis of uncultured marine viral communities
http://www.pnas.org/[...]
2002-10-29
[57]
논문
Community structure and metabolism through reconstruction of microbial genomes from the environment
http://www.nature.co[...]
2004-03
[58]
논문
Environmental Genome Shotgun Sequencing of the Sargasso Sea
https://www.sciencem[...]
2004-04-02
[59]
논문
Genomic and functional adaptation in surface ocean planktonic prokaryotes
http://www.nature.co[...]
2010-11
[60]
논문
Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA
https://www.sciencem[...]
2006-01-20
[61]
논문
Using pyrosequencing to shed light on deep mine microbial ecology
https://bmcgenomics.[...]
2006-12
[62]
논문
Comparison of metagenomic samples using sequence signatures
http://bmcgenomics.b[...]
2012
[63]
간행물
ヒト腸内細菌叢のゲノムシークエンス
https://doi.org/10.1[...]
公益財団法人 腸内細菌学会
2007
[64]
논문
Unlocking Short Read Sequencing for Metagenomics
https://dx.plos.org/[...]
2010-07-28
[65]
논문
Next-generation sequencing transforms today's biology
http://www.nature.co[...]
2008-01
[66]
논문
Metagenomics versus Moore's law
http://www.nature.co[...]
2009-09
[67]
논문
Metagenomics and Bioinformatics in Microbial Ecology: Current Status and Beyond
https://doi.org/10.1[...]
2016
[68]
논문
Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen
2018-02-28
[69]
논문
Metagenomics - a guide from sampling to data analysis
[70]
논문
Metagenomic Discovery of Biomass-Degrading Genes and Genomes from Cow Rumen
https://www.sciencem[...]
2011-01-28
[71]
논문
A human gut microbial gene catalogue established by metagenomic sequencing
http://www.nature.co[...]
2010-03
[72]
논문
Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies
2015
[73]
논문
Assessment of Metagenomic Assembly Using Simulated Next Generation Sequencing Data
2012-02-23
[74]
논문
Filtering duplicate reads from 454 pyrosequencing data
[75]
논문
Eu-Detect: an algorithm for detecting eukaryotic sequences in metagenomic data sets
[76]
논문
Fast identification and removal of sequence contamination from genomic and metagenomic datasets
[77]
논문
A Bioinformatician's Guide to Metagenomics
http://mmbr.asm.org/[...]
2008-12-01
[78]
논문
Species-Level Deconvolution of Metagenome Assemblies with Hi-C-Based Contact Probability Maps
http://g3journal.org[...]
2014-07
[79]
논문
A Primer on Metagenomics
https://dx.plos.org/[...]
2010-02-26
[80]
논문
Velvet: Algorithms for de novo short read assembly using de Bruijn graphs
http://www.genome.or[...]
2008-02-21
[81]
논문
MetaVelvet: an extension of Velvet assembler to de novo metagenome assembly from short sequence reads
https://academic.oup[...]
2012-11-01
[82]
논문
Integrative analysis of environmental sequences using MEGAN4
http://genome.cshlp.[...]
2011-09-01
[83]
논문
Ab initio gene identification in metagenomic sequences
https://academic.oup[...]
2010-07
[84]
논문
A new view of the tree of life
2016-04-11
[85]
논문
What is microbial community ecology?
http://www.nature.co[...]
2009-11
[86]
논문
MEGAN analysis of metagenomic data
http://www.genome.or[...]
2007-02-06
[87]
논문
Metagenomic microbial community profiling using unique clade-specific marker genes
http://www.nature.co[...]
2012-08
[88]
논문
Metagenomic species profiling using universal phylogenetic marker genes
http://www.nature.co[...]
2013-12
[89]
논문
Microbial abundance, activity and population genomic profiling with mOTUs2
http://www.nature.co[...]
2019-12
[90]
논문
Accurate and fast estimation of taxonomic profiles from metagenomic shotgun sequences
http://bmcgenomics.b[...]
2011
[91]
논문
SLIMM: species level identification of microorganisms from metagenomes
https://peerj.com/ar[...]
2017-03-28
[92]
서적
The New Science of Metagenomics: Revealing the Secrets of Our Microbial Planet
http://www.nap.edu/c[...]
National Academies Press
2007-05-24
[93]
논문
The Genomes OnLine Database (GOLD) v.4: status of genomic and metagenomic projects and their associated metadata
https://academic.oup[...]
2012-01-01
[94]
논문
The metagenomics RAST server - a public resource for the automatic phylogenetic and functional analysis of metagenomes
https://bmcbioinform[...]
2008-12
[95]
논문
IMG/M: the integrated metagenome data management and comparative analysis system
https://academic.oup[...]
2012-01-01
[96]
논문
Functional analysis of metagenomes and metatranscriptomes using SEED and KEGG
https://bmcbioinform[...]
2011-12
[97]
논문
GenBank
http://academic.oup.[...]
2012-11-26
[98]
논문
A comparative evaluation of sequence classification programs
https://bmcbioinform[...]
2012-12
[99]
논문
CLARK: fast and accurate classification of metagenomic and genomic sequences using discriminative k-mers
http://www.biomedcen[...]
2015-12
[100]
논문
Metagenomic Composition Analysis of an Ancient Sequenced Polar Bear Jawbone from Svalbard
http://www.mdpi.com/[...]
2018-09-06
[101]
논문
Comparative Metagenomics Revealed Commonly Enriched Gene Sets in Human Gut Microbiomes
https://academic.oup[...]
2007
[102]
논문
Metagenomic Analyses: Past and Future Trends
http://aem.asm.org/l[...]
2011-02-15
[103]
논문
Metagenomic signatures of 86 microbial and viral metagenomes.
[104]
논문
HabiSign: a novel approach for comparison of metagenomes and rapid identification of habitat-specific sequences.
[105]
논문
TriageTools: tools for partitioning and prioritizing analysis of high-throughput sequencing data
https://academic.oup[...]
2013-04-01
[106]
논문
Compareads: comparing huge metagenomic experiments
https://bmcbioinform[...]
2012-12
[107]
논문
Differential abundance analysis for microbial marker-gene surveys
http://www.nature.co[...]
2013-12
[108]
논문
Community-analyzer: a platform for visualizing and comparing microbial community structure across microbiomes
[109]
논문
Bacterial community structures are unique and resilient in full-scale bioenergy systems
http://www.pnas.org/[...]
2011-03-08
[110]
논문
Syntrophy in anaerobic global carbon cycles
https://linkinghub.e[...]
2009-12
[111]
논문
Ecosystems biology of microbial metabolism
https://linkinghub.e[...]
2011-08
[112]
논문
Archaea predominate among ammonia-oxidizing prokaryotes in soils
http://www.nature.co[...]
2006-08
[113]
논문
Uncovering Earth's virome
http://www.escholars[...]
2016-08
[114]
논문
IMG/VR: a database of cultured and uncultured DNA Viruses and retroviruses
2017-01
[115]
논문
IMG/VR v.2.0: an integrated data management and analysis system for cultivated and environmental viral genomes
2019-01
[116]
논문
Nontargeted virus sequence discovery pipeline and virus clustering for metagenomic data
http://www.nature.co[...]
2017-08
[117]
논문
New dimensions of the virus world discovered through metagenomics
https://linkinghub.e[...]
2010-01
[118]
논문
Giant viruses of the Kutch Desert
2016-03
[119]
논문
The "Giant Virus Finder" discovers an abundance of giant viruses in the Antarctic dry valleys
2017-06
[120]
논문
The World Within Us
http://claudiacopela[...]
2017-09
[121]
논문
メタゲノム解析
https://doi.org/10.3[...]
2011
[122]
논문
Towards “Tera-Terra”: Terabase Sequencing of Terrestrial Metagenomes: Microbial ecologists are taking a metagenomics approach to analyze complex and diverse soil microbial communities
http://www.asmscienc[...]
2011-01-01
[123]
논문
TerraGenome: a consortium for the sequencing of a soil metagenome
http://www.nature.co[...]
2009-04
[124]
서적
Metagenomics : theory, methods, and applications
https://www.worldcat[...]
Caister Academic Press
2010
[125]
논문
Pivotal roles of phyllosphere microorganisms at the interface between plant functioning and atmospheric trace gas dynamics
2015-05-22
[126]
논문
Bioprospecting metagenomes: glycosyl hydrolases for converting biomass
http://biotechnology[...]
2009
[127]
논문
Comparative and Joint Analysis of Two Metagenomic Datasets from a Biogas Fermenter Obtained by 454-Pyrosequencing
https://dx.plos.org/[...]
2011-01-26
[128]
논문
An Insect Herbivore Microbiome with High Plant Biomass-Degrading Capacity
https://dx.plos.org/[...]
2010-09-23
[129]
논문
Achievements and new knowledge unraveled by metagenomic approaches
http://link.springer[...]
2009-11
[130]
논문
Biotechnological prospects from metagenomics
https://linkinghub.e[...]
2003-06
[131]
논문
Size does matter: Application-driven approaches for soil metagenomics
https://linkinghub.e[...]
2010-11
[132]
논문
Isolation of xylose isomerases by sequence- and function-based screening from a soil metagenomic library
http://biotechnology[...]
2011
[133]
논문
Culture-independent discovery of the malacidins as calcium-dependent antibiotics with activity against multidrug-resistant Gram-positive pathogens
2018-04
[134]
논문
Toward molecular trait-based ecology through integration of biogeochemical, geographical and metagenomic data
2011-03
[135]
논문
High nutrient transport and cycling potential revealed in the microbial metagenome of Australian sea lion (Neophoca cinerea) faeces
[136]
논문
Metagenomics for pathogen detection in public health
http://genomemedicin[...]
2013
[137]
논문
Identification of a novel coronavirus causing severe pneumonia in human: a descriptive study
http://journals.lww.[...]
2020-05
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com