대사체학

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

대사체학은 "대사물질"과 "염색체"의 합성어에서 유래된 용어로, 유기체의 유전자와 환경 간의 상호작용을 반영하는 대사체를 연구하는 학문이다. 1998년 처음 사용되었으며, 게놈, 단백질체, 전사체와 같은 생물학 용어와 유사하게 만들어졌다. 대사체는 핵자기 공명 분광법(NMR)과 질량 분석법(MS) 등의 기술을 사용하여 측정하며, 다양한 대사체 데이터베이스를 통해 정보를 얻을 수 있다. 주요 데이터베이스로는 인간 대사체 데이터베이스(HMDB), 효모 대사체 데이터베이스(YMDB), 대장균 대사체 데이터베이스(ECMDB) 등이 있다.

대사체학
📚 더 읽어볼만한 페이지
  • 유전체학 - 발현체학
  • 유전체학 - 유전형 분석
    유전자형 분석은 DNA 염기 서열 분석, RFLP, PCR, DNA 마이크로어레이 등 다양한 기술을 통해 유전형을 파악하는 방법으로 질병 진단, 품종 개량 등 여러 분야에 활용되며 윤리적 문제와 사회적 영향을 동반하지만, 혁신적인 변화를 가져올 것으로 예상되는 기술이다.
  • 물질대사 - 아라키드산
    아라키드산은 탄소 20개로 이루어진 포화 지방산으로, 땅콩 기름과 같은 식물성 기름에 많이 함유되어 있으며, 인체 내에서 세포막 구성, 신호 전달 물질의 전구체, 에이코사노이드 합성에 관여하고, 제약 산업에서 프로스타글란딘의 전구체로 사용되는 경제적 가치가 높은 물질이다.
  • 물질대사 - 카프릴산
    카프릴산은 8개의 탄소로 이루어진 포화 지방산으로, 식품, 향료, 소독제 등 다양한 산업에 사용되며, 식욕 촉진, 항균 작용, 간질 치료 등 의학적 용도로도 연구된다.
  • 생물정보학 - Rosetta@home
    Rosetta@home은 분산 컴퓨팅 플랫폼 BOINC를 활용하여 단백질 구조 예측 연구를 수행하며, 신약 개발 및 질병 연구에 기여하는 것을 목표로 한다.
  • 생물정보학 - 발현체학

2. 역사

"대사체"라는 단어는 "대사물질"과 "염색체"의 합성어로 보인다. 이는 대사물질이 유전자에 의해 간접적으로 암호화되거나 유전자 및 유전자 산물에 작용한다는 것을 의미하기 위해 만들어졌다. "대사체"라는 용어는 1998년에 처음 사용되었으며, 완전한 유전자 집합(게놈), 완전한 단백질 집합(단백질체), 완전한 전사체 집합(전사체)을 지칭하는 기존 생물학 용어와 일치하도록 만들어졌을 가능성이 높다. 대사체학에 관한 첫 번째 책은 2003년에 출판되었다. 대사체학 전용 저널("Metabolomics"라는 제목)은 2005년에 창간되었으며 현재 로이 굿에이커 교수가 편집하고 있다.

3. 대사체 측정

대사체는 유기체의 게놈과 환경 간의 상호작용을 반영하여 표현형(유전자형과 환경의 산물)의 훌륭한 탐침 역할을 할 수 있다. 핵자기 공명 분광법(NMR) 및 질량 분석법(MS)을 포함한 여러 기술을 사용하여 대사체를 측정(식별, 정량화 또는 분류)할 수 있다.

대부분의 질량 분석법(MS)은 화합물 분리를 위해 액체 크로마토그래피(LC), 기체 크로마토그래피(GC) 또는 모세관 전기영동(CE)과 결합하여 사용된다. 각 방법은 사용되는 기기나 프로토콜에 따라 한 번에 50~5,000개의 서로 다른 대사체 또는 대사체 "특징"을 식별하거나 특성화할 수 있다. 현재 단일 분석 방법으로는 전체 대사체 범위를 분석하는 것이 불가능하다.

3.1. 핵자기 공명 (NMR) 분광법

핵자기 공명(NMR) 분광법은 강한 자기장 내에서 특정 핵을 포함하는 분자가 전파 방사선을 흡수하는 현상을 측정하는 분석 화학 기술이다. 주어진 원자나 핵이 흡수하는 주파수(즉, 화학적 이동)는 해당 분자 내에서 원자의 화학적 환경(결합, 화학 구조, 주변 환경, 용매)에 따라 크게 달라진다. NMR 흡수 패턴은 서로 다른 주파수나 화학적 이동에서 "공명" 피크를 생성하는데, 이 피크 모음을 NMR 스펙트럼이라고 한다. 각 화학 화합물은 서로 다른 화학 구조를 가지므로 고유한 NMR 스펙트럼을 갖는다. 따라서 NMR은 대사체와 같은 작은 분자를 특성화, 식별 및 정량화하는 데 유용하다.

NMR은 "고전적인" 대사 연구에 널리 사용되었고 복잡한 대사체 혼합물을 처리하는 능력이 뛰어나 일상적인 대사체 측정을 위해 널리 채택된 최초의 기술 중 하나였다. NMR은 비파괴적이고, 편향되지 않으며, 쉽게 정량화할 수 있고, 분리가 거의 또는 전혀 필요하지 않으며, 새로운 화합물의 식별을 허용하고, 화학적 유도체가 불필요하다는 장점이 있다. NMR은 LC-MS로는 다루기 어려운 당류, 아민, 휘발성 액체나 GC-MS로는 다루기 어려운 큰 분자(>500 Da) 또는 상대적으로 비활성인 화합물을 검출하는 데 적합하다. 그러나 NMR은 감도가 낮아 검출 하한선이 약 5 μM이며, 일반적으로 50~150개의 화합물을 식별할 수 있다.

3.2. 질량 분석법 (MS)

질량 분석법(MS)은 분자의 질량 대 전하 비율을 측정하는 분석 기술이다. 대부분의 질량 분석법은 액체 크로마토그래피(LC) 또는 기체 크로마토그래피(GC)를 사용하여 일종의 분리 과정을 거친다. 이 분리 단계는 결과 질량 스펙트럼을 단순화하고 보다 정확한 화합물 식별을 가능하게 한다. 일부 질량 분석법에서는 분자가 크로마토그래피 분리에 더 적합하도록 유도체화되거나 화학적으로 변형되기도 한다(특히 GC-MS의 경우).

MS는 매우 적은 양의 시료(1 ng 미만의 물질 또는 10 μL 미만의 생체 유체)로도 단일 시료에서 수천 개의 대사체 신호를 생성할 수 있는 매우 민감한 방법이다. MS 기기는 하루에 수백에서 수천 개의 시료를 분석할 수 있는 높은 처리량을 갖도록 구성할 수도 있다. 그러나 MS는 핵자기 공명 분광법(NMR)보다 대사체 정량화 및 새로운 화합물 구조 특성화가 더 어렵다.

LC-MS는 소수성 분자(지질, 지방산)와 펩타이드 검출에 특히 적합하며, GC-MS는 작은 분자(<500 Da)와 휘발성이 높은 화합물(에스테르, 아민, 케톤, 알칸, 티올) 검출에 가장 적합하다.

3.3. 대사체의 동적 특성

게놈이나 프로테옴과 달리, 대사체는 단 몇 초 또는 몇 분 만에 극적으로 변할 수 있는 매우 동적인 실체이다. 결과적으로 NMR 또는 MS 기반 대사체학의 수정된 버전을 사용하여 여러 기간 또는 짧은 시간 간격으로 대사체를 측정하는 데 관심이 높아지고 있다.

4. 대사체 데이터베이스

생물의 대사체는 유전체에 의해 크게 정의되므로, 서로 다른 종은 서로 다른 대사체를 갖는다. 예를 들어 토마토와 사과의 맛이 다른 이유는 이 두 과일의 대사체가 다르기 때문이다. 또한, 서로 다른 조직, 기관 및 생체 액체도 뚜렷하게 다른 대사체를 가질 수 있다. 이러한 특성으로 인해 여러 생물 종 특이적, 생체 액체 특이적 대사체 데이터베이스가 개발되었다.

4.1. 주요 대사체 데이터베이스

인간 대사체 데이터베이스(HMDB), 효모 대사체 데이터베이스(YMDB), 대장균 대사체 데이터베이스(ECMDB), 아라비돕시스 대사체 데이터베이스(AraCyc), 소변 대사체 데이터베이스, 뇌척수액(CSF) 대사체 데이터베이스, 혈청 대사체 데이터베이스 등이 있다. 이 중 소변, 뇌척수액, 혈청 대사체 데이터베이스는 인간 생체 액체에 특화된 데이터베이스이다. 이 외에도 KEGG, MetaboLights, 골름 대사체 데이터베이스, MetaCyc, LipidMaps, Metlin 등 여러 생물 종의 대사체 데이터를 가볍게 주석 처리하거나 요약하여 제공하는 일반적인 대사체 데이터베이스도 많이 사용된다.

4.2. 인간 대사체 데이터베이스 (HMDB)

인간 대사체 데이터베이스(HMDB)는 확인되었거나 인체에서 발견될 가능성이 있는 40,000개 이상의 대사체에 대한 자세한 데이터를 담고 있는 공개 데이터베이스이다. HMDB는 화학 정보, 임상 정보, 생화학 정보의 세 가지 정보를 포함한다.

화학 데이터에는 자세한 설명, 광범위한 화학적 분류, 합성 정보 및 관찰/계산된 화학적 특성을 포함하는 40,000개 이상의 대사체 구조가 포함되어 있다. 또한 1,100개 이상의 서로 다른 대사체에서 얻은 거의 10,000개의 실험적으로 측정된 NMR, GC-MS 및 LC/MS 스펙트럼을 포함한다. 임상 정보에는 10,000개 이상의 대사체-생체 액체 농도, 600개 이상의 서로 다른 인간 질병에 대한 대사체 농도 정보 및 200개 이상의 서로 다른 선천성 대사 이상에 대한 경로 데이터가 포함되어 있다. 생화학 정보에는 6,000개 이상의 단백질(및 DNA) 서열과 이러한 대사체 항목과 연결된 5,000개 이상의 생화학 반응이 포함된다.

HMDB는 텍스트 검색, 화학 구조 검색, 서열 유사성 검색 및 스펙트럼 유사성 검색을 포함한 다양한 온라인 쿼리를 지원한다. 이는 임상 대사체학 연구에서 대사체를 식별하거나 이해하려는 대사체학 연구자에게 특히 유용하다.

HMDB의 첫 번째 버전은 2007년 1월 1일에 앨버타 대학교캘거리 대학교의 과학자들이 편집하여 출시되었다. 당시 그들은 2,500개의 대사체, 1,200개의 약물 및 3,500개의 식품 성분에 대한 데이터를 보고했다. 그 이후로 HMDB는 크게 확장되어 버전 3.5에는 16,000개 이상의 내인성 대사체, 1,500개 이상의 약물 및 22,000개 이상의 식품 구성 요소 또는 식품 대사체가 포함되어 있다.

4.2.1. 인간 생체 액체 대사체

앨버타 대학교의 과학자들은 혈청 대사체, 소변 대사체, 뇌척수액(CSF) 대사체, 타액 대사체를 포함한 특정 생체 액체 대사체를 체계적으로 특성화했다. 여기에는 실험 대사체학 분석(NMR, GC-MS, ICP-MS, LC-MS 및 HPLC 분석)과 광범위한 문헌 검색이 모두 포함되었다. 이들의 데이터에 따르면, 인간 혈청 대사체는 최소 4,200개의 서로 다른 화합물(많은 지질 포함)을 포함하고, 인간 소변 대사체는 최소 3,000개의 서로 다른 화합물(수백 개의 휘발성 물질과 장내 미생물 대사물 포함)을 포함하며, 인간 CSF 대사체는 거의 500개의 서로 다른 화합물을, 인간 타액 대사체는 약 400개의 서로 다른 대사 산물(많은 박테리아 생성물 포함)을 포함한다.

4.3. 효모 대사체 데이터베이스 (YMDB)

효모 대사체 데이터베이스는 사카로마이세스 세레비지애 (빵 효모)에서 발견되거나 생성된 2,000개 이상의 소분자 대사체에 대한 온라인 데이터베이스로, 자유롭게 접근할 수 있다. YMDB는 화학 정보와 생화학 정보, 두 종류의 정보를 담고 있다.

YMDB의 화학 정보는 2,027개의 대사체 구조를 포함하며, 상세한 대사체 설명, 광범위한 화학 분류, 합성 정보, 관찰/계산된 화학적 특성을 포함한다. 또한 500개 이상의 서로 다른 대사체에서 얻은 거의 4,000개의 NMR, GC-MS 및 LC/MS 스펙트럼을 담고 있다. YMDB의 생화학 정보는 1,100개 이상의 단백질(및 DNA) 서열과 900개 이상의 생화학 반응을 포함한다. YMDB는 텍스트 검색, 화학 구조 검색, 서열 유사성 검색 및 스펙트럼 유사성 검색을 포함한 다양한 종류의 쿼리를 지원한다. 이는 효모를 모델 생물체로 연구하거나 발효 음료 (와인, 맥주) 생산 최적화를 모색하는 대사체학 연구자들에게 특히 유용하다.

2차 전계 분무 이온화-고분해능 질량 분석법 (SESI-HRMS)는 효모 대사 활동을 모니터링할 수 있는 비침습적 분석 기술이다. SESI-HRMS는 효모 발효 과정에서 약 300개의 대사체를 발견했으며, 이는 문헌에 보고되지 않은 많은 양의 포도당 대사체가 있음을 시사한다.

4.4. 대장균 대사체 데이터베이스 (ECMDB)

대장균 (Escherichia coli, E. coli 균주 K12, MG1655)에서 발견되거나 생성된 2,700개 이상의 소분자 대사체에 대한 자유롭게 접근 가능한 온라인 데이터베이스인 E. Coli 대사체 데이터베이스(ECMDB)는 화학 정보와 생화학 정보를 포함하고 있다.

화학 정보에는 2,700개 이상의 대사체 구조와 자세한 대사체 설명, 광범위한 화학 분류, 합성 정보 및 관찰/계산된 화학적 특성이 포함되어 있으며, 600개 이상의 서로 다른 대사체에서 얻은 약 5,000개의 NMR, GC-MS 및 LC-MS 스펙트럼도 포함하고 있다. 생화학 정보에는 이러한 대사체 항목과 연결된 1,600개 이상의 단백질 (및 DNA) 서열과 3,100개 이상의 생화학 반응이 포함되어 있다. ECMDB는 텍스트 검색, 화학 구조 검색, 서열 유사성 검색 및 스펙트럼 유사성 검색을 포함한 다양한 유형의 온라인 쿼리를 지원하여 E. coli를 모델 유기체로 연구하는 대사체학 연구자들에게 특히 유용하다.

2차 전계 분무 이온화 (SESI-MS)는 휘발성 유기 화합물 프로파일링을 통해 11개의 E. Coli 균주를 구별할 수 있다.

4.5. 쥐 뇌 대사체 아틀라스

2021년, 생애주기 전반에 걸쳐 뇌의 대사체를 보여주는 최초의 아틀라스가 온라인에 공개되었다. 이는 생쥐 뇌에 대한 것이었으며, 여러 동물(포유류)을 대상으로 했다. 이 데이터는 뇌 영역별로 구분되며, 대사 변화를 기존 유전자 및 단백질 뇌 아틀라스에 매핑할 수 있다.

5. 장내 미생물 대사체

인간의 장 미생물 군집은 대사체를 통해 대장암병인에 기여한다. 특히, 결장에서의 미생물 대사로 인한 1차 담즙산의 2차 담즙산으로의 전환은 발암을 촉진한다.