차세대 염기서열 분석
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
차세대 염기서열 분석(NGS)은 대량의 DNA 염기 서열을 빠르고 효율적으로 분석하는 기술을 의미한다. 로슈 454의 등장 이후 일루미나, 팩바이오 등의 플랫폼이 개발되었으며, DNA를 클론 증폭, 염기서열 결정, 병렬 분석하는 단계를 거쳐 진행된다. NGS 기술은 유전체 염기서열 분석 비용을 감소시키고, 수백 메가베이스에서 기가베이스에 이르는 염기서열 데이터를 생성하여 생명 의학 분야에 큰 영향을 미쳤다. 현재 다양한 NGS 플랫폼이 상용화되어 있으며, 파이로시퀀싱, 가역적 염료 터미네이터 시퀀싱, 라이게이션 기반 시퀀싱, 실시간 시퀀싱 등의 분석 방법이 사용된다. NGS를 통해 생성된 데이터는 read, fastq 파일 생성, 참조 유전체 매핑, de-novo 시퀀싱, 유전 변이 분석, 유전자 발현 분석 등의 과정을 거쳐 분석된다.
더 읽어볼만한 페이지
- DNA 시퀀싱 - 총유전체
총유전체는 생물의 완전한 DNA 서열을 의미하며, 유전체 염기서열 분석을 통해 해독 가능하고, 자동화된 분석 방법 발전으로 분석이 용이해졌으며, 질병 예측, 맞춤형 치료 등 다양한 분야에 응용되지만 윤리적 문제와 개인 정보 보호가 중요하다. - DNA 시퀀싱 - 맥삼-길버트 염기 서열 분석법
맥삼-길버트 염기 서열 분석법은 1977년 앨런 맥삼과 월터 길버트가 개발한 DNA 염기 서열 분석 방법으로, 화학적 처리를 통해 특정 염기에서 DNA를 절단하고 겔 전기 영동법을 이용하여 염기 서열을 분석한다.
차세대 염기서열 분석 | |
---|---|
차세대 염기서열 분석 | |
![]() | |
기술 | |
유형 | DNA 염기서열 분석 |
기반 기술 | 대규모 병렬 처리 |
관련 기술 | 유전체학 분자생물학 생물정보학 |
역사 | |
최초 개발 | 1990년대 후반 |
주요 개발자 | 피에르 뉘렌 모스타파로나기 파스칼 메이어 엘위 카와시마 로렌트 파리넬리 |
초기 기술 | 파이로시퀀싱 |
발전 | Solexa 시퀀싱 SOLiD 시퀀싱 이온 토렌트 시퀀싱 |
응용 | |
분야 | 유전체 연구 진단 법의학 |
세부 응용 | 전장 유전체 분석 전사체 분석 후성 유전체 분석 메타 유전체 분석 타겟 시퀀싱 |
장점 | |
특징 | 높은 처리량 낮은 비용 빠른 분석 속도 |
이전 기술 대비 | 대용량 데이터 생산 가능 복잡한 유전체 분석 가능 |
단점 | |
고려 사항 | 데이터 처리 및 분석의 복잡성 높은 초기 투자 비용 전문 인력 필요 |
주요 기술 플랫폼 | |
종류 | Illumina 플랫폼 Thermo Fisher 플랫폼 PacBio 플랫폼 Oxford Nanopore 플랫폼 |
2. NGS 플랫폼
차세대 염기서열 분석(NGS) 플랫폼을 이용한 DNA 염기서열 분석은 일반적으로 다음과 같은 단계를 거친다.[7]
# DNA 염기서열 라이브러리는 PCR 생체외(in vitro)를 통해 클론 증폭하여 생성된다.
# DNA는 합성에 의해 염기서열이 결정되는데, 이는 사슬 종결 화학 반응 대신 보완 가닥에 뉴클레오티드를 첨가함으로써 결정된다.
# 공간적으로 분리된 증폭된 DNA 템플릿은 물리적 분리 단계 없이 대규모 병렬 방식으로 동시에 염기서열 분석된다.
이러한 단계는 대부분의 NGS 플랫폼에서 수행되지만, 각 플랫폼은 서로 다른 전략을 사용한다.
NGS 염기서열 분석 반응의 병렬화는 단일 기기 작동으로 수백 메가베이스에서 기가베이스의 뉴클레오티드 염기서열 리드를 생성한다. 이는 사용 가능한 염기서열 데이터의 급격한 증가를 가능하게 했으며, 생명 의학 분야에서 유전체학 염기서열 분석 접근 방식을 근본적으로 변화시켰다.[8] 새롭게 등장하는 NGS 기술과 기기는 염기서열 분석 비용의 상당한 감소에 더욱 기여하여 유전체 염기서열 분석 당 1000USD에 근접하게 되었다.[9][10]
2. 1. 주요 플랫폼
로슈 454가 등장하면서 다량의 DNA를 한꺼번에 분석하는 방법이 시도되었고,[47] 이후 일루미나(Illumina), 팩바이오(PacBio) 등의 플랫폼이 등장하였다.2014년을 기준으로 상업적으로 이용 가능한 대규모 병렬 염기서열 분석 플랫폼은 아래 표와 같으며, 차세대 염기서열 분석(NGS) 기술의 빠른 발전 속도로 인해 기술 사양 및 가격은 유동적이다.
단일 가닥 염기서열 분석에 대한 실행 시간 및 실행당 기가베이스(Gb) 출력이 표기되어 있다. 쌍으로 짝지어진 염기서열 분석을 수행할 때 실행 시간과 출력이 약 2배 증가한다.
‡Roche 454 및 Helicos Biosciences 플랫폼의 평균 읽기 길이.[20]
2. 2. 플랫폼 비교
로슈 454의 등장으로 다량의 DNA를 한꺼번에 분석하는 방법이 시도되었으며,[47] 이후 일루미나(Illumina), 팩바이오(PacBio) 등의 플랫폼이 등장한다.2014년 현재, 대규모 병렬 염기서열 분석 플랫폼이 상업적으로 이용 가능하며, 그 특징은 아래 표와 같다. 차세대 염기서열 분석(NGS) 기술의 발전 속도가 빠르기 때문에 기술 사양 및 가격은 유동적이다.
차세대 염기서열 분석 (NGS) 실험은 크게 다음과 같은 과정으로 이루어진다.
단일 가닥 염기서열 분석에 대한 실행 시간 및 실행당 기가베이스(Gb) 출력이 표기되어 있다. 쌍으로 짝지어진 염기서열 분석을 수행할 때 실행 시간과 출력이 약 2배 증가한다. ‡Roche 454 및 Helicos Biosciences 플랫폼의 평균 읽기 길이.[20]
상업적으로 이용 가능한 차세대 염기서열 분석(NGS) 플랫폼을 이용한 DNA 염기서열 분석은 일반적으로 다음과 같은 단계를 거쳐 수행된다.[7]
# DNA 염기서열 라이브러리는 PCR 생체외(in vitro)를 통해 클론 증폭하여 생성된다.
# DNA는 합성에 의해 염기서열이 결정되는데, 이는 사슬 종결 화학 반응 대신 보완 가닥에 뉴클레오티드를 첨가함으로써 결정된다.
# 공간적으로 분리된 증폭된 DNA 템플릿은 물리적 분리 단계 없이 대규모 병렬 방식으로 동시에 염기서열 분석된다.
NGS 염기서열 분석 반응의 병렬화는 단일 기기 작동으로 수백 메가베이스에서 기가베이스의 뉴클레오티드 염기서열 리드를 생성한다. 이는 사용 가능한 염기서열 데이터의 급격한 증가를 가능하게 했으며, 생명 의학 분야에서 유전체 염기서열 분석 접근 방식을 근본적으로 변화시켰다.[8] 새롭게 등장하는 NGS 기술과 기기는 염기서열 분석 비용의 상당한 감소에 더욱 기여하여 유전체 염기서열 분석 당 1000USD에 근접하게 되었다.[9][10]
3. 실험 과정
1. '''DNA 분절화''': 온전한 DNA는 길이가 매우 길어(약 2미터[46]) 시퀀서로 직접 분석할 수 없다. 따라서 시퀀서가 인식 가능한 크기로 DNA를 자르는 과정이 필요하다. 이 과정은 물리적 방법(초음파 사용) 또는 효소적 방법(제한 효소 사용)을 통해 이루어진다.
2. '''말단 수리''': 분절된 DNA는 끝부분이 불완전한 경우가 많다. DNA 중합효소를 이용하여 양쪽 끝을 완전한 이중나선 형태로 만든다.
3. '''어댑터 부착''': 시퀀서가 DNA 조각을 인식하고 결합할 수 있도록 특수한 염기서열(어댑터)을 붙인다. 이 어댑터에는 샘플을 구별하는 바코드 정보도 포함될 수 있다.
4. '''라이브러리 제작''': 어댑터가 부착된 DNA 조각들을 라이브러리라고 부른다.
5. '''시퀀싱''': 라이브러리의 어댑터 부위를 이용하여 시퀀서 상에서 대규모 복제를 수행하고, 복제 과정에서 염기가 결합되는 순서를 관측한다. 이때 형광 물질이나 전압 차이를 이용해 염기 서열을 판독한다.
NGS 반응을 위한 템플릿을 준비하는 방법에는 단일 DNA 분자에서 유래된 증폭된 템플릿과 단일 DNA 분자 템플릿을 사용하는 두 가지 방법이 있다. 단일 형광 이벤트를 감지할 수 없는 이미징 시스템의 경우, DNA 템플릿 증폭이 필요한데, 에멀젼 PCR (emPCR), 롤링 서클, 고상 증폭 등이 사용된다.
합성 기반 시퀀싱(SBS)은 DNA 중합효소에 의한 뉴클레오티드 삽입을 감지하여 DNA 샘플의 염기서열을 결정한다. 1993년에 처음 기술되었고,[1] 이후 개선되었다.[30] SBS는 DNA 증폭, 단일 가닥 DNA 생성, 개량된 중합효소를 사용한 뉴클레오티드 삽입 및 감지 등의 단계를 거치며, 이 원리는 454, PacBio, 이온 토렌트, 일루미나, MGI 등 대부분의 대규모 병렬 시퀀싱 기기에 사용된다.
3. 1. DNA 분절화 (Fragmentation)
2021년 현재 DNA를 통째로 분석할 수 있는 차세대 염기서열 분석(NGS) 기기(시퀀서)는 존재하지 않는다. 온전한 DNA는 길이가 2미터에 달하기 때문에[46], 시퀀서가 인식 가능한 크기로 DNA를 자르는 DNA 분절화(Fragmentation) 과정이 필수적이다.
NGS 실험 과정에서 DNA 분절화는 크게 물리적 방법과 효소적 방법으로 나뉜다.3. 2. 말단 수리 (End Repair)
분절화된 DNA 파편들은 완전한 이중나선 구조가 아닌 한쪽 말단의 염기가 부족한 불완전한 구조인 경우가 많다. 이를 균일하게 만들기 위해 DNA 중합효소 등으로 염기서열이 긴 쪽을 잘라내거나 짧은 쪽을 상보적인 염기로 채워넣는다.[46]
3. 3. 어댑터 부착 (Adapter Ligation)
어댑터는 시퀀서에서 인식할 수 있도록 사전에 설계한 특정 염기서열을 가진 올리고뉴클레오타이드이다. 앞서 추가한 말단 아데닌과 상보적으로 결합하는 다수의 티민으로 구성된 결합부위를 갖고 있으며, 이외에도 시퀀스 내 샘플 정보를 대변하는 특정 염기서열인 바코드(barcode)를 지니고 있다.[46] 어댑터 부착이 완료된 DNA 분절은 라이브러리로 불리며, 분석 종류에 따라 PCR을 통한 증폭 및 자성 비드를 통한 정제작업을 거친다.[46]
3. 4. 라이브러리 제작 (Library Preparation)
DNA는 온전한 상태에서 길이가 2미터에 달하며[46], 2021년 현재 이를 통째로 분석할 수 있는 NGS 기기(시퀀서)는 없다. 따라서 시퀀서가 인식 가능한 크기로 DNA를 자르는 DNA 분절화(Fragmentation) 과정이 필수적이다.
DNA 분절화 방법은 크게 물리적 방법과 효소적 방법으로 나뉜다.
분절화된 DNA 파편은 한쪽 말단의 염기가 부족한 불완전한 이중나선 구조인 경우가 많다. 이를 균일하게 만들기 위해 DNA 중합 효소 등을 이용해 염기서열이 긴 쪽을 잘라내거나 짧은 쪽을 상보적인 염기로 채워 넣어 말단 수리를 한다.
말단 수리가 끝난 DNA 파편에는 시퀀서에서 인식할 수 있도록 미리 설계된 특정 염기서열을 가진 올리고뉴클레오타이드인 어댑터를 부착한다. 어댑터는 말단에 추가된 아데닌과 상보적으로 결합하는 다수의 티민으로 구성된 결합 부위를 가지며, 시퀀스 내 샘플 정보를 나타내는 특정 염기서열인 바코드(barcode)도 포함한다. 어댑터가 부착된 DNA 분절은 라이브러리라고 불리며, 분석 종류에 따라 PCR을 통한 증폭 및 자성 비드(magnetic bead)를 이용한 정제 작업을 거친다.
3. 5. 시퀀싱 (Sequencing)
2021년 현재 온전한 상태의 DNA를 통째로 분석할 수 있는 NGS 기기(시퀀서)는 존재하지 않는다. DNA의 길이는 온전한 상태에서 2미터에 달하기 때문에,[46] 시퀀서에서 인식 가능한 크기로 잘라주는 DNA 분절화(Fragmentation) 과정이 필수적으로 요구된다.
일반적인 NGS 실험 과정에서 사용되는 DNA 분절화 방법에는 크게 물리적 방법과 효소적 방법이 있다. 물리적 방법은 DNA가 담긴 샘플 튜브에 물과 같은 매질을 통해 초음파 진동을 가하여 DNA를 분절하는 방식이다. 에너지 세기와 노출 시간을 조절하여 원하는 길이의 DNA 파편을 만들 수 있다. 효소적 방법은 제한 효소를 사용하여 DNA를 자르는 방법으로, DNA를 자르는 동시에 어댑터(Adapter)를 붙이는 과정이 함께 이루어진다. 물리적 방법에 비해 어댑터 부착 단계까지의 여러 과정을 생략할 수 있어 적은 시료로도 가능하다는 장점이 있지만, 효소적 방법은 분절 과정의 시간에 큰 영향을 받고, 시료의 상태가 좋지 않을 경우 균일한 DNA 파편을 만들기 어렵다는 단점이 있다.
분절화된 DNA 파편은 한쪽 말단의 염기가 부족한 불완전한 이중나선 구조인 경우가 많다. 이러한 불완전한 구조를 균일하게 만들기 위해 DNA 중합 효소 등을 이용해 염기서열이 긴 쪽을 잘라내거나 짧은 쪽에 상보적인 염기를 채워 넣어 완전한 이중나선 구조로 만든다.
어댑터는 시퀀서가 인식할 수 있도록 미리 설계된 특정 염기서열을 가진 올리고뉴클레오타이드이다. 어댑터는 추가된 말단 아데닌과 상보적으로 결합하는 다수의 티민으로 구성된 결합 부위를 가지고 있으며, 시퀀스 내 샘플 정보를 나타내는 특정 염기서열인 바코드(barcode)도 포함하고 있다. 어댑터 부착이 완료된 DNA 분절은 라이브러리라고 불리며, 분석 종류에 따라 PCR을 통한 증폭 및 자성 비드(magnetic bead)를 이용한 정제 작업을 거친다.
라이브러리 제작 단계에서 부착된 어댑터 부위는 시퀀서 상의 상보적인 프라이머와 결합하여 대규모 복제를 일으킨다. 대규모 복제 과정은 시퀀서(Sequencer) 생산 업체마다 차이가 있지만, 같은 방향의 단일 염기서열을 다수 복제하는 것을 목적으로 한다는 점은 동일하다. 이후, 정렬된 DNA에 염기가 재조합되는 순서를 관측하는 과정이 이루어진다. 형광 물질이 결합된 염기가 조합될 때 발생하는 빛을 카메라로 촬영하거나, 염기에 따른 전압 차이를 측정하는 방식이 현재 사용되고 있다.
합성 기반 시퀀싱(SBS)의 목표는 DNA 중합효소에 의한 뉴클레오티드의 삽입을 감지하여 DNA 샘플의 시퀀싱을 결정하는 것이다. 합성 기반 시퀀싱의 원리는 1993년에 처음 기술되었고,[1] 몇 년 후에 개선된 내용이 발표되었다.[30] SBS의 핵심 부분은 (1) 후속 신호를 향상시키고 시퀀싱할 DNA를 고체 지지체에 부착하기 위한 DNA 증폭, (2) 고체 지지체에서 단일 가닥 DNA 생성, (3) 개량된 중합효소를 사용한 뉴클레오티드 삽입 및 (4) 뉴클레오티드 삽입 감지를 포함하며, 거의 모든 방식에서 매우 유사하다. 이후 3-4단계를 반복하고 4단계에서 얻은 신호로부터 시퀀스를 조립한다. 이러한 합성 기반 시퀀싱의 원리는 454, PacBio, 이온 토렌트, 일루미나 및 MGI를 포함한 거의 모든 대규모 병렬 시퀀싱 기기에 사용되었다.
4. 분석 방법
차세대 염기서열 분석(NGS)은 기존의 염기서열 분석 방법에 비해 훨씬 빠르고 저렴하게 대량의 DNA 염기서열 정보를 얻을 수 있는 기술이다. NGS는 다양한 분석 방법을 통해 구현되는데, 대표적인 방법들은 다음과 같다.
- 파이로시퀀싱 (Pyrosequencing): 1996년 팔 뉘렌(Pål Nyrén)이 제안한 방법으로, 염기서열이 추가될 때마다 발생하는 빛을 감지하여 염기서열을 분석한다. 로슈 454 시스템에 적용되었다.[47] DNA 조각을 기름방울 안에 넣어 증폭시킨 후, 각 염기에 따라 다른 색깔의 빛을 내는 원리를 이용한다. 1993년에 처음 기술되었으며,[1] DNA 증폭, 단일 가닥 DNA 생성, 조작된 중합효소를 사용한 뉴클레오티드 삽입, 실시간 빛 감지를 통한 뉴클레오티드 검출 등의 핵심 개념을 포함한다. 1998년에는 비삽입 뉴클레오티드를 제거하는 효소(아피라제)를 사용하여 세척 없이 염기서열 분석을 수행할 수 있게 되었다.[30]
- 가역적 염료 터미네이터 시퀀싱 (Reversible Dye Terminator Sequencing): DNA를 유리판에 부착된 프라이머로부터 증폭시켜 DNA 라이브러리 복제본 집락을 형성하고, 형광 염료로 표지된 염기를 이용하여 분석하는 방법이다. 많은 양의 데이터를 얻을 수 있고 오류가 적지만, 분석 가능한 서열의 길이가 짧다는 단점이 있다. 뉴클레오티드 주입, 형광 이미징, 절단의 순환 방식을 사용하며,[31][32][33] 각 dNTP가 추가될 때 형광 표지된 종결제가 이미징된 후 절단되어 다음 염기가 주입될 수 있도록 한다. Solexa 및 일루미나 기기의 기초가 되었다. Helicos BioSciences는 "가상 종결제"라는 차단되지 않은 종결제를 사용하여 DNA 합성이 단일 염기 부가 후 종료되도록 했다.[22][34][35]
- 라이게이션 기반 시퀀싱 (Sequencing by Ligation): DNA 연결효소와 염기로 암호화된 프로브를 사용하여 서열을 연장하는 방식이다. 형광 표지된 프로브가 프라이밍된 주형에 인접한 상보적인 서열에 혼성화되면, DNA 연결효소가 첨가되어 염료 표지된 프로브를 프라이머에 연결한다. 연결되지 않은 프로브는 씻어내고, 연결된 프로브는 형광 영상을 통해 확인한다.
- 실시간 시퀀싱 (Real-time Sequencing): 퍼시픽 바이오사이언스(Pacific Biosciences)에서 개발한 방법으로, DNA 합성이 진행되는 동안 염료 표지된 뉴클레오티드의 삽입을 실시간으로 관찰하여 염기서열을 분석한다.[1][30] 단일 DNA 중합효소 분자가 제로 모드 도파관 검출기(Zmw 검출기) 바닥 표면에 부착되어 서열 정보를 얻는다. 퍼시픽 바이오사이언스는 독특한 DNA 중합효소를 사용하여 단일 리드 정확도가 87%이지만, 다중 킬로베이스 리드 길이에서 컨센서스 정확도가 99.999%에 이른다.[37][38] 2015년에는 시퀀스 처리량을 약 6.5배 증가시킨 시퀄 시스템(Sequel System)을 출시했다.[39][40]
4. 1. 파이로시퀀싱 (Pyrosequencing)
1996년 팔 뉘렌(Pål Nyrén)이 제안한 방법으로 염기서열의 길이가 늘어날 때마다 각 서열이 다른 색을 발생하게 하여 많은 DNA를 동시에 분석하는 방법이며 로슈 454에 적용되었다.[47] 조각난 DNA를 라이브러리로 제작해 각 라이브러리를 일종의 기름방울 안에 넣고 증폭한다.파이로시퀀싱의 원리는 1993년에 처음 기술되었으며,[1] 고체 지지체와 3'에서 5' 엑소뉴클레아제 활성(교정)이 없는 조작된 DNA 중합효소 및 발광 실시간 검출을 반딧불이 루시페라아제를 사용하여 결합하는 방식으로 이루어졌다. 합성 기반 염기 서열 분석의 모든 핵심 개념은 (1) DNA 증폭을 통해 후속 신호를 향상시키고 염기 서열 분석할 DNA(템플릿)를 고체 지지체에 부착, (2) 고체 지지체에서 단일 가닥 DNA 생성, (3) 조작된 중합효소를 사용한 뉴클레오티드 삽입, (4) 실시간으로 빛 감지를 통한 삽입된 뉴클레오티드 검출을 포함하여 소개되었다. 이후 1998년에는 비삽입 뉴클레오티드를 네 번째 효소(아피라제)로 제거하여 비삽입 뉴클레오티드를 제거하기 위한 세척 없이 합성 기반 염기 서열 분석을 수행할 수 있음을 보여주는 기사가 발표되었다.[30]
4. 2. 가역적 염료 터미네이터 시퀀싱 (Reversible Dye Terminator Sequencing)
각 DNA를 유리판에 부착된 프라이머로부터 증폭하는 방법을 이용한다. 이렇게 하면 프라이머 부근에 각 DNA 라이브러리의 복제본이 집락을 이루게 되고 이 집락을 형광 염료로 표지된 염기를 이용해 분석한다. 이 방법은 많은 양의 데이터를 얻는 것이 가능하고 오류가 적다는 장점이 있지만 분석할 수 있는 서열의 길이가 짧다는 단점이 있다.가역적 종결제 화학을 이용한 염기 서열 분석은 뉴클레오티드 주입, 형광 이미징 및 절단의 순환 방식을 사용하는 방법이다.[31][32][33] 각 dNTP가 추가될 때 형광 표지된 종결제가 이미징된 후, 다음 염기의 주입을 허용하기 위해 절단된다.
이 뉴클레오티드는 각 주입이 고유한 사건이 되도록 화학적으로 차단된다. 각 염기 주입 단계 후에 이미징 단계가 이어지고, 차단된 그룹은 화학적으로 제거되어 DNA 중합 효소에 의한 다음 주입을 위해 각 가닥을 준비한다. 이 일련의 단계는 사용자가 정의한 기기 설정에 따라 특정 수의 사이클 동안 계속된다. 3' 차단 그룹은 원래 효소적 또는 화학적 가역으로 고안되었다. 화학적 방법은 Solexa 및 일루미나 기기의 기초가 되었다.
가역적 종결제 화학을 이용한 염기 서열 분석은 Illumina/Solexa에서 사용되는 것과 같은 4색 사이클이거나 Helicos BioSciences에서 사용되는 것과 같은 단일 색상 사이클일 수 있다.
Helicos BioSciences는 억제제 역할을 하는 두 번째 뉴클레오사이드 유사체를 가진 차단되지 않은 종결제인 "가상 종결제"를 사용했다. 이 종결제는 DNA 합성이 단일 염기 부가 후 종료되도록 하는 종결 또는 억제 그룹에 적합한 변형을 가지고 있다.[22][34][35]
4. 3. 라이게이션 기반 시퀀싱 (Sequencing by Ligation)
이 방식에서 서열 연장 반응은 DNA 연결효소와 1개의 염기로 암호화된 프로브 또는 2개의 염기로 암호화된 프로브에 의해 수행된다. 가장 간단한 형태에서 형광 표지된 프로브는 프라이밍된 주형에 인접한 상보적인 서열에 혼성화된다. 그 다음 DNA 연결효소를 첨가하여 염료 표지된 프로브를 프라이머에 연결한다. 연결되지 않은 프로브는 씻어내고, 이어서 연결된 프로브의 정체를 확인하기 위해 형광 영상을 실시한다.이 사이클은 형광 염료를 제거하고 후속 연결 사이클을 위해 5'-PO4 그룹을 재생성하기 위해 절단 가능한 프로브를 사용하거나(연쇄 연결[13][36]), 주형에 새로운 프라이머를 제거하고 혼성화하여 반복할 수 있다(비연쇄 연결[15][16]).
4. 4. 실시간 시퀀싱 (Real-time Sequencing)
퍼시픽 바이오사이언스(Pacific Biosciences)에서 개발한 방법이다. 합성 기반 시퀀싱(SBS)의 목표는 DNA 중합효소에 의한 뉴클레오티드의 삽입을 감지하여 DNA 샘플의 시퀀싱을 결정하는 것이다. 개량된 중합효소를 사용하여 단일 가닥 DNA의 사본을 합성하고 각 뉴클레오티드의 삽입을 모니터링한다.[1][30]실시간 시퀀싱 방식은 DNA 합성이 진행되는 동안 염료 표지된 뉴클레오티드의 연속적인 삽입을 이미지화하는 방식을 포함한다. 개별 포스폴린킹 뉴클레오티드가 성장하는 프라이머 가닥에 삽입되는 동안, 단일 DNA 중합효소 분자가 개별 제로 모드 도파관 검출기(Zmw 검출기)의 바닥 표면에 부착되어 서열 정보를 얻을 수 있다.
퍼시픽 바이오사이언스는 포스폴린킹 뉴클레오티드를 더 잘 통합하고 닫힌 원형 템플릿의 재시퀀싱을 가능하게 하는 독특한 DNA 중합효소를 사용한다. 단일 리드 정확도는 87%이지만, 다중 킬로베이스 리드 길이에서 컨센서스 정확도가 99.999%로 입증되었다.[37][38] 2015년에 퍼시픽 바이오사이언스는 시퀀스 처리량을 약 6.5배 증가시킨 새로운 시퀀싱 장비인 시퀄 시스템(Sequel System)을 출시했다.[39][40]
5. 데이터 분석
질적 정량기준을 통과한 데이터는 이후 유전체를 재조립하는 과정에 부품으로서 사용된다. 이미 제작되어 있는 참조 유전체 상에 read들을 퍼즐처럼 조합시키는 과정이 진행되며, 이를 정렬 또는 매핑이라 한다. 학계에 발표된 참조 유전체가 존재하지 않는 경우 read간의 연결을 통하여 유전체를 조합하는 방법이 있는데, 이는 ''de-novo'' sequencing이라 하며 주로 발굴된 고생물 시료 및 신생물종 연구에서 활용된다. 생성된 유전체는 이후 유전자의 위치, 유전 변이 확인 및 위험성 평가 등을 측정하는 Annotation 과정을 거친다.[54]
5. 1. Read 생성
시퀀서를 통해 전자적으로 읽어진 한 라이브러리의 염기서열 정보를 read라고 부른다. 생성된 read 데이터는 시퀀서로부터 2진수 형태인 BCL 파일로 생성되며, 시퀀서 자체 시스템 또는 bcl2fastq 소프트웨어를 사용하여 fastq 파일 형태로 가공된다. 일반적인 유전체 원시데이터는 이 fastq파일을 뜻한다. 각 fastq파일은 시퀀싱에 사용된 리드(read)의 ID, 시퀀싱 순서 정보, 염기서열 정보, 시퀀싱 질을 나타내는 프레드 품질 점수(Phred Quality Score) 등으로 구성된다.[54]5. 2. Fastq 파일 생성
시퀀서를 통해 전자적으로 읽어진 한 라이브러리의 염기서열 정보를 read라고 부른다. 생성된 read 데이터는 시퀀서로부터 2진수 형태인 BCL 파일로 생성되며 이를 시퀀서 자체 시스템 또는 bcl2fastq 소프트웨어를 사용하여 fastq 파일 형태로 가공된다.[54] 일반적인 유전체 원시데이터는 이 fastq파일을 뜻한다. 각 fastq파일은 시퀀싱에 사용된 리드(read)의 ID 및 시퀀싱 순서 정보, 염기서열 정보, 시퀀싱 질을 나타내는 프레드 품질 점수(Phred Quality Score) 등으로 구성된다.[54]5. 3. 참조 유전체 매핑 (Reference Genome Mapping)
시퀀서를 통해 전자적으로 읽어진 한 라이브러리의 염기서열 정보를 read라고 부른다. 생성된 read 데이터는 시퀀서로부터 2진수 형태인 BCL 파일로 생성되며, 시퀀서 자체 시스템 또는 bcl2fastq 소프트웨어를 사용하여 fastq 파일 형태로 가공된다. 일반적인 유전체 원시데이터는 이 fastq파일을 뜻한다. 각 fastq파일은 시퀀싱에 사용된 리드(read)의 ID, 시퀀싱 순서 정보, 염기서열 정보, 시퀀싱 질을 나타내는 프레드 품질 점수(Phred Quality Score) 등으로 구성된다.질적 정량기준을 통과한 데이터는 이후 유전체를 재조립하는 과정에 부품으로서 사용된다. 이미 제작되어 있는 참조 유전체(Reference Genome) 상에 read들을 퍼즐처럼 조합시키는 과정이 진행되며, 이를 정렬(Alignment) 또는 매핑(Mapping)이라 한다.[54]
5. 4. ''De-novo'' 시퀀싱
시퀀서를 통해 전자적으로 읽어진 한 라이브러리의 염기서열 정보를 read라고 부른다. 생성된 read 데이터는 시퀀서로부터 2진수 형태인 BCL 파일로 생성되며, 이를 시퀀서 자체 시스템 또는 bcl2fastq 소프트웨어를 사용하여 fastq 파일 형태로 가공된다. 일반적인 유전체 원시데이터는 이 fastq파일을 뜻한다. 각 fastq파일은 시퀀싱에 사용된 리드(read)의 ID 및 시퀀싱 순서 정보, 염기서열 정보, 시퀀싱 질을 나타내는 프레드 품질 점수(Phred Quality Score) 등으로 구성된다.질적 정량기준을 통과한 데이터는 이후 유전체를 재조립하는 과정에 부품으로서 사용된다. 이미 제작되어 있는 참조 유전체(Reference Genome) 상에 read들을 퍼즐처럼 조합시키는 과정이 진행되며, 이를 Alignment 또는 Mapping이라 한다. 학계 내 발표된 참조 유전체가 존재하지 않는 경우 read간의 연결을 통하여 유전체를 조합하는 방법이 있는데, 이는 ''de-novo'' sequencing이라 하며 주로 발굴된 고생물 시료 및 신생물종 연구에서 활용된다. 생성된 유전체는 이후 유전자의 위치, 유전 변이 확인 및 위험성 평가 등을 측정하는 Annotation 과정을 거친다.[54]
참조
[1]
논문
Solid Phase DNA Minisequencing by an Enzymatic Luminometric Inorganic Pyrophosphate Detection Assay
https://linkinghub.e[...]
1993-01
[2]
논문
Real-time DNA sequencing using detection of pyrophosphate release
1996-11
[3]
특허
Method of nucleic acid amplification
[4]
특허
Method of nucleic acid sequencing
[5]
논문
Next-generation sequencing: from basic research to diagnostics
2009-04
[6]
논문
Massive parallel sequencing in forensics: advantages, issues, technicalities, and prospects
2020-07
[7]
논문
Next generation DNA sequencing and the future of genomic medicine
2010-05
[8]
논문
Massively parallel sequencing: the next big thing in genetic medicine
2009-08
[9]
논문
Next-generation sequencing: the race is on
2008-03
[10]
웹사이트
2008 Release: NHGRI Seeks DNA Sequencing Technologies Fit for Routine Laboratory and Medical Use
http://www.genome.go[...]
Genome.gov
2012-08-05
[11]
웹사이트
Specifications for HiSeq 2500
http://systems.illum[...]
2014-11-06
[12]
웹사이트
'HiSeq v4 is here… and it delivers | Edinburgh Genomics'
http://genomics.ed.a[...]
2014-11-06
[13]
논문
Sequence and structural variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding
2009-09
[14]
웹사이트
Ion Torrent
http://www.allseq.co[...]
2014-01-01
[15]
논문
Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays
2010-01
[16]
논문
Accurate multiplex polony sequencing of an evolved bacterial genome
2005-09
[17]
논문
Accurate whole-genome sequencing and haplotyping from 10 to 20 human cells
2012-07
[18]
간행물
Pacific Biosciences Introduces New Chemistry With Longer Read Lengths to Detect Novel Features in DNA Sequence and Advance Genome Studies of Large Organisms
https://www.globenew[...]
GlobeNewswire News Room
2013-10-03
[19]
웹사이트
De novo bacterial genome assembly: a solved problem?
http://flxlexblog.wo[...]
2013-07-05
[20]
논문
Next generation sequencing for clinical diagnostics-principles and application to targeted resequencing for hypertrophic cardiomyopathy: a paper from the 2009 William Beaumont Hospital Symposium on Molecular Pathology
2010-09
[21]
서적
Next Generation Sequencing Technologies and Their Applications.
John Wiley & Sons, Ltd
2010-04
[22]
논문
Sequencing technologies - the next generation
2010-01
[23]
논문
Transforming single DNA molecules into fluorescent magnetic particles for detection and enumeration of genetic variations
2003-07
[24]
특허
Replica amplification of nucleic acid arrays
[25]
논문
In situ localized amplification and contact replication of many individual DNA molecules
1999-12
[26]
특허
Nanogrid rolling circle DNA sequencing
[27]
특허
Single molecule arrays for genetic and chemical analysis
[28]
간행물
A very large scale, high throughput and low cost DNA sequencing method based on a new 2-dimensional DNA auto-patterning process
http://www.slideshar[...]
1998-10-07
[29]
특허
Method for performing amplification of nucleic acid with two primers bound to a single solid support
[30]
논문
A Sequencing Method Based on Real-Time Pyrophosphate
https://www.science.[...]
1998-07-17
[31]
특허
Polynucleotide sequencing
[32]
특허
Massive parallel method for decoding DNA and RNA
[33]
논문
Accurate whole human genome sequencing using reversible terminator chemistry
2008-11
[34]
웹사이트
Assay Technology
http://www.illumina.[...]
Illumina
2012-08-05
[35]
웹사이트
True Single Molecule Sequencing (tSMS™): Helicos BioSciences
http://www.helicosbi[...]
Helicosbio.com
2012-08-05
[36]
웹사이트
Fundamentals of 2 Base Encoding and Color Space
http://appliedbiosys[...]
Appliedbiosystems.cnpg.com
2012-08-05
[37]
논문
Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data
2013-06
[38]
웹사이트
PacBio Users Report Progress in Long Reads for Plant Genome Assembly, Tricky Regions of Human Genome
http://www.genomeweb[...]
2013-03-05
[39]
웹사이트
PacBio Launches Higher-Throughput, Lower-Cost Single-Molecule Sequencing System
https://www.genomewe[...]
2015-10
[40]
웹사이트
PacBio Announces Sequel Sequencing System - Bio-IT World
http://www.bio-itwor[...]
[41]
저널
Next-generation sequencing transforms today's biology.
2007
[42]
저널
Next-Generation DNA Sequencing Methods.
2008
[43]
저널
Nucleotide sequence of bacteriophage φX174 DNA.
[44]
저널
Pyrosequencing: History, biochemistry and future.
[45]
웹인용
dna-sequencing-costs
https://www.genome.g[...]
2016-05-05
[46]
서적
McGraw-Hill Encyclopedia of Science and Technology
[47]
저널
Real-time DNA sequencing using detection of pyrophosphate release
[48]
웹인용
보관된 사본
http://systems.illum[...]
2016-05-03
[49]
웹인용
보관된 사본
http://genomics.ed.a[...]
2016-05-03
[50]
저널
Sequence and structural variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding
2009-09
[51]
웹인용
Ion Torrent
http://www.allseq.co[...]
2014-01-01
[52]
뉴스
Pacific Biosciences Introduces New Chemistry With Longer Read Lengths to Detect Novel Features in DNA Sequence and Advance Genome Studies of Large Organisms
http://globenewswire[...]
[53]
웹인용
De novo bacterial genome assembly: a solved problem?
http://flxlexblog.wo[...]
[54]
저널
Challenges and opportunities in understanding microbial communities with metagenome assembly (accompanied by IPython Notebook tutorial).
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com