단일염기 다형성
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
단일 염기 다형성(SNP)은 유전체의 특정 위치에서 나타나는 DNA 서열의 변이로, 유전자의 코딩 및 비코딩 영역, 유전자 간 영역에 위치할 수 있다. SNP는 코딩 영역에서 동의어 및 비동의어 SNP로 구분되며, 비코딩 영역의 SNP는 mRNA 구조 및 유전자 발현에 영향을 줄 수 있다. SNP는 유전체 연구, 맞춤 의학, 법의학 등 다양한 분야에 응용되며, 개인별 유전적 차이를 분석하는 데 활용된다. SNP 분석을 위해 DNA 염기 서열 분석, 모세관 전기 영동 등의 기술이 사용되며, dbSNP와 같은 데이터베이스를 통해 SNP 정보를 얻을 수 있다.
더 읽어볼만한 페이지
- 돌연변이 - 조로증
조로증은 DNA 복구 과정 결함으로 아동기 또는 청소년기에 노화 징후를 보이는 희귀 유전 질환으로, RecQ 헬리카제, NER 단백질, 라민 등 DNA 복구 단백질 유전자 돌연변이가 주요 원인이며, 베르너 증후군, 블룸 증후군, 로스문드-톰슨 증후군, 콕케인 증후군, 색소피부건조증, 허친슨-길포드 프로제리아 증후군 등이 대표적이다. - 돌연변이 - 돌연변이원
돌연변이원은 DNA에 변화를 일으켜 유전독성을 유발하는 물질 또는 방사선으로, 에임스 검사로 검출이 가능하며 암을 비롯한 질병을 유발할 수 있고, 물리적, 화학적, 생물학적 요인 등 다양한 종류가 존재하여 위험성을 줄이기 위한 연구가 진행 중이다. - 집단유전학 - 근친교배
근친교배는 유전적으로 가까운 개체 간의 교배를 의미하며, 유전 질환 발현 가능성을 높이는 등 생물학적 영향과 품종 개량 및 연구에 활용된다. - 집단유전학 - 유전적 부동
유전적 부동은 집단 내 대립형질 빈도가 무작위로 변하는 현상으로, 집단 크기가 작을수록 영향이 커지며 자연 선택과 함께 작용하여 진화에 영향을 미친다. - DNA - 미토콘드리아 DNA
미토콘드리아 DNA(mtDNA)는 세포 호흡에 필수적인 유전 정보를 담고 있는 미토콘드리아 내의 이중 가닥 환상 DNA로서, 동물의 경우 약 16,000개의 염기쌍과 37개의 유전자로 구성되며, 모계 유전, 높은 돌연변이율, 질병 및 노화와의 연관성 등의 특징을 가진다. - DNA - 이중 나선
이중 나선은 DNA의 구조로서, 두 개의 폴리뉴클레오티드 사슬이 반대 방향으로 배열되어 오른손잡이 나선 구조를 이루며, 상보적인 염기쌍이 수소 결합으로 연결되고 주구와 부구라는 고랑을 가지며 다양한 형태가 존재한다.
단일염기 다형성 | |
---|---|
정의 | |
설명 | DNA 서열에서 하나의 뉴클레오타이드 염기 서열에 차이가 있는 유전적 변이의 한 형태 |
다른 이름 | 단일 뉴클레오타이드 변이 (SNV) |
특징 | |
정의 | 게놈 DNA의 단일 뉴클레오티드 위치에서 발생하는 흔한 변이 |
조건 | 모집단에서 1% 이상의 빈도로 나타나야 함 |
위치 | 단백질 코딩 영역 비코딩 영역 |
중요성 | |
유전적 변이 | 가장 흔한 형태의 유전적 변이 중 하나 |
표현형 영향 | 질병 감수성, 약물 반응, 기타 표현형 특성에 영향 |
활용 | |
연구 분야 | 질병 연관성 연구 약물 유전체학 개인 맞춤 의학 |
2. 유형
단일 염기 다형성은 유전자의 코딩 서열, 유전자의 비코딩 영역, 또는 유전자 간 영역 (유전자 사이의 영역) 내에 위치할 수 있다. 코딩 서열 내의 SNP는 유전 부호의 퇴화로 인해 생성되는 아미노산 서열에 반드시 영향을 미치지는 않는다.[15]
코딩 영역의 SNP는 동의어 SNP와 비동의어 SNP의 두 가지 유형이 있다.[16] 동의어 SNP는 단백질 서열에 영향을 미치지 않지만 비동의어 SNP는 단백질의 아미노산 서열을 변경한다.[16]
- 코딩 영역의 SNP:
- * 동의어 치환은 정의상 단백질의 아미노산 변화를 초래하지 않지만, 다른 방식으로 기능에 영향을 미칠 수 있다. 한 가지 예는 세포에서 약물을 배출하는 세포막 펌프를 코딩하는 다약제 내성 유전자 1 (MDR1)의 겉보기에는 침묵하는 돌연변이가 번역을 늦추고 펩타이드 사슬이 비정상적인 컨포메이션으로 접히게 하여 돌연변이 펌프의 기능을 저하시키는 것이다(예: MDR1 단백질에서 C1236T 다형성은 폴리펩타이드의 아미노산 위치 412에서 GGC 코돈을 GGT로 변경합니다(둘 다 글리신을 코딩함) 그리고 C3435T 다형성은 위치 1145에서 ATC를 ATT로 변경합니다(둘 다 이소류신을 코딩함)).[19]
- * 비동의어 치환:
- ** 미스센스 돌연변이 – 염기의 단일 변화로 인해 단백질의 아미노산이 변경되고 기능이 제대로 작동하지 않아 질병을 유발합니다(예: LMNA 유전자의 c.1580G>T SNP – DNA 서열에서 위치 1580 (nt)(CGT 코돈)은 구아닌이 티민으로 대체되어 DNA 서열에서 CTT 코돈을 생성하며, 단백질 수준에서 아르기닌이 위치 527에서 류신으로 대체됩니다,[20] 표현형 수준에서 이는 하악관절 이형성증과 조로증 증후군의 중첩으로 나타납니다.)
- ** 넌센스 돌연변이 – 조기 종결 코돈, 또는 전사된 mRNA의 "넌센스 코돈"을 초래하는 DNA 서열의 점 돌연변이이며, 절단된 불완전하고 일반적으로 기능이 없는 단백질 산물을 생성합니다(예: 낭성 섬유증 투과도 조절 인자 유전자의 G542X 돌연변이로 인한 낭성 섬유증).[21]
비코딩 영역의 단일염기 다형성(SNP)은 암 발생 위험을 높일 수 있으며,[17] mRNA 구조 및 질병 감수성에 영향을 줄 수 있다.[18] 또한 비코딩 SNP는 발현 수준을 변경할 수 있는데, 이는 eQTL (발현 정량적 특성 유전자좌)이다.
단백질 코딩 영역에 없는 SNP는 유전자 스플라이싱, 전사 인자 결합, 메신저 RNA 분해 또는 비코딩 RNA 서열에 영향을 미칠 수 있다. 이러한 유형의 SNP에 의해 영향을 받는 유전자 발현은 eSNP(발현 SNP)라고 하며 유전자 상류 또는 하류에 있을 수 있다.
2. 1. 코딩 영역의 SNP
단일 염기 다형성은 유전자의 코딩 서열, 유전자의 비코딩 영역, 또는 유전자 간 영역 (유전자 사이의 영역) 내에 위치할 수 있다. 코딩 서열 내의 SNP는 유전 부호의 퇴화로 인해 생성되는 아미노산 서열에 반드시 영향을 미치지는 않는다.[15]
코딩 영역의 SNP는 동의어 SNP와 비동의어 SNP의 두 가지 유형이 있다.[16] 동의어 SNP는 단백질 서열에 영향을 미치지 않지만 비동의어 SNP는 단백질의 아미노산 서열을 변경한다.[16]
- 코딩 영역의 SNP:
- * 동의어 치환은 정의상 단백질의 아미노산 변화를 초래하지 않지만, 다른 방식으로 기능에 영향을 미칠 수 있다. 한 가지 예는 세포에서 약물을 배출하는 세포막 펌프를 코딩하는 다약제 내성 유전자 1 (MDR1)의 겉보기에는 침묵하는 돌연변이가 번역을 늦추고 펩타이드 사슬이 비정상적인 컨포메이션으로 접히게 하여 돌연변이 펌프의 기능을 저하시키는 것이다(예: MDR1 단백질에서 C1236T 다형성은 폴리펩타이드의 아미노산 위치 412에서 GGC 코돈을 GGT로 변경합니다(둘 다 글리신을 코딩함) 그리고 C3435T 다형성은 위치 1145에서 ATC를 ATT로 변경합니다(둘 다 이소류신을 코딩함)).[19]
- * 비동의어 치환:
- ** 미스센스 돌연변이 – 염기의 단일 변화로 인해 단백질의 아미노산이 변경되고 기능이 제대로 작동하지 않아 질병을 유발합니다(예: LMNA 유전자의 c.1580G>T SNP – DNA 서열에서 위치 1580 (nt)(CGT 코돈)은 구아닌이 티민으로 대체되어 DNA 서열에서 CTT 코돈을 생성하며, 단백질 수준에서 아르기닌이 위치 527에서 류신으로 대체됩니다,[20] 표현형 수준에서 이는 하악관절 이형성증과 조로증 증후군의 중첩으로 나타납니다.)
- ** 넌센스 돌연변이 – 조기 종결 코돈, 또는 전사된 mRNA의 "넌센스 코돈"을 초래하는 DNA 서열의 점 돌연변이이며, 절단된 불완전하고 일반적으로 기능이 없는 단백질 산물을 생성합니다(예: 낭성 섬유증 투과도 조절 인자 유전자의 G542X 돌연변이로 인한 낭성 섬유증).[21]
2. 1. 1. 비동의 SNP
코딩 영역의 SNP에는 두 종류가 있다. 하나는 synonymous SNP이고 다른 하나는 nonsynonymous SNP이다. synonymous SNP는 단백질의 배열에 영향을 미치지 않는다. 반면 nonsynonymous SNP는 단백질의 아미노산 배열을 변화시킨다.2. 1. 2. 동의 SNP
wikitext코딩 영역의 SNP에는 동의(synonymous) SNP와 비동의(nonsynonymous) SNP의 두 종류가 있다. 동의 SNP는 단백질의 배열에 영향을 미치지 않는다. 반면 비동의 SNP는 단백질의 아미노산 배열을 변화시킨다.
2. 2. 비코딩 영역의 SNP
비코딩 영역의 단일염기 다형성(SNP)은 암 발생 위험을 높일 수 있으며,[17] mRNA 구조 및 질병 감수성에 영향을 줄 수 있다.[18] 또한 비코딩 SNP는 발현 수준을 변경할 수 있는데, 이는 eQTL (발현 정량적 특성 유전자좌)이다.
단백질 코딩 영역에 없는 SNP는 유전자 스플라이싱, 전사 인자 결합, 메신저 RNA 분해 또는 비코딩 RNA 서열에 영향을 미칠 수 있다. 이러한 유형의 SNP에 의해 영향을 받는 유전자 발현은 eSNP(발현 SNP)라고 하며 유전자 상류 또는 하류에 있을 수 있다.
2. 3. 유전자 간 영역의 SNP
단일 염기 다형성은 유전자의 코딩 영역, 유전자의 비코딩 영역, 유전자 간 영역 중 어느 곳에나 존재한다.
3. 빈도
인류 전체에서 6억 개 이상의 단일 염기 다형성이 확인되었다.[22] 일반적인 유전체는 참조 인간 유전체와 400만~500만 개의 위치에서 다르며, 그중 대부분(99.9% 이상)이 단일 염기 다형성 및 짧은 삽입-결손으로 구성된다.[23]
게놈 내 분포게놈 내 SNP 분포는 균일하지 않으며, SNP는 비암호화 DNA에서 암호화 영역보다 더 자주 발생한다.[24] 일반적으로 자연 선택이 작용하여 가장 유리한 유전적 적응을 구성하는 SNP의 대립 유전자를 "고정"하는(다른 변이를 제거하는) 영역에서 발생한다.[24] 유전자 재조합 및 돌연변이율과 같은 다른 요인들도 SNP 밀도를 결정할 수 있다.[25]
SNP 밀도는 마이크로새틀라이트의 존재로 예측할 수 있다. 특히 AT 마이크로새틀라이트는 SNP 밀도의 강력한 예측 인자이며, 긴 (AT)(n) 반복 서열은 현저하게 감소된 SNP 밀도와 낮은 GC 함량을 갖는 영역에서 발견되는 경향이 있다.[26]
인구 집단 간 변이인간 집단 간에는 변이가 존재하여, 특정 지리적 또는 민족 집단에서 흔한 SNP 대립유전자가 다른 집단에서는 드물게 나타날 수 있다. 그러나 이러한 변이 패턴은 비교적 드물다. 인간 게놈 다양성 프로젝트는 6,730만 개의 SNP에 대한 전 세계 샘플에서 "특정 대륙이나 주요 지역에서 고정된 사적인 변이를 발견하지 못했다. 아프리카, 아메리카, 오세아니아에서는 70% 이상(그리고 수천 개는 50% 이상)의 빈도로 나타나는 수십 개의 변이가 가장 높은 빈도에 도달한다. 반면 유럽, 동아시아, 중동, 또는 중앙 및 남아시아에만 있는 변이의 가장 높은 빈도는 10~30%에 불과하다."[27]
개체군 내에서 SNP는 특정 개체군에서 관찰되는 유전자 자리의 가장 낮은 대립유전자 빈도인 최소 대립유전자 빈도(MAF)를 할당받을 수 있다.[28] 이는 단일 염기 다형성에 대한 두 대립유전자 빈도 중 더 작은 값이다.
이러한 지식을 바탕으로 과학자들은 연구가 덜 된 종에서 개체군 구조를 분석하는 새로운 방법을 개발했다.[29][30][31] 풀링 기술을 사용하면 분석 비용이 현저히 낮아진다. 이러한 기술은 개체군 내의 모든 개체를 개별적으로 시퀀싱하는 대신 풀링된 샘플에서 개체군을 시퀀싱하는 것을 기반으로 한다. 새로운 생물정보학 도구를 통해 전체 개체군 내에서 대립유전자 빈도를 관찰함으로써 개체군 구조, 유전자 흐름 및 유전자 이동을 조사할 수 있다. 이러한 프로토콜을 통해 SNP의 장점과 마이크로 위성 마커를 결합할 수 있는 가능성이 있다.[32][33]
3. 1. 게놈 내 분포
게놈 내 SNP 분포는 균일하지 않으며, SNP는 비암호화 DNA에서 암호화 영역보다 더 자주 발생한다.[24] 일반적으로 자연 선택이 작용하여 가장 유리한 유전적 적응을 구성하는 SNP의 대립 유전자를 "고정"하는(다른 변이를 제거하는) 영역에서 발생한다.[24] 유전자 재조합 및 돌연변이율과 같은 다른 요인들도 SNP 밀도를 결정할 수 있다.[25]SNP 밀도는 마이크로새틀라이트의 존재로 예측할 수 있다. 특히 AT 마이크로새틀라이트는 SNP 밀도의 강력한 예측 인자이며, 긴 (AT)(n) 반복 서열은 현저하게 감소된 SNP 밀도와 낮은 GC 함량을 갖는 영역에서 발견되는 경향이 있다.[26]
3. 2. 인구 집단 간 변이
인간 집단 간에는 변이가 존재하여, 특정 지리적 또는 민족 집단에서 흔한 SNP 대립유전자가 다른 집단에서는 드물게 나타날 수 있다. 그러나 이러한 변이 패턴은 비교적 드물다. 인간 게놈 다양성 프로젝트는 6,730만 개의 SNP에 대한 전 세계 샘플에서 "특정 대륙이나 주요 지역에서 고정된 사적인 변이를 발견하지 못했다. 아프리카, 아메리카, 오세아니아에서는 70% 이상(그리고 수천 개는 50% 이상)의 빈도로 나타나는 수십 개의 변이가 가장 높은 빈도에 도달한다. 반면 유럽, 동아시아, 중동, 또는 중앙 및 남아시아에만 있는 변이의 가장 높은 빈도는 10~30%에 불과하다."[27]개체군 내에서 SNP는 특정 개체군에서 관찰되는 유전자 자리의 가장 낮은 대립유전자 빈도인 최소 대립유전자 빈도(MAF)를 할당받을 수 있다.[28] 이는 단일 염기 다형성에 대한 두 대립유전자 빈도 중 더 작은 값이다.
이러한 지식을 바탕으로 과학자들은 연구가 덜 된 종에서 개체군 구조를 분석하는 새로운 방법을 개발했다.[29][30][31] 풀링 기술을 사용하면 분석 비용이 현저히 낮아진다. 이러한 기술은 개체군 내의 모든 개체를 개별적으로 시퀀싱하는 대신 풀링된 샘플에서 개체군을 시퀀싱하는 것을 기반으로 한다. 새로운 생물정보학 도구를 통해 전체 개체군 내에서 대립유전자 빈도를 관찰함으로써 개체군 구조, 유전자 흐름 및 유전자 이동을 조사할 수 있다. 이러한 프로토콜을 통해 SNP의 장점과 마이크로 위성 마커를 결합할 수 있는 가능성이 있다.[32][33]
4. 응용
단일 핵산염기 다형현상은 각 개인마다 많은 변이를 보이는 부분이므로 DNA 지문 분석에 주로 이용된다.[73]
; 유전체 연구
: 단일염기 다형성(SNP)이 임상 연구에 기여하는 주요 부분 중 하나는 GWAS이다.[38] GWAS는 질병 또는 임상 표현형이나 특성과 관련된 SNP를 식별하는 데 일반적으로 사용된다.
: 후보 유전자 연관 연구는 고처리량 유전자형 분석 또는 시퀀싱 기술이 발명되기 전에 유전학 연구에 일반적으로 사용되었다.[39] 소수의 SNP만 검사되므로 연관성을 감지하기에 비교적 작은 표본 크기가 충분하다. 후보 유전자 연관 접근 방식은 또한 독립적인 표본에서 GWAS의 결과를 확인하는 데에도 일반적으로 사용된다.
: 전체 유전체 SNP 데이터는 동형접합성 매핑에 사용될 수 있다.[40] 동형접합성 매핑은 질병 발병 기전에 관련된 유전체 영역 또는 유전자를 매핑하는 강력한 도구가 될 수 있는, 동형접합성 열성 유전자 좌위를 식별하는 데 사용되는 방법이다.
; 맞춤 의학
: 인간의 DNA 염기 서열 변이는 질병, 병원체, 화학 물질, 약물, 백신 및 기타 제제에 대한 반응 방식에 영향을 미칠 수 있다.[37] 단일 염기 다형성(SNP)은 맞춤 의학에 매우 중요하다.[37]
: 약물유전학은 치료 반응의 차이와 관련된 SNP를 포함한 유전적 변이를 식별하는 데 중점을 둔다.[46] 약물 대사 효소 활성에 관련된 SNP는 약물 약동학을 변화시킬 수 있으며, 약물 표적 또는 그 경로에 관련된 SNP는 약물 약력학을 변화시킬 수 있다. 따라서 SNP는 약물 노출 또는 치료 효과를 예측하는 데 사용될 수 있는 잠재적인 유전적 마커이다.
: SNP는 Single Nucleotide Polymorphism의 약자이지만, 실제로 이 용어가 사용되는 상황에서는 1염기에 국한되지 않고, 2염기에서 수십 염기 정도의 짧은 치환, 삽입, 결실을 포함하는 데이터를 가리키는 경우도 많다.[72] 또한, 1% 이상의 빈도를 가진 것을 SNP라고 부르는 규칙도 지침이며, 현재는 1%를 임계값으로 하는 경우가 많지만, 5%가 지침으로 여겨지는 경우도 있다.[72]
: 사람의 염색체에는 약 30억 개의 염기쌍이 있지만, 그 배열은 개인 간(상동 염색체 간)에 따라 다르다. SNP를 DNA 마커로 이용하면 유전적 배경을 조사할 수 있으며, 원인 유전자가 밝혀진 유전병에 대해서는, 미래의 위험률도 진단할 수 있다. 또한, SNP를 이용한 연관분석을 통해 질병 관련 유전자를 특정할 수 있다.
: 알코올에 대한 강함 등 유전적인 요인은, 주로 알데히드 탈수소 효소 유전자 ''ALDH2''의 SNP에 의존하는 것으로 알려져 있다. 효소 시토크롬 P450(CYP) 패밀리 및 항결핵약 아이소니아지드의 대사에 관여하는 ''N''-acetyltransferase 2(NAT-2), 경구용 항응고제 와파린 효과의 강도에 크게 영향을 미치는 ''CYP2C9'' 및 ''VKORC1''등이 그 예이다. 이러한 유전자에서 그 효소 활성을 저하시키는 SNP가 있으면, 약물의 혈중 농도가 오랫동안 높게 유지된 결과, 효과가 강하게 발현되거나, 유독한 중간 대사 산물이 축적될 수 있다. 또한, 약물이 제대로 작용하지 못하는 SNP가 있으면, 투약량을 늘리는 등의 처치가 필요하게 된다. 그래서, 투약 전에 이러한 유전자의 SNP를 검사하고, 그 유전자의 타입으로부터 판단하여 적절한 약물 투약량을 결정하는 등, 부작용을 회피하고, 효율적인 치료 효과를 얻으려는 의료는 "맞춤 의료"라고 불린다.
; 법의학
: 단일 핵산염기 다형현상은 각 개인마다 많은 변이를 보이는 부분이므로 DNA 지문 분석에 주로 이용된다.[73] 차세대 염기 서열 분석(NGS) 기술의 개발로 민족, 모발 색상, 눈 색상과 같은 표현형 단서에 SNP을 사용할 수 있게 되었다.
: SNP는 잠재적인 마커가 풍부하고, 완전히 자동화될 수 있으며, 필요한 절편 길이를 100bp 미만으로 줄일 수 있다.[26]
4. 1. 유전체 연구
단일염기 다형성(SNP)이 임상 연구에 기여하는 주요 부분 중 하나는 전장 유전체 연관성 분석(GWAS)이다.[38] 전장 유전체 유전 데이터는 SNP array 및 전체 유전자 시퀀싱을 포함한 여러 기술로 생성될 수 있다. GWAS는 질병 또는 임상 표현형이나 특성과 관련된 SNP를 식별하는 데 일반적으로 사용된다. GWAS는 전장 유전체 평가이므로 가능한 모든 연관성을 감지하기에 충분한 통계적 검정력을 얻으려면 대규모 표본 크기가 필요하다. 일부 SNP는 질병 또는 임상 표현형이나 특성에 비교적 작은 영향을 미친다. 연구 검정력을 추정하기 위해 우성, 열성 또는 가산 효과와 같은 질병에 대한 유전 모델을 고려해야 한다. 유전적 이질성으로 인해 GWAS 분석은 인종에 따라 조정되어야 한다.후보 유전자 연관 연구는 고처리량 유전자형 분석 또는 시퀀싱 기술이 발명되기 전에 유전학 연구에 일반적으로 사용되었다.[39] 후보 유전자 연관 연구는 질병 또는 임상 표현형 또는 특성과 관련된, 미리 지정된 소수의 단일 염기 다형성(SNP)을 조사하는 것이다. 따라서 이는 가설 기반 접근 방식이다. 소수의 SNP만 검사되므로 연관성을 감지하기에 비교적 작은 표본 크기가 충분하다. 후보 유전자 연관 접근 방식은 또한 독립적인 표본에서 GWAS의 결과를 확인하는 데에도 일반적으로 사용된다.
전체 유전체 SNP 데이터는 동형접합성 매핑에 사용될 수 있다.[40] 동형접합성 매핑은 질병 발병 기전에 관련된 유전체 영역 또는 유전자를 매핑하는 강력한 도구가 될 수 있는, 동형접합성 열성 유전자 좌위를 식별하는 데 사용되는 방법이다.
4. 2. 맞춤 의학
인간의 DNA 염기 서열 변이는 질병, 병원체, 화학 물질, 약물, 백신 및 기타 제제에 대한 반응 방식에 영향을 미칠 수 있다.[37] 단일 염기 다형성(SNP)은 맞춤 의학에 매우 중요하다.[37]약물유전학은 치료 반응의 차이와 관련된 SNP를 포함한 유전적 변이를 식별하는 데 중점을 둔다.[46] 많은 약물 대사 효소, 약물 표적 또는 표적 경로는 SNP의 영향을 받을 수 있다. 약물 대사 효소 활성에 관련된 SNP는 약물 약동학을 변화시킬 수 있으며, 약물 표적 또는 그 경로에 관련된 SNP는 약물 약력학을 변화시킬 수 있다. 따라서 SNP는 약물 노출 또는 치료 효과를 예측하는 데 사용될 수 있는 잠재적인 유전적 마커이다. 유전체 전체 약물유전학 연구는 약물유전체학이라고 한다. 약물유전학과 약물유전체학은 정밀 의학, 특히 암과 같은 생명을 위협하는 질병의 발전에 중요하다.
SNP는 Single Nucleotide Polymorphism의 약자이지만, 실제로 이 용어가 사용되는 상황에서는 1염기에 국한되지 않고, 2염기에서 수십 염기 정도의 짧은 치환, 삽입, 결실을 포함하는 데이터를 가리키는 경우도 많다.[72] 또한, 1% 이상의 빈도를 가진 것을 SNP라고 부르는 규칙도 지침이며, 현재는 1%를 임계값으로 하는 경우가 많지만, 5%가 지침으로 여겨지는 경우도 있다.[72]
사람의 염색체에는 약 30억 개의 염기쌍이 있지만, 그 배열은 개인 간(상동 염색체 간)에 따라 다르다. SNP를 DNA 마커로 이용하면 유전적 배경을 조사할 수 있으며, 원인 유전자가 밝혀진 유전병에 대해서는, 미래의 위험률도 진단할 수 있다. 또한, SNP를 이용한 연관분석을 통해 질병 관련 유전자를 특정할 수 있다.
알코올에 대한 강함 등 유전적인 요인은, 주로 알데히드 탈수소 효소 유전자 ''ALDH2''의 SNP에 의존하는 것으로 알려져 있다. 많은 약물 대사에 관여하는 효소 시토크롬 P450(CYP) 패밀리 및 항결핵약 아이소니아지드의 대사에 관여하는 ''N''-acetyltransferase 2(NAT-2), 경구용 항응고제 와파린 효과의 강도에 크게 영향을 미치는 ''CYP2C9'' 및 ''VKORC1''등이 있다. 이러한 유전자에서 그 효소 활성을 저하시키는 SNP가 있으면, 약물의 혈중 농도가 오랫동안 높게 유지된 결과, 효과가 강하게 발현되거나, 유독한 중간 대사 산물이 축적될 수 있다. 또한, 약물이 제대로 작용하지 못하는 SNP가 있으면, 투약량을 늘리는 등의 처치가 필요하게 된다. 그래서, 투약 전에 이러한 유전자의 SNP를 검사하고, 그 유전자의 타입으로부터 판단하여 적절한 약물 투약량을 결정하는 등, 부작용을 회피하고, 효율적인 치료 효과를 얻으려는 의료는 "맞춤 의료"라고 불린다.
4. 3. 법의학
단일 핵산염기 다형현상은 각 개인마다 많은 변이를 보이는 부분이므로 DNA 지문 분석에 주로 이용된다.[73] 역사적으로 법의학적 DNA 샘플과 용의자를 대조하는 데 단일 염기 다형성(SNP)이 사용되었지만, STR 기반의 DNA 지문 분석 기술이 발전하면서 사용이 중단되었다. 그러나 차세대 염기 서열 분석(NGS) 기술의 개발로 민족, 모발 색상, 눈 색상과 같은 표현형 단서에 SNP을 사용할 수 있게 되었다. 이는 STR DNA 프로파일링 일치가 없더라도 용의자를 식별하는 데 도움이 될 수 있다.SNP을 STR에 비해 사용하는 단점 중 일부는 SNP이 STR보다 적은 정보를 제공하므로 더 많은 SNP을 분석해야 한다는 것이다. 또한, SNP은 샘플의 비교 분석을 위한 데이터베이스의 존재에 크게 의존한다. 그러나, 열화되거나 소량의 샘플의 경우, SNP 기술은 STR 방법에 대한 훌륭한 대안이다. SNP는 잠재적인 마커가 풍부하고, 완전히 자동화될 수 있으며, 필요한 절편 길이를 100bp 미만으로 줄일 수 있다.[26]
4. 4. 기타
5. 대한민국에서의 SNP 연구
6. SNP 관련 데이터베이스
생물정보학 데이터베이스는 단일 염기 다형성(SNP)에 대해서도 존재한다.[56][57]
- '''dbSNP'''는 국립 생명공학 정보 센터(NCBI)의 SNP 데이터베이스이다. 2015년 6월 8일 기준으로 dbSNP는 인간의 149,735,377개의 SNP를 목록으로 제공한다.[56][57]
- '''[http://db.systemsbiology.net/kaviar/ Kaviar]'''는[58] dbSNP를 포함한 여러 데이터 소스의 SNP를 종합한 것이다.
- '''SNPedia'''는 개인 유전자체 주석, 해석 및 분석을 지원하는 위키 스타일 데이터베이스이다.
- '''OMIM''' 데이터베이스는 다형성과 질병 간의 연관성을 설명한다(예: 텍스트 형식으로 질병 제공).
- '''dbSAP''' – 단백질 변이 탐지를 위한 단일 아미노산 다형성 데이터베이스[59]
- '''Human Gene Mutation Database'''는 인간의 유전 질환 및 기능적 SNP를 유발하거나 관련시키는 유전자 변이를 제공한다.
- 연구자들이 각 대상에서 발견되는 haplotype 집합을 결정할 수 있도록 Tag SNP를 식별하고 있는 국제 HapMap 프로젝트.
- '''GWAS Central'''을 통해 사용자는 하나 이상의 전장 유전체 연관 연구에서 실제 요약 수준의 연관 데이터를 시각적으로 조사할 수 있다.
국제 SNP 맵 작업 그룹은 Genebank의 대형 삽입 클론의 유전체 서열에 정렬하여 각 SNP의 주변 서열을 매핑했다. 이러한 정렬은 아래 표에 표시된 염색체 좌표로 변환되었다.[60] Kaviar 데이터베이스는 현재 1억 6천 2백만 개의 단일 뉴클레오티드 변이체(SNV)를 나열하고 있다.
염색체 | 길이(bp) | 전체 SNP | TSC SNP | ||
---|---|---|---|---|---|
전체 SNP | SNP당 kb | 전체 SNP | SNP당 kb | ||
1 | 214,066,000 | 129,931 | 1.65 | 75,166 | 2.85 |
2 | 222,889,000 | 103,664 | 2.15 | 76,985 | 2.90 |
3 | 186,938,000 | 93,140 | 2.01 | 63,669 | 2.94 |
4 | 169,035,000 | 84,426 | 2.00 | 65,719 | 2.57 |
5 | 170,954,000 | 117,882 | 1.45 | 63,545 | 2.69 |
6 | 165,022,000 | 96,317 | 1.71 | 53,797 | 3.07 |
7 | 149,414,000 | 71,752 | 2.08 | 42,327 | 3.53 |
8 | 125,148,000 | 57,834 | 2.16 | 42,653 | 2.93 |
9 | 107,440,000 | 62,013 | 1.73 | 43,020 | 2.50 |
10 | 127,894,000 | 61,298 | 2.09 | 42,466 | 3.01 |
11 | 129,193,000 | 84,663 | 1.53 | 47,621 | 2.71 |
12 | 125,198,000 | 59,245 | 2.11 | 38,136 | 3.28 |
13 | 93,711,000 | 53,093 | 1.77 | 35,745 | 2.62 |
14 | 89,344,000 | 44,112 | 2.03 | 29,746 | 3.00 |
15 | 73,467,000 | 37,814 | 1.94 | 26,524 | 2.77 |
16 | 74,037,000 | 38,735 | 1.91 | 23,328 | 3.17 |
17 | 73,367,000 | 34,621 | 2.12 | 19,396 | 3.78 |
18 | 73,078,000 | 45,135 | 1.62 | 27,028 | 2.70 |
19 | 56,044,000 | 25,676 | 2.18 | 11,185 | 5.01 |
20 | 63,317,000 | 29,478 | 2.15 | 17,051 | 3.71 |
21 | 33,824,000 | 20,916 | 1.62 | 9,103 | 3.72 |
22 | 33,786,000 | 28,410 | 1.19 | 11,056 | 3.06 |
X | 131,245,000 | 34,842 | 3.77 | 20,400 | 6.43 |
Y | 21,753,000 | 4,193 | 5.19 | 1,784 | 12.19 |
RefSeq | 15,696,674 | 14,534 | 1.08 | ||
합계 | 2,710,164,000 | 1,419,190 | 1.91 | 887,450 | 3.05 |
7. SNP 분석 방법
SNP는 두 개의 가능한 대립 유전자와 두 대립 유전자를 포함하는 세 가지 가능한 유전자형(A 동형 접합체, B 동형 접합체, AB 이형 접합체) 만을 포함하기 때문에 쉽게 분석할 수 있으며, 이는 분석을 위한 많은 가능한 기술로 이어진다. 다음은 그 중 일부이다. DNA 염기 서열 분석, 모세관 전기 영동, 질량 분석법, 단일 가닥 컨포메이션 다형성(SSCP), 단일 염기 연장, 전기 화학적 분석, 변성 HPLC 및 젤 전기 영동, 제한 효소 절편 길이 다형성, 혼성화 분석 분석 등이 활용된다.
8. SNP 명명법
단일 염기 다형성(SNP) 명명법은 개별 SNP에 대한 몇 가지 변형을 포함하지만 공통된 합의는 부족하다.
rs### 표준은 dbSNP가 채택한 것으로, "참조 SNP"를 의미하는 "rs" 접두사와 고유하고 임의의 숫자가 뒤따른다.[61] SNP는 위의 예와 같이 dbSNP rs 번호로 자주 언급된다.
인간 게놈 변이 협회(HGVS)는 SNP에 대한 더 많은 정보를 전달하는 표준을 사용한다. 예시는 다음과 같다.
참조
[1]
웹사이트
single-nucleotide polymorphism / SNP {{!}} Learn Science at Scitable
http://www.nature.co[...]
2015-11-13
[2]
논문
dbSNP—Database for Single Nucleotide Polymorphisms and Other Classes of Minor Genetic Variation
[3]
논문
Initial sequencing and analysis of the human genome
[4]
논문
A global reference for human genetic variation
[5]
논문
ASPsiRNA: A Resource of ASP-siRNAs Having Therapeutic Potential for Human Genetic Disorders and Algorithm for Prediction of Their Inhibitory Efficacy
2017-09
[6]
논문
Complement factor H and related proteins in age-related macular degeneration
https://comptes-rend[...]
2014-03
[7]
논문
APOE and Alzheimer's Disease: From Lipid Transport to Physiopathology and Therapeutics
2021-02-17
[8]
웹사이트
Definition of single nucleotide variant - NCI Dictionary of Genetics Terms
https://www.cancer.g[...]
2023-05-02
[9]
서적
eLS
Wiley
2005-09-23
[10]
논문
SNVMix: predicting single nucleotide variants from next-generation sequencing of tumors
[11]
논문
Single nucleotide variations: Biological impact and theoretical interpretation
2014-10-20
[12]
논문
Role of non-coding sequence variants in cancer
2016-01-19
[13]
논문
Defining "mutation" and "polymorphism" in the era of personal genomics
Springer Science and Business Media LLC
2015-07-15
[14]
웹사이트
SNP vs SNV
http://lh3.github.io[...]
2023-05-03
[15]
논문
Genetic code redundancy and its influence on the encoded polypeptides
2012
[16]
논문
Nonsynonymous, synonymous and nonsense mutations in human cancer-related genes undergo stronger purifying selections than expectation
2019-04-16
[17]
논문
Regulatory Variants and Disease: The E-Cadherin -160C/A SNP as an Example
2014
[18]
논문
IFNL3 mRNA structure is remodeled by a functional non-coding polymorphism associated with hepatitis C virus clearance
2015-11
[19]
논문
A "silent" polymorphism in the MDR1 gene changes substrate specificity
https://zenodo.org/r[...]
2007-01
[20]
논문
A novel homozygous p.Arg527Leu LMNA mutation in two unrelated Egyptian families causes overlapping mandibuloacral dysplasia and progeria syndrome
2012-11
[21]
논문
CFTR mutation analysis and haplotype associations in CF patients
2012-02
[22]
웹사이트
What are single nucleotide polymorphisms (SNPs)?: MedlinePlus Genetics
https://medlineplus.[...]
2023-03-22
[23]
논문
A global reference for human genetic variation
2015-10
[24]
논문
Natural selection has driven population differentiation in modern humans
2008-03
[25]
논문
Single nucleotide polymorphisms and recombination rate in humans
2001-09
[26]
논문
Heterogeneous distribution of SNPs in the human genome: microsatellites as predictors of nucleotide diversity and divergence
2010-03
[27]
논문
Insights into human genetic variation and population history from 929 diverse genomes.
[28]
논문
Enrichment of Minor Alleles of Common SNPs and Improved Risk Prediction for Parkinson's Disease
2015-07-24
[29]
논문
Measuring Genetic Differentiation from Pool-seq Data
2018-07-30
[30]
논문
Applications of next generation sequencing in molecular ecology of non-model organisms
2010-12-08
[31]
논문
Genome sequencing and population genomics in non-model organisms
2014-01
[32]
논문
Comparing Pool-seq, Rapture, and GBS genotyping for inferring weak population structure: The American lobster (Homarus americanus) as a case study
2019
[33]
논문
RAD sequencing resolves fine-scale population structure in a benthic invertebrate: implications for understanding phenotypic plasticity
[34]
논문
Haplotype block partitioning and tag SNP selection using genotype data and their applications to association studies
2004-05
[35]
논문
Single nucleotide polymorphisms: a new paradigm for molecular marker technology and DNA polymorphism detection with emphasis on their use in plants
https://www.research[...]
2001-02-25
[36]
논문
Beyond the SNP Threshold: Identifying Outbreak Clusters Using Inferred Transmissions
2019-01-25
[37]
논문
SNPs — A Shortcut to Personalized Medicine
http://www.genengnew[...]
Mary Ann Liebert, Inc.
2008-06-15
[38]
논문
10 Years of GWAS Discovery: Biology, Function, and Translation
2017-07
[39]
논문
Genetic Susceptibility to Cancer
2008-05-28
[40]
논문
Homozygosity mapping: One more tool in the clinical geneticist's toolbox
2010-04
[41]
논문
SNPs in Sites for DNA Methylation, Transcription Factor Binding, and miRNA Targets Leading to Allele-Specific Gene Expression and Contributing to Complex Disease Risk: A Systematic Review
2020
[42]
논문
The Interaction Analysis of SNP Variants and DNA Methylation Identifies Novel Methylated Pathogenesis Genes in Congenital Heart Diseases
2021
[43]
논문
Genetic variation influencing DNA methylation provides insights into molecular mechanisms regulating genomic function
https://www.nature.c[...]
2022-01
[44]
논문
Genome-wide sequencing-based identification of methylation quantitative trait loci and their role in schizophrenia risk
2021-09-02
[45]
논문
The Future is The Past: Methylation QTLs in Schizophrenia
2016-12
[46]
논문
Pharmacogenetics: a general review on progress to date
2017-10-11
[47]
논문
Gene-Environment Interactions in Psychiatry: Recent Evidence and Clinical Implications
2019-08-13
[48]
논문
Anger- and aggression-related traits are associated with polymorphisms in the 5-HT-2A gene
2006-11
[49]
논문
Association of Foxp3 rs3761548 polymorphism with cytokines concentration in gastric adenocarcinoma patients
2021-02
[50]
논문
Factor V Leiden thrombophilia
2011-01
[51]
논문
Genotyping of triallelic SNPs using TaqMan PCR
2007-06
[52]
논문
Bitter taste study in a sardinian genetic isolate supports the association of phenylthiocarbamide sensitivity to the TAS2R38 bitter receptor gene
2004-10
[53]
논문
Non-synonymous polymorphisms in the FCN1 gene determine ligand-binding ability and serum levels of M-ficolin
2012-11-28
[54]
논문
A molecular basis for classic blond hair color in Europeans
2014-07
[55]
논문
Common variants in mismatch repair genes associated with increased risk of sperm DNA damage and male infertility
2012-05
[56]
웹사이트
"[DBSNP-announce] DBSNP Human Build 142 (GRCh38 and GRCh37.p13)"
https://www.ncbi.nlm[...]
National Center for Biotechnology Information, United States National Library of Medicine
2017-09-11
[57]
웹사이트
DBSNP Summary
https://www.ncbi.nlm[...]
National Center for Biotechnology Information, United States National Library of Medicine
2017-09-11
[58]
논문
Kaviar: an accessible system for testing SNV novelty
2011-11
[59]
논문
dbSAP: single amino-acid polymorphism database for protein variation detection
2017-01
[60]
논문
A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms
2001-02
[61]
서적
SNP FAQ Archive
U.S. National Center for Biotechnology Information
2005
[62]
웹사이트
Recommendations for the description of sequence variants
http://www.hgvs.org/[...]
Human Genome Variation Society
2008-02-20
[63]
논문
Mutation nomenclature extensions and suggestions to describe complex mutations: a discussion
2000
[64]
논문
Standard mutation nomenclature in molecular diagnostics: practical and educational challenges
2007-02
[65]
웹사이트
Sequence Variant Nomenclature
http://varnomen.hgvs[...]
2019-12-02
[66]
논문
SNP bioinformatics: a comprehensive review of resources
2009-10
[67]
논문
Improved measures for evolutionary conservation that exploit taxonomy distances
2019-04
[68]
논문
LIST-S2: Taxonomy Based Sorting of Deleterious Missense Mutations Across Species
[69]
웹사이트
View of SNPViz - Visualization of SNPs in proteins
https://genomicscomp[...]
2018-10-20
[70]
논문
PhyreRisk: A Dynamic Web Application to Bridge Genomics, Proteomics and 3D Structural Data to Guide Interpretation of Human Genetic Variants
2019-06
[71]
논문
Can Predicted Protein 3D Structures Provide Reliable Insights into whether Missense Variants Are Disease Associated?
2019-05
[72]
간행물
The Biostar Handbook: A Beginner's Guide to Bioinformatics
https://read.biostar[...]
2016-12-07
[73]
서적
LIFE
Mc Graw Hill
2009
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com