선택적 스플라이싱
1. 개요
선택적 스플라이싱은 1977년 아데노바이러스 연구를 통해 처음 발견되었으며, 하나의 유전자에서 서로 다른 단백질을 생성하는 과정이다. 진핵생물에서 보편적으로 나타나며, 엑손 스킵, 상호 배타적 엑손, 대체 도너 부위, 대체 수용체 부위, 인트론 유지 등 다양한 형식으로 일어난다. 선택적 스플라이싱은 스플라이소좀, 조절 요소, 단백질에 의해 조절되며, 초파리, Fas 수용체, HIV-1 등 다양한 유전자에서 예시를 찾아볼 수 있다. 이러한 과정은 유전 정보 저장 효율성을 높이고, 진화적 유연성을 제공하지만, 질병, 특히 암과 관련되기도 한다. 고처리량 RNA 시퀀싱, 딥 시퀀싱, 마이크로어레이, CLIP, 리포터 유전자 분석 등 다양한 기술을 통해 연구되며, AspicDB, Intronerator, ProSAS와 같은 데이터베이스를 통해 관련 정보를 얻을 수 있다.
-
스플라이소솜 -
엑손
엑손은 유전자 내 발현되는 영역으로, 단백질 코딩 유전자에서 단백질 코딩 서열과 비번역 영역을 포함하며, 선택적 스플라이싱을 통해 다양한 단백질 이성질체 생성에 기여하고 새로운 유전자 발견에 활용된다. -
스플라이소솜 -
인트론
진핵생물 유전자에서 엑손 사이에 존재하는 비코딩 DNA 서열인 인트론은 스플라이싱 과정을 거쳐 제거되며 유전자 발현 조절, 선택적 스플라이싱 등 다양한 기능에 관여하는 것으로 여겨진다. -
RNA 스플라이싱 -
엑손
엑손은 유전자 내 발현되는 영역으로, 단백질 코딩 유전자에서 단백질 코딩 서열과 비번역 영역을 포함하며, 선택적 스플라이싱을 통해 다양한 단백질 이성질체 생성에 기여하고 새로운 유전자 발견에 활용된다. -
RNA 스플라이싱 -
인트론
진핵생물 유전자에서 엑손 사이에 존재하는 비코딩 DNA 서열인 인트론은 스플라이싱 과정을 거쳐 제거되며 유전자 발현 조절, 선택적 스플라이싱 등 다양한 기능에 관여하는 것으로 여겨진다. -
유전자 발현 -
RNA 간섭
RNA 간섭은 이중가닥 RNA에 의해 유전자 발현이 억제되는 과정으로, 다이서 효소에 의해 생성된 작은 간섭 RNA가 RNA 유도 침묵 복합체와 결합하여 표적 mRNA를 분해하거나 번역을 억제하며, 바이러스 방어, 발생 조절, 유전체 안정성 유지 등 다양한 기능과 응용 분야를 가진다. -
유전자 발현 -
유전자 재조합
유전자 재조합은 유성 생식 생물의 염색체 유전자 교차를 통한 유전자 재배열 현상으로, 유전적 변이를 증가시키고 유전학적 지도 작성에 활용되며, 생명공학 등 다양한 분야에서 기술로 이용된다.
2. 발견
아데노바이러스 연구를 통해 1977년에 선택적 스플라이싱이 처음 발견되었다. 연구자들은 아데노바이러스 2형이 생성하는 1차 RNA 전사체가 다양한 방식으로 스플라이싱되어 서로 다른 바이러스 단백질을 암호화하는 mRNA를 생성한다는 사실을 발견했다. 또한 1차 전사체에는 여러 폴리아데닐화 부위가 있어 다양한 3' 말단을 가진 mRNA가 생성될 수 있었다.
1981년에는 정상적인 내인성 유전자인 칼시토닌 유전자에서 선택적 스플라이싱의 첫 번째 사례가 확인되었다. 칼시토닌 유전자의 1차 전사체는 6개의 엑손을 포함하며, 칼시토닌 mRNA는 엑손 1-4를 포함하고 엑손 4의 폴리아데닐화 부위에서 종결된다. 이 pre-mRNA에서 엑손 4를 건너뛰면 엑손 1-3, 5, 6을 포함하는 mRNA가 생성되어 칼시토닌 유전자 관련 펩타이드(CGRP)를 암호화한다.
이후 진핵생물에서 선택적 스플라이싱이 보편적인 현상임이 밝혀졌다. 초파리(Drosophila melanogaster)의 Dscam 유전자는 38,016종류의 스플라이스 변이체를 생성할 수 있어, 선택적 스플라이싱의 대표적인 예시로 꼽힌다.
2021년에는 아데노바이러스 2형이 기존에 알려진 것보다 훨씬 다양한 스플라이스 변이체를 생성할 수 있다는 사실이 밝혀졌다. 연구자들은 차세대 시퀀싱 기술을 통해 아데노바이러스 2형 전사체 지도를 업데이트하고 904개의 스플라이스 변이체를 확인했다.
3. 형식
선택적 스플라이싱은 일반적으로 5가지 기본 형식으로 분류된다.
--
--
* 엑손 스키핑 (exon skipping) 또는 카세트 엑손 (cassette exon): 엑손은 일시적 전사체에서 제거되거나, 유지된 채로 남아 있거나 한다. 포유류의 mRNA 전구체에서 가장 일반적인 방식이다.
* 상호 배타적 엑손 (mutually exclusive exons): 두 개의 엑손 중 어느 하나가 mRNA에 유지되지만, 둘 다 유지되는 경우는 없다.
* 선택적 5' 공여 부위 (alternative 5' donor sites): 선택적인 5' 스플라이스 접합부(공여 부위)가 이용되어, 상류 엑손의 3' 측 경계가 변화한다.
* 선택적 3' 수용 부위 (alternative 3' acceptor sites): 선택적인 3' 스플라이스 접합부(수용 부위)가 이용되어, 하류 엑손의 5' 측 경계가 변화한다.
* 인트론 유지 (intron retention): 어떤 배열이 인트론으로서 제거되거나, 그대로 유지되거나 한다. 유지되는 배열이 인트론과 인접해 있지 않다는 점에서 엑손 스키핑과는 구별된다. 유지된 인트론이 코딩 영역 내에 있으면, 인접한 엑손과 같은 판독 틀 내에서 아미노산을 코딩해야 한다. 종결 코돈이 존재하거나 판독 틀이 이동하면, 단백질은 기능을 잃는다. 포유류에서는 가장 드문 형식이다.
이러한 주요 스플라이싱 모드 외에도, 동일한 유전자에서 서로 다른 mRNA를 생성하는 두 가지 주요 메커니즘으로 다중 프로모터 (multiple promoters)와 다중 폴리아데닐화 부위 (multiple polyadenylation sites)가 있다. 다중 프로모터의 사용은 선택적 스플라이싱이 아닌 Transcriptional regulation영어 기전으로 설명되지만, 다른 지점에서 전사가 시작됨으로써 가장 5' 측의 엑손이 다른 전사체가 만들어질 수 있다. 한편, 다중 폴리아데닐화 부위는 전사체의 3' 말단의 지점이 다르다. 두 기전 모두 선택적 스플라이싱과 조합되어 사용되어, 하나의 유전자에서 유래하는 mRNA에 더욱 다양한 기능을 부여한다.
이러한 형식은 기본적인 스플라이싱 기전을 기술하는 것이지만, 복잡한 스플라이싱의 기술에는 부적절할 수 있다. 예를 들어, 오른쪽 그림에서는 마우스의 히알루로니다제 3 유전자의 3가지 스플라이싱 형식을 나타낸다. 1번째(녹색)와 2번째(노란색) 엑손 구조를 비교한 경우의 형식은 인트론 유지가 되지만, 2번째(노란색)와 3번째(파란색)를 비교한 경우에는 엑손 스키핑이 된다.
4. 기작
일반적인 스플라이싱은 RNA와 단백질 복합체인 스플라이소좀에 의해 수행된다. 전사된 mRNA 전구체(pre-mRNA)에는 여러 인트론과 엑손이 포함되어 있으며, mRNA에 유지될 엑손은 스플라이싱 과정에서 결정된다.
전형적인 진핵 세포 핵 인트론은 중요한 영역을 정의하는 컨센서스 서열을 갖는다. 각 인트론은 5' 말단에 GU 서열을, 3' 말단 근처에는 분지 부위(branch site)를 갖는다. 분지점의 뉴클레오티드는 항상 A(아데닌)이며, 인간의 경우 분지 부위 컨센서스 서열은 yUnAy이다. 분지 부위 다음에는 폴리피리미딘 트랙이라 불리는 일련의 피리미딘이 오고, 3' 말단에 AG가 온다.
mRNA의 스플라이싱은 snRNP (U1, U2, U4, U5 및 U6)를 포함하는 스플라이소좀에 의해 수행된다. U1은 5' GU에 결합하고, U2는 U2AF 단백질 인자의 도움을 받아 분지 부위 내의 분지점 A에 결합한다. 이 복합체를 스플라이소좀 A 복합체라고 하며, A 복합체의 형성은 스플라이싱될 인트론과 엑손의 말단을 정의하는 중요한 단계이다.
이후 U4, U5, U6 복합체가 결합하고 U6가 U1 위치를 대체하며, U1과 U4가 떠난다. 남아있는 복합체는 두 가지 전이에스테르화 반응을 수행한다. 첫 번째 반응에서 인트론의 5' 말단은 상류 엑손에서 잘리고 2',5'-포스포디에스테르 결합에 의해 분지 부위 A에 결합된다. 두 번째 반응에서 인트론의 3' 말단은 하류 엑손에서 잘리고 두 엑손은 포스포다이에스터 결합에 의해 결합된다. 그 후 인트론은 올가미 형태로 방출되어 분해된다.
4.1. 조절 요소와 단백질
스플라이싱은 전사 인자 단백질 (억제 인자와 활성화 인자)과 pre-mRNA 상의 시스 작용 조절 부위 (사일렌서와 인핸서)에 의해 조절된다. 스플라이싱 인자의 효과는 종종 위치에 따라 달라진다. 즉, 인트론 인핸서에 결합하면 스플라이싱 활성 인자로 작용하는 인자가 엑손의 스플라이싱 요소에 결합하면 억제 인자로 작용할 수 있으며, 그 반대도 가능하다. pre-mRNA의 이차 구조도 스플라이싱 요소를 연결하거나 스플라이싱 인자의 결합 요소를 가려 스플라이싱 조절에 영향을 미친다. 이러한 요소들은 다양한 세포 조건에서 스플라이싱을 조절하는 "스플라이싱 코드"를 형성한다.
pre-mRNA에는 두 가지 주요 시스 작용 RNA 서열 요소가 있으며, 각각에 결합하는 트랜스 작용 RNA 결합 단백질이 있다.
* 스플라이싱 사일렌서는 스플라이싱 억제 단백질이 결합하여 주변 부위가 스플라이스 접합부로 사용될 확률을 낮추는 부위이다. 인트론 자체 (인트론 스플라이싱 사일렌서, ISS) 또는 인접 엑손 (엑손 스플라이싱 사일렌서, ESS)에 위치할 수 있다. 서열과 결합 단백질 종류는 다양하다. 대부분의 스플라이싱 억제제는 hnRNPA1 및 폴리피리미딘 트랙 결합 단백질 (PTB)과 같은 hnRNP이다.
* 스플라이싱 인핸서는 스플라이싱 활성 단백질이 결합하여 주변 부위가 스플라이스 접합부로 사용될 확률을 높이는 부위이다. 인트론 (인트론 스플라이싱 인핸서, ISE) 또는 엑손 (엑손 스플라이싱 인핸서, ESE)에 존재할 수 있다. ISE 및 ESE에 결합하는 대부분의 활성 단백질은 SR 단백질 계열에 속하며, RNA 인식 모티프와 아르기닌 및 세린이 풍부한 (RS) 도메인을 포함한다.
--
--
일반적으로 스플라이싱 결정 인자는 문맥에 따라 상호 의존적으로 작용하여 스플라이싱 조절 규칙, 즉 스플라이싱 코드를 형성한다. 특정 시스 작용 RNA 서열 요소의 존재는 인접 부위의 스플라이싱 확률을 높이기도 하지만, 문맥에 따라 낮추기도 한다. 조절 요소가 작용하는 문맥에는 다른 RNA 서열 특징에 의한 시스 작용 문맥과 세포 조건에 의한 트랜스 작용 문맥이 있다. 예를 들어, 일부 시스 작용 RNA 서열 요소는 여러 요소가 동일 영역에 존재해야만 스플라이싱에 영향을 준다. 또 다른 예로, 시스 작용 요소는 세포 내 발현 단백질 종류 (예: 뉴런 대 비뉴런 PTB)에 따라 반대 효과를 낼 수 있다. 인간 유전자 연구에서 새로운 사일렌서 생성 또는 기존 인핸서 파괴를 막는 강력한 선택이 있음을 확인하여 스플라이싱 사일렌서와 인핸서의 적응적 중요성이 입증되었다.
5. 예시
선택적 스플라이싱의 몇 가지 예시는 다음과 같다.
* 엑손 스키핑: 초파리 dsx 유전자
--
초파리(D. melanogaster)의 dsx 유전자는 6개의 엑손을 가지고 있다. 수컷에서는 엑손 1, 2, 3, 5, 6이 연결되어 mRNA를 만들고, 이는 수컷 발생에 필요한 전사 조절 단백질을 만든다. 암컷에서는 엑손 1, 2, 3, 4가 연결되고, 엑손 4의 폴리아데닐화 신호가 mRNA를 자른다. 이렇게 만들어진 mRNA는 암컷 발생에 필요한 전사 조절 단백질을 만든다.
이는 엑손 건너뛰기(엑손 스키핑)의 한 예이다. 엑손 4 상류의 인트론은 폴리피리미딘 트랙트를 가지는데, 이는 컨센서스 서열과 잘 맞지 않아 스플라이싱 활성제의 도움 없이는 U2AF 단백질이 제대로 결합하지 못한다. 그래서 수컷에서는 이 3' 스플라이스 수용체 부위가 사용되지 않는다. 그러나 암컷은 스플라이싱 활성제인 Transformer(Tra)를 만든다. SR 단백질 Tra2는 암수 모두에서 만들어지며 엑손 4의 ESE에 결합한다. Tra가 있으면 Tra2에 결합하고 다른 SR 단백질과 함께 복합체를 만들어 U2AF 단백질이 약한 폴리피리미딘 트랙트에 결합하도록 돕는다. U2는 관련된 분기점에 모집되고, 엑손 4가 mRNA에 포함되게 한다.
* 선택적 수용 부위: 초파리 Transformer 유전자
초파리(D. melanogaster)의 Transformer(Tra) 유전자 전구 mRNA는 대립적 수용 부위 모드를 통해 대립적 스플라이싱을 한다. Tra 유전자는 암컷에서만 발현되는 단백질을 만든다. 이 유전자 1차 전사체는 두 개의 가능한 수용 부위를 가진 인트론을 포함한다. 수컷에서는 상류 수용 부위가 사용된다. 이 때문에 엑손 2의 더 긴 버전이 처리된 전사체에 포함되어 조기 종결 코돈이 생긴다. 결과 mRNA는 비활성인 절단된 단백질 산물을 만든다. 암컷은 주요 성 결정 단백질인 Sex lethal (Sxl)을 만든다. Sxl 단백질은 상류 수용 부위 근처 Tra 전사체 RNA에 있는 ISS에 결합하는 스플라이싱 억제 단백질로, U2AF 단백질이 폴리피리미딘 트랙에 결합하는 것을 막는다. 이것은 이 접합부 사용을 막고 스플라이소좀 결합을 하류 수용 부위로 이동시킨다. 이 지점에서 스플라이싱은 인트론의 일부로 절제되는 종결 코돈을 우회한다. 결과 mRNA는 활성 Tra 단백질을 만드는데, 이 단백질 자체는 다른 성 관련 유전자 대립적 스플라이싱 조절 인자이다.
* 엑손 정의: Fas 수용체
Fas 수용체 단백질의 여러 아이소폼은 선택적 스플라이싱으로 만들어진다. 사람에게서 흔히 발생하는 두 가지 아이소폼은 엑손 스키핑(Exon skipping) 기전을 통해 만들어진다. 엑손 6을 포함하는 mRNA는 막 결합형 Fas 수용체를 만들고, 세포자멸사 또는 프로그램 세포사를 촉진한다. 만성적으로 햇빛에 노출된 피부 세포에서는 Fas 수용체의 발현이 증가하는 반면, 피부암 세포에서는 발현이 보이지 않는 것은, 사람에게서 이 기전이 전암 상태의 세포 제거에 중요하다는 것을 보여준다. 엑손 6이 스킵되면, 만들어지는 mRNA는 가용성 Fas 단백질을 만들고, 이는 세포자멸사를 촉진하지 않는다. 엑손이 삽입되거나 스킵되는 것은 TIA-1과 폴리피리미딘 트랙 결합 단백질(PTB)이라는 두 개의 상반되는 단백질에 달려있다.
* pre-mRNA의 엑손 6의 하류 인트론의 5' 공여 부위는 컨센서스 서열과의 일치도가 약하며, 보통 U1 snRNP는 결합하지 않는다. U1이 결합하지 않으면 엑손이 스킵된다.
* TIA-1 단백질이 인트론 스플라이싱 인핸서(ISE) 부위에 결합하면 U1 snRNP의 결합이 안정화된다. 이렇게 만들어진 5' 공여 부위 복합체는 엑손 상류의 3' 스플라이스 부위에 U2AF의 결합을 돕지만, 그 기전은 확실하지 않다.
* 엑손 6은 피리미딘이 풍부한 엑손 스플라이싱 억제제(ESS) ure6를 포함하고 있으며, 여기에 PTB가 결합한다. PTB가 결합하면, PTB는 5' 공여 부위 복합체가 U2AF의 수용 부위에 결합하는 것을 막고, 그 결과 엑손이 스킵된다.
이 기전은 스플라이싱에 의해 엑손이 정의되는 예이다. 보통 스플라이소솜은 인트론에서 조립되며, snRNP의 서브유닛은 인트론의 5' 말단과 3' 말단이 결합하도록 RNA를 접는다. 그러나 이와 같이 최근 연구된 예는 엑손 양쪽 끝의 상호작용도 있다는 것을 보여준다. 이러한 엑손을 정의하는 상호작용에서는, 두 개의 인접한 인트론에서 스플라이소솜이 조립되기 전에 핵심 스플라이싱 인자가 결합하는 것이 필요하다.
* 억제자와 활성자의 경쟁: HIV-1 *tat* 엑손 2
인간 면역 결핍 바이러스(HIV)는 후천성 면역 결핍 증후군(AIDS)을 일으키는 레트로 바이러스의 일종으로, 하나의 RNA 1차 전사체에서 40개 이상의 서로 다른 mRNA를 만들기 위해 다양한 방식의 선택적 스플라이싱을 한다. tat 유전자의 엑손 2는 스플라이싱 억제제 hnRNP A1과 SR 단백질 SC35 간의 경쟁으로 조절된다. 엑손 2 내부에는 엑손 스플라이싱 억제 서열(ESS)과 엑손 스플라이싱 인핸서 서열(ESE)이 겹쳐져 있다. 억제 단백질 A1이 ESS에 결합하면 여러 A1 분자가 협동 결합을 시작하여 엑손 2의 상류 5' 도너 부위까지 확장되고, 핵심 스플라이싱 인자인 U2AF35가 폴리피리미딘 트랙에 결합하는 것을 막는다. 반면 SC35가 ESE에 결합하면 A1의 결합을 막고 5' 도너 부위를 스플라이소좀 조립에 사용할 수 있도록 유지한다. 이러한 활성제와 억제제의 경쟁으로 인해 엑손 2가 포함된 mRNA와 포함되지 않은 mRNA 두 종류가 모두 만들어진다.
5.1. 엑손 스키핑: 초파리 *dsx* 유전자
--
초파리(D. melanogaster)의 dsx 유전자는 6개의 엑손을 포함한다. 수컷의 경우 엑손 1, 2, 3, 5, 6이 연결되어 mRNA를 형성하며, 이는 수컷 발생에 필요한 전사 조절 단백질을 암호화한다. 암컷의 경우 엑손 1, 2, 3, 4가 연결되고, 엑손 4의 폴리아데닐화 신호가 해당 지점에서 mRNA를 절단한다. 그 결과 생성된 mRNA는 암컷 발생에 필요한 전사 조절 단백질이다.
이는 엑손 건너뛰기(엑손 스키핑)의 한 예이다. 엑손 4 상류의 인트론은 폴리피리미딘 트랙트를 가지는데, 이는 컨센서스 서열과 잘 일치하지 않아 스플라이싱 활성제의 도움 없이는 U2AF 단백질이 제대로 결합하지 못한다. 따라서 이 3' 스플라이스 수용체 부위는 수컷에서는 사용되지 않는다. 그러나 암컷은 스플라이싱 활성제인 Transformer(Tra)를 생성한다. SR 단백질 Tra2는 양성 모두에서 생성되며 엑손 4의 ESE에 결합한다. Tra가 존재하면 Tra2에 결합하고 다른 SR 단백질과 함께 복합체를 형성하여 U2AF 단백질이 약한 폴리피리미딘 트랙트에 결합하는 데 도움을 준다. U2는 관련된 분기점에 모집되며, 이는 엑손 4가 mRNA에 포함되도록 한다.
5.2. 선택적 수용 부위: 초파리 *Transformer* 유전자
초파리(D. melanogaster)의 Transformer(Tra) 유전자 전구 mRNA는 대립적 수용 부위 모드를 통해 대립적 스플라이싱을 거친다. Tra 유전자는 암컷에서만 발현되는 단백질을 암호화한다. 이 유전자 1차 전사체는 두 개의 가능한 수용 부위를 가진 인트론을 포함한다. 수컷의 경우 상류 수용 부위가 사용된다. 이로 인해 엑손 2의 더 긴 버전이 처리된 전사체에 포함되어 조기 종결 코돈이 포함된다. 결과 mRNA는 비활성인 절단된 단백질 산물을 암호화한다. 암컷은 주요 성 결정 단백질인 Sex lethal (Sxl)을 생성한다. Sxl 단백질은 상류 수용 부위 근처 Tra 전사체 RNA에 있는 ISS에 결합하는 스플라이싱 억제 단백질로, U2AF 단백질이 폴리피리미딘 트랙에 결합하는 것을 방지한다. 이것은 이 접합부 사용을 막고 스플라이소좀 결합을 하류 수용 부위로 이동시킨다. 이 지점에서 스플라이싱은 인트론의 일부로 절제되는 종결 코돈을 우회한다. 결과 mRNA는 활성 Tra 단백질을 암호화하며, 이 단백질 자체는 다른 성 관련 유전자 대립적 스플라이싱 조절 인자이다.,
5.3. 엑손 정의: Fas 수용체
Fas 수용체 단백질의 여러 아이소폼은 선택적 스플라이싱에 의해 생성된다. 사람에게서 일반적으로 발생하는 두 가지 아이소폼은 엑손 스키핑(Exon skipping) 기전을 통해 생성된다. 엑손 6을 포함하는 mRNA는 막 결합형 Fas 수용체를 암호화하며, 세포자멸사 또는 프로그램 세포사를 촉진한다. 만성적으로 햇빛에 노출된 피부 세포에서는 Fas 수용체의 발현이 상승하는 반면, 피부암 세포에서는 발현이 보이지 않는 것은, 사람에게서 이 기전이 전암 상태의 세포 제거에 중요하다는 것을 시사한다. 엑손 6이 스킵된 경우, 생성되는 mRNA는 가용성 Fas 단백질을 암호화하며, 이는 세포자멸사를 촉진하지 않는다. 엑손이 삽입되거나 스킵되는 것은 TIA-1과 폴리피리미딘 트랙 결합 단백질(PTB)이라는 두 개의 상반되는 단백질에 의존한다.
* pre-mRNA의 엑손 6의 하류 인트론의 5' 공여 부위는 컨센서스 서열과의 일치도가 약하며, 일반적으로 U1 snRNP는 결합하지 않는다. U1이 결합하지 않으면 엑손이 스킵된다.
* TIA-1 단백질이 인트론 스플라이싱 인핸서(ISE) 부위에 결합하면 U1 snRNP의 결합이 안정화된다. 결과적으로 형성된 5' 공여 부위 복합체는 엑손 상류의 3' 스플라이스 부위에 U2AF의 결합을 돕지만, 그 기전은 불명확하다.
* 엑손 6은 피리미딘이 풍부한 엑손 스플라이싱 억제제(ESS) ure6를 포함하고 있으며, 여기에 PTB가 결합한다. PTB가 결합하면, PTB는 5' 공여 부위 복합체가 U2AF의 수용 부위에 결합하는 것을 방해하며, 그 결과 엑손이 스킵된다.
이 기전은 스플라이싱에 의해 엑손이 정의되는 예이다. 일반적으로 스플라이소솜은 인트론에서 조립되며, snRNP의 서브유닛은 인트론의 5' 말단과 3' 말단이 결합하도록 RNA를 접는다. 그러나 이와 같은 최근 연구된 예는 엑손 양쪽 끝의 상호작용도 존재한다는 것을 보여준다. 이러한 엑손을 정의하는 상호작용에서는, 두 개의 인접한 인트론에서 스플라이소솜이 조립되기 전에 핵심 스플라이싱 인자가 결합하는 것이 필요하다.
5.4. 억제자와 활성자의 경쟁: HIV-1 *tat* 엑손 2
인간 면역 결핍 바이러스(HIV)는 후천성 면역 결핍 증후군(AIDS)을 유발하는 레트로 바이러스의 일종으로, 하나의 RNA 1차 전사체에서 40개 이상의 서로 다른 mRNA를 만들기 위해 다양한 방식의 선택적 스플라이싱을 거친다. tat 유전자의 엑손 2는 스플라이싱 억제제 hnRNP A1과 SR 단백질 SC35 간의 경쟁에 의해 조절된다. 엑손 2 내부에는 엑손 스플라이싱 억제 서열(ESS)과 엑손 스플라이싱 인핸서 서열(ESE)이 겹쳐져 있다. 억제 단백질 A1이 ESS에 결합하면 여러 A1 분자가 협동 결합을 시작하여 엑손 2의 상류 5' 도너 부위까지 확장되고, 핵심 스플라이싱 인자인 U2AF35가 폴리피리미딘 트랙에 결합하는 것을 막는다. 반면 SC35가 ESE에 결합하면 A1의 결합을 막고 5' 도너 부위를 스플라이소좀 조립에 사용할 수 있도록 유지한다. 이러한 활성제와 억제제의 경쟁으로 인해 엑손 2가 포함된 mRNA와 포함되지 않은 mRNA 두 종류가 모두 생성된다.
6. 적응적 의의
선택적 스플라이싱은 제한된 수의 유전자로부터 다양한 단백질을 생성하여 유전 정보 저장 효율성을 높인다. 하나의 유전자에 여러 단백질을 암호화함으로써, 제한된 크기의 게놈에서 더 다양한 프로테옴을 만들 수 있다.
또한, 선택적 스플라이싱은 진화적 유연성을 제공한다. 단일 점 돌연변이로 인해 스플라이싱 과정에서 특정 엑손이 전사물에서 제외되거나 포함될 수 있으며, 원래 단백질을 손실하지 않고 새로운 아이소폼을 생성할 수 있다. 본질적으로 무질서한 영역(본질적으로 무질서한 단백질 참조)이 비구성 엑손에 풍부하며, 이는 단백질 이소형이 이러한 영역 내 기능적 모듈 변화로 인해 기능적 다양성을 나타낼 수 있음을 시사한다. 이소형의 기능적 다양성은 발현 패턴에 반영되며 기계 학습으로 예측할 수 있다. 비교 연구에 따르면 선택적 스플라이싱은 다세포성보다 먼저 나타났으며, 다세포 생물 발달에 기여했을 가능성이 있다.
인간 게놈 프로젝트 등 연구에 따르면 인간은 선충 Caenorhabditis elegans보다 약 30%, 초파리 Drosophila melanogaster보다 약 2배 많은 유전자를 가진다. 이는 척추동물의 복잡성이 무척추동물보다 높은 선택적 스플라이싱 비율 때문일 수 있다는 추측을 낳았다. 그러나 인간, 쥐, 소, 초파리, 선충, 애기장대의 발현 서열 태그(EST) 샘플 연구에서는 큰 차이가 발견되지 않았다. 다른 연구에서는 EST 수 차이로 인한 인공물이라 제안하며, 척추동물이 무척추동물보다 높은 선택적 스플라이싱 비율을 가진다고 결론지었다.
7. 질병
RNA 처리 기계의 변화나 스플라이스 부위의 돌연변이는 비정상적인 스플라이싱을 유발하여 질병을 일으킬 수 있다. 인간 질병을 유발하는 돌연변이의 상당 부분이 스플라이싱에 영향을 미치는 것으로 추정된다. 암세포에서 비정상적인 스플라이싱이 높은 비율로 발견되며, 특정 스플라이싱 변이체는 암과 관련이 있다.
* 암 관련 스플라이싱 변이:
* DNMT3B: 이 유전자의 비정상적인 스플라이싱은 DNA 메틸화 패턴을 변화시키고 세포 성장을 촉진하여 종양 발생에 기여한다.
* Ron (MST1R): 이 원암유전자의 비정상적인 스플라이싱은 SF2/ASF 수준 증가와 관련 있으며, 세포 운동성을 유발하여 암세포의 이동 및 침투 능력을 향상시킨다.
* 약물 및 행동 중독: 핵 측좌핵 내 특정 뉴런 집단에서 FOSB 유전자의 절단된 스플라이스 변이체인 ΔFosB의 과발현은 약물 및 자연적 보상에 대한 중독의 유도 및 유지에 관여한다.
* 염색질 구조 및 히스톤 수정: 염색질 구조 및 히스톤 수정은 선택적 스플라이싱 조절에 중요한 역할을 한다. 즉, 후성 유전학적 조절이 유전자 발현뿐만 아니라 스플라이싱 방식도 결정한다.
암세포에서는 정상 세포에 비해 선택적 스플라이싱이 감소하고 스플라이싱 유형이 다르다. 예를 들어 암세포는 인트론 유지가 더 높고 엑손 건너뛰기 수준은 더 낮다. 이러한 차이는 스플라이싱 인자 유전자의 체세포 돌연변이 빈도, 트랜스 작용 스플라이싱 인자의 인산화 변화, 또는 생성되는 스플라이싱 인자의 상대적 양 변화 때문일 수 있다. 잘못 스플라이싱된 전사체의 유해한 영향은 무의미-매개 mRNA 분해에 의해 제거될 수 있다.
8. 전사체 전체 분석 (Genome-scale analysis)
대체 스플라이싱의 전사체 전체 분석은 일반적으로 고처리량 RNA 시퀀싱으로 수행된다. 대부분은 일루미나(Illumina) 기기와 같은 단일 가닥 시퀀싱으로 수행되지만, Nanopore 또는 PacBio 기기와 같은 장가닥 시퀀싱을 통해 더 많은 정보를 얻을 수 있다. 전사체 전체 분석은 암 환자군과 같이 대체 스플라이싱의 변동량을 측정하는 데 사용될 수 있다.
심층 시퀀싱 기술은 가공되지 않은 mRNA와 가공된 mRNA 모두에 대한 유전자 전체 분석을 수행하는 데 사용되어 왔으며, 대체 스플라이싱에 대한 통찰력을 제공한다. 예를 들어, 심층 시퀀싱 결과, 인간의 경우 다중 엑손 유전자에서 생성된 전사체의 약 95%가 대체 스플라이싱을 거치며, 여러 개의 pre-mRNA 전사체가 조직 특이적인 방식으로 스플라이싱되는 것으로 나타났다. 다중 인스턴스 학습을 기반으로 한 기능 유전체학 및 계산적 접근 방식은 RNA-seq 데이터를 통합하여 대체 스플라이싱된 아이소폼의 기능을 예측하는 데에도 개발되었다. 심층 시퀀싱은 또한 스플라이싱 동안 방출되는 일시적인 라리아트의 생체 내 검출, 분지점 서열 결정, 그리고 인간 pre-mRNA 전사체에서 분지점의 대규모 매핑에도 도움을 주었다.
역사적으로, 대체 스플라이싱된 전사체는 EST 서열을 비교하여 발견되었지만, 이는 매우 많은 수의 EST 시퀀싱을 필요로 했다. 대부분의 EST 라이브러리는 매우 제한된 수의 조직에서 나오기 때문에, 조직 특이적 스플라이스 변이체는 놓치기 쉬웠다. 그러나 DNA 마이크로어레이 기반 분석, RNA 결합 분석, 심층 시퀀싱과 같은 고처리량 접근법이 개발되어 스플라이싱을 조사하는 데 사용되고 있다. 이러한 방법들은 단백질 결합에 영향을 미치는 스플라이싱 요소 안 또는 주변의 다형성 또는 돌연변이를 검사하는 데 사용될 수 있다. 리포터 유전자 분석을 포함한 스플라이싱 분석과 결합하면, pre-mRNA 전사체의 스플라이싱에 대한 다형성 또는 돌연변이의 기능적 효과를 분석할 수 있다.
마이크로어레이 분석에서, 개별 엑손(예: Affymetrix 엑손 마이크로어레이) 또는 엑손/엑손 경계(예: ExonHit 또는 Jivan의 어레이)를 나타내는 DNA 단편의 어레이가 사용되었다. 그런 다음 어레이는 관심 조직의 표지된 cDNA로 프로브된다. 프로브 cDNA는 해당 조직에서 mRNA에 포함된 엑손의 DNA 또는 두 엑손이 연결된 경계의 DNA에 결합한다. 이를 통해 특정 대체 스플라이싱된 mRNA의 존재를 밝힐 수 있다.
CLIP (가교 결합 및 면역침전)은 UV 방사선을 사용하여 스플라이싱 중에 조직 내의 RNA 분자에 단백질을 연결한다. 그런 다음 특정 항체를 사용하여 관심 있는 전사 작용 스플라이싱 조절 단백질을 침전시킨다. 해당 단백질에 부착된 RNA를 분리하고 클로닝하면, 해당 단백질에 대한 표적 서열이 밝혀진다. RNA 결합 단백질을 식별하고 pre-mRNA 전사체에 대한 결합을 매핑하는 또 다른 방법은 "Microarray Evaluation of Genomic Aptamers by shift (MEGAshift)"이다. 이 방법은 "Systematic Evolution of Ligands by Exponential Enrichment (SELEX)" 방법을 적용한 것과 마이크로어레이 기반 판독을 사용한다. MEGAshift 방법은 ASF/SF2 및 PTB와 같은 서로 다른 스플라이싱 인자와의 결합을 매개하는 대체 스플라이싱된 엑손 주변의 pre-mRNA 전사체의 서열을 식별할 수 있게 함으로써, 대체 스플라이싱의 조절에 대한 통찰력을 제공했다. 이러한 접근법은 또한 RNA 2차 구조와 스플라이싱 인자의 결합 사이의 관계를 결정하는 데에도 사용되었다.
리포터 유전자 분석은 스플라이싱 반응에 따라 두 개의 다른 형광 단백질 중 하나를 발현하는 리포터 유전자를 구성함으로써, 특정 대체 스플라이싱 이벤트에 관여하는 스플라이싱 단백질을 찾는 것을 가능하게 한다. 이 방법은 스플라이싱에 영향을 미치는 돌연변이를 분리하고, 그 돌연변이에서 불활성화된 새로운 스플라이싱 조절 단백질을 식별하는 데 사용되었다.