오픈 리딩 프레임
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
오픈 리딩 프레임(ORF)은 개시 코돈에서 시작하여 종결 코돈에서 끝나는 코돈의 연속적인 염기 서열을 의미하며, 유전자 예측에 중요한 단서로 활용된다. ORF는 DNA 염기 서열에서 단백질 또는 기능성 RNA 암호화 영역을 식별하는 데 사용되지만, ORF의 존재가 항상 번역을 의미하는 것은 아니다. 원핵생물에서는 개시 코돈 다음에 충분히 긴 ORF가 오는지, 코돈 사용 빈도가 유기체의 암호화 영역과 일치하는지 확인하여 유전자 예측을 수행한다. 짧은 오픈 리딩 프레임(sORF)은 100개 미만의 코돈 길이를 가지며 기능적인 펩타이드를 생성할 수 있으며, 포유류 mRNA의 약 50%에서 발견된다. DNA는 3개의 리딩 프레임을 가지며, DNA 이중 나선은 6개의 가능한 프레임 번역을 가진다. ORF 분석 도구로는 ORF Finder, ORF Investigator, OrfPredictor, ORFik, orfipy 등이 있다.
더 읽어볼만한 페이지
- 분자유전학 - RNA 간섭
RNA 간섭은 이중가닥 RNA에 의해 유전자 발현이 억제되는 과정으로, 다이서 효소에 의해 생성된 작은 간섭 RNA가 RNA 유도 침묵 복합체와 결합하여 표적 mRNA를 분해하거나 번역을 억제하며, 바이러스 방어, 발생 조절, 유전체 안정성 유지 등 다양한 기능과 응용 분야를 가진다. - 분자유전학 - 염색체
염색체는 유전자를 포함하는 DNA 가닥으로, 진핵생물에서는 단백질과 결합해 염색질을 형성하고 세포 분열 시 응축된 막대 모양을 나타내며, 원핵생물은 진핵생물보다 단순한 구조를 가지고 종에 따라 수와 구조가 다양하며, 이상이 생기면 유전 질환을 유발할 수 있어 유전 연구에 중요한 역할을 한다.
오픈 리딩 프레임 | |
---|---|
서론 | |
정의 | DNA 서열 내에서 개시 코돈(start codon)부터 종결 코돈(stop codon)까지의 영역을 말한다. 유전체의 특정 영역을 의미하며, 단백질을 암호화할 가능성이 있다. |
특징 | 진핵생물의 경우 5' UTR이 앞에 위치한다. 원핵생물의 경우 리보솜 결합 부위가 앞에 위치한다. |
상세 정보 | |
중요성 | 유전자 예측(Gene prediction)에 중요한 역할을 한다. |
종결 코돈 | UAA, UAG, UGA의 세 가지가 존재한다. 이러한 코돈은 mRNA 번역을 종료시키는 신호로 작용한다. |
참고 자료 | |
참고 문헌 | Brody LC (2021-08-25). "Stop Codon". National Human Genome Research Institute. National Institutes of Health. 2021-08-25에 확인함. Slonczewski J, Foster JW (2009). Microbiology: An Evolving Science. New York: W.W. Norton & Co. ISBN 978-0-393-97857-5. OCLC 185042615. Sieber P, Platzer M, Schuster S (March 2018). "The Definition of Open Reading Frame Revisited". Trends in Genetics. 34 (3): 167–170. PMID 29366605. doi:10.1016/j.tig.2017.12.009. Claverie JM (1997). "Computational methods for the identification of genes in vertebrate genomic sequences". Human Molecular Genetics. 6 (10): 1735–44. PMID 9300666. doi:10.1093/hmg/6.10.1735. |
추가 정보 | Open reading frame. U.S. National Library of Medicine. 2015-10-19. 2015-10-22에 확인함. |
2. 정의 및 생물학적 의미
오픈 리딩 프레임(ORF)은 개시 코돈에서 시작하여 종결 코돈에서 끝나는, 코돈으로 구성된 연속적인 염기 서열을 의미한다. ORF는 유전자 예측을 돕는 중요한 증거 중 하나로 사용되며, 특히 긴 ORF는 단백질 코딩 영역을 나타낼 가능성이 높다.[6][30] 하지만 ORF의 존재가 반드시 해당 영역이 항상 번역되는 것을 의미하는 것은 아니다.[6][30]
원핵생물의 경우, 개시 코돈 다음에 전형적인 단백질을 암호화할 만큼 충분히 긴 ORF가 오는지, 그리고 해당 영역의 코돈 사용이 유기체의 암호화 영역에 대한 특징적인 빈도와 일치하는지 여부를 확인하는 방법으로 유전자 예측을 수행할 수 있다.[6] 따라서 일부 저자는 ORF가 최소 길이, 예를 들어 100 코돈[5] 또는 150 코돈[6]을 가져야 한다고 말한다. 그러나 긴 ORF만으로는 유전자의 존재에 대한 결정적인 증거가 아니다.[6]
2. 1. 짧은 오픈 리딩 프레임 (sORF)
'''짧은 오픈 리딩 프레임'''([7], '''작은 오픈 리딩 프레임'''([8], '''sORF''' 또는 '''smORF''')은 일반적으로 100개 미만의 코돈 길이를 가지며,[9] 마이크로단백질 또는 sORF-인코딩 단백질(SEP)을 암호화한다. 포유류 mRNA의 약 50%의 5'-UTR에는 하나 이상의 sORF가 포함되어 있는 것으로 알려져 있는데,[11] 이를 상류 ORF(uORF)라고도 한다. 실험적으로 발견된 sORF 번역 개시 부위의 64~75%가 인간과 마우스의 게놈에서 보존되어 있어,[13] 이러한 sORF가 특정 기능을 가질 수 있음을 시사한다. sORF는 SLAMF1 유전자와 같이 특정 유전자의 프로모터 내부에 위치하는 경우가 많다.[14]3. 6 프레임 번역
DNA는 3개의 뉴클레오티드(코돈) 그룹으로 해석되므로 DNA 가닥은 3개의 뚜렷한 리딩 프레임을 갖는다.[15] DNA 분자의 이중 나선은 두 개의 역평행 가닥을 가지고 있으며, 각 가닥은 3개의 리딩 프레임을 가지므로 총 6개의 가능한 프레임 번역이 있다.[15]
4. ORF 분석 도구
DNA 또는 RNA 서열에서 열린 읽기 틀 (ORF)을 식별하고 분석하기 위해 다양한 소프트웨어 도구를 사용할 수 있다.
4. 1. ORF Finder
ORF Finder는 사용자 또는 데이터베이스에 있는 서열에서 선택 가능한 최소 크기의 모든 열린 읽기 틀 (ORF)을 찾는 그래픽 분석 도구이다.[16] 표준 또는 대체 유전 암호를 사용하여 모든 ORF를 식별하고, 추론된 아미노산 서열을 다양한 형식으로 저장할 수 있다. BLAST를 사용하여 서열 데이터베이스에 대해 검색할 수 있다.[16] ORF Finder는 완전하고 정확한 서열 제출을 준비하는 데 도움이 되며, Sequin 서열 제출 소프트웨어와 함께 패키지로 제공된다.4. 2. ORF Investigator
ORF 인베스티게이터[17]는 코딩 및 비코딩 서열에 대한 정보를 제공하고, 서로 다른 유전자/DNA 영역 서열의 쌍을 이루는 전체 정렬을 수행할 수 있는 프로그램이다. 이 도구는 해당 아미노산 서열에 대한 ORF를 효율적으로 찾아 단일 문자 아미노산 코드로 변환하고 서열 내 위치를 제공한다. 서열 간의 쌍을 이루는 전체 정렬을 통해 단일 염기 다형성을 포함한 다양한 돌연변이를 편리하게 감지할 수 있다. 니들만-분쉬 알고리즘이 유전자 정렬에 사용된다. ORF 인베스티게이터는 이식 가능한 펄 프로그래밍 언어로 작성되었으므로 모든 공통 운영 체제의 사용자가 사용할 수 있다.[37]4. 3. OrfPredictor
OrfPredictor는 발현 서열 태그(EST)에서 파생된 서열에서 단백질 코딩 영역을 식별하도록 설계된 웹 서버이다.[18] BLASTX에서 일치하는 쿼리 시퀀스의 경우, 이 프로그램은 BLASTX 정렬에서 식별된 번역 판독 프레임을 기반으로 코딩 영역을 예측하며, 그렇지 않은 경우 쿼리 시퀀스의 고유 신호를 기반으로 가장 가능성이 높은 코딩 영역을 예측한다. 출력은 FASTA 형식의 예측된 펩타이드 서열과 쿼리 ID, 번역 판독 프레임 및 코딩 영역이 시작하고 끝나는 뉴클레오티드 위치를 포함하는 정의 라인이다. OrfPredictor는 특히 대규모 EST 프로젝트에 유용하며, EST에서 파생된 서열의 주석을 용이하게 한다.[38]ORF Predictor는 위에 언급된 두 가지 서로 다른 ORF 정의를 조합하여 사용한다. 시작 코돈으로 시작하여 정지 코돈으로 끝나는 스트레치를 검색한다. 추가 기준으로는 5' 비번역 영역에서 정지 코돈을 검색한다.[39]
4. 4. ORFik
ORFik는 차세대 염기서열 분석 기술을 사용하여 오픈 리딩 프레임(Open Reading Frame, ORF)을 찾고 ORF의 타당성을 확인하기 위한 Bioconductor의 R 패키지이다.[20][21][40]4. 5. orfipy
파이썬/사이썬으로 작성된 도구로, 매우 빠르고 유연한 방식으로 오픈 리딩 프레임(ORF)을 추출한다.[22] orfipy는 일반 또는 gzip으로 압축된 FASTA 및 FASTQ 시퀀스에서 작동하며, ORF 검색을 세부 조정할 수 있는 몇 가지 옵션을 제공한다. 여기에는 시작 및 정지 코돈 지정, 부분 ORF 보고, 사용자 지정 번역 테이블 사용 등이 포함된다. 결과는 공간 효율적인 BED 형식을 포함하여 여러 형식으로 저장할 수 있다. orfipy는 특히 de novo 전사체 어셈블리와 같이 여러 개의 작은 FASTA 시퀀스를 포함하는 데이터에 더 빠르다.[23]참조
[1]
웹사이트
Stop Codon
https://www.genome.g[...]
National Institutes of Health
2021-08-25
[2]
서적
Microbiology: An Evolving Science
W.W. Norton & Co.
[3]
저널
The Definition of Open Reading Frame Revisited
2018-03-01
[4]
저널
Computational methods for the identification of genes in vertebrate genomic sequences
1997-01-01
[5]
저널
The difficulty of identifying genes in anonymous vertebrate sequences
1997-01-01
[6]
서적
Computational Genome Analysis: an introduction
Springer-Verlag
[7]
저널
Short open reading frames (sORFs) and microproteins: an update on their identification and validation measures
[8]
저널
De novo birth of functional microproteins in the human lineage
[9]
저널
Small Open Reading Frames, How to Find Them and Determine Their Function
[10]
저널
Pri sORF peptides induce selective proteasome-mediated protein processing
https://hal.inrae.fr[...]
2015-09-01
[11]
저널
uORFdb--a comprehensive literature database on eukaryotic uORF biology
2014-01-01
[12]
저널
Initiation codons within 5'-leaders of mRNAs as regulators of translation
https://pubmed.ncbi.[...]
1994-04-01
[13]
저널
Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution
2012-09-01
[14]
저널
Early B-cell factor 1 (EBF1) is critical for transcriptional control of SLAMF1 gene in human B cells
2016-10-01
[15]
저널
Comparison of DNA sequences with protein sequences
1997-11-01
[16]
웹사이트
ORFfinder
https://www.ncbi.nlm[...]
[17]
저널
ORF Investigator: A New ORF finding tool combining Pairwise Global Gene Alignment
2012-01-01
[18]
웹사이트
OrfPredictor
http://bioinformatic[...]
[19]
저널
Cap-independent enhancement of translation by a plant potyvirus 5' nontranslated region
1990-04-01
[20]
웹사이트
ORFik - Open reading frames in genomics
https://bioconductor[...]
[21]
저널
ORFik: A comprehensive R toolkit for the analysis of translation
[22]
저널
orfipy: a fast and flexible tool for extracting ORFs
2021-02-01
[23]
웹사이트
urmi-21/orfipy
https://github.com/u[...]
2021-02-13
[24]
저널
The Definition of Open Reading Frame Revisited
https://doi.org/10.1[...]
2018-03-01
[25]
웹사이트
Open reading frame
http://ghr.nlm.nih.g[...]
U.S. National Library of Medicine
2015-10-19
[26]
서적
Microbiology: An Evolving Science
W.W. Norton & Co.
[27]
저널
Computational methods for the identification of genes in vertebrate genomic sequences
[28]
저널
The definition of open reading frame revisited
[29]
저널
The difficulty of identifying genes in anonymous vertebrate sequences
[30]
서적
Computational Genome Analysis: an introduction
Springer-Verlag
[31]
저널
Pri sORF peptides induce selective proteasome-mediated protein processing
[32]
저널
uORFdb—a comprehensive literature database on eukaryotic uORF biology
2014-01-01
[33]
저널
Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution
2012-09-11
[34]
저널
Early B-cell factor 1 (EBF1) is critical for transcriptional control of SLAMF1 gene in human B cells
2016-10-01
[35]
저널
Comparison of DNA Sequences with Protein Sequences
https://semanticscho[...]
1997-11-15
[36]
웹사이트
ORFfinder
https://www.ncbi.nlm[...]
2021-06-04
[37]
논문
ORF Investigator: A New ORF finding tool combining Pairwise Global Gene Alignment
2012
[38]
웹사이트
OrfPredictor
http://bioinformatic[...]
2021-06-04
[39]
논문
Cap-independent enhancement of translation by a plant potyvirus 5’ nontranslated region
https://pubmed.ncbi.[...]
1990
[40]
웹사이트
ORFik - Open reading frames in genomics
https://bioconductor[...]
2021-06-04
[41]
논문
orfipy: a fast and flexible tool for extracting ORFs
https://academic.oup[...]
[42]
Github
urmi-21/orfipy
https://github.com/u[...]
2021-02-13
[43]
서적
Microbiology: An Evolving Science
W.W. Norton & Co.
[44]
서적
Computational Genome Analysis: an introduction
Springer-Verlag
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com