开放阅读框

2022-11-11 05:01:27   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《开放阅读框》,欢迎阅读!
开放,阅读
开放阅读框

百科名片



蛋白质的开放阅读框



开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。当一个新基因被识别,DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。这是因为在没有其它信息前提下,DNA序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。 ORF

开放阅读框[open reading rame0RF] 是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。 英文原文

An open reading frame (ORF) is a portion of a gene’s sequence that contains a sequence of bases uninterrupted by stop sequences that could potentially encode a protein. When a new gene is identified and its DNA sequence deciphered it is still unclear what its corresponding protein sequence is. This is because in the absence of any other knowledge the DNA sequence can be translated or read in six possible reading frames (three for each strand corresponding to three different start positions for the first codon). ORF identification involves scanning each of the six reading frames and determining which one(s) contains a stretch of DNA sequence bounded by a start and stop codon yet containing no start or stop codons within it a sequence meeting these conditions could correspond to the actual single product of the gene. The identification of an ORF provides the first evidence that a new sequence of DNA is part or all of a gene encoding for a particular protein.


核苷酸序列

在构成基因的核苷酸序列中存在着一些最终翻译成蛋白的碱基段,每三个连续碱基(即三联“ 密码子”) 编码相应的氨基酸。其中有一个起始“密码子”--AUG/ATG和三个终止“ 密码子”,终止“ 密码子”提供 终止信号。当细胞机器沿着核酸合成蛋白链并使其不断延伸的过程中遇到终密码子时,蛋白的延伸反应终止,一个成熟(或提前终止的突变)蛋白产生。因此开放阅读框是基因序列的一部分,包含一段可以编码蛋白的 碱基序列。由于拥有特殊的起始密码子和直到可以从该段碱基序列产生合适大小蛋白才出现的终止密码子,该段碱基序列编码一个蛋白。 ORF软件

现在有很多找ORF软件,包括在线的,如:ORF Finding的功能ORF Finding 被用来预测已存在的编码区的小基因序列。它较早应于序列设计应用优于长片断、高质量的匹配。进而,它提供了比用标准基因编码查询更有用的信息ORF Finding 把提交序列分成六个亚区,并对这六个阅读框分别进行默认,赋予每个亚区一个确定其编码内容的度量, 如果可能,将对每一亚区进行进一步分析。每个亚区按照已有的分类结果,被随机提交给查找它们是否编码 白质的特定测试收集器。最后只有那些具有编码潜能的重要区域才被报导。ORF Finding 识别是证明一个新的DNA序列编码特定的蛋白质的部分或全部的先决条件,可用于大规模的开放式阅读框寻找。 使用说明

使用说明测试过程:当一个基因被识别、其DNA序列被解读时,人们往往仍然无法 弄清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA序列可以按六种框架阅读和翻译 (每条链三种,对应三种不同的起始密码子)。 ORF Finding 针对小基因序列,搜索并报导可能的蛋白质编码区,它检测这六个阅读框架,并寻找以启动子和 终止子为界限的DNA序列,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF Finding 通过如下方式处理您的序列: ·定位六个阅读框上的ORF候选区域 ·对每个候选区域的编码可能性进行评估 ·如果可能性很高,就把该区域作为可能的蛋白质编码区进行报导 编码可能性:是通过从物种训练模拟器收集来的统计数据确定的用。ORF Finding 进行蛋白质编码区的预测,有三步程序。 一步:延伸无终止密码子的序列,把延伸的片断定位在六个阅读框上;它们是下一步进行开放式阅读框研究的候选序列。 第二步:用物种hexamer统计表来估算ORF候选区域上蛋白质编码部分编码蛋白质的最大可能性。 第三步:根据序列结构和区域最可能成分来计算蛋白质编码的可能性。 这种测试利用物种的统计学原理把编码区从非编码区区分出来,其中包括编码蛋白质的最大可能性的估算、3 个过程的测试 ORF片断大小的确定。这种测试应用于物种的二次形式,得到一个三个自由度的 chi-square统计量,被称为候选ORF的二次判别式。这个判别式对于编码区趋向于取大值,对于非编码区 趋向于小值,并被固定化,所以非编码区获取的值趋


本文来源:https://www.dy1993.cn/6e8x.html

相关推荐