当前位置:主页 > 理工论文 > 系统学论文 >

基于数字信号处理方法的基因预测

发布时间:2020-05-13 03:53
【摘要】: 基因是指携带有遗传信息的DNA或RNA序列,也称为遗传因子,是控制性状的基本遗传单位。基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。基因预测是基因表达、基因调控、蛋白质结构预测、生物医学工程研究的基础,以基因预测为基础的研究最终将用来解释包括进化在内的其他各种生命过程和生命现象,可以说,基因预测是后基因组时代研究的基础。本文运用数字信处理的方法来对基因进行预测。 首先本文基于基因外显子周期3特性,运用滑动窗法对基因预测的基本原理进行了分析,并仿真得到了预测曲线,总结并提出外显子的长度和周期性是影响预测结果的重要因素。其次,预测基因序列的同时,提出了一种预测基因外显子位置的快速算法,对于滑动DFT算法,提出了新的证明方法,对Goertzel算法进行了详细的推导,并运用这三种算法对基因序列进行仿真预测和比较。然后,针对背景噪声的问题,需要选通性较好滤波器进行预测,对陷波滤波器和多级滤波器的实现进行了详尽的推导,并对基因序列进行滤波,得到较好的基因预测曲线。最后,为了进一步抑制背景噪声,更好地预测基因序列F56F11.4a中的第一个外显子,运用频率抽样法设计了FIR窄带带通数字滤波器,对基因序列滤波,得到了较为理想的预测效果。
【图文】:

DNA序列,基因,密码子,外显子


2.3 DNA、基因、外显子和内含子DNA 是脱氧核糖核酸的简称,是绝大部分生物遗传信息的化学载体。而基因就是 DNA 分子上具有遗传效应的特定核苷酸序列,也被称为遗传因子,是控制性状的基本遗传单位。基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。一个 DNA 链可分为基因和基因间隔区,基因区可被用来编码蛋白质决定生物性状,而基因间隔区并不编码蛋白质。对于真核生物的细胞来说,基因又可被分为外显子(exon)和内含子(intron)。外显子就是基因内的编码区,而内含子并不参与蛋白质的编码。外显子处于启始密码子和终止密码子之间的区域。密码子是 DNA 序列中包含三个碱基序列的子序列。密码子是由组成 DNA 序列的 4 种碱基中的 3 种所组成,所以总共有 64种可能的密码子。在这 64 种可能的密码子中,有一个启始密码子和三种终止密码子,,其余的密码子负责编码组成蛋白质的二十种氨基酸。DNA 序列,基因,基因间隔区,外显子,内含子和密码子的关系如图 2-1、图 2-2 和图 2-3 所示。

外显子,内含子,密码子


外显子就是基因内的编码区,而内含子并不参与蛋白质的编码。外显子处于启始密码子和终止密码子之间的区域。密码子是 DNA 序列中包含三个碱基序列的子序列。密码子是由组成 DNA 序列的 4 种碱基中的 3 种所组成,所以总共有 64种可能的密码子。在这 64 种可能的密码子中,有一个启始密码子和三种终止密码子,其余的密码子负责编码组成蛋白质的二十种氨基酸。DNA 序列,基因,基因间隔区,外显子,内含子和密码子的关系如图 2-1、图 2-2 和图 2-3 所示。图 2-1 构成 DNA 序列的基因与基因间隔区
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TN911.72;N945.24

【参考文献】

相关期刊论文 前6条

1 马宝山;朱义胜;;一种用于基因预测的FIR数字滤波器[J];电子学报;2007年09期

2 黄科,曹家树,吴秋云,温庆放;生物信息学[J];情报学报;2002年04期

3 卢欣,陈惠民,李衍达;细菌 DNA 序列中的长程相关性[J];清华大学学报(自然科学版);1999年07期

4 杜永莉,王志萍,程瑾;因特网生物信息学数据库资源及其利用[J];中华医学图书情报杂志;2004年06期

5 王明怡,吴平,王德林;基于相关性分析的基因选择算法[J];浙江大学学报(工学版);2004年10期

6 陈晓燕,鲍伦军,莫金垣;连续小波变换法分析核酸序列的长程相关性[J];中山大学学报(自然科学版);2003年03期



本文编号:2661335

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/xtxlw/2661335.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8a805***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com