基因序列比对算法的优化研究
1990年,人类基因组计划(HGP)正式启动,该计划被誉为生命科学的“阿波罗登月计划”,随着该计划的实施,生物学相关的数据呈爆炸式的增长。如何对这些海量的生物数据进行处理,成了生物科学家亟待解决的问题。生物信息学融合了分子生物学、计算机科学、数学等学科知识,为日益增长的生物数据的处理提供了新的方法。在生物信息学的研究中,最基础的问题是对生物序列进行分析,序列比对是最基本的操作,它对于发现生物序列中的功能、结构和进化信息具有非常重要的意义。如何开发出高效、准确的序列比对算法是目前序列比对的一个难点,本文基于以上背景对序列比对问...
1990年,人类基因组计划(HGP)正式启动,该计划被誉为生命科学的“阿波罗登月计划”,随着该计划的实施,生物学相关的数据呈爆炸式的增长。如何对这些海量的生物数据进行处理,成了生物科学家亟待解决的问题。生物信息学融合了分子生物学、计算机科学、数学等学科知识,为日益增长的生物数据的处理提供了新的方法。在生物信息学的研究中,最基础的问题是对生物序列进行分析,序列比对是最基本的操作,它对于发现生物序列中的功能、结构和进化信息具有非常重要的意义。如何开发出高效、准确的序列比对算法是目前序列比对的一个难点,本文基于以上背景对序列比对问题进行研究。
  本文首先对序列比对问题的研究现状做了简要分析,对生物信息学的基础知识做了简单概括。然后深入研究了序列比对问题,对经典的双序列比对算法:Needleman-Wunsch算法、Smith-Waterman算法及点阵图法进行了系统论述;对多序列比对中的精确比对算法、渐进比对算法、迭代算法进行了讨论,对基于这三个算法思想的几个常用算法进行了概述。
  最后,本文以多序列比对为研究对象,重点研究了遗传算法,对遗传算法的思想及基本原理进行了论述。根据遗传算法的特点,对遗传算法的编码方式、遗传算子、选择算子等方面进行了重新设计,使遗传算法得到一定程度的优化,利用优化的遗传算法来进行多序列比对。通过实验的方式,与其他算法进行比较,从实验结果和实验分析的角度来对改进后算法进行评估。
展开
作者: 汪浩
学科专业: 管理科学与工程
授予学位: 硕士
学位授予单位: 中国农业科学院
导师姓名: 王文生
学位年度: 2015
语 种: chi
分类号: Q78
在线出版日期: 2015年9月7日