2000年全国大学生数学建模竞赛论文内容摘要:

=2(An+Gn)n : 嘌呤 类 ,嘧啶 类的相对 数目 Yn=2(An+Cn)n : 氨基 类 ,酮基 类的相对数目 Xn=2(An+Tn)n : 弱 键结 ,強 键结的相对数目 Rn : 三维坐标 (Xn,Yn,Zn) Ω : 分类 正确率 四 、 问题分析 本题属于现代前沿科学研究中的热点。 为 了 判断自然 DNA 序列的类别, 可以 让自然 DNA 序列 和 人工制造的已知类别的 DNA 序列 来 进行比对, 判断自然 DNA 序列的类别。 本题中, 通过对 A 类 ,B 类 DNA 序列的各自一般特点的分析 , 找到 A 类 DNA 序列 与 B 类DNA序列各自的 特点 ,总结 出 分类的方法 ,用以区分题目给出的另外 20条人工 DNA序列以及 182 条自然态 DNA 序列 . 五、模型建立 与求解 Ⅰ、 求解人工 DNA 分类 首先,参照 DNA序列 的实际特性和 前沿的最新研究 [1], 定义 DNA的 Z曲线 (ZCurve)模型 : 已 知核苷酸有三种特性: 嘌呤( A, G) VS 嘧啶( C, T); 强键( C, G) VS 弱键( A, T); 氨基( A, C) VS 酮基( G, T); 设 对于任何一个 DNA 序列,第 1个到第 n 个 碱 基中, A, T, C, G 出 现 的 个数 各 为 An, Tn, Cn, Gn 接 着定义 DNA 序列 三 维坐标 Rn=(Xn, Yn, Zn),其中 Xn, Yn, Zn定义为 : Xn=2(An+Gn)n Yn=2(An+Cn)n Zn=2(An+Tn)n 若有一序列 总长度为 N, 则 可以由以上 定义 算出 Rn( n=1,2,3…… ,N), 并 在三 维空间 中画出轨迹。 这里为方便 观察 , 我们只 画 出 Z 曲线的二维形式: X(n),Y(n),Z(n)。 ★ Z 曲线的 实际 意义 : Xn=2(An+Gn)n → Xn0 表嘌呤 类较 多,嘧啶 类较 少。 Yn=2(An+Cn)n → Yn0 表氨基 类较 多,酮基 类较 少。 Zn=2(An+Tn)n → Zn0 表弱 键结较 多,強 键结较 少。 求解已知类别的 20 个人工制造的序列的 Z曲线 根据 Z 曲线定义,编写 Matlab 程序( 见附录)求解已知类别的 20 个人工制造的序列 Z曲线, 根据所得 Z 曲线归纳 A 类及其 B类 DNA 序列的特征 ,所得结果如下 : 图 1—— 左下 10 图分别为 DNA 序列 110,右下 10 图分别为 DNA 序列 1120 ★图线意义: 红色曲线表示 X(n) 黑色曲线表示 Y(n) 蓝色曲线表示 Z(n) 我们考虑各曲线终点所对应的纵坐标的值,将其与 0 比较,并以此为依据将 DNA 序列分为 8 类: Xn0, Zn0, Yn0 Xn0, Zn0, Yn0 Xn0, Zn0, Yn0 Xn0, Zn0, Yn0 Xn0, Zn0, Yn0 Xn0, Zn0, Yn0 Xn0, Zn0, Yn0 Xn0, Zn0, Yn0 可得如下表格: 红 蓝 黑 符合条件的 序列 组 0 0 0 0 0 1 0 1 0 1 1 1 1 1 1 1 1 20 0 1 1 17 1 0 0 10 1 0 1 1 1 0 7 1 1 1 4 说明: 0 表示该曲线终点对应的纵坐标的值小于 0 1 表示该曲线终点对应的纵坐标的值大于 0 根据表格,可知 A 类的 DNA 序列分布在( 1, 0, 0),( 1, 1, 0),( 1, 1, 1)三组中,三组的共同。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。