基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现_毕业论文(编辑修改稿)内容摘要:
合,尤其应尽量少选水平。 “分批走着瞧,在有苗头处着重加密,在过稀处适当加密” 是节约试验次数的一条根本原则。 在多批试验中,在不增加试验次数的前提下,可以多选因素,少取水平,这意味着每批用小号正交表,做少数次试验,即通过各批很少的总次数就能找到当前设备和工艺技术前提下的最优生产条件。 当试验因素考查的范围较宽时,若仍然只选 2 水平进行试验,就会有很多范围没有机会进行考查,试验结果就可能得到局部最优。 此时试验因素应多选水平,以便找到全局最 优。 在一项试验中,如不能分批或只能少分批的试验(如数学试验、均匀试验),也希望多取水平。 选用正交表 选定了因素数和水平数后,则可选择合适的正交表。 具体选哪张正交表,应该根据因素和水平多少以及试验的工作量大小而定。 例如,每个因素有 2 水平时,当因素为 2~3 时,一般选 32 2L 正交表;当因素 4~7 个时,一般选用 78 2L ,当因素个数较多时,试验条件 又允许事,也可用 1516 2L正交表。 通常情况下,选用正交表时既不允许裁减试验因素,也不允许缩减试验因素的水平,即因素水平表必须在选用的正交表中得到完全的安排。 如果选用的正交表既能容得下所有试验因素,又使试验号最小,就认为所选的正交表是合适的。 因此在选正交表时,只要试验因素能安排的下,就尽量可能选小号的正交表。 例如,挑好 4 个因素,如果每个因素取 4 个水平,则必须用 516 4L 正交表,要做 16 次试验。 为了节约试验次数,改为每个因素取 3 个水平,则用 49 3L 正交表,只做 9 次试验就可以了。 到底用哪个正交表则应根据实际情况进行选取。 试验次数的多少各有利弊,不能一概而论。 一般以快为主的时候选用试验次数少一些的正交表,而以好好为主的时候做则应选用试验次数稍多一些的正交表。 表头设计 正交表只提供了一些列和各列对 应于每次试验的水平号,这与所选取的因素和水平并没有一一对应的关系,研究人员还必须把所选的每一个因素都安排到一个合适的列上。 这种把各个因素分别安排在正交表的适当列上的过程称为表头设安徽建筑大学毕业设计(论文) 11 计。 这一步在一些简单的情况下是很容易的,可以将所选定的因素随意安排在正交表的不同列上。 但当考虑交互作用时,往往比较复杂。 一般而言避免混杂是表头设计的一个重要原则,也是表头设计选优的一个重要条件。 混杂是指在正交表的同一列安排了两个或货两个以上的因素或交互作用。 这样就无法确定同一列中的这些不同因素或交互作用对实验指标的作用效果。 但是有时 为了满足试验的某些要求,或是为了减少试验次数,可以允许一级交互作用的混杂,也可以允许次要因素与高级交互作用的混杂,但是一般不允许因素与一级交互作用的混杂。 编制试验方案 表头设计完成后,将正交表安排有因素的各列中不同数字换成对应因素的相应水平,即构成试验方案。 安排考查交互作用的各列对试验方案及试验的具体实施不产生任何影响。 试验过程中,应当严格保证各号组合处理,严格控制试验因素的水平,试验条件应当尽量保持一致。 试验方案中的试验号并不意味着是实际进行试验的顺序。 为了加快试验进程,最好进行同时试验,同 期取得全部的试验结果。 如果条件只允许一个一个的进行试验,为了排除外界的干扰,应使试验号随机化,即采用抽签,掷骰子或查随机数字表的方法确定试验顺序。 不论用什么顺序进行试验,一般都应进行重复试验,以减少随机误差对试验指标的影响。 试验结束后,将试验结果直接填入试验指标栏内。 安徽建筑大学毕业设计(论文) 12 4 实验数据分析 实验数据的综合分析 正交设计中数据的综合分析方法的步骤为: 第一步 算出所有数据的总评均值。 将所有数据的总平均值记为 FX 一般求总平均值的公式为 11 n iiF X F Xn ( 41) 式中, n 为试验次数。 第二步 算出 iF 各水平的平均值 定义 在 n次试验中第 i因素的 j水平出现的各次实验所对应的实验数据的平均值,称为 i因素 j 水平的水平平均值, 记为 jiF。 1jikjikF F XiF F Xr ( 42) 式中, jiiF F X 是指在第 k 次试验中, i因素取 j 水平。 第三步 算出各因素的极差 定义 因素的全部水平平均值中,最大值与最小值之差称为该因素对目标函数影响的极差 ,简称为 i因素的极差,记为 iF。 则 jji i iF Ma x F Mi n F ( 43) 一个因素的极差说明了该因素在试验范围内对目标函数的影响的大小,极差越大,说明该因素对目标函数影响越大,反之越小。 利用对试验数据进行综合分析的方法可得到以下几个方面的有用信息。 ① 每因素的最优水平及各因素的最优水平组合(根据水平平均值 jiF )。 ② 各因素对目标函数影响的大小顺序(根据 iF )。 ③ 最优水平组合条件下目标函数估计值。 (利用此方法也可计算出任意水平组合条件下目标函数的估计 值)。 这些信息是非常有用的,但仔细考察发现还有以下几点不能让人满意的问题。 ① 各 jiF 的值到底有多大。 ② 本次试验的误差有多大。 安徽建筑大学毕业设计(论文) 13 ③ 各因素对目标函数都有一定影响,但这些影响是否可以忽略不计,或者说这些因素影响是否是显著的。 ④ 利用实验值估计出的目标函数值的可靠性如何。 也就是说估计的误差有多大。 上面这些问题对我们来说是非常重要的,不知道 jiF 的确切值,想求出因素对目标函数影响的确切关系是难以做到的;不知道试验的误差有多大,就不知道试验所得数据的可靠性;不知道因素对目标函数的影响是否显著,也就不知道试验的效果;不知道利用试验值估计出来的目标函数值的可靠性如何,就不能贸然将这种估计值用于生产实践。 这些问题用 综合分析的方法是很难解决的,需要用统计的方法来加以解决。 下面就介绍试验数据的统计分析方法。 实验数据的统计分析 因素效应值 定义 i 因素第 j 水平的数据平均值与总平均值之差称为 i 因素 j 水平的效应值; i 因素的所有水平的效应值统称为 i 因素的效应值,简称 i 因素的因素效应,记为 jiF。 0j j ji i iF F F X F F ( 44) 由于 jiF 和 FX都可以确切的计算出来,所以 jiF 的值也能计算出来。 可以用约束条件1 0il jij F 来检查因素效应值的计算是否正确。 若某因素的全部效应值 之和不为 0,则该组因素效应值的计算是不正确的,需要重新校核。 当然由于四舍五入,一个因素效应值之和可能不为。 如果在计算中没有四舍五入,则一个因素的各效应值之和就必须为 ,各效应值之和为 0,并不能说明计算是肯定正确的。 因素的自由度 定义 求解一组未知数所需要独立方差的个数称为这组未知数的自由度。 那么一个因素各水平的自由度是 多少呢。 若一组因素的水平为 il ,则可知这 il 个因素效应值之间有一约束条件 121 1 1 0ilF F F ( 45) 安徽建筑大学毕业设计(论文) 14 这就是说解这 il 个未知数只需要 il 1个方程即可。 于是得出:一个因素的自由度为该因素的 水平数减 1,将其记为 if。 则有 1iifl ( 46) 误差效应 若在一个正交设计中,各因素的自由度之和加 1 小于试验的容量,即 11mii fn ( 47) 则根据线性方程组的理论取其中的一部分线性无关的方程就可解出未知数。 但由于试验误差的存在,即使是两次实验的条件完全相同,所得的结果也会有差别。 这样当方程的个数多于未知数个数时就会出现矛盾方程,反而解不出来未知数来。 要解决这类问题需要加上松弛未知数,也就是误差。 这就像我们多次测量同一个物体的长度时,若测出的数值不同时反而不知道应该取哪一个值才好,但当引入误差后,可以将这些数的平均值作为这个物体的长度。 然后根据平均 值和测量值可以求出若干个误差。 如正交表中的一列既然没有安排因素,就不应该有效应值,也就是说各效应值都为 ,这一列的试验条件尽管没变,但其效应值一般不为 0,这类似于多次测量同一个物体的长度所得到的值可能各不相同一样。 可以这样解释这一现象:假定空闲列上也安排了某一因素,但该因素各水平的取值为一常数(尽管不符合因素的定义,但有助于理解),于是各水平对目标函数的影响应该是相等的,即应该有 1 2 3 0i i iF F F 。 但由于实验中不可避免的存在误差,因而导致了各效应值不全为 两次试验,其结果也不会不同一样,这种差别就是误差。 将空闲列看成误差列后,这一列的效应值就是误差,通常称为误差效应。 误差效应的求法与普通因素效应值的求法一样(各水平平均值与总评均值之差)。 误差一般记为 ie ( i=1,2„)。 其中, i为正交表中的第 i个误差列(当误差列多于一列时)。 显著性检验 某因素的不同水平引起总 平均值的变化是大还是不大呢。 换句话说这种变化是明显还是不明显,是否可以忽略不计呢。 要解决这一问题,需要进行一定的安徽建筑大学毕业设计(论文) 15 判断已进行取舍。 这就要取一个可比较的参数及一个极限值。 一个因素的效应值是否明显,应该依赖于客观标准,而不应该依赖于主观选取的标准。 那么客观的标注是什么呢。 这就是误差。 将因素效应与误差效应相比,若某因素的因素效应明显地大于误差效应,则认为该因素的因素效应应对目标函数的影响是明显的,不是由误差由误差引起的,一般称之为是显著的。 若某因素的因素效应与误差效应相比差别不大,则很难断定它对目标函数的影响是不是 由误差引起的,这时称该因素是不显著的。 对于 2 水平正交设计的显著性检验,常用 t检验( Studentt)法, t检验是用于检验数据平均值齐性的方法,即判断数据平均值是否有显著性差别的方法。 由于 2 水平因素的效应值实际上只有一个,我们可以用某一个水平效应值的绝对值来作为该因素效应的平均值。 对于 2 水平正交设计,用 t检验十分方便,可以减少大量的计算。 在 t检验中,因素效应的平均值可以作为效应值的绝对值,可以用误差的均方根作为误差的平均值。 t检验的具体步骤如下: ① 计算因素效应值 ② 计算误差的均方根(标准差) 21iesefe ( 48) 若在安排实验时没有构造误差列,则可根据正交性先求出 De,在根据 De 用下求出 se Desen fe ( 49) 2 20,1ni i i jiD e F X n F D F D F ( 410) ③ 查 t分布表,求出 fe , fe , fe。 根据查的数据求出 Se fe。基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现_毕业论文(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。