haccp在蜂产品原料控制中的应用(ppt45)-haccp(编辑修改稿)内容摘要:

,当将样本分成 5类时,它们主要集中在第二类。  与可能的检验标准 - 与目标样本的聚类结果差别明显。 这说明,合理的检验结果应该在 -。 3 基于相似合成算法的聚类方法 对检验标准的分析  以上层次聚类在方法上存在不完善的地方 ,这可能会影响到分析结果。 其不足包括:  ⑴ 类别个数的确定主观性强。 如上面的分析中 , 到底将数据样本分成几类才能最恰当地反映它们之间的相似程度未知 , 只能通过建模者的主观判断进行试错分析。  ⑵ 层次聚类方法将所有数据样本作为学习集 ,从中寻找数据样本反映的规律。 但是数据样本中包含的信息除了反映共性规律外 , 还有反映个性特征的信息。 将所有数据样本作为学习集得到的聚类结果可能可以很精确地反映学习集的情况 , 但是对于新加入的 、 具有同一规律性的数据样本就可能不适用 , 即聚类结果不具有良好推广能力 , 出现 “ 过拟合 ”。 如果这样 , 那么基于层次聚类的分析结果的可信度就值得怀疑。  基于相似合成算法的聚类方法可以解决以上 2个问题。 基于相似合成算法 的聚类方法简介  由 Lorence提出的相似体合成算法 ( Analog Complexing, 以下简称 AC) [1]是对模糊对象的预测 、 聚类和分类的一种序列模式识别方法 , 最先提出 AC算法是为了解决对模糊经济对象的预测问题。 应用 AC算法进行预测时 , 一般需要待研究的过程满足以下假设:  ( 1) 系统由多维过程所描述;  ( 2) 多维过程的观察值很多 ( 长期序列 ) ;  ( 3) 多维过程是充分有代表性的 , 即由基本的系统变量形成数据集;  ( 4) 过程的行为一般将在一段时间内相似地重复。  AC包含 3个步骤 [2]: 1) 待选模式的产生; 2) 待选模式的变换; 3) 相似模式的选取。 待选模式的产生 待选模式的变换 • 根据工作原理,对于长度为 k的某参照模式,在数据样本中可能有一个或几个长度为 k的相似模式。 但是由于系统是动态的,不同时期的相似模式可能具有不同的平均值和标准方差。 因此,需要用一种变换来描述这些差异,将模式变换到同一基准点上从而使各模式具有可比性。 即为了下面将进行的模式间相似性的度量,必须寻找待选模式到参照模式的变换。 一般取线性变换为: *1,*1,*1,1*,*,*,1***1................)]([kimkilkijimjiljimiliikixxxxxxxxxiPT 相似模式的选取  ⑴ 模式相似度  这一步的主要目的是识别模式形状间的相似性,其度量我们称为模式相似度。 一般地,第 i个待选模式与参照模式间的距离可定义为:   模式间的相似度可由距离来度量,如定义第i个模式与参照模式的相似度 si为: ,显然距离值越大,模式相似度就越小。    。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。