k均值课程设计---k均值聚类k-means优化(编辑修改稿)内容摘要:

然后根据各个体的适应度计算个体被选中的概率,用轮盘赌方法进行个体的选择,最后在每次遗传操作后形成新群体时用当前所记录的最优个体替换新群体中的最差个体,以防止遗传操作破坏当前群体中适应度最好的个体。 交叉操作 交叉操作是指对 2个相互配对的染色体按某种方式相互交换部分基因,从而形成 2个新的个体,提高遗传算法的搜索能力。 由于本文染色体采用浮点数编码,因此采用适合浮点数编码的算术交叉算子,即 其 中, a是一个 (0, 1)范围内的随机数。 变异操作 变异是一种局部随机搜索,与选择、交叉重组算子相结合可以保证遗传算法的有效性,使其具有局部随机搜索能力,同时保持种群的多样性,防止非成熟收敛。 本文采用均匀变异算子,其具体操作过程是:对于每个变异点,从对应基因位的取值范围内取一随机数代替原有基因值。 即 其中, r为 (0, 1)范围内的随机数; ,分别是该基因位的数值上下限。 maxU, minU 交叉率和变异率的自适应调整 标准的遗传算法已经被证明无法收敛到问题的全局最优解 ,尤其是在种群分布不均匀时易出现未成熟收敛,即“早熟现象”,在进化中后期由于个体竞争减弱而引起的随机搜索趋势还会导致算法收敛速度缓慢,其原因是进化算子在整个进化过程中都采用了固定的概率值。 为了避免以上问题,本文采用了自适应遗传算子。 自适应遗传参数的选择如下: 其中, avgf表示每代群体的平均适应度值; maxf表示群体中的最大适应度值; 39。 f表示要交叉的 2个个体中较大的适应度值; f表示群体中要变异个体的适应度值。 对于适应度大的个体,赋予其相应的交叉和变异概率,而对于适应度小的个体,其交叉概率和变异概率较大,自适应的交叉和变异概率能够提供相对某个解最佳的 cp和 mp,使自适应遗传算法在保持群体多样性的同时,保证算法收敛。 5 K 均值操作 先以变异后产生的新群体的编码值为中心,把每个数据点分配到最近的类,形成新的聚类划分。 然后按照新的聚类划分,计算新的聚类中心,取代原来的编码值。 由于 K均值具有较强的局部搜索能力,因此引入 K均值操作后,遗传算法的收敛速度可以大大提高。 6 循环终止条件 循环代数开始为 0,每循环一次,代数加 1,若当前循环代数。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。