基于粒子群优化的快速knn分类算法内容摘要:
法 文档分类的训练样本集规模很大 KNN方法穷尽搜索整个样本空间的代价很大 粒子群算法群体的随机搜索能力,群体利用与其 k个随机样本距离最近的粒子信息指导种群粒子的移动,在很小的搜索空间内快速获得 k个近邻样本。 输入:文档集合文档总数 N,近邻个数 k,粒子群种群个数 Q,误差阈值 ε。 (1) 生成测试文档的文档特征向量 w; (2) 用随机函数在区间 [1,N]内为 Q个粒子各选择出 k个整数(对应文档集合的文档序号)作为每个粒子的初始 k个近邻位置,粒子群的初始速度为 0; (3) 计算 w的 k个最优近邻有序集合作为粒子群的全局最优位置,各粒子的位置先作为其局部最优位置。 (4) 置 n=n+1,计算每个粒子的移动速度 (即其 k个近邻的序号偏移量 ) (5) 从种群移动历史中选择 w的 k个最优近邻有序集合作为全局指导, If ,则 ;从粒子 j的移动历史中。基于粒子群优化的快速knn分类算法
相关推荐
体域自治性等等。 目标 :寻找一种合适的方法来量化这些定性描述的安全元素。 :安全元素 参考: Basit Shafiq, James . Joshi: Secure Interoperation in a Multidomain Environment Employing RBAC Policies. IEEE TRANSACTIONS ON KNOWLEDGE AND DATA
w):“又译”,同义词 T(w):“艾菲尔铁塔” 郑州大学自然语言处理实验室 百度百科 (2/4) 2 T(w)+S(w)+W(w) 例如:“澳大利亚”的百科内容中: 澳大利亚联邦( The Commonwealth of Australia)简称澳大利亚( Australia)。 以上内容中 T(w):澳大利亚联邦, S(w):简称,W(w):澳大利亚 郑州大学自然语言处理实验室 百度百科
同一个事务聚类内用户之间的浏览模式尽可能相似,而不同事务聚类中用户之间的浏览模式尽可能不同 给定事务聚类 c和显著性阈值 ,事务聚类 c的总体使用特征 prc的计算方法如下: prc = {p, weight(p, prc) | p P, weight(p, prc) } weight(p, prc) = 推荐引擎 根据当前的用户会话产生实时的推荐集 用户当前会话
测平台,整个系统的架构如 图 : 分析 检测 流程 • 平台 基于 HDFS中的离线数据使用 Spark训练模型 ,然后将训练好的模型交给 Spark Streaming进行分析检测。 分析 检测 流程 • 采用 离线模型训练与在线分析检测结合的方法可以最大限度的利用大数据平台的高效计算能力,同时利用 Spark streaming的特性保证数据检测的实时性。 实验结果与分析 • 实验环境 –
取元数据的协调厂商索取元信息 二、项目实施过程 按照 DC标准建立的电子书元数据信息表 电子资源元信息 汇总 二、项目实施过程 电子书元信息汇总 汇文 OPAC内建立存储表 元信息数据注入汇文数据库 电子资源元 信息处理 对题名、著者等重要检索字段进行 索引 二、项目实施过程 汇文 OPAC系统整合改造 汇文检索 主程序 ,加入电子书检索模块,实现在检索纸质图书的同时检出相关电子书资源。 二