基于web的个性化服务内容摘要:

同一个事务聚类内用户之间的浏览模式尽可能相似,而不同事务聚类中用户之间的浏览模式尽可能不同  给定事务聚类 c和显著性阈值 ,事务聚类 c的总体使用特征 prc的计算方法如下: prc = {p, weight(p, prc) | p  P, weight(p, prc)  } weight(p, prc) = 推荐引擎  根据当前的用户会话产生实时的推荐集  用户当前会话 S可以表示为: S = {s1, s2, … , sn}  总体使用特征 C可以表示为: C = {w1C, w2C, … , wnC } 推荐引擎  使用余弦相似性函数来计算 C和 S之间的匹配系数:  计算浏览页 p的推荐系数 Rec(S, p): 基于 Web使用挖掘和 Web内容挖掘的个性化 [6]  基于 Web使用挖掘的个性化服务的问题:  商业网站的用户使用数据比较少  网站内容变化比较频繁  基本思路:在基于 Web使用挖掘的基础上, 根据浏览页内容之间的相似性为用户提供个性化服务 基本过程  离线部分  数据预处理  内容特征获取  在线部分  推荐引擎 数据预处理  从文本数据和元数据中抽取内容特征  内容特征权重的计算方法:  元数据而的权重由商业网站的设计者提供  文本内容特征而言的权重由词频反文献频率 (TFIDF)确定 数据预处理的结果  浏览页 p表示为内容特征空间上的 k维向量: p = fw(p, f1), fw(p, f2), …, fw(p, f k) fw(p, f i)为浏览页 p在特征 f i上的权重  必须对将元数据与文本内容特征进行一致化处理 内容特征获取  浏览页内容特征矩阵的行列互换,每个内容特征看作浏览页空间上的 n维向量  使用聚类算法对内容特征。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。