关联规则挖掘举例内容摘要:

B ,E } 超过三项{ A ,C } + { C ,E } { A ,C , E}{ B ,C } + { B ,E } { B ,C , E}{ B ,C } + { C ,E } { B ,C , E}{ B ,E } + { C ,E } { B ,C , E}从 K2 中求可用来计算的的三项集{A,B,C} 25%{A,C , E} 25%50%{B,C , E}C3支持度 50 支持度 50 L 3 {B,C , E} 50%Apriori算法举例 _产生关联规则 • 对于频繁项集 {B,C,E},它的非空子集有 {B}、 {C}、 {E}、 {B,C}、 {B,E}、{C,E}。 以下就是据此获得的关联规则及其置信度。 规则 置信度 Confidence BCE % CBE % EBC % CEB 1 BEC % BCE 1 置信度 ≥50%(最小置信度 ), 都是强关联规则 Apriori算法弊端 需要多次扫描数据表 如果频繁集最多包含 10个项 , 那么就需要扫描交易数据表 10遍 , 这需要很大的 I/O负载 产生大量频繁集 若有 100个项目 , 可能产生候选项数目 1 2 1 0 0 3 01 0 0 1 0 0 1 0 0. . . 1 . 2 7 * 1 0C C C   FPgrowth算法 •Jiawei Han等人在 2020年提出了一种基于 FP树的。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。