数据挖掘概念与技术数据预处理(编辑修改稿)内容摘要:

y or accuracy ( also known as rule reliability , rule strength, rule quality, certainty factor, discriminating weight )等 .  有用性 (utility)  如: support (association),s(A=B)=n(A nd B)/n(all),  noise threshold (description)  新颖程度 (novelty)  如: not previously known, surprising (used to remove redundant rules, ., Canada vs. Vancouver rule implication support ratio 结果模式的可视化  挖掘系统应能够用多种形式来显示发掘出来的模式  如:规则,表,报表,图表,图,决策数和立方体  挖掘系统应能够支持挖掘结果的多种操作  如: drilldown , rollup , slicing , dicing ,rotation… 挖掘原语,语言和体系结构  数据挖掘原语  数据挖掘语言  数据挖掘系统体系结构  总结 DMQL——一个数据挖掘语言  动机  为了能提供交互式数据挖掘能力  通过提供一个类似 SQL的语言  希望能像 SQL语言一样成为挖掘标准语言  希望成为系统开发和演化 (evolution)的基础  希望促进信息交换,技术转移,商业化并获得广泛承认  设计  DMQL 在前面介绍的挖掘原语基础之上进行设计 任务相关数据的语法表示  use database database_name, or use data warehouse data_warehouse_name  from relation(s)/cube(s) where [condition]  in relevance to att_or_dim_list  order by order_list  group by grouping_list  having condition 任务相关数据语法表示(续)  例:如果挖掘 AllElectronics的加拿大顾客经常购买的商品之间的关联,针对顾客不同收入和年龄,并且数据用购买日期进行分组。 挖掘相关数据可以写成 : use database AllElectronics_db in relevance to , , , from customer C , item I , purchase P , item_sold S where = and = and = group by 挖掘知识类型的语法  Mine_Knowledge_Specificaton::=Mine_Char | Mine_Discri | Mine_Assoc | Mine_Class | Mine_Pred  Mine_Char::= Mine characterization [as pattern_name] analyze meansure(s)  例: mine characteristics as customerPurchasing analyze count%  Mine_Discri::=Mine parison [as pattern_name] for target_class where target_condition { versus contrast_class_i where contrast_condition_i} analyze measure(s)  例: mine parison as purchaseGroups for bigSpenders where avg() ≥$100 analyze count versus budgetSpenders where avg(),$100 挖掘知识类型的语法 (续 )。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。