数据仓库与数据挖掘综述(编辑修改稿)内容摘要:

随时间变化) 13. 变长数据 14. 加锁管理(程序员能显式控制锁管理程序) 15. 单独索引处理(查看索引就能提供某些服务) 16. 快速恢复 数据仓库技术 — [Inmon, 1996] 17. 其他技术特征,传统技术起很小作用  事务集成性、高速缓存、行 /页级锁定、参照完整性、数据视图 18. 传统 DBMS与数据仓库 DBMS区别  为数据仓库和决策支持优化设计  管理更多数据: 10GB/100GB/TB  传统 DBMS适合记录级更新,提供:锁定 Lock、 提交 Commit、 检测点CheckPoint、 日志处理 Log、 死锁处理 DeadLock、 回退 Roolback.  基本数据管理,如:块管理,传统 DBMS需要预留空间  索引区别:传统 DBMS限制索引数量,数据仓库 DBMS没有限制  通用 DBMS物理上优化便于事务访问处理,而数据仓库便于 DSS访问分析 19. 改变 DBMS技术 20. 多维 DBMS和数据仓库  多维 DBMS作为数据仓库的数据库技术,这种想法是不正确的  多维 DBMS( OLAP) 是一种技术,数据仓库是一种体系结构的基础 21. 双重粒度级别( DASD/磁带) 数据仓库技术 — [Inmon, 1996] 22. 数据仓库环境中的元数据  DSS分析人员和 IT专业人员不同,需要元数据的帮助  操作型环境和数据仓库环境之间的映射需要元数据  数据仓库包含很长时间的数据,必须有元数据标记数据结构 /定义 23. 上下文和内容(上下文维)  简单上下文信息(数据结构 /编码 /命名约定 /度量)  复杂上下文信息(产品定义 /市场领域 /定价 /包装 /组织结构)  外部上下文信息(经济预测:通货膨胀、金融、税收 /政治信息 /竞争信息 /技术进展) 24. 刷新数据仓库  数据复制(触发器)  变化数据捕获( CDC)( 日志) 提纲  数据仓库概念  数据仓库体系结构及组件  数据仓库设计  数据仓库技术(与数据库技术的区别)  数据仓库性能  数据仓库应用  数据挖掘应用概述  数据挖掘技术与趋势  数据挖掘应用平台(科委申请项目) 数据仓库性能 — [Inmon, 1999]  使用  数据  平台  服务管理 王天佑 等译,《数据仓库管理》, 电子工业出版社, 20xx年 5月 提纲  数据仓库概念  数据仓库体系结构及组件  数据仓库设计  数据仓库技术(与数据库技术的区别)  数据仓库性能  数据仓库应用  数据挖掘应用概述  数据挖掘技术与趋势  数据挖掘应用平台(科委申请项目) 数据仓库应用 — DW用户数的调查 5 0 0 1 0 0 016% 1 0 0 014%1 0 0 5 0 036% 1 012%5 0 1 0 022%“ DW系统的用户 在 100500以内或以上 是未来一段时期内 的主要部分“ DW用户 的调查 最近一年 Meta Group Survey 调查对象: 3000+ 用户或意向用户 DW数据规模的调查 1 T B40% 5 0 G B12%5 0 2 5 0 G B19%2 5 0 5 0 0 G B8%5 0 0 G B 1 T B21%DW规模的调查 最近一年 Meta Group Survey 调查对象: 3000+ 用户或意向用户 How Much?  $36m for midsize pany, less if smaller, more if larger  $10m+ for large anizations, large data sets  1050+% annual maintenance costs  33% Hardware / 33% Software / 33% Services How Long?  24 years for 80/20 of full system for midsize pany  612 months for initial iteration  36 months for subsequent iterations How Risky?  For EDW Projects, 20% (Meta) to 70% (OTR, DWN) fail  High failure rate for nonbusiness driven initiatives  Very few systems meet the expectations of the business  Failure not due to technology, due to “soft” issues  Massive upside to successful projects (100% 20xx+% ROI)  99% politics 1% technology 参考文献  Inmon,.,” Building the Data Warehouse” ,Johm Wiley and Sons,1996.  Ladley,John,”Operational Data Stores:Building an Effective Strategy”,Data warehouse:Pratical Advice form the Experts,Prentice Hall,Englewood Cliffs,NJ,1997.  Gardmer,Stephen R., “Building the Data warehouse”,Communication of ACM, September 1998, Volume 41, Numver 9, 5260.  Douglas Hackney , , DW101: A Practical Overview, 20xx  Pieter R. Mimno, “The Big Picture How Brio Competes in the Data Warehousing Market”, Presentation to Brio Technology August 4, 1998.  Alex Berson, Stephen Smith, Kurt Therling, “Building Data Mining Application for CRM”, McGrawHill, 1999  Martin Stardt, Anca Vaduva, Thomas Vetterli, “The Role of Meta for Data Warehouse”, 20xx  , Ken Rudin, Christopher K. Buss, Ryan Sousa, “Data Warehouse Performance”, John Wiley amp。 Sons , 1999 提纲  数据仓库概念  数据仓库体系结构及组件  数据仓库设计  数据仓库技术(与数据库技术的区别)  数据仓库性能  数据仓库应用  数据挖掘应用概述  数据挖掘技术与趋势  数据挖掘应用平台(科委申请项目) 数据挖掘应用综述  数据挖掘应用概述  数据挖掘技术与趋势  数据挖掘应用平台 数据挖掘应用概述  应用比例  Data Mining Upsides  Data Mining Downsides  Data Mining Use  Data Mining Industry and Application  Data Mining Costs 应用比例 Clustering 22% Direct Marketing 14% CrossSell Models 12% m 20xx/6/11 News  Discovery of previously unknown relationships, trends, anomalies, etc.  Powerful petitive weapon  Automation of repetitive analysis  Predictive capabilities Data Mining Upsides  Knowledge discovery technology immature  Long learning and tuning cycles for some technologies  “Black box” technology minimizes confidence  VLDB (Very Large Data Base) requirements Data Mining Downsides Data Mining Uses  Discover anomalies, outlie。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。