企业数据信息挖掘与分析系统--市信息产业局项目申报可行性报告内容摘要:

际联合人工智能学术会议上。 到目前为止,由美国人工智能协会主办的 KDD 国际研讨会已经召开了 8 次,规模由原来的专题讨论会发展到国际学术大会(见表 1),研究重点也逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。 1999 年,亚太地区在北京召开的第三届 PAKDD 会议收到 158 篇论文,空前热 烈。 IEEE 的 Knowledge and Data Engineering 会刊率先在 1993 年出版了 KDD 技术专刊。 并行计算、计算机网络和信息工程等其他领域的国际学会、学刊也把数据挖掘和知识发现列为专题和专刊讨论,甚至到了脍炙人口的程度。 国内现状 与国 外相比,国内对 DMKD 的研究稍晚,没有形成整体力量。 1993 年国家自然科学 资金 首次支持我们对该领域的研究项目。 目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。 其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和 企业数据信息挖掘与分析系统 8 改造;南京大学、四川联合 大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及 Web 数据挖掘。 业界观点 最近, Gartner Group 的一次高级技术调查将数据挖掘和人工智能列为 “未来三到五年内将对工业产生深远影响的五大关键技术 ”之首,并且还将并行处理体系和数据挖掘列为未来五年内投资焦点的十大新兴技术前两位。 根据最近Gartner 的 HPC 研究表明, “随着数据捕获、传输和存储技术的快速发展,大型系统用户将更多地需要采用新技术来挖掘市场以外的价值,采用更为广阔的并行处理系统来创建新的商业增长点”。 实际意 义 通过收集、加工和处理涉及中小企业大量数据信息,形成数据分析模型,市场分析模型,业务分析模型、渠道分析模型、决策分析模型、市场容量分析模型,社会库存容量分析等。 确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。 可行性分析 市场可行性分析 我国有 4240 多万家企 业, 如果把个体工商户、养殖户去掉能够去掉一半左右,中小企业的数量说出来很惊人,占我们国家所有企业数量的 %,其他的大型企业只占 %,很多方面都在整个国家企业因素里超过 50%,比如新产品的研发量超过 50%,就业人口超过整个国家就业人口 75%,每年申请专利超过所有企业申请专利 66%,销售额将近 60%,占 GDP 将近 60%,只有一项低于 50%,就是 企业数据信息挖掘与分析系统 9 税收,我们可以看到中小企业对我们国家经济和社会的是非常之大的,出口方面占 7578%。 经过近年来国家及各地信息化主管部门对中小企业信息化的重视,利用互联网进行 经济活动、采用办公自动化、财务软件进行内部管理的中小企业数据在迅速增加,但相对于庞大的中小企业总量而言,还需进一步加大投入、持续改善服务 ,提高企业信息收集能力、信息分析能力、企业决策能力。 目前中小 企业发展的主要障碍是 :企业信息 数据的繁多,信息沟通的不对称,无法从大量的信息中提取有效的信息来帮助领导进行市场开发、产品研发、生产经营等方面的决策。 本项目的信息数据挖掘系统 正是解决企业这方面的问题,即解决了企业信息数据分析提供决策的问题,同时又解决了国外同类系统昂贵的价格问题,使中大小型企业都能在低投入的情况下 拥有信息数据挖掘系统,为企业决策服务。 所以本系统具有非常广阔的市场前景。 技术可行性分析 ① 基于 Web的开发工具日趋完善 经过几年来的发展,基于 Web的开发工具,无论是 J2EE还是 .Net,已经日臻完善,近些年来的开发,为在此之上的应用奠定了良好的理论和项目基础,开发难度已经大大降低,成熟的构件、模块和大量的成功案例为进一步的开发具有极高的利用价值和借鉴意义。 ② B/S与 C/S结构日臻成熟 采用该结构软件的优势在于: (1)结合了 B/S和 C/S结构的优点,使系统运行更稳定,功能更强大; (2)可跨 平台操作,任何一台机器只要装有 WWW浏览器软件,均可作为客户机来访问系统; (3)具有良好的开放性和可扩充性; (4)可采用防火墙技术来保证系统的安全性,有效地适应了当前用户对管理信息系统的新需求。 因此该结构在管理信息系统开发领域中获得飞速发展,成为应用软件研制中一种流行的体系结构。 ③ 数据库技术发展迅速 目前数据库研究领域中,信息集成、数据流管理、传感器数据库技术、 XML 企业数据信息挖掘与分析系统 10 数据管理、网格数据管理、 DBMS自适应、移动数据管理和微小数据库、数据库用户 界面等都是目前热门的研究课题,并取得了较大的进展,有了较成熟的技术支持。 第三代数据库支持多种数据模型(比如关系模型和面向对象的模型),并和诸多新技术相结合(比如分布处理技术、并行计算技术、人工智能技术、多媒体技术、模糊技术),广泛应用于多个领域。 项目的创新点 和竞争优势 B/S 与 C/S 结构相结合 采用这种结构优点在于:① 充分发挥了 B/S与 C/S体系结构的优势,弥补了二者不足。 充分考虑用户利益,保证浏览查询者方便操作的同时也使得系统更新简单,维护简单灵活,易于操作。 ② 信息发布采用 B/S结构,保持了瘦客户端的优点。 装入客户机的软件可以采用统一的 WWW浏览器。 而且由于 WWW浏览器和网络综合服务器都是基于工业标准,可以在所有的平台上工作。 ③ 数据库端采用 C/S结构,通过 ODBC/JDBC连接。 这一部分只涉及到系统维护、数据更新等,不存在完全采用 C/S结构带来的客户端维护工作量大等缺点。 并且在客户端可以构造非常复杂的应用,界面友好灵活,易于操作,能解决许多 B/S存在的固有的缺点。 ④ 对于原有基于 C/S体系结构的应用,可以非常容易地升级到这种体系结构,只需开发用于发布的 WWW界面,可以保留原有的 C/S结构的某些子系统,充分地利用现有的资源。 现有资源无需大的改造即可以连接使用,节约了资源。 ⑤ 将服务器端划分为 WEB服务器和 WEB应用程序两部分。 WEB应用程序采用组件技术实现三层体系结中的商业逻辑部分,达到封装源代码,保护知识产权的目的。 基于角色的访问控制( RBAC) 建立角色访问机制,在统一的身份认证的基础上,对于不同的资源进行角色访问控制。 RBAC 工作示意图 企业数据信息挖掘与分析系统 11 柔性工作流系统 在实际管理中,由于工作的复杂性和多变性,需要有一套机制来响应工作的变化,完成流程的管理。 工作流系统通过将工 作分解成定义良好的任务、角色、路由、授权,按照一定的规则和过程来执行这些任务并对它们进行监控,通过对这些元规则和元过程的组合形成具体的工作流程,从而以最低的开发和维护成本,良好的可控性和通用性实现工作管理。 在工作流系统中采用 Web方式下的流程自定义和表单自定义技术。 决策支持系统 系统中集成决策支持系统,在管理与服务系统积累了一定的数据后,根据系统设计的分析主题,经过对基础数据的抽取、转换、加载、分析,得到对管理数据、资源利用情况等内容的综合性分析,通过直观的图形(柱状图、饼形图、仪表盘等)展现出 来,并通过多维分析、数据钻取、同期比较、趋势预测、结论生成等方式做进一步的分析,从而提供辅助决策支持。 数据交换 在各个分系统之间以及新系统和原有各类系统之间存在数据交换,交换用的文档和数据采用 XML语言,通过 SOAP协议传输。 利用 XML作为载体封装各类文档和数据,使系统具有良好的可扩展性。 智能代理 Agent 智能代理。 智能代理具有以下的特点: ① 智能性。 具有丰富的知识和一定的推理能力,能揣测用户的意图,并能 企业数据信息挖掘与分析系统 12 处理复杂的难度高的任务,对用户的需求能分析地接收,自动拒绝一些不合理或可能给用户带来危害的要求,而且具有从经验中不断学习的能力,适当地进行自我调节,提高处理问题能力; ② 代理性。 在功能上是用户的某种代理,它可以代。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。