软件项目标书范本内容摘要:
仓库对数据质量的要求 数据仓库对数据质量的要求总体上归纳为:数据完整性,包括数据源是否 完整、数据取值是否完整、维度取值是否完整等。 数据准确性,包括数据源是否准确、编码映射关系是否准确、处理逻辑是否准确等。 数据核对准确的判断是要么结果一致,要么不一致但原因是可解释的。 数据一致性,包括源系统之间同一数据是否一致,源数据与抽取的数据是否一致,数据仓库内部各处理环节数据是否一致等。 数据逻辑合理性,主要从业务逻辑的角度判断数据是否正确,如帐目类型的金额、时长、次数的逻辑关系是否满足等。 数据时效性,包括数据处理(获取、整理、加载等)的及时性,数据异常检测的及时性,数据处理回退的及时性等。 数据仓库服务于 经营决策,经营决策依据的数据应该是全面的、真实可靠的、有意义的。 数据时效性如果得不到保证,就可能延误了市场人员的分析,失去商机。 从数据仓库的建设过程来看,它本身修复数据以提高数据质量的能力并不是很强,但是它能发现生产系统存在的一些数据质量问题从而提醒用户哪些数据有质量问题,将数据问题反馈到业务支撑系统中,由后者做数据修正。 数据质量改进目标 数据质量改进的目标是清理、标准化、提高和匹配现有数据。 通过数据整合,建立完整的、准确的、一致的统一客户视图,完善共享信息数据,并使共享信息数据服务于经营分析,为生产 系统的改进提供标准。 建立数据整合流程,实现流程定义、流程配置和流程管控。 建立数据整合的规章制度,落实数据质量的分级负责。 建立起数据整合队伍,使数据质量能够得以持续改进。 数据质量改进方法 数据质量控制要从技术、流程和管理三个方面进行。 从技术层面上,生产系统存在的噪音数据、遗漏数据和不一致性数据,需要进行数据清洗;同时需要对源数据做稽核,如总量稽核和分量稽核。 Actuate Confidential 5/4/2020 11 在流程层面上,对于源数据的抽取要遵从一定的业务规则,数据的抽取和转换需要很多步骤来完成,这就需要将过程流程化,并且流程可通过配置来实现。 在管理 层面上,要求生产系统报送数据,按照“谁提供数据,谁负责”的原则由生产系统保证源数据的完整性、准确性、一致性、时效性。 下面 是我们在技术层面 采取 的具体做法。 在 ETL 架构设计中我们会 包括数据质量设计,将数据质量检查脚本加入到 ETL 流程中,分 为 技术检查和业务规则检查。 错误分严重程度,如主键重复的就停止 ETL 流程,等待解决 , 但低级别的错误不 会 阻塞 ETL 过程。 在这个过程中,所有的错误都会进行记录,最终生成数据质量检查报告。 但需要明确的是,很多情况下,许多数据问题在 ETL 之前都无法知道,只能通过 ETL 之后的数据核对才能 发现,然后逐渐积累,加到 ETL 的规则控制中 去。 报表平台设计 建立报表查询门户,提供各类信息报表的查询,统一查询渠道,统一数据口径,统一用户管理。 多个管理信息系统在报表平台上表现为一个个独立的逻辑子系统。 通过 报表平台 ,技术人员可以通过灵活配置逻辑系统 集成不同 BI 工具产生的异构报表资源, 业务人员可以进行 不同 报表资源的集中管理 和发布 , 最终用户可以通过一致的展示环境获取报表信息。 具体设计如下: 逻 辑 数 据 模 型L o g i c a l D a t a M o d e l数 据 仓 库D a t a M a r tB I 工 具前 端 展 现电 子 帐 表报 表 查 询风 险 监 控报 表 分 析仪 表 盘信 息 生 产 信 息 消 费B I工 具报表引擎报表调度报表交互报表设计D a t a b a s e Actuate Confidential 5/4/2020 12 灵活的报表查询 在报表的查询过程中,可以通过浏览器直 接浏览报表,同时,用户也可以通过简单的操作,对报表进行重新订制,为了更好的提高实用性,用户可通过浏览器同报表服务器进行交互,查看到需要的报表。 先进的报表开发模式 在报表的开发中,我们将采用最先进的协同开发模式,开发人员定制业务逻辑,业务人员根据自己需要通过简单的拖动则可形成自己需要的报表。 基 于I E设 计 生 成报 表S a l e s O r d e r sC u s t o m e r P r o f i l eS h i p m e n t s设 计 并 发 布I n f o r m a t i o no b j e c t s1设 计R e p o r t模 板并 发 布 至服 务 器T e s t I D D a t e T e s t e rD e s c r i p t i o nO S1 1 1 / 0 5 / 0 3L L e n n o nR e t a i l s a l e s i n f o r m a t i o nW i n 2 0 0 02 1 1 / 0 5 / 0 3L L e n n o nH o s p i t a l a d m i s s i o n s i n f oW i n 2 0 0 03 1 1 / 0 5 / 0 3L L e n n o nG a m b l e S A P e x t r a c t i o nW i n 2 0 0 04 1 1 / 1 0 / 0 3L L e n n o nS a l e s 1 0 D 5 M 1 0 KW i n 2 0 0 05 0 6 / 0 3 / 0 3M D a v i e sS a l e s 1 0 D 5 M 1 0 KW i n 2 0 0 06 1 1 / 1 0 / 0 3L L e n n o nS a l e s 1 0 D 5 M 1 0 0 KW i n 2 0 0 07 0 6 / 0 3 / 0 3M D a v i e sS a l e s 1 0 D 5 M 1 0 0 KW i n 2 0 0 001 02 03 04 05 06 07 08 09 01 s t Q t r 2 n d Q t r 3 r d Q t r 4 t h Q t rE a s tW e s tN o r t h01 02 03 04 05 06 07 08 09 01 s t Q t r 2 n d Q t r 3 r d Q t r 4 t h Q t rE a s tW e s tN o r t hT e s t I D D a t e T e s t e rD e s c r i p t i o nO S1 1 1 / 0 5 / 0 3L L e n n o nR e t a i l s a l e s i n f o r m a t i o nW i n 2 0 0 02 1 1 / 0 5 / 0 3L L e n n o nH o s p i t a l a d m i s s i o n s i n f oW i n 2 0 0 03 1 1 / 0 5 / 0 3L L e n n o nG a m b l e S A P e x t r a c t i o nW i n 2 0 0 04 1 1 / 1 0 / 0 3L L e n n o nS a l e s 1 0 D 5 M 1 0 KW i n 2 0 0 05 0 6 / 0 3 / 0 3M D a v i e sS a l e s 1 0 D 5 M 1 0 KW i n 2 0 0 06 1 1 / 1 0 / 0 3L L e n n o nS a l e s 1 0 D 5 M 1 0 0 KW i n 2 0 0 07 0 6 / 0 3 / 0 3M D a v i e sS a l e s 1 0 D 5 M 1 0 0 KW i n 2 0 0 02选 择I n f o r m a t i o nO b j e c t选 择 报 表 模 板4选 择 报 表 模 板5I TB u s i n e s s设 计 报 表3 高效的报表消费 在使用的过程中,业务人员根本不用关心对应的后台业务逻辑,以及数据信息来源等信息,其只要根据自己的业务需要,通过简单的拖拽即可完成对报表的定制 ,获取到自己需要的信息。 老系统统计报表移植 对于老系统的统计报表,我们将采取重写的方式移植到统一的报表平台上面。 重写后的统计报表基于新建 的数据仓库 ,这样就统一了现存的多个统计系统,统一了统计口径,解决了统计口径不一致所造成的 各个部门信息的 不 一致 ,并消除这种不一致对管理决策带来的负面影响。 Actuate Confidential 5/4/2020 13 老系统报表迁移的一个难点是如何保证 数据仓库系统中的报表统计结果与原报表统计结果的一致性 ,对此要具体问题具体分析。 新报表的统计结果与原报表的统计结果不一致只可能是两种情况:新报表的统计方式是错误的,造成新老报表统计结果不 一致;新老报表的统计口径不一致,造成统计结果不一致。 如果是前一种情况,采用正确的统计方式就能修正错误。 如果是后一种情况,则需要根据业务的需要选择统计口径, 使新报表能够达到业务人员的预期。 我们将会采用严格的测试手段来保证 新报表与老报表统计结果的一致性。 测试 的目的 ,是验证 对于相同的输入, 新老报表 得到的输出结果完全一致。 实际测试中, 我们将采用等价类划分以及边值分析法来设计测试用例,产生有限的测试用例来覆盖足够多的“任何情况”。 对有差异的报表,我们会作进一步的数据集对比,以确定问题的根源到底是在数据,还是报表逻辑。 认证管理 在对用户信息的管理中,提供以角色和用户为安全模型的统一认证机制,只有具有对应角色的用户才能访问对应的报表。 系统可靠性及可扩展性 系统的可靠性及可扩展性对企业级应用来说是非常重要的。 我们的设计充分考虑了这两个因素。 针对可靠性,我们的设计是在 系统包含一个双机组成的数据仓库,和一个双机组成的报表服务平台。 数据仓库和报表服务器分别带有自己的外存磁盘阵列。 架构中的每个功能节点设计都含冗余度,保证系统不存在单一失败点,满足提供 7x24 不间断服务的要求。 采用的这样系统架构, 主机系统的维 护 、 系统扩容 、 升级 、 系统性能统计 、 分析 、 优化以及部件更换 就能够 在不影响应用系统功能的前提下完成。 而 所有关键部件 能够 保证在不停顿数据共享服务的前提下提供热插拔能 力。 对于可扩展性, 使用我们建议的 报表服务平台 安讯 iServer,系统架构会有很强的可扩展性,用户可以通过增加硬件的方式扩容,以支持越来越多的用户和应用。 安讯 iServer 可以运行在由多台服务器组成的集群上,利用任务控制与自动负载平衡技术,将任务平均分配到各台服务器上。 安讯 iServer 具备出色的可扩展性,用户可以简单的向集群中添加更多Actuate Confidential 5/4/2020 14 的服务器来满足更 高的报表需求 ,而系统的性能随着服务器数量的增多呈线性增长,这方面的 具体 数据请参考附录 D “安讯 9 系统性能白皮书”。 在集群系统中,安讯 iServer 可以通过不同的故障转移模 (Failover)式来保障 iServer 各项服。软件项目标书范本
相关推荐
多的时候;其次是 1 对 1 的沟通,与下面的项目经理和团队成员 进行面对面沟通,可以及时了解项目进展、团队成员的思想波动,有针对的为其提出建议、解决方案,让团队成员感觉到项目经理的人文关怀,并传达公司的温暖;最后是避免不了的项目活动,聚餐、爬山、电影都是很好的活动方式,这取决与项目经理的权限和公司的财务制度。 8 组织能力 : 这里的核心团队是指子项目的项目经理和关键技术人员
,实行分类指导,强化协调机制,使上海电子口岸建设工作不断取得成效。 加强企业物流数据的信息化建设 在上海电子口岸建设中 ,企业的信息化建设也是推动其发展的重要一步 .企业没有实现信息化就不可能实现口岸的电子化 .在企业管理中,任何工作和岗位都脱离不开对信息及数据的依赖。 作为以信息化为特征的现代物流,其对数据的需求和依靠更为迫切。 数据管理不仅工作量非常大
算 0:超出于预算 成本效能指数: CPI(Cost Performance Index)=BCWP/ACWP 费用的支出速度 =1:按照预算进行 1:低于预算 1:超出预算 进度效能指标: SPI(Schedule Performance Index)=BCWP/BCWS 已完成工作百分比 =1:按照进度进行 1:超前于进度 1:落后于进度 [问题
.............................................................................. 17 一般目的单元 ...................................................................................................... 17 构件单元
......... 5 转让与分包 ............................................................................................................................ 5 服务变更 .................................................