元数据管理与数据质量平台内容摘要:

果,相同的名字被用于表示意义不同的事情,而同一件事情则使用了几个不同的名字。 尽管如此,相比之下,从不同来源来的数据和数据的含义已经具有了更多的透明度。 对于商业用户,如果他们需要,现存的技术可为他们提供有关数据的来源和怎样对数据进行计算的信息。 人 人们开始感知到共享元数据信息的重要性。 业务分析员、数据拥 有者和应用开发者现在自觉地将元数据信息加载到中央知识库中。 处理 元数据知识经由中央数据库进行共享。 凭借对中央知识库地理解,人们能够发现在其他应用系统中的数据。 然而,由于使用术语的不同,人们互相之间需要交流,以便弄清某些元数据的含义。 而且,由于元数据的更新不受任何方式的控制,使得这种更新没有告示或贴切的分析。 技术 有一些元数据管理工具可用于共享来自数据源的元数据,并能把来自不同建模工具的逻辑元数据导入到元数据知识库中。 AG Rochade、 Unicon、MetaMatrix 是该类产品的一些例子。 然而, 除了以商业含义来定义数据表格的栏目名之外,这些工具没有一个能很好地 抓取元数据。  第三级 : 管理控制 行为特征 这一级对元数据的修改进行集中管理。 局部业务单元或开发小组如不通知其他的元数据保管者和用户,就不再能按照自己的想法对元数据进行修改。 在一个地方发起 的元数据的修改将传播给其他地方。 有各种工具和方法可用于不同业务单元之间交换元数据。 为了整合不同数据源中的数据,仍然必须用手工进行数据的映射,以解 决不同数据源的数据整合。 但是,这种映射在一个中央知识库上进行维护和管理。 人 数据拥有者、应用开发人员 、用户和其他的数据保存者现在比以往任何时候更清楚元数据管理的重要性。 人们遵循有关元数据管理的 “监督 ”处理操作规程。 在对元数据进行修改前,他们就分析这种修改将会产生的影响。 他们认识到元数据的共享将使组织的运作更有效,并使他们的生活更轻松。 处理 建立了监督体系结构 (谁是数据和应用的拥有者 ),监督资产(数据仓库、数据集市、命名标准)和流程(何时开始更新、如何更新)。 技术 有几个工具经常被用于元数据的监督处理。 SchemaLogic 是一种新兴的工具,通常被用于帮助监督处理发现业务的词汇及其分类。 还有一些软件 提供商 方案 12 正在相互竞争,以填补这一空间,但还没有一家能提供商用的产品。  第四级 : 优化 行为特征 在对元数据实施集中存储并通过监督体制对元数据进行管理后,企业会发现,通过标准化和整合可以实施有意义的优化。 为了优化各业务单元之间的各种冲突和各个副本,人们开发了一个企业数据模型和词汇表。 人们可以将这些标准模型和词汇表用于各种新的应用。 时机成熟时,可以把各种老的应用迁移到这些模型上。 人 在这一级,人们坚持不懈地探索优化的途径。 人们协同工作,通过在数据的入口点确认数据的有效性来提高数据的质量。 通过确定各业务实体 的权威数据源,使数据的映射达到最小化。 数据开始从一个业务单元平滑地流到另一个业务单元,而不用担心昂贵的数据集成成本。 处理 首先,生成企业数据模型,并在中央知识库进行维护。 第二,对数据模型中定义的每一个实体确定权威数据源或企业应用的主参照数据,然后将业务的上下文信息和 含义与这些数据源进行关联。 在整个组织中对业务的词汇表进行标准化。 鼓励应用开发小组使用这些标准化的术语,来生成、传播和表示信息。 技术 目前,仅有少数几个能帮助企业实施优化的工具。 而且,每一个工具只能完成其中一到两个任务,还没有哪个工具能做 企业优化所需的所有事情。  第五级 : 自动化 行为特征 在这一级,元数据管理是自动进行的。 当在逻辑层次发生元数据更新时,它们将被传播到物理层次。 反之,当在物理层次发生更新时,逻辑层次将被更新,以反映这 种更新。 在元数据中的任何变化也将触发业务工作流,以处理其他各个业务系统所需的相对应的任何修改。 由于各个应用系统遵照相同的词汇表,它们之间的关系可 以通过知识本体进行推断,所以,各应用系统之间数据格式的映射自动产生。 人 人们把元数据管理作为常规业务的组成部分。 就像电信网对业务的支持一样,元数据成为组织运作 中一种关键的、普遍存在的、无形的资产。 元数据管理变成业务处 理的一个主要组成部分,而且,整个业务运作都要依赖于它。 事实上,如果元数据管理实施得很好,人们可以无需关心它在何处。 在自动化级,元数据管理成为一种 使能器,而不被视为一种障碍。 处理 在这一级,元数据管理的处理较为理想。 绝大多数处理是自动完成的。 方案 13 人们从手工和程序处理过程中解放出来。 他们在元数据判定上可以工作得更有效。 当业务变化时,由知识工人对企业数据模型、词汇表和知识本体进行维护。 这样一种改变立即会在各个应用中反映出来。 例如,假如一个新产品被引进,把它加到企业词汇表和知识本体中,这一情况将自动地被传播给金融系统、制造业系统和营销系统。 使得每个应用系统无需花费昂贵的代价,去完成相应的修改。 技术 各个应用必须使用企业数据模型、词汇表和知识本体来获取、传播和表示数据。 人们开发了各种代理, 将数据从一种格式翻译成另一种格式。 为了实现这些功能,当前正在展开知识库表示和知识集成方面的许多研究。 元数据管理工具 基本功能 元数据管理典型的应用有 :ETL映射分析、血统分析 /影响分析和差异分析等。 这些 应用对于整个企业、技术人员、业务人员和 IT 管理人员都的挥着至关重要的作用。 对于整个企业而言,元数据管理可以协助企业进行数据资产管理。 帮助解决数据 孤岛的现象,形成统一企业信息地图。 实现集中浏览分布在企业内部的所有电子文档。 同时协助企业建立企业级视图的指标库。 随着企业信息化建设的不断深入和积累,元数据管 理平台可以发挥企业知识传承的平台。 通过元数据的 “ETL 映射分析 ”功能,从企业级视图去查看“Transformer”这个转换的具体细节。 帮助技术人员更好的理解数据内部的来龙去脉。 对于那些已经建设有 BI/DW系统的企业而言,企业内部分散着数十种系统的情况是很 普遍的现象。 这些企业的业务人员和决策层所关注的一些统计报表和指标,往往是经过许多业务系统和若干数据处理环节而形成的。 当最末端的数据发生异常时,在 没有元数据管理系统的情况下,需要许多单位和部门(包括软件集成商)的人共同参与,利用手工的方式去逐级查找数据 出错的原因。 这种方式不仅不利于问题的及 时发现,而且一旦出现问题,很难短时间内定位问题,甚至根本不可能定位问题的所在。 而利用元数据管理系统的血统分析等功能,可以很容易的定位问题,再配合监控规则的设置,使问题发现的及时性大大提高。 利用元数据管理系统,企业可以建立数据元(标准)的统一视图。 通过统一数据口径、 完善指标体系、建立统一数据视图,可确保数据的完整性、准确性、一致性,从而有效的在各个业务系统内进行数据的转换和整理工作。 目前,许多 方案 14 企业经常会面临 同一个指标在不同部门或者不同系统中定义不一致的情况, 以至于最终的统计数据出现偏差,为决策者提供了错误的决策依据。 如某企业某月 A。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。