某企业综合运维监控安全管理平台技术白皮书内容摘要:

基 于 K P I 的 科 学 考 核智 能 预 警 和 综 合 监 控 展 现科 学 的 运 行 质 量 评 估 体 系全 面 的 运 维 工 作 考 核动 态 的 运 行 审 计可 视 化 的 流 程 建 模 工 具符 合 国 际 标 准 的 工 作 流 程 管 理预 案 指 挥 管 理 系 统基 于 规 则 的 关 联 分 析 和 归 并快 速 的 故 障 定 位多 种 响 应 方 式 和 自 动 处 理综 合 的 运 行 状 况 展 示安 全 的 授 权 访 问 控 制系 统 配 置 管 理数 据 采 集 管 理系 统 维 护 管 理I T 资 产 管 理丰 富 的 I T 资 产 信 息 属 性 维 护I T 基 础 设 施 与 业 务 应 用 系 统 的有 机 结 合 图表 综合运行 态势 综合 运行 态势是信息系统建设成果 和运行质量 的具体体现,是平台 运维业务管理 功能 和 信息系统监测管理的集中展现,是信息系统 建设、管理 决策和指挥调度的依据。 综合 运行 态势是 全面整合现有各类设备和系统的各类 异构 信息,包括网络设备、安全设备、应用系统和终端管理中各 种 事件 ,经过分析后的综合展现界面,注重对信息系统的运行状态、 综合 态势的宏观展示。 XX信息系统 综合运维 监控安全 管理平台技术白皮书 12 图表 综合 运行 态势界面示意 图 IT 资产管理 IT 资产管理 是全面实现信息 系统运行维护 管理的 基础, 提供的丰富的 IT 资产信息属性维护和备案管理,以及对业务应用系统的备案和配置管理。 平台 基于 KBP( Key Business Point 关键业务点) 配置 关键业务的 基础 设施关联 ,通过 资产 对象信息配置丰富 业务应用系统 的 运行维护 内容,实现 各类IT 基础设施与用户关键业务的有机结合,以及全面的 综合监控。 XX信息系统 综合运维 监控安全 管理平台技术白皮书 13 图表 资产信息管理 监控中心 监控中心模块基于 KBP( Key Business Point 关键业务点)面向业务系统可用性和业务连续性进行合理布控和监测,以 KPI( Key Performance Indication 关键 绩效 指标 ) 指导 和 考核信息系统运行质量和运维管理工作的实施和执行, 帮助用户建立全面覆盖信息系统的监测中心, 并对 各类 事件做出快速 、准确的 定位和展现。 实现对信息系统 运行 动态的快速掌握,以及 运行维护管理 过程中的事前预警、事发时快速定位。 XX信息系统 综合运维 监控安全 管理平台技术白皮书 14 图表 图表  集中 监控: 采用开放的、遵循国际标准的、可扩展的架构,整合各类 监控管理 工具的监控信息,实现对 信息系统 IT 资产的全面监控,对 网络 资源 、 物理设备 (服务器或网络设备 ) 、通信、环境资源 以及XX信息系统 综合运维 监控安全 管理平台技术白皮书 15 软件 系统 和 业务 应用系统等, 实现集中 监视、查看和管理的 智能化、可视化监控系统。  综合展现: 基于 KBP 的合理规划与布控, 整合来自各种不同的监控管理工具和信息源,进行标准化、归一化的处理,并按照 KPI 的定义进行 过滤 和归并,减少单个事件多处报警、多次报警对运维工作造成的区划不明、责任不清、重复排查的情况,并进行集中、综合的展现。  快速定位和预警: 经过同构和归并的信息,将依据预先配置的规则、事件知识库、关联关系进行快速的故障定位,并根据预警条件的判断进行相应的预警,展现在监控界面上。 告警中心 告警中心模块基于规则配置和 自动关联,实现对监控采集、同构、归并的信息的智能关联判别,并综合的展现信息系统中发生的预警和告警事件,帮助运维管理人员快速定位、排查问题所在。 同时,告警中心提供多种告警响应方式,内置与事件响应中心的工单和预案处理接口,可依据事件关联和响应规则的定义,触发相应的预案处理,实现运维管理过程中突发事件和问题处理的自动化和智能化。  事件基础库维护: 是事件知识库的基础 定义 ,内置大量的标准事件 ,按事件类型进行合理划分和维护管理,可基于事件名称和事件描述信息进行归一化处理的配置,定义了多源、异构信息的同构规则和过滤规则。  智能关联分析: 借助基于规则的分析算法, 对获取的各类信息进行分析,找到信息之间的逻辑关系, 结合安全事件产生的网络环境、资产重要程度,对安全事件进行深度分析,消除安全事件的误报和重复报警。 平台支持的智能关联分析包括:  事件关联分析  位置关联分析  因果关联分析 XX信息系统 综合运维 监控安全 管理平台技术白皮书 16  业务关联分析  行为关联分析  综合查询和展现: 实现了 多种视角的故障告警信息和业务预警信息的查询和集中展现。  告警响应和处理: 提供了事件生成 /过滤、短信告警、邮件告警、自动派发工单、启动预案等多种响应方式,内置监控界面的图形化告警方式; 可手工解除告警、创建 工单,提供了与事件响应中心的智能接口,可基于事件关联响应规则自动生成工单并触发相应的预案工作流进行处理。 事件响应中心 平台 借鉴并融合了 ITIL(信息系统基础设施库) /ITSM( IT 服务管理)的先进管理规范和最佳实践指南,借助 WFMC(工作流模型 参考 ) 等 标准, 开发了图形化、可 配置 的工作流程管理系统,将 运维管理 工作以任务和工作单 传递 的方式 ,通过科学的、符合用户运维管理规范的工作流程进行处置 ,在处理过程中 实现 电子化的自动流转,无需人工干预,缩短了流程周期,减少人工错误, 并 实现对 事件、 问题处理 过程 中的各个环节 的 追 踪、监督和审计。 图表  图形化的工作流建模工具: 实现了预案建模的图形化管理,简单易用的预案流程的创建和维护 ,简洁的工作流仿真和验证。 XX信息系统 综合运维 监控安全 管理平台技术白皮书 17  可配置的预案流程: 所有的运维管理流程均可由用户自行配置定义,即可实现 ITIL/ITSM 的主要运维管理流程,又可根据用户的实际管理要求和规范,配置个性化的任务、事件处理流程。  智能化的自动派单: 可配置和维护的派单规则维护,智能的规则匹配和处理,基于用户管理规范的自动处理,降低事件、任务发起到处理的延时,以及人工派发的误差。  全程的事件处理监控 : 实现了对事件响应处理全过程的跟踪记录和监控,根据 ITIL 管理建议和用户运维要求,对事件处理的响应时限和处理时限的监督和催办。  事件处理经验的积累: 实现了对事件处理过程的备案和综合查询,帮助用户在处理事件时查找历史处理记录和流程,为运维管理工作积累经验。 审核 评估中心 审核评估中心模块提供 对信息系统运行质量、服务水平、运维管理工作绩效的综合 评估、考核、审计管理功能。 图表  评估 XX信息系统 综合运维 监控安全 管理平台技术白皮书 18 遵循 BS779 ISO1333 ISO15408 等国际和工业标准及指南建立平台的 运 行质量 评估框架,如图: 图表 图 通过 评估模型使用户了解 运维需求 、认知 运行 风险、采取 相应的保护和 控制,有效 的 保证 信息系统的建设 投入与 运行 风险的平衡,系统地保证信息化建设的投资效益,提高关键业务应用的业务连续性。  考核 考核是为了在评价过程中避免主观 臆断 和片面随意性, 平台实现了以下考核功能:  个人和部门工作量考核 —— 故障和工单处理情况考核  个人和部门工作效率考核 —— 故障和工单完成情况考核  故障处理考核 —— 故障和工单状态变化考核  信息系统服务能力考核 —— 信息系统可用性评价  信息系统安全状态考核 —— 信息系统安全性评价  管理策略执行考核 —— 策略执行及效果评价  审计 平台审计功能是以 跨平台多数据源信息安全审计 为框架,以电子数据XX信息系统 综合运维 监控安全 管理平台技术白皮书 19 处理审计( EDP 审计)为基础的信息审计 系统。 主要包括以下内容:  系统建设程序完整性审计  系统业务流程合规性审计  系统数据流程 合 规性审计  系统认证和权限管理有效性审计  系统功能控制有效性审计  系统输入数据真实性审计  系统输出数据真实性审计  系统数据接口有效性审计  系统安全控制有效性审计 利用信息传递、共享、可视 化 等特点,对信息 系统 数据进行全面的审计监督。 系统配 置管理 数据采集管理 以信息 系统内的网络设备、机房设备、服务器系统、视频会议系统、智能监控系统、通信系统、安全系统、办公自动化系统、动力环境监控系统等各 种 IT资源及各 个业务系统的监控管理 为主线,采集相关异构监控系统的信息,通过对不同来源的信息数据的整合、同构、规格化处理、规则匹配,生成面向 运行维护管理的事件数据,实现信息的共享和标准化,建立多角度的监控管理拓扑视图,实现技术指标与管理策略的关联,达到有效监控的目的。  数据采集对象  主机设备监控 主机设备指服务器、小型机连同这些设备所带的磁盘阵列、磁带机等以及 配套使用的机柜、控制台等外围设备。 监控的主要内容是: CPU、内存、硬盘、网络端口状态等。 XX信息系统 综合运维 监控安全 管理平台技术白皮书 20 图表  网络设备监控 网络设备主要指交换机、路由器、防火墙等设备和网络线路。 监控的主要内容是:设备的运转状态,网络流量 ,端口状态,延迟情况,防火墙访问情况、线路通断情况和故障位置等。 XX信息系统 综合运维 监控安全 管理平台技术白皮书 21 图表  机房设备监控 机房设备主要指 UPS、空调、新风、加湿、消防、防雷、屏蔽等设备。 监控的主要内容是:电压、温度、湿度等。 XX信息系统 综合运维 监控安全 管理平台技术白皮书 22 图表  系统监控 系统监控主要包括对操作系统、数据库系统、 HTTP 服务、 FTP 服务、文件系统、邮件系统、消息系统和客户端系统等运行状态的监控。 内容主要包括:资源占用、端口状态、服务状态和可用性等。  应用监控 应用监控主要包括对服务、组件、作业、进程、页面、目录、数据库访问等方面进行监控。 内容主要包括:可用性、资源占用、进程和侦听器状态等。  采集适配器 数据采集主要通过采集适配器完成。 数据采集定义通用适配器的数据接口标准,包括数据采集接口和数据接收接口 、 信息格式标准 、 以及通用适配器模板 ,通 过 采集接口接入到平台进行集中处理。 数据采集 适配器 支持标准协议,符合 WBEM 标准 (支持 EventLog、 Unix/Linux XX信息系统 综合运维 监控安全 管理平台技术白皮书 23 日志、活动目录日。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。