ds-20xx-xxx-宁夏商业银行运维监控一体化运维管理平台-技术方案内容摘要:
书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 16 页 共 273 页 3 总体设计 设计思路 运维管理目标架构 根据 IT 运维管理平台的具体要求,以及前期我们调研的结果, 达烁高科 认为本次项目可以依托于下图中所示的 BMC五台一库的 BSM理念下的 IT运维管理框架进行建设: IT运维管理框架从逻辑结构上划分为五个平台和一个中心配置库(“五台一库”),分别是数据展现平台,流程管理平台,集中监控平台,自动化管理平台,历史数据分析平台以及CMDB配置管理核心库。 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 17 页 共 273 页 “监控平台”:构建整个 IT 监控架构,实现集中事件管理,并为面向业务的监控管理打下基础。 “流程平台”:整合并标准化运维的日常工作,将日常的工作规范,并透明化。 “展现及报表平台”:建设统一报表平台和统一门户平台将有效增强数据利用和展示效果。 “自动化操作平台”:完成对整个 IT操作的集中管控和自动化。 “统一报表平台”:集中存放历史数据,提供后期统一分析及规划。 “配置管理数据库”:记录完整的、准确的 IT 环境中各组件的信息和彼此间的 关联关系,作为唯一、可信的数据源,为周边系统提供支撑数据。 本解决方案从 IT 运维管理平台的角度出发,首先实现 IT 基础架构管理的扩充,整合各事件源,对事件处理进行事件集中处理,协助运维人员及时了解系统当前状况,以及系统故障对相关业务的影响,同时以适当的形式进行集中呈现。 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 18 页 共 273 页 技术架构设计 具体而言,我们在本次项目建设中,对需求中的功能按照基础监控平台、流程平台进行划分; 基础监控 平台 配合 搬迁同步实施; 流程平台 的同步 实施 同时在架构规划时也考虑了整体 架构 未来可能的需求。 系统涉及软件模块如下: 编号 软件名称 描述 1 BMC TrueSight Operations Management 集中事件处理服务器软件 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 19 页 共 273 页 2 BMC TRUESIGHT OPERATIONS MANAGEMENT Integration Service 性能 数据采集 组件 3 BMC TRUESIGHT OPERATIONS MANAGEMENT Cell Component 事件 集成 组件 4 BMC TRUESIGHT OPERATIONS MANAGEMENT Reporting 报表服务器 及 数据 、事件采集引擎 5 BMC Remedy IT Service management 流程管理 平台 6 BMC TrueSight App Visibility Manager 应用 性能监控 7 IBM Netcool 网络监控 系统架构层次 架构层次 定位描述 涉及组件 数据采集层 负责事件信息的采集获取,通过 主机代理Agent采集被管理节点数据,将事件信息及性能信息送入 TrueSight 集中事件处理平台进行统一处理。 对采集层获取的 网络 、 环控 等相关事件进行数据的汇总及初步处理。 操作系统 数据库 中间件 存储 网络 环控 数据 处理 层 负责监控数据的处理,包括事件处理, 事件翻译 , 事件丰富,声音告警, 报表等 负责实现 服务支持和服务交付相关 IT运维管理流程 事件 管理 平台 流程平台 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 20 页 共 273 页 数据展现层 面向最终用户,信息的集中展现,包括事件, 性能等即时信息的展现。 事件 管理平台 报表平台 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 21 页 共 273 页 4 总体 技术方案 被动 阶段 解决 方案 基础 监控解决方案 网络 运维 监控管理 网络 监控采用 IBM Netcool管理 平台 , 主要功能包括:网络告警 /故障管理、网络性能管理、网络拓扑管理、配置管理、报表管理等。 网络状态 管理 拓扑的发现与展示 ITNM 提供的准确的网络三层、二层连接视图,可以清楚的反映网络实际的物理连接,其发现的网络拓扑结构包括网络所有节点之间的连接关系,如 交换机划分的 VLAN、 每个 VLAN包含的端口 端口连接的节点 路由器的端口 互连 的设备 服务器或 PC地址 连接在交换机端口 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 22 页 共 273 页 网络设备拓扑动态获取 根据当前企业网络架构,自动发现网络设备之间关系及相关配置信息。 要求实现以下功能 拓扑图可以动态更新 告警等级实时 更新 可以根据不同网段进行过滤设置不同 VIEW 告警与设备关联,要求不同告警与设备关联时显示不同颜色 点击设备关联事件时,会自动转入下一级页面,即告警的详细信息。 该信息需要包含设备名、设备种类、设备 IP、告警具体内容、设备位置、责任人、联系方式相关信息 通过设定告警阀值,可以实现链路状态与告警相关联。 要求当链路异常时,告警能够实时展现在拓扑图上,并以不同的颜色区分不同的告警。 点击具体链路时可以链接到详细事件列表 具体如下图所示: 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 23 页 共 273 页 鼠标点击告警图标,自动链接到详细告警信息,如下图所示 自定义拓扑的展现 客户环境动态获取的网络拓扑结构,可读性有时不是很强,而且界面美观的程度跟客户定 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 24 页 共 273 页 制的有一定区别。 通过根据企业当前网络拓扑,利用美工设计出企业当前企业网络架构图,要求做到准确、可读性很强、美观等相关功能。 具体如下图所示: 基于拓扑的事件 关联 ITNM 能够自动发现网络设备间真实的连接关系,这些拓扑关系不仅仅用于显示网络连接视图,更重要的是帮助在发生故障时定位故障点。 当网络事件信息汇总在 Object Server事件管理服务器中时, ITNM内置的 RCA(根源故障分析引擎)功能会自动根据节点之间的连接关系 分析根源故障点,从而找出事件之间的关系,确定故障位置。 比如当物理端口故障导致逻辑端口产生事件时,由于 ITNM 了解端口之间的连接关系,就可以自动定位出根源故障点是物理端口,从而压缩逻辑端口的事件信息。 或者当路由出现问题时,两端的端口都会产生事件, ITNM也会自动将两个事件关联起来。 对事件的分析实现两个主要功能,其中基础是对网络拓扑的准确发现,而不仅仅是简单的 IP连接, ITNM详细的端口到端口的连接,能够准确描述设备间的依赖关系,从而在事件 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 25 页 共 273 页 发生时确定事件的关联性。 同时 ITNM 内置的 RCA 分析引擎,通过对拓扑数 据的利用和与事件管理服务器的结合,自动分析事件间的关联关系。 网络告警管理 网络管理解决方案核心围绕网络事件管理,将所有的管理报警信息: 网络故障 trap事件 根据采集性能设置性能告警 网络链路异常 这些都将以事件的方式报告到网络事件处理平台,管理人员通过直观的事件信息监控,就可以了解网络实时的运行状况。 告警事件采集 确保对网络设备的性能及故障信息采集全面,采集方式主要有以下两种 接收设备发送的 Syslog和 Trap事件; 主动对设备的信息进行 PING和 SNMP轮询。 告警事件预处理 在实现了告警事件信息采集后,网管系统的 Probe还可以对事件进行必要的预处理,主要包括事件的采集层过滤、事件的重定义、信息丰富和信息发送等功能。 事件的压缩 根据关键字对事件进行压缩处理、确保同类事件是显示一条告警 事件关联 根据设备之间的关系,当设备发生告警时能否做到告警之间关联 事件信息丰富 网络设备报告的事件信息,一般只有针对设备本身的参数。 在实际管理中, 般需要获 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 26 页 共 273 页 取更多的信息,如该设备所在的位置,联系人,线路名称等。 在 NETCOOL探针规则文件中,可以根据事件的原始信息,如 IP地址、名称,从预先定 义好的文本文件中,找到该设备相关的管理信息,如位置、联系人,并将新获取的设备信息作为事件的新字段,同时发送给事件处理中心。 用于事件信息丰富的 探针规则文件 如以下示意图所示: 告警的展现 告警展现分为两种方式:事件列表方式;拓扑视图方式 事件列表方式需要包含部分丰富信息、如设备位置、所属应用、联系人、联系方式;根据不同的告警等级,在事件列表中加以区分,如下图所示 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 27 页 共 273 页 告警第三方事件平台集成 网络监控系统所产生的告警支持第三方事件平台集成,事件通过网络监控系统的集中告警平台,调用脚本并且调用第三方事件平台的 jar包,通过 的方式把告警推送到第三方软件,每条推送的告警都有相应的日志记录,告警格式可以根据第三方软件的告警格式约定推送,然后再由第三方事件平台进行处理和通知。 事件推送可以做到实时性,准确性。 网络性能管理 网络性能管理通过 SNMP、 ICMP 等多种方式检查网络设备的性能,线路的连通性和服务质量,同时通过对网络协议和服务的检查,查看网络为业务提供的服务的可用性和服务质量。 性能数据存储 在数据库中,并且通过性能管理的呈现界面形成各种性能报告。 Tivoli ITNM 网管系统可以根据实际工作的需要,基于拓扑发现的网络设备信息,灵活地通过定时轮循机制来查询网元设备 MIB 获得 SNMP 信息,生成网络设备性能告警信息,同时,针对端口流量等性能数据进行实时监视。 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 28 页 共 273 页 网络实时性能数据采集 在告警事件列表、拓扑视图中,选中设备(已经在 ITNM 中发现的)选择右键菜单中的图 SNMP MIB 数据,就能够设置实时简单性能监视,如果监视的 MIB有历史数据,能够设置呈现历史数据的天数 可以直接定义 MIB 值,或采用以定义的基本阀值采集 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 29 页 共 273 页 实时监视性能数据视图 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 30 页 共 273 页 图表是动态的 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 31 页 共 273 页 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 32 页 共 273 页 网络性能数据存储 采集到的数据能够存储在数据库中 在数据库中,数据保存在: 技术 方案建议书 本文档仅限达烁高科(北京 ) 信息 技术有限公司 和被呈送方内部使用,未经许可,请勿扩散到第三方。 第 33 页 共 273 页 资产配置数据发现 查看设备资产结构数据 统计网络资产,如按照设备类型、按照端。ds-20xx-xxx-宁夏商业银行运维监控一体化运维管理平台-技术方案
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。