网络运维部管理制度内容摘要:

障 分类 一般故障 严重故障 重大故障 主机 故障 主机 负载 一般业务承载主机 关键业务承载主机 核心业务承载主机 主机 网络 网络丢包 /中断 网络丢包 /中断 网络丢包 /中断 主机 运行 主机宕机 /故障 主机宕机 /故障 主机宕机 /故障 网络 设备 设备 运行 不影响运行 接入层设备运行 接入层以上设备运行 设备 故障 个别端口 业务板卡等局部接入层设备 汇聚层及核心层设备 网络 网络 连通 整体小于 3% 整体大于 3%小于 10% 大于 10% 网络 规模 影响接入层以下网络连通 影响整体网络连通 整体网络中断 网络 攻击 网络攻击影响个别客户 网络攻击影响同汇聚层下客户 网络攻击影响整个网络 病毒 病毒引发主机故障 病毒引发局部网络故障 设施 故障 空调 单点设备 设施故障,可切备份 设施故障后影响局部业务运行 设施故障影响整体业务运行 电力 供电故障,不影响设备运行。 供电故障引发设备停机不影响业务 供电故障引发设备停机,影响业务 消防 雷击、火灾、暴雨、等 人为 因素 人为 操作 违规操作、影响较小 违规操作,引起故障 恶意操作、引起故障 计划 调整 计划调整内因发故障 计划调整外引发故障 计划调整外引发故障 不影响业务 可回滚操作 不可回滚操作 其他 因素 非以上因素 影响个别业务, 影响局部业务运行 影响整体业务运行 故障(事件 )管理流程目的 事件管理流程的主要目标是尽快恢复 IT 服务提供并减少其对业务的不利影响,尽可能保证最好的 IT 服务质量和可用性等级。 事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。 故障管理流程 值 班 人 员 发 现 监 控 告 警或 收 到 客 户 报 障登 记 故 障 信 息 到 故 障 跟 踪 表根 据 S L A 规 定 的 故 障 级 别 发送 邮 件 和 短 信 通 知值 班 人 员 判 断 是 否 可 以处 理 故 障处 理 故 障 并 在 故 障 解 决 后 第一 时 间 发 送 故 障 解 决 及 业 务恢 复 的 公 告补 充 故 障 处 理 过 程 信 息 到 故障 跟 踪 表故 障 处 理 结 束 , 关 闭 此 故障 处 理 流 程将 故 障 传 递 给 接 口 技 术人 员 处 理判 断 是 否 可 以 立 即 解 决故 障处 理 故 障 并 在 故 障 解 决 后 第一 时 间 通 知 值 班 人 员 发 送 故障 解 决 及 业 务 恢 复 的 公 告补 充 故 障 处 理 过 程 信 息 , 由值 班 人 员 统 一 补 充 进 故 障 跟踪 表启 动 紧 急 方 案 恢 复 业 务业 务 恢 复 后 第 一 时 间 通 知 值班 人 员 发 送 业 务 恢 复 的 公 告补 充 故 障 处 理 过 程 信 息 , 由值 班 人 员 统 一 补 充 进 故 障 跟踪 表启 动 问 题 管 理 流 程 , 跟 进 处理 遗 留 问 题YNYN故 障 处 理 流 程 图 值班运维发现监控报警或者客户向值班运维报障; 登记故障信息,发生时间、故障来源(故障处理跟踪表) 判断故障影响范围,并根据 SLA定义,公告相应岗位人员(邮件和短信) 值班运维人员判断此次故障是否可以处 理; 若故障问题值班人员可直接处理,便做好故障记录,迅速处理故障;若故障不可立刻处理,值班运维则须在 10 分钟内通知运维中心的技术专员; 同时在故障处理跟踪表记录故障处理转移时间和转移到的相关人员; 技术专员判断故障的原因并处理故障,若能够立刻判断故障的成因,则迅速处理故障; 故障处理完毕后,第一时间通知值班运维,由值班运维发布业务恢复公告(根据 SLA定义级别公告对象),告知故障处理完毕。 补充故障处理过程到故障跟踪表。 若故障不可立即处理,则启动应急方案恢复业务,技术人员须记录好相关情况,通知值班运维人员发业 务恢复通告,并于事后通知研发部门,协助解决类似技术问题;启动问题管理流程,跟踪解决问题。 在故障处理完毕后,运维人员应做故障分析,编写对内及对外的故障报告,并对此次故障进行存档归类。 每星期统计所有团队的故障信息入故障统计表。 关联表单《 400 电话记录表》、《故障处理跟踪表》、《故障统计表》 问题管理 问题管理流程 由 故 障 流 程 传 递 的 遗 留 问题 、 巡 检 发 现 的 运 维 问 题运 维 工 程 师登 记 问 题 ( 问 题 处 理 跟 踪 表 )针 对 问 题 的 影 响 范 围 、 引 起 的潜 在 风 险 、 某 些 流 程 规 定 等 因素 , 提 出 解 决 方 案 以 及 预 计 解决 时 间管 理 层 评 审 解 决 方 案 及 解决 时 间方 案 评 审 通 过 后按 照 具 体 的 方 案 执 行 采 购 和 变更 , 在 《 问 题 处 理 跟 踪 表 》 简单 描 述 解 决 方 案问 题 解 决 后 记 录 解 决 时 间 和 解决 状 态 《 问 题 处 理 跟 踪 表 》对 于 某 些 不 可 控 、 风 险 低 、无 法 短 时 间 解 决 的 问 题申 请 挂 起 或 关 闭 状 态评 审 决 定 是 否 可 以 实 施挂 起 或 关 闭 状 态评 审 可 以 挂 起 的 问 题 , 待 继续 处 理 条 件 具 备 后 继 续 解决。 评 审 确 定 可 以 关 闭 的 问 题 结束 流 程。 问 题 处 理 流 程 关 闭YYN申 请 挂 起或 直 接 关 闭N将 挂 起 状 态更 改 为 待 处理 状 态问 题 处 理 流 程 图 一、 问题管理流程目标: 问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。 问题管理流程包括诊 断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理,负责确保解决方案的实施。 问题管理还将维护有关问题、应急方案和解决方案的信息。 二、问题管理流程: 问题产生来源:由故障流程传递的遗留问题、巡检发现的运维问题等; 运维工程师登记问题(问题处理跟踪表) 针对问题的影响范围、引起的潜在风险、某些流程规定等因素,提出解决方案以及预计解决时间; 管理层评审解决方案及解决时间; 解决方案评审通过后,按照具体的方案执行采购和变更 问题解决后记录解决时间和解决状态(问题处理跟踪表) 对 于某些不可控、风险低、无。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。