zxg10-scv30短消息中心故障应急指导书(doc20)-经营管理(编辑修改稿)内容摘要:
如:网线松动、网线断、网络交换机掉电等硬件故障和配置改动等软件故障。 如果出现短信中心所有的设备网络都不正常的情况,请检查网络中的 HUB 等设备。 如果故障出现在某个模块,检查该模块的网络配置情况。 3. 短消息网关或排队机的 MP 出现不正常时,可能会影响短信业务,此时可以采取数据同步、复位网关 MP、复位机架等进 行尝试。 故障若出现在前台时,请在前台交换机的前面观察 MP 和其他单板上的各个指示灯的运行情况,若 MP 和其他单板通过反复复位都无法启动时,请尽快更换MP,或加显卡进行故障的定位。 4. 业务处理机是否运行正常,可以通过维护终端进行监视,如果有问题可以采取复位业务处理机等来尝试解决,如果不能恢复,请观察业务处理机的上电调试信息,观察数据库是否破坏或接口改变和客户端连接协议改变等 如果数据库损坏,倒换双机或在其他服务器上建立对应的数据库,然后在 SC配置和本地配置中将参数指向相应的节点和数据库。 5. 如果出现计费 问题,请先进行判断是否为短信中心问题、传输问题、计费中心问题等,然后进行有关处理。 如果为短信中心问题请观察 130上的业务程序是否启动、分解程序是否启动、140 等业务处理机上的 BIL 目录下是否产生了积压文件等。 出现问题,可以查看告警箱有无告警,如有告警,可以在短信中心或排队机的 5 应用服务器或维护台上的故障管理系统中查看有关告警记录信息,然后做出响应的处理。 6. 上面的方法如果不能解决现场故障,请与中兴公司 ZXG10SC维护工程师或者中兴公司移动用服部联系。 备注:在故障管理系统中告警信息,可以知道当前告 警的具体信息,如设备单板故障、网络链路故障、 7 号链路故障等,比较方便现场及时定位问题原因。 6 4 系统掉电的应急处理 需要的注意点:系统在掉电瘫痪后,不能马上重启,必须查明事故原因,以防止电源短路等更严重的后果发生。 重启步骤: 检查系统掉电原因并确认系统是否允许重启。 检查交换机、服务器、小型机等关键硬件设备是否全部掉电,如果有个别机器没有掉电,那么就应该全部将还在运行的软件退出。 在检查工作完成之后,开始上电启动短消息及其业务系统。 1. 交换机上电,观察没有问题的情况下,进行系统加载。 2. 上电短消息中心各服 务器或小型机等主机的磁盘阵列或磁带机等外设。 3. 上电启动短消息中心各服务器或小型机等主机设备,启动操作系统。 4. 启动短消息中心应用程序。 请根据 ZXG10SC 操作维护说明来进行。 5. 进行点对点短消息测试,确认短消息中心系统运行已经恢复正常。 注意:对于双机系统,如果带有磁阵,请先启动磁阵,然后在启动主机,再启动备机(主备机不要同时重起)。 7 5 硬件故障应急处理 短信网关和排队交换机出现硬件故障,排查起来比较容易,并且上述设备的关键单板硬件都配置成主备方式,一旦出现故障,在坏板没有及时替换之前,系统基 本还能够正常运行。 然而,有些单板与对端局相连,出现硬件故障后将会对系统造成不同程度的影响,但是这在系统配置中是可以补救的。 如在系统配置和工程安装中,考虑到与中继相关联单板的可靠性,对于每个局向可以采取负荷分担的两条链路和两个中继路由。 另外,对于处理 7 号信令板,在配置中肯定是负荷分担的,如果有一块单板出现硬件故障,可以马上将损坏单板需处理信令的链路,通过有关数据管理台的数据配置到其它好的信令板上,保证系统仍然安全运行。 目前 ZXG10SC在前台交换机配置上通常采用 64K中心机架组网和 8K外围模块组网两种 方式,在这两种方式下,设备 2 号模块 MP 主要承担消息交换和 OMC功能,因此必须确保 2 号模块的正常。 在极端情况下,如果 1或 2 号模块的左右 MP 同时出现故障无法正常启动的情况,则必须从其他模块 MP 上拔下一块 MP,将其 C:\DATA\V0100、 C:\DATA\TEMP 两个目录下的文件删除,然后将 MP 主板上的模块跳线跳到 1 或者 2 号模块的位置,重新插到 1 或者 2 号模块位置,最后重起重传 3 次数据。 如果正在运行中上述业务平台出现硬件故障,就应该采取相应的补救措施,以保证系统尽快恢复运行。 如果工程中配置有备用机器 ,那么在安装的过程中必须将该硬件也安装起来,并且与主用机器安装配置成双机系统,这样在主用机器硬件出现故障时,马上启动备用机器进行接管,保证系统运行不受影响。 如果工程中没有配置有备用机器,一但出现故障,应该紧急找出一台计算机进行恢复安装,使系统尽快恢复。 有关业务模块的安装请参照 ZXG10SC 短消息中心安装手册来进行安装调试。 8 6 软件故障的应急处理 系统业务软件的应急处理是建立在良好的日常维护和备份的基础之上的,因此在系统的运行中,需要作好备份工作。 系统监控 在节假日尤其是春节期间,短消息使用一般会是平时运 行的好几倍,所以在这期间,定期对系统进行检查,可以及早发现系统是否出现拥塞等问题。 在节假日对短消息中心系统维护,建议每 1 个小时左右就进行一次系统的监控,春节除夕晚上建议半小时进行一次系统的监控。 监控的对象主要是: 1. 短消息中心当前的处理消息数,注意是否已经接近系统设计的最大容量。 2. 短消息中心所在机器的系统资源,跟踪系统占用资源是否已经接近系统设计的最大容量。 3. 数据库 /话单文件等是否还有足够空间和资源。 4. 当前的告警有无任何负荷告警等。 系统测试 在节假日对短消息中心系统维护,建议每 1 个小 时左右就进行一次系统的测试,春节除。zxg10-scv30短消息中心故障应急指导书(doc20)-经营管理(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。