更新时间:2024-01-10 GMT+08:00
故障处理原则
在遇到网络或业务异常时,请遵循以下原则对故障进行定界和恢复:
- 网络发生重大事故时,需依照快速定界故障、隔离故障的原则来尽快恢复业务。
- 定界故障:根据不同的故障现象匹配不同的故障定界思路流程,快速确定故障点。
- 快速恢复:通过隔离端口、隔离设备等手段,将故障目标暂时隔离,隔离的前提是网络有可靠性冗余备份,业务由其他正常节点承载,从而快速恢复业务。
- 在定位故障时,应及时获取并保存故障数据信息,不能随意删除数据。这些数据信息包括但不局限于网络拓扑、故障业务涉及的IP地址范围、故障接入点位置等。
- 在确定故障处理方案时,应先评估故障影响大小。
- 第三方硬件出现故障,可查看第三方相关资料或拨打第三方公司的服务电话求助。
- 维护人员在上岗前必须接受必要的应急维护培训,应熟练使用数据中心各个产品的运维功能,学习判断紧急事故的基本方法、掌握处理紧急事故的基本技能。
父主题: 维护工程师必读