COC最佳实践汇总
本文汇总了云运维中心(COC,Cloud Operations Center)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用COC进行资源运维管理。
|
最佳实践 |
说明 |
|---|---|
|
本章节介绍如何将原始告警清洗为告警单,并根据排班管理通知对应责任人。责任人对告警进行处理,定位恢复后,清除告警。对于无法清除的告警转事件单跟进,进行升级、启动WarRoom处理。 |
|
|
本章节介绍如何通过COC进行内存高使用率故障演练,并创建改进单跟进待改进事项。 |
|
|
本章节介绍如何通过COC对主机的OS补丁进行扫描并且提供合规性报告,针对不合规补丁进行修复。 |
|
|
本章节介绍通过COC自动化运维的定时运维功能,可便捷实现ECS实例定时开关机,有效降低云资源运营成本。 |
|
|
本章节介绍通过COC批量执行命令功能,同时向多台ECS发送执行命令,构建了一套标准化、自动化、可审计的运维闭环,将传统的 “串行人工运维” 升级为 “并行自动运维”。 |
|
|
本章节介绍通过COC的OS版本变更功能,实现对多台主机的批量升级操作,无需逐台手动处理,大幅提升操作系统升级的效率。 |
|
|
本章节介绍通过COC构建定时扫描OS补丁及失败自动通知机制,实现失败事件实时告警、根因快速定位、问题闭环处理。 |
|
|
本章节介绍通过COC账号管理提供账号基线能力,对存量资源批量自动改密,实现统一管控、安全合规、高效运维。 |
|
|
本章节介绍通过COC脚本管理能力,实现ECS主机名在线标准化修改。 |