配置网络故障自动恢复程序
背景
在进行主机迁移时,当源端和目的端之间的网络连接出现不稳定时,可能会导致迁移任务因长时间的网络中断而报错。这种情况下,一旦网络恢复,通常需要手动在SMS控制台重新启动迁移任务,这无疑导致迁移效率的降低。为了解决这一问题,SMS-Agent开发了网络故障自动恢复功能,能够在检测到网络连通性恢复后,自动尝试重新启动迁移任务。
使用须知
- 自动恢复范围:当前版本的自动恢复程序仅在迁移任务出现特定错误代码(SMS.0807、SMS.1807、SMS.2802、SMS.3802、SMS.2805、SMS.2806)时触发。
- 最大执行次数:自动恢复程序在尝试一定次数后,如果网络仍未恢复正常,则程序将自动退出。待网络恢复后,需要手动在SMS控制台重新启动迁移任务。
配置参数说明
为了满足不同场景下的恢复需求,自动恢复程序提供了几个关键的配置参数,您可以根据实际情况进行调整。
- 自动恢复任务程序的执行间隔周期 (auto_start_interval_seconds):该参数用于设置自动恢复程序的启动间隔时间,单位为秒。例如,如果希望在报错后每隔半小时进行一次检测,则将该参数设置为1800秒。
- 自动恢复任务程序最大执行次数 (auto_start_max_retry_times):该参数用于设置自动恢复程序在退出前执行的最大次数。
- 自动恢复任务程序每次检测后递增时间周期 (auto_start_each_addition_seconds):该参数用于控制每次检测后的间隔时间递增量,单位为秒。例如,如果设置auto_start_each_addition_seconds为10,而auto_start_interval_seconds为3600,则程序的检测间隔时间将会是3600秒、3610秒、3620秒,以此类推,每次执行间隔时间递增10秒。
配置文件路径
根据源端操作系统的不同,配置文件的路径也有所区别:
- Linux主机:配置文件位于.../SMS-Agent/agent/config/g-property.cfg。
- Windows主机:
- Py3配置文件位于C:\SMS-Agent-Py3\config\g-property.cfg。
- Py2配置文件位于C:\SMS-Agent-Py2\config\g-property.cfg。