cm_agent参数
log_dir
参数说明:log_dir决定存放cm_agent日志文件的目录。可以是绝对路径,或者是相对路径(相对于cm_agent数据目录的路径)。
参数类型:字符串
参数单位:无
取值范围:合法目录路径。
默认值:“$GAUSSLOG/cm/cm_agent”,表示在$GAUSSLOG对应的cm目录下生成cm_agent日志。
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启cm_agent才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
log_file_size
参数说明:控制日志文件的大小。当日志文件达到指定大小时,则重新创建一个日志文件记录日志信息。
参数类型:整型
参数单位:MB
取值范围:0 ~ 2047
默认值:16
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。例如,设置为16,不带单位,表示16MB;设置为16MB,带单位,表示16MB。取值如果要带单位,必须为MB。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
log_min_messages
参数说明:控制写到cm_agent日志文件中的消息级别。每个级别都包含排在它后面的所有级别中的信息。级别越低,服务器运行日志中记录的消息就越少。
参数类型:枚举类型
参数单位:无
取值范围:有效值有debug5、debug1、log、warning、error、fatal。
默认值:warning
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:考虑硬盘大小后适当设置。
设置不当的风险与影响:设置级别低可能导致调试信息丢失。
incremental_build
参数说明:控制重建备DN模式是否为增量。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示增量重建备DN。
- off:表示全量重建备DN。
默认值:on
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
alarm_component
参数说明:设置用于处理告警内容的告警组件的位置。
参数类型:字符串
参数单位:无
取值范围:合法文件路径。
- 若前置脚本gs_preinstall中的--alarm-type参数设置为5,表示未对接第三方组件,告警写入system_alarm日志,此时GUC参数alarm_component的取值为“/opt/huawei/snas/bin/snas_cm_cmd”。
- 若前置脚本gs_preinstall中的--alarm-type参数设置为1,表示对接第三方组件,此时GUC参数alarm_component的值为第三方组件的可执行程序的绝对路径。
默认值:"/opt/huawei/snas/bin/snas_cm_cmd"
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
alarm_report_interval
参数说明:指定告警上报的时间间隔。
参数类型:整型
参数单位:秒(s)
取值范围:1 ~ 2147483647
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致告警上报不及时,过小可能导致cpu负载变高。
alarm_report_max_count
参数说明:指定告警上报的最大次数。
参数类型:整型
参数单位:无
取值范围:1 ~ 2592000
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致cpu负载变高。
agent_report_interval
参数说明:cm_agent上报实例状态的时间间隔。
参数类型:整型
参数单位:秒(s)
取值范围:1 ~ 2147483647
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时。
agent_phony_dead_check_interval
参数说明:cm_agent检测CN/DN/GTM进程是否僵死的时间间隔。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 2147483647
默认值:10
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致cpu负载变高。
agent_check_interval
参数说明:cm_agent查询DN、CN、GTM等实例状态的时间间隔。
参数类型:整型
参数单位:秒(s)
取值范围:1 ~ 2147483647
默认值:2
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致cpu负载变高。
agent_heartbeat_timeout
参数说明:cm_agent检测cm_server心跳的超时时间。当cm_agent没有在超时时间内接收到cm_server的心跳信息时,将终止与cm_server的连接。
参数类型:整型
参数单位:秒(s)
取值范围:2 ~ 2147483647
默认值:8
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
agent_connect_timeout
参数说明:cm_agent连接cm_server的超时时间。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 2147483647
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
agent_connect_retries
参数说明:cm_agent连接cm_server的重试次数。
参数类型:整型
参数单位:无
取值范围:0 ~ 2147483647
默认值:15
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
agent_kill_instance_timeout
参数说明:当cm_agent在无法连接cm_server主节点后,发起一次终止本节点上所有实例的操作之前,所需等待的时间间隔。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 2147483647
默认值:0,表示不发起终止本节点上所有实例的操作。
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:如果要设置为0以外的值,则需要大于cm_server升级为主节点所耗费的时间。
设置不当的风险与影响:设置过大可能导致CM故障恢复不及时。
enable_gtm_phony_dead_check
参数说明:控制是否开启gtm僵死检查功能。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭gtm僵死检查功能。
- 1:表示开启gtm僵死检查功能。
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
security_mode
参数说明:控制是否以安全模式启动CN、DN。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示以安全模式启动CN、DN。
- off:表示以非安全模式启动CN、DN。
默认值:off
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
upgrade_from
参数说明:就地升级过程中使用,用于标识升级前集群的内部版本号,此参数禁止手动修改。
参数类型:整型
参数单位:无
取值范围:0 ~ 4294967295
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:手动修改可能会导致就地升级失败。
process_cpu_affinity
参数说明:控制是否以绑核优化模式启动主DN进程。仅支持ARM。
参数类型:整型
参数单位:无
取值范围:0 ~ 2
- 取值为0时,表示不进行绑核优化。
- 取值大于0时,表示进行绑核优化,且物理CPU片数为2n个。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群、cm_agent才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
dilatation_shard_count_for_disk_capacity_alarm
参数说明:扩容场景下,设置新增的扩容分片数,用于上报磁盘容量告警时的阈值计算。
参数类型:整型
参数单位:个
取值范围:0 ~ 2147483647
- 取值为0时,表示关闭磁盘扩容告警上报。
- 取值大于0时,表示开启磁盘扩容告警上报,且告警上报的阈值根据此参数设置的分片数量进行计算。
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:请将该分片数与实际扩容分片数设置为一致。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
log_threshold_check_interval
参数说明:控制日志压缩和清除的时间间隔。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 2147483647
默认值:1800
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。
设置不当的风险与影响:设置过大可能导致硬盘空间占用过多。
log_max_size
参数说明:控制日志最大存储值。
参数类型:整型
参数单位:MB
取值范围:0 ~ 2147483647
默认值:10240
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
log_max_count
参数说明:控制硬盘上可存储的最大日志数量。
参数类型:整型
参数单位:个
取值范围:0 ~ 10000
默认值:10000
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
log_saved_days
参数说明:控制日志保存的天数。
参数类型:整型
参数单位:天(d)
取值范围:0 ~ 1000
默认值:90
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
enable_log_compress
参数说明:控制是否开启压缩日志功能。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启压缩日志功能。
- off:表示关闭压缩日志功能。
默认值:on
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
enable_cn_auto_repair
参数说明:控制是否开启CN自动修复功能。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启CN自动修复功能,即CN被剔除后,agent会尝试自动修复并加回CN。
- off:表示关闭CN自动修复功能。
默认值:on
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:CN自动修复功能默认开启,关闭后CN不会自动加回。若要更改,请在理解参数含义后谨慎操作,避免因误操作产生意料之外的风险。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
agent_backup_open
参数说明:灾备集群设置,控制CM是否按照灾备集群模式运行。
参数类型:整型
参数单位:无
取值范围:0 ~ 3
- 0:表示未搭建灾备关系。
- 1:表示搭建了dorado灾备关系。
- 2:表示搭建了流式灾备关系。
- 3:表示搭建了逻辑灾备关系。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启cm_agent才能生效。
设置建议:此参数为内部调用参数,不建议用户修改。
设置不当的风险与影响:修改该参数取值可能导致集群出现意料之外的结果,请保持默认值。
enable_xc_maintenance_mode
参数说明:在集群只读模式下,控制是否可以修改pgxc_node系统表。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示可以修改pgxc_node系统表。
- off:表示不可以修改pgxc_node系统表。
默认值:on
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启cm_agent才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
unix_socket_directory
参数说明:unix套接字的目录位置。
参数类型:字符串
参数单位:无
取值范围:合法目录路径。
默认值:""
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
enable_dcf
参数说明:DCF模式开关。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启DCF模式。
- off:表示关闭DCF模式。
默认值:off
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
disaster_recovery_type
参数说明:主备集群灾备关系的类型。
参数类型:整型
参数单位:无
取值范围:0 ~ 2
- 0:表示未搭建灾备关系。
- 1:表示搭建了dorado灾备关系。
- 2:表示搭建了流式灾备关系。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
enable_e2e_rto
参数说明:端到端RTO功能开关,开启后僵死检测周期及网络检测超时时间将缩短,CM可以达到端到端RTO指标(单实例故障RTO<=10s,叠加故障RTO<=30s)。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭端到端RTO功能。
- 1:表示开启端到端RTO功能。
默认值:
独立部署:1
金融版(标准型)、企业版、金融版(数据计算型):0
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:建议设置为默认值,不做调整。如场景需要,可做适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
environment_threshold
参数说明:agent所监控的物理环境和节点状态信息的阈值,超过阈值会打印日志。具体分别表示为内存使用率阈值,cpu占用率阈值,磁盘使用率阈值,实例的内存使用率阈值,实例的线程池使用率阈值。
参数类型:字符串
参数单位:无
取值范围:该参数由五个部分组成,分别是内存使用率阈值、cpu占用率阈值、磁盘使用率阈值、实例的内存使用率阈值、实例的线程池使用率阈值,每个阈值的取值范围为[0,100],单位为%,0表示关闭检测。不同阈值之间用“,”进行连接,取值要以括号开头和结束。例如,“(0,0,0,0,0)”表示对五个阈值都不进行检测。
默认值:"(0,0,0,0,0)"
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
thread_effective_time
参数说明:线程运行一轮的有效超时时间。超时说明此线程卡住,线程将自动退出。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 1200,0表示关闭线程监控能力。
默认值:60
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:不建议调整参数值大小,如果需要调整请联系华为技术支持。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
ping_fault_kill_inst_timeout
参数说明:主DN实例与所有备机ping不通后,重启该实例的超时时间。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 1000,0表示关闭ping fault处理能力。
默认值:30
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
high_cpu_threshold
参数说明:CPU高使用率的阈值,当CPU使用率超过阈值,cm_agent会根据检测周期将CPU使用信息打印到日志中,检测周期默认为1s/次。
参数类型:整型
参数单位:%
取值范围:0 ~ 100
默认值:95
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
high_mem_threshold
参数说明:内存高使用率的阈值,当内存使用率超过阈值,cm_agent会根据检测周期将内存使用信息打印到日志中,检测周期默认为1s/次。
参数类型:整型
参数单位:%
取值范围:0 ~ 100
默认值:95
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
high_disk_threshold
参数说明:磁盘高I/O的阈值,当I/O超过阈值,cm_agent会根据检测周期将I/O信息打印到日志中,检测周期默认为1s/次。连续打印10次,频率为1s/次,并将iostat -xm信息输出到system_stat日志中。
参数类型:整型
参数单位:%
取值范围:0 ~ 100
默认值:95
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
sys_check_interval
参数说明:系统资源检测周期,即CPU、内存、磁盘I/O检测的间隔时间。配置成0则关闭检测。
参数类型:整型,
参数单位:秒(s)
取值范围:0 ~ 10
默认值:1
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致告警不及时。
network_check_concurrency
参数说明:网络检测的并发数,即同一时刻检测多少条网络链路。配置成0则关闭检测。
参数类型:整型
参数单位:条
取值范围:0 ~ 1000
默认值:10
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会导致cm故障检测和恢复功能不及时,设置过大会导致cpu负载变高。
network_check_interval
参数说明:网络检测的周期,即间隔多久检测一次网络。配置成0则关闭检测。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 1000
默认值:5
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致cpu负载变高。
asyn_log_enable
参数说明:异步日志开关,打开后cm_agent启动异步日志。
参数类型:布尔型
参数单位:无
- on:表示cm_agent开启异步日志。
- off:表示cm_agent不开启异步日志,使用串行日志。
默认值:on
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:关闭可能导致日志丢失。
asyn_log_max_buf_size
参数说明:异步日志缓存大小。当异步日志发生堆积,且积压的日志超过了缓存大小,后续的日志无法记录。
参数类型:整型
参数单位:kB
取值范围:1 ~ 1048576
默认值:1024
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:根据内存和硬盘大小适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
asyn_log_fault_solution
参数说明:识别到日志磁盘故障后,异步日志处理方案。当CM识别到日志盘故障或异步日志缓存溢出,CM会根据配置来处理异步日志。
参数类型:整型
参数单位:无
取值范围:0 ~ 2
- 0:表示不对日志做多余的处理,缓存区保留所有日志,直到缓存大小达到上限,达到上限后不会记录更多日志。
- 1:表示对日志进行筛选,识别到日志磁盘故障后,只将关键日志、告警和ERROR级别以上的日志保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。
- 2:表示丢弃日志,识别到日志磁盘故障后,只将关键日志、告警保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。
默认值:0
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:根据内存和硬盘大小适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
disk_check_hung_timeout
参数说明:磁盘I/O hang的超时时间,磁盘检测的单次I/O,如果超过这个时间,则认为磁盘已经I/O hang。配置成0则关闭磁盘hang检测。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 1000
默认值:20,但如果安装时无法判断被检测磁盘是否为条带化,则会将默认值改为60。
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
disk_check_block_timeout
参数说明:如果磁盘因文件系统某些原因,导致open这类文件操作阻塞,当这类操作阻塞超过此参数设定的时间时,会判定磁盘故障。配置为0,表示关闭此判断。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 1000
默认值:60
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
disk_check_interval
参数说明:控制磁盘I/O hang检测的流量,即最少需要在多长时间内写入指定的数据。默认检测周期是5秒,配置成0则关闭磁盘检测。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 1000
默认值:5
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置不当可能导致故障检测不准确、故障恢复不及时。
disk_check_io_size
参数说明:控制磁盘I/O hang检测的流量,即在检测周期内,给磁盘中写入的数据量,这个是直接对磁盘的I/O操作。默认是写入512B的数据,如果检测的磁盘为条带化,则安装的时候会把默认参数改为262144B(256KB)。最大写入1G的数据。配置成0则关闭磁盘hang检测。磁盘检测白名单包括:CM,CN,DN,GTM数据目录,日志目录所在磁盘以及自定义表空间目录所在磁盘。
参数类型:整型
参数单位:B
取值范围:0 ~ 1073741824
默认值:512
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置不当可能导致故障检测不准确、故障恢复不及时。
process_unhealthy_alarm_time
参数说明:进程状态检测超时告警参数,当进程长时间处于某种异常状态(D/T/Z)时,超过此参数时间则触发进程异常告警。
参数类型:整型
参数单位:秒(s)
取值范围:0 ~ 2147483647。0表示关闭此功能。
默认值:50
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。
enable_tblspc_disk_check
参数说明:表空间磁盘检测功能开关。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启表空间磁盘检测功能,即表空间所在磁盘hang,中止对应DN。
- off:表示不开启表空间磁盘检测功能。
默认值:on
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后重启集群才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
max_network_package_loss
参数说明:检测DN主备之间丢包率,DN主丢包率超过阈值时,触发重启操作。
参数类型:整型
参数单位:%
取值范围:0 ~ 99。0表示关闭此功能。
默认值:30
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致故障恢复不及时。
enable_auto_start
参数说明:控制cm_agent是否自动拉起DN、CN。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭自动拉起。
- 1:表示开启自动拉起。
默认值:1
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
enable_check_az_network
参数说明:是否开启az级数据面网络检测。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启az级数据面网络检测。
- off:表示关闭az级数据面网络检测。
默认值:on
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:关闭会导致故障检测功能降低。
expect_stop_az_name
参数说明:az级网络检测功能,期望停止的az名称。
参数类型:字符串
参数单位:无
取值范围:环境中已有的az名称。取值为空时,与cmserver主相反的az上的实例停止。
默认值:""
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。
check_az_network_concurrency
参数说明:az级网络检测支持并发数。
参数类型:整型
参数单位:个
取值范围:1 ~ 10
默认值:2
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会导致cm故障检测和恢复功能不及时,设置过大会导致cpu负载变高。
cm_hadr_process_type
参数说明:容灾流程标识。
参数类型:枚举类型
参数单位:无
取值范围:
- none:表示当前无流程。
- failover:表示当前处于灾备集群升主流程。
- switchover_promote:表示主备集群倒换流程中灾备集群升主流程。
- switchover_demote:表示主备集群倒换流程中主集群降为灾备集群流程。
默认值:none
设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。