更新时间:2024-11-12 GMT+08:00
分享

cm_agent参数

log_dir

参数说明log_dir决定存放cm_agent日志文件的目录。可以是绝对路径,或者是相对路径(相对于cm_agent数据目录的路径)。

参数类型:字符串

参数单位:

取值范围:合法目录路径。

默认值:“$GAUSSLOG/cm/cm_agent”,表示在$GAUSSLOG对应的cm目录下生成cm_agent日志。

设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启cm_agent才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

log_file_size

参数说明:控制日志文件的大小。当日志文件达到指定大小时,则重新创建一个日志文件记录日志信息。

参数类型:整型

参数单位:MB

取值范围:0 ~ 2047

默认值:16

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。例如,设置为16,不带单位,表示16MB;设置为16MB,带单位,表示16MB。取值如果要带单位,必须为MB。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

log_min_messages

参数说明:控制写到cm_agent日志文件中的消息级别。每个级别都包含排在它后面的所有级别中的信息。级别越低,服务器运行日志中记录的消息就越少。

参数类型:枚举类型

参数单位:

取值范围:有效值有debug5、debug1、log、warning、error、fatal。

默认值:warning

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:考虑硬盘大小后适当设置。

设置不当的风险与影响:设置级别低可能导致调试信息丢失。

incremental_build

参数说明:控制重建备DN模式是否为增量。

参数类型:布尔型

参数单位:

取值范围:

  • on:表示增量重建备DN。
  • off:表示全量重建备DN。

默认值:on

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

alarm_component

参数说明:设置用于处理告警内容的告警组件的位置。

参数类型:字符串

参数单位:

取值范围:合法文件路径。

  • 若前置脚本gs_preinstall中的--alarm-type参数设置为5,表示未对接第三方组件,告警写入system_alarm日志,此时GUC参数alarm_component的取值为“/opt/huawei/snas/bin/snas_cm_cmd”。
  • 若前置脚本gs_preinstall中的--alarm-type参数设置为1,表示对接第三方组件,此时GUC参数alarm_component的值为第三方组件的可执行程序的绝对路径。

默认值:"/opt/huawei/snas/bin/snas_cm_cmd"

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

alarm_report_interval

参数说明:指定告警上报的时间间隔。

参数类型:整型

参数单位:秒(s)

取值范围:1 ~ 2147483647

默认值:1

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大可能导致告警上报不及时,过小可能导致cpu负载变高。

alarm_report_max_count

参数说明:指定告警上报的最大次数。

参数类型:整型

参数单位:

取值范围:1 ~ 2592000

默认值:1

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大可能导致cpu负载变高。

agent_report_interval

参数说明:cm_agent上报实例状态的时间间隔。

参数类型:整型

参数单位:秒(s)

取值范围:1 ~ 2147483647

默认值:1

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时。

agent_phony_dead_check_interval

参数说明:cm_agent检测CN/DN/GTM进程是否僵死的时间间隔。

参数类型:整型

参数单位:秒(s)

取值范围:0 ~ 2147483647

默认值:10

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致cpu负载变高。

agent_check_interval

参数说明:cm_agent查询DN、CN、GTM等实例状态的时间间隔。

参数类型:整型

参数单位:秒(s)

取值范围:1 ~ 2147483647

默认值:2

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致cpu负载变高。

agent_heartbeat_timeout

参数说明:cm_agent检测cm_server心跳的超时时间。当cm_agent没有在超时时间内接收到cm_server的心跳信息时,将终止与cm_server的连接。

参数类型:整型

参数单位:秒(s)

取值范围:2 ~ 2147483647

默认值:8

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

agent_connect_timeout

参数说明:cm_agent连接cm_server的超时时间。

参数类型:整型

参数单位:秒(s)

取值范围:0 ~ 2147483647

默认值:1

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

agent_connect_retries

参数说明:cm_agent连接cm_server的重试次数。

参数类型:整型

参数单位:

取值范围:0 ~ 2147483647

默认值:15

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

agent_kill_instance_timeout

参数说明:当cm_agent在无法连接cm_server主节点后,发起一次终止本节点上所有实例的操作之前,所需等待的时间间隔。

参数类型:整型

参数单位:秒(s)

取值范围:0 ~ 2147483647

默认值:0,表示不发起终止本节点上所有实例的操作。

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:如果要设置为0以外的值,则需要大于cm_server升级为主节点所耗费的时间。

设置不当的风险与影响:设置过大可能导致CM故障恢复不及时。

enable_gtm_phony_dead_check

参数说明:控制是否开启gtm僵死检查功能。

参数类型:整型

参数单位:

取值范围:0 ~ 1

  • 0:表示关闭gtm僵死检查功能。
  • 1:表示开启gtm僵死检查功能。

默认值:1

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

security_mode

参数说明:控制是否以安全模式启动CN、DN。

参数类型:布尔型

参数单位:

取值范围:

  • on:表示以安全模式启动CN、DN。
  • off:表示以非安全模式启动CN、DN。

默认值:off

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

upgrade_from

参数说明:就地升级过程中使用,用于标识升级前集群的内部版本号,此参数禁止手动修改。

参数类型:整型

参数单位:

取值范围:0 ~ 4294967295

默认值:0

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:手动修改可能会导致就地升级失败。

process_cpu_affinity

参数说明:控制是否以绑核优化模式启动主DN进程。仅支持ARM。

参数类型:整型

参数单位:

取值范围:0 ~ 2

  • 取值为0时,表示不进行绑核优化。
  • 取值大于0时,表示进行绑核优化,且物理CPU片数为2n个。

默认值:0

设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群、cm_agent才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

dilatation_shard_count_for_disk_capacity_alarm

参数说明扩容场景下,设置新增的扩容分片数,用于上报磁盘容量告警时的阈值计算。

参数类型整型

参数单位

取值范围0 ~ 2147483647

  • 取值为0时,表示关闭磁盘扩容告警上报。
  • 取值大于0时,表示开启磁盘扩容告警上报,且告警上报的阈值根据此参数设置的分片数量进行计算。

默认值1

设置方式该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议请将该分片数与实际扩容分片数设置为一致。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

log_threshold_check_interval

参数说明控制日志压缩和清除的时间间隔。

参数类型整型

参数单位秒(s)

取值范围0 ~ 2147483647

默认值1800

设置方式该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。

设置不当的风险与影响:设置过大可能导致硬盘空间占用过多。

log_max_size

参数说明控制日志最大存储值。

参数类型整型

参数单位MB

取值范围0 ~ 2147483647

默认值10240

设置方式该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

log_max_count

参数说明控制硬盘上可存储的最大日志数量。

参数类型整型

参数单位

取值范围0 ~ 10000

默认值10000

设置方式该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

log_saved_days

参数说明控制日志保存的天数。

参数类型整型

参数单位:天(d)

取值范围0 ~ 1000

默认值90

设置方式该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议建议设置为默认值,不做调整。如场景需要,可根据磁盘空间做适当调整。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

enable_log_compress

参数说明控制是否开启压缩日志功能。

参数类型:布尔型

参数单位:

取值范围

  • on:表示开启压缩日志功能。
  • off:表示关闭压缩日志功能。

默认值on

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

enable_cn_auto_repair

参数说明控制是否开启CN自动修复功能。

参数类型布尔型

参数单位:

取值范围

  • on:表示开启CN自动修复功能,即CN被剔除后,agent会尝试自动修复并加回CN。
  • off:表示关闭CN自动修复功能。

默认值on

设置方式该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议CN自动修复功能默认开启,关闭后CN不会自动加回。若要更改,请在理解参数含义后谨慎操作,避免因误操作产生意料之外的风险。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

agent_backup_open

参数说明灾备集群设置,控制CM是否按照灾备集群模式运行。

参数类型整型

参数单位:

取值范围0 ~ 3

  • 0:表示未搭建灾备关系。
  • 1:表示搭建了dorado灾备关系。
  • 2:表示搭建了流式灾备关系。
  • 3:表示搭建了逻辑灾备关系。

默认值0

设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启cm_agent才能生效。

设置建议:此参数为内部调用参数,不建议用户修改。

设置不当的风险与影响:修改该参数取值可能导致集群出现意料之外的结果,请保持默认值。

enable_xc_maintenance_mode

参数说明:在集群只读模式下,控制是否可以修改pgxc_node系统表。

参数类型布尔型

参数单位:

取值范围:

  • on:表示可以修改pgxc_node系统表。
  • off:表示不可以修改pgxc_node系统表。

默认值:on

设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启cm_agent才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

unix_socket_directory

参数说明unix套接字的目录位置。

参数类型字符串

参数单位:

取值范围:合法目录路径。

默认值:""

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

enable_dcf

参数说明DCF模式开关。

参数类型布尔型

参数单位:

取值范围

  • on:表示开启DCF模式。
  • off:表示关闭DCF模式。

默认值off

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

disaster_recovery_type

参数说明主备集群灾备关系的类型。

参数类型整型

参数单位:

取值范围0 ~ 2

  • 0:表示未搭建灾备关系。
  • 1:表示搭建了dorado灾备关系。
  • 2:表示搭建了流式灾备关系。

默认值0

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

enable_e2e_rto

参数说明:端到端RTO功能开关,开启后僵死检测周期及网络检测超时时间将缩短,CM可以达到端到端RTO指标(单实例故障RTO<=10s,叠加故障RTO<=30s)。

参数类型:整型

参数单位:

取值范围:0 ~ 1

  • 0:表示关闭端到端RTO功能。
  • 1:表示开启端到端RTO功能。

默认值:

独立部署:1

金融版(标准型)、企业版、金融版(数据计算型):0

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:建议设置为默认值,不做调整。如场景需要,可做适当调整。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

environment_threshold

参数说明agent所监控的物理环境和节点状态信息的阈值,超过阈值会打印日志。具体分别表示为内存使用率阈值,cpu占用率阈值,磁盘使用率阈值,实例的内存使用率阈值,实例的线程池使用率阈值。

参数类型:字符串

参数单位:

取值范围该参数由五个部分组成,分别是内存使用率阈值、cpu占用率阈值、磁盘使用率阈值、实例的内存使用率阈值、实例的线程池使用率阈值,每个阈值的取值范围为[0,100],单位为%,0表示关闭检测。不同阈值之间用“,”进行连接,取值要以括号开头和结束。例如,“(0,0,0,0,0)”表示对五个阈值都不进行检测。

默认值"(0,0,0,0,0)"

设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

thread_effective_time

参数说明线程运行一轮的有效超时时间。超时说明此线程卡住,线程将自动退出。

参数类型:整型

参数单位:秒(s)

取值范围0 ~ 1200,0表示关闭线程监控能力。

默认值60

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:不建议调整参数值大小,如果需要调整请联系华为技术支持。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

ping_fault_kill_inst_timeout

参数说明主DN实例与所有备机ping不通后,重启该实例的超时时间。

参数类型:整型

参数单位:秒(s)

取值范围0 ~ 1000,0表示关闭ping fault处理能力。

默认值30

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

high_cpu_threshold

参数说明CPU高使用率的阈值,当CPU使用率超过阈值,cm_agent会根据检测周期将CPU使用信息打印到日志中,检测周期默认为1s/次。

参数类型:整型

参数单位:%

取值范围0 ~ 100

默认值95

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

high_mem_threshold

参数说明内存高使用率的阈值,当内存使用率超过阈值,cm_agent会根据检测周期将内存使用信息打印到日志中,检测周期默认为1s/次。

参数类型:整型

参数单位:%

取值范围0 ~ 100

默认值95

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

high_disk_threshold

参数说明磁盘高I/O的阈值,当I/O超过阈值,cm_agent会根据检测周期将I/O信息打印到日志中,检测周期默认为1s/次。连续打印10次,频率为1s/次,并将iostat -xm信息输出到system_stat日志中。

参数类型:整型

参数单位:%

取值范围0 ~ 100

默认值95

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

sys_check_interval

参数说明系统资源检测周期,即CPU、内存、磁盘I/O检测的间隔时间。配置成0则关闭检测。

参数类型:整型,

参数单位:秒(s)

取值范围0 ~ 10

默认值1

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大可能导致告警不及时。

network_check_concurrency

参数说明网络检测的并发数,即同一时刻检测多少条网络链路。配置成0则关闭检测。

参数类型:整型

参数单位:

取值范围0 ~ 1000

默认值10

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过小会导致cm故障检测和恢复功能不及时,设置过大会导致cpu负载变高。

network_check_interval

参数说明网络检测的周期,即间隔多久检测一次网络。配置成0则关闭检测。

参数类型:整型

参数单位:秒(s)

取值范围0 ~ 1000

默认值5

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致cpu负载变高。

asyn_log_enable

参数说明异步日志开关,打开后cm_agent启动异步日志。

参数类型:布尔型

参数单位:

取值范围
  • on:表示cm_agent开启异步日志。
  • off:表示cm_agent不开启异步日志,使用串行日志。

默认值on

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:关闭可能导致日志丢失。

asyn_log_max_buf_size

参数说明异步日志缓存大小。当异步日志发生堆积,且积压的日志超过了缓存大小,后续的日志无法记录。

参数类型:整型

参数单位:kB

取值范围1 ~ 1048576

默认值1024

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:根据内存和硬盘大小适当调整。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

asyn_log_fault_solution

参数说明识别到日志磁盘故障后,异步日志处理方案。当CM识别到日志盘故障或异步日志缓存溢出,CM会根据配置来处理异步日志。

参数类型:整型

参数单位:

取值范围0 ~ 2

  • 0:表示不对日志做多余的处理,缓存区保留所有日志,直到缓存大小达到上限,达到上限后不会记录更多日志。
  • 1:表示对日志进行筛选,识别到日志磁盘故障后,只将关键日志、告警和ERROR级别以上的日志保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。
  • 2:表示丢弃日志,识别到日志磁盘故障后,只将关键日志、告警保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。

默认值0

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:根据内存和硬盘大小适当调整。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

disk_check_hung_timeout

参数说明磁盘I/O hang的超时时间,磁盘检测的单次I/O,如果超过这个时间,则认为磁盘已经I/O hang。配置成0则关闭磁盘hang检测。

参数类型:整型

参数单位:秒(s)

取值范围0 ~ 1000

默认值20,但如果安装时无法判断被检测磁盘是否为条带化,则会将默认值改为60。

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

disk_check_block_timeout

参数说明如果磁盘因文件系统某些原因,导致open这类文件操作阻塞,当这类操作阻塞超过此参数设定的时间时,会判定磁盘故障。配置为0,表示关闭此判断。

参数类型:整型

参数单位:秒(s)

取值范围0 ~ 1000

默认值60

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

disk_check_interval

参数说明控制磁盘I/O hang检测的流量,即最少需要在多长时间内写入指定的数据。默认检测周期是5秒,配置成0则关闭磁盘检测。

参数类型:整型

参数单位:秒(s)

取值范围0 ~ 1000

默认值5

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置不当可能导致故障检测不准确、故障恢复不及时。

disk_check_io_size

参数说明控制磁盘I/O hang检测的流量,即在检测周期内,给磁盘中写入的数据量,这个是直接对磁盘的I/O操作。默认是写入512B的数据,如果检测的磁盘为条带化,则安装的时候会把默认参数改为262144B(256KB)。最大写入1G的数据。配置成0则关闭磁盘hang检测。磁盘检测白名单包括:CM,CN,DN,GTM数据目录,日志目录所在磁盘以及自定义表空间目录所在磁盘。

参数类型:整型

参数单位:B

取值范围0 ~ 1073741824

默认值512

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置不当可能导致故障检测不准确、故障恢复不及时。

process_unhealthy_alarm_time

参数说明进程状态检测超时告警参数,当进程长时间处于某种异常状态(D/T/Z)时,超过此参数时间则触发进程异常告警。

参数类型:整型

参数单位:秒(s)

取值范围0 ~ 2147483647。0表示关闭此功能。

默认值50

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大和过小会导致故障检测的假阴性和假阳性。

enable_tblspc_disk_check

参数说明表空间磁盘检测功能开关。

参数类型:布尔型

参数单位:

取值范围

  • on:表示开启表空间磁盘检测功能,即表空间所在磁盘hang,中止对应DN。
  • off:表示不开启表空间磁盘检测功能。

默认值on

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后重启集群才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

max_network_package_loss

参数说明检测DN主备之间丢包率,DN主丢包率超过阈值时,触发重启操作。

参数类型:整型

参数单位:%

取值范围:0 ~ 99。0表示关闭此功能。

默认值30

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过大可能导致故障恢复不及时。

enable_auto_start

参数说明控制cm_agent是否自动拉起DN、CN。

参数类型:整型

参数单位:

取值范围0 ~ 1

  • 0:表示关闭自动拉起。
  • 1:表示开启自动拉起。

默认值1

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

enable_check_az_network

参数说明是否开启az级数据面网络检测。

参数类型:布尔型

参数单位:

取值范围

  • on:表示开启az级数据面网络检测。
  • off:表示关闭az级数据面网络检测。

默认值on

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:关闭会导致故障检测功能降低。

expect_stop_az_name

参数说明az级网络检测功能,期望停止的az名称。

参数类型:字符串

参数单位:

取值范围环境中已有的az名称。取值为空时,与cmserver主相反的az上的实例停止。

默认值""

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

check_az_network_concurrency

参数说明az级网络检测支持并发数。

参数类型:整型

参数单位:

取值范围1 ~ 10

默认值2

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:设置过小会导致cm故障检测和恢复功能不及时,设置过大会导致cpu负载变高。

cm_hadr_process_type

参数说明:容灾流程标识。

参数类型:枚举类型

参数单位:

取值范围:

  • none:表示当前无流程。
  • failover:表示当前处于灾备集群升主流程。
  • switchover_promote:表示主备集群倒换流程中灾备集群升主流程。
  • switchover_demote:表示主备集群倒换流程中主集群降为灾备集群流程。

默认值:none

设置方式:请参见《工具参考》中“统一集群管理工具 > cm_ctl工具介绍”章节的表“set cm参数”进行设置,然后执行reload指令才能生效。

设置建议:推荐使用默认值。

设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改,避免出现意料之外的结果。

相关文档