cm_server参数
log_dir
参数说明:log_dir决定存放cm_server日志文件的目录。可以是绝对路径,或者是相对路径(相对于cm_server数据目录的路径)。
参数类型:字符串,最大长度为1024。
参数单位:无
取值范围:合法目录路径。
默认值:“$GAUSSLOG/cm/cm_server”,表示在$GAUSSLOG对应的cm目录下生成cm_server日志。
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
log_file_size
参数说明:控制日志文件的大小。当日志文件达到指定大小时,则重新创建一个日志文件记录日志信息。
参数类型:整型
参数单位:MB
取值范围:0 ~ 2047
默认值:16
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。例如,设置为16,不带单位,表示16MB;设置为16MB,带单位,表示16MB。取值如果要带单位,必须为MB。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
log_min_messages
参数说明:控制写到cm_server日志文件中的消息级别。每个级别都包含排在它后面的所有级别中的信息。级别越高,服务器运行日志中记录的消息就越少。
参数类型:枚举类型
参数单位:无
取值范围:消息级别从低到高依次为debug5、debug1、log、warning、error、fatal(不区分大小写)。
默认值:warning
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:考虑硬盘大小后适当设置。
设置不当的风险与影响:设置级别高可能导致调试信息丢失。
thread_count
参数说明:agent线程池的线程数。
参数类型:字符串
参数单位:无
取值范围:该参数分为2个部分,'worker_thread_count, io_ratio',这2个部分的具体含义如下:
- worker_thread_count:AgentWorker的线程数量,取值范围2 ~ 1000。
- io_ratio:io和worker线程的比例,值为n代表一个AgentIO线程对应n个AgentWorker线程,取值范围1 ~ 100。AgentIO线程最少一个。
如果第一部分的参数,即AgentWorker的线程数量大于集群节点数与处理cm_ctl请求的线程数(集群节点数小于32默认1个线程,否则4个线程)之和,实际生效值为集群节点数与处理cm_ctl请求的线程数之和。
默认值:"(1000,1)"
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:不做调整设置为默认值。若要更改,请在理解参数含义后谨慎操作,避免因误操作产生意料之外的风险。
设置不当的风险与影响:设置不当可能导致CM故障检测和恢复不及时、CPU负载变高。
alarm_component
参数说明:设置用于处理告警内容的告警组件的位置。
参数类型:字符串
参数单位:无
取值范围:合法文件路径。
- 若前置脚本gs_preinstall中的--alarm-type参数设置为5,表示未对接第三方组件,告警写入system_alarm日志,此时GUC参数alarm_component的取值为“/opt/huawei/snas/bin/snas_cm_cmd”。
- 若前置脚本gs_preinstall中的--alarm-type参数设置为1,表示对接第三方组件,此时GUC参数alarm_component的值为第三方组件的可执行程序的绝对路径。
默认值:"/opt/huawei/snas/bin/snas_cm_cmd"
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
alarm_report_interval
参数说明:指定告警上报的时间间隔。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:3
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致告警上报不及时,过小可能导致CPU负载变高。
alarm_report_max_count
参数说明:指定告警上报的最大次数。
参数类型:整型
参数单位:次
取值范围:1 ~ 2592000
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致CPU负载变高。
instance_failover_delay_timeout
参数说明:cm_server检测到主机无法正常使用,延迟仲裁出新主机。超时后,cm_server会重新仲裁出新的实例主机。该参数对GTM仲裁生效,对主备从模式的DN仲裁生效。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致数据库故障恢复不及时。
instance_heartbeat_timeout
参数说明:cm_server检测实例心跳的超时时间。超时后,则表示该实例处于托管状态,实例状态显示unknown。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2147483647
默认值:6
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致故障检测的假阴性,设置过小会导致故障检测的假阳性。
instance_keep_heartbeat_timeout
参数说明:cm_agent会定期检测实例状态并上报给cm_server,若实例状态长时间无法成功检测,累积时间超出该数值,则cm_server将下发命令给agent重启该实例。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:40
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致故障检测的假阴性,设置过小会导致故障检测的假阳性。
instance_phony_dead_restart_interval
参数说明:当CN/DN/GTM实例僵死时,会被cm_agent重启,相同的实例连续因僵死被终止时,其间隔时间不能小于该参数数值,否则cm_agent不会下发命令。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:21600
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致故障检测的假阴性,设置过小会导致故障检测的假阳性。
coordinator_heartbeat_timeout
参数说明:CN故障自动剔除的心跳超时时间。设置后立即生效,不需要重启集群。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2592000,0表示CN故障后不会自动剔除。
默认值:25
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致CN长时间无法剔除,过小可能导致CN无法正常剔除。
phony_dead_effective_time
参数说明:用于CN/DN/GTM进程的僵死检测,当检测到的僵死次数大于该参数值时,认为进程僵死,将进程重启。
参数类型:整型
参数单位:次
取值范围:1 ~ 2147483647
默认值:5
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致故障检测的假阴性,设置过小会导致故障检测的假阳性。
enable_transaction_read_only
参数说明:控制是否打开cm_server磁盘阈值检测功能,该功能打开后,当磁盘使用率大于datastorage_threshold_value_check值时,cm_server会自动将数据库设置为只读模式。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启阈值检测功能。
- off:表示关闭阈值检测功能。
默认值:on
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:关闭此功能可能导致磁盘占用过高。
enable_disk_full_check
参数说明:磁盘disk full(磁盘使用率超过disk_full_threshold,会停止故障节点的实例进程)检测开关,打开后,允许磁盘disk full check。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启磁盘disk full check。
- off:表示关闭磁盘disk full check。
默认值:on
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
disk_full_threshold
参数说明:在参数enable_disk_full_check开启情况下,设置数据库磁盘最大的占用阈值,当数据目录所在磁盘占用超过这个阈值,会自动将数据库停止。当磁盘占用恢复到datastorage_threshold_value_check以下时,会自动将数据库启动。disk_full_threshold需要大于datastorage_threshold_value_check才能生效。
参数类型:整型
参数单位:%
取值范围:1 ~ 99
默认值:98
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大可能导致其他进程不可用。
datastorage_threshold_check_interval
参数说明:检测磁盘占用的时间间隔。每间隔用户指定时间,检测一次磁盘占用。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2592000
默认值:10
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致CPU负载变高。
datastorage_threshold_value_check
参数说明:设置数据库只读模式的磁盘占用阈值,当数据目录所在磁盘占用超过这个阈值,自动将数据库设置为只读模式。由于数据库只读后无法限制日志回放,磁盘占用会继续增加,因此应当关注集群磁盘容量,及时处理数据库只读相关告警,防止出现磁盘空间写满、数据库无法快速恢复的场景。
参数类型:整型
参数单位:%
取值范围:1 ~ 99
默认值:85
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:建议设置为默认值,不做调整。根据磁盘空间可做适当调整,调整该参数时,建议同步调整DN的max_size_for_xlog_retention参数,避免因备份操作触发集群只读阈值。
- GaussDB一般用于承载重要核心业务,支持的存储容量上限较大,这类业务的并发通常会比较高,预留15%的空间以便在磁盘空间紧张的情况下,有足够的空间承载磁盘扩容前这段时间的数据增量。
- 为数据库进入只读模式后的运维操作预留磁盘空间,如处理日志、空间回收、备份等,避免发生问题后无空间余量支撑运维操作。
- 根据客户的默认阈值诉求,大部分客户默认使用85%的配置。
设置不当的风险与影响:设置过大会导致磁盘空间占用过高、出现无法快速恢复的场景。
datastorage_threshold_recover
参数说明:数据库取消只读模式的缓冲阈值。数据目录所在磁盘占用超过datastorage_threshold_value_check后,被设置为只读模式。当磁盘占用恢复到小于(datastorage_threshold_value_check - datastorage_threshold_recover)后,才会取消只读模式。对于被剔除的CN,为了防止反复剔除加回的情况出现,当磁盘占用小于(datastorage_threshold_value_check - datastorage_threshold_recover)时,该CN才能被加回,超过则不加回。主数据库只读后,只有当备数据库磁盘占用小于(datastorage_threshold_value_check - datastorage_threshold_recover)时,才会将主切换到该备机。
参数类型:整型
参数单位:%
取值范围:0 ~ 99
默认值:5
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
max_datastorage_threshold_check
参数说明:设置磁盘使用率的最大检测间隔时间。当用户手动修改只读模式参数后,会自动在指定间隔时间后开启磁盘满检测操作。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2592000
默认值:43200
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时。
enable_az_auto_switchover
参数说明:控制是否开启AZ自动切换功能,若开启,则表示允许cm_server自动切换AZ。否则当发生DN故障等情况时,即使当前AZ已经不再可用,也不会自动切换到其它AZ上,除非手动执行切换命令。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭AZ自动切换功能。
- 1:表示开启AZ自动切换功能。
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:关闭此功能可能会导致cm故障检测和恢复功能不及时。
enable_az_conn_check
参数说明:AZ网络仲裁开关。cm_server会停掉被网络隔离的AZ。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭。
- 1:表示开启。开启后,cm_server会进行AZ网络仲裁。
默认值:1
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
cm_auth_method
参数说明:CM模块端口认证方式。
参数类型:枚举类型
参数单位:无
取值范围:
- trust:表示未配置端口认证。
- gss:表示采用kerberos端口认证。
默认值:trust
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:只有当kerberos服务端和客户端成功安装后才能修改为“gss”,否则CM模块无法正常通信,将影响数据库状态。
cm_krb_server_keyfile
参数说明:kerberos服务端key文件所在位置,需要配置为绝对路径。该文件通常在“${GAUSSHOME}/kerberos”路径下,以keytab格式结尾,文件名与集群运行所在用户名相同。
参数类型:字符串
参数单位:无
取值范围:服务器上kerberos服务端key文件所在位置的绝对路径。
默认值:“${GAUSSHOME}/kerberos/{UserName}.keytab”,默认值无法生效,仅作为提示。
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:该参数与上述cm_auth_method参数是配对的,当cm_auth_method参数修改为“gss”时,该参数也必须配置为正确路径,否则将影响集群状态。
cm_hadr_process_type
参数说明:容灾流程标识。
参数类型:枚举类型
参数单位:无
取值范围:
- none:表示当前无流程。
- failover:表示当前处于灾备集群升主流程。
- switchover_promote:表示主备集群倒换流程中灾备集群升主流程。
- switchover_demote:表示主备集群倒换流程中主集群降为灾备集群流程。
默认值:none
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
cma_fault_kill_instance_timeout
参数说明:DN上报CMS的等待时间。DN实例无法上报,cmserver主内部状态置为unknown后,等待超时,cmserver通过pssh命令远程发送kill操作,重启不上报DN实例进程。此参数默认不添加到cmserver配置文件中,需要手动添加。该参数只支持QUORUM模式。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647,0表示关闭该功能。
默认值:不配置此参数,默认开启,默认值为:(cm_server_num * agent_connect_timeout * agent_connect_retries + agent_heartbeat_timeout + 10)。
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置不当可能导致故障恢复不及时。
cm_server_arbitrate_delay_base_time_out
参数说明:cm_server仲裁延迟基础时长。cm_server主机断连后,仲裁启动计时开始,经过仲裁延迟时长后,将选出新的cm_server主机。其中仲裁延迟时长由仲裁延迟基础时长、节点index(server ID序号)和增量时长共同决定。公式为:仲裁延迟时长=仲裁延迟基础时长+节点index*仲裁延迟增量时长。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:10
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会导致cm_server断连故障假阳性,过大会导致CM故障恢复不及时。
cm_server_arbitrate_delay_incrememtal_time_out
参数说明:cm_server仲裁延迟增量时长。cm_server主机断连后,仲裁启动计时开始,经过仲裁延迟时长后,将选出新的cm_server主机。其中仲裁延迟时长由仲裁延迟基础时长、节点index(server ID序号)和增量时长共同决定。公式为:仲裁延迟时长=仲裁延迟基础时长+节点index*仲裁延迟增量时长。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:3
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会导致cm_server断连故障假阳性,过大会导致CM故障恢复不及时。
cmserver_ha_connect_timeout
参数说明:cm_server连接到其他cm_server的超时时间。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2147483647
默认值:2
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致故障检测的假阴性,设置过小会导致故障检测的假阳性。
cmserver_ha_heartbeat_timeout
参数说明:cm_server从其他cm_server接收心跳信号的超时时间。超时后,会触发cm_server重新选主。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2147483647
默认值:6
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致故障检测的假阴性,设置过小会导致故障检测的假阳性。
cmserver_ha_status_interval
参数说明:cm_server主备同步状态信息的时间间隔。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2147483647
默认值:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致cm故障检测和恢复功能不及时,设置过小会导致CPU负载变高。
cmserver_self_vote_timeout
参数说明:cm_server自仲裁超时时间。只有当该参数取值大于等于cmserver_ha_heartbeat_timeout参数取值时,该参数设置才有效。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:6
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致故障检测的假阴性,设置过小会导致故障检测的假阳性。
cmserver_demote_delay_on_etcd_fault
参数说明:因为etcd不健康而导致cm_server从主降为备的时间延迟。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2147483647
默认值:8
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会导致etcd故障检测的假阳性,过大会导致CM故障恢复不及时。
cn_dn_disconnect_to_delete_time
参数说明:CN在所有DN主执行检测SQL都失败的次数。当失败次数超过该值时,则剔除该CN。
参数类型:整型
参数单位:次
取值范围:1 ~ 600
默认值:20
设置方式:该参数为CM参数,参数修改请参考表3中方式一进行设置。
设置建议:无
设置不当的风险与影响:无
force_promote
参数说明:控制cm_server是否开启强切逻辑功能(集群状态为Unknown的时候以丢失部分数据为代价保证集群基本功能可用)。该参数同时适用于CN和DN。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭强切逻辑功能。
- 1:表示开启强切逻辑功能。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:如果用户可以接受业务(系统)发生强切导致部分数据丢失,以恢复业务为最高优先级,则可以设置为开启。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
switch_rto
参数说明:cm_server强切逻辑等待时延。在force_promote参数取值被置为1时,当集群的某一分片处于无主状态开始计时,等待该延迟时间后开始执行强切逻辑。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:s(秒)
取值范围:60 ~ 2147483647
默认值:600
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会导致数据库故障假阳性,过大会导致故障恢复不及时。
enable_finishredo_retrieve
参数说明:控制cm_server强切逻辑后是否对redo切除的xlog进行数据找回。该参数取值设置为on时,发生强切后进行数据自动找回。该参数仅支持QUORUM模式。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示进行数据找回。
- off:表示不进行数据找回。
默认值:off
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:按照实际需要进行调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
backup_open
参数说明:灾备集群设置,控制CM是否按照灾备集群模式运行。
参数类型:整型
参数单位:无
取值范围:0 ~ 3
- 0:表示未搭建灾备关系。
- 1:表示搭建了dorado灾备关系。
- 2:表示搭建了流式灾备关系。
- 3:表示搭建了逻辑灾备关系。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:非灾备集群不能开启该参数。此参数为内部调用参数,不建议用户修改。
设置不当的风险与影响:修改该参数取值可能导致集群出现意料之外的结果,请保持默认值。
cluster_starting_aribt_delay
参数说明:cm_server在集群启动阶段,等待DN静态主升主的时间。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 2592000
默认值:180
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
install_type
参数说明:容灾集群相关的设置,用来区分集群的类型。
参数类型:整型
参数单位:无
取值范围:0 ~ 2
- 0:表示未搭建容灾关系的集群。
- 1:表示基于dorado的集群。
- 2:表示基于流式的集群。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:非灾备集群不能开启该参数。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
enable_ssl
参数说明:ssl证书开关。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示启用ssl证书加密通信。
- off:表示不启用ssl证书加密通信。
默认值:off
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:出于安全性考虑,建议不要关闭该配置。关闭后cm将不使用加密通信,所有信息明文传播,可能带来窃听、篡改、冒充等安全风险。
设置不当的风险与影响:关闭后cm将不使用加密通信,所有信息明文传播,可能带来窃听、篡改、冒充等安全风险。
ssl_cert_expire_alert_threshold
参数说明:ssl证书过期告警时间。证书过期时间少于该时间时,上报证书即将过期告警。
参数类型:整型
参数单位:d(天)
取值范围:7 ~ 180
默认值:90
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:按照实际需要进行调整。
设置不当的风险与影响:设置过小可能会导致告警不及时。
ssl_cert_expire_check_interval
参数说明:ssl证书过期检测周期。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:86400(即1天)
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:按照实际需要进行调整。
设置不当的风险与影响:设置过小会增加CPU负载,过大会导致告警不及时。
delay_arbitrate_timeout
参数说明:设置等待跟主DN同AZ节点redo回放后升主的时间。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过大会导致DN故障恢复不及时。
enable_dcf
参数说明:DCF模式开关。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启DCF模式。
- off:表示关闭DCF模式。
默认值:off
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
dcf_heartbeat_timeout
参数说明:dcf实例心跳超时时间。dcf的主超时后,则表示该dcf实例处于脱管状态,cm会自动触发dcf的主备切换。该参数仅支持DCF模式。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647,设置为0表示不开启联合仲裁dcf实例的心跳超时检测。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:该功能关闭后,CM不会再处理脱管中的DCF实例,DCF实例在脱管状态下出现异常将无法得到CM的辅助仲裁。请在充分理解参数含义,并经过测试验证后进行修改。
ddb_type
参数说明:etcd,dcc模式切换开关。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示开启etcd模式。
- 1:表示开启dcc模式。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一进行设置,修改后需要重启集群才能生效。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
ddb_log_level
参数说明:设置ddb日志级别。
参数类型:字符串
参数单位:无
取值范围:
- “NONE”:表示关闭日志打印,不能与以下日志级别混合使用。
- “RUN_ERR|RUN_WAR|RUN_INF|DEBUG_ERR|DEBUG_WAR|DEBUG_INF|TRACE|PROFILE|OPER”:表示开启日志,日志级别可以从上述字符串中选取字符串并使用竖线组合使用,不能配置空字符串。
默认值:"RUN_ERR|RUN_WAR|DEBUG_ERR|OPER|RUN_INF|PROFILE"
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
ddb_log_backup_file_count
参数说明:最大保存日志文件个数。
参数类型:整型
参数单位:无
取值范围:1 ~ 100
默认值:10
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
ddb_max_log_file_size
参数说明:单条日志最大字节数。
参数类型:字符串
参数单位:无
取值范围:该参数取值由数字部分和单位组成,数字部分取值范围为1 ~ 1000,单位为M。
默认值:"10M"
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
ddb_log_suppress_enable
参数说明:控制是否开启日志抑制功能。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭日志抑制功能。
- 1:表示开启日志抑制功能。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
ddb_election_timeout
参数说明:dcc选举超时时间。
参数类型:整型
参数单位:s(秒)
取值范围:1 ~ 600
默认值:3
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
ddb_dcf_sync_nodes
参数说明:设置dcc同步复制的备机列表。
参数类型:字符串
参数单位:无
取值范围:合法的备机列表,支持按如下格式配置:
ANY num_sync:node_id[, ...]
num_sync表示ddb需要同步复制的备机数量,node_id表示备机的序号。例如:ddb_dcf_sync_nodes='ANY 1:2,3'。
默认值:""
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
ddb_dcf_extreme_mode
参数说明:设置dcc的日志提交策略。
参数类型:整型
参数单位:无
取值范围:0 ~ 2
- 0:表示最大保护,多数派提交。
- 1:表示最大可用,备机故障时主机可直接提交,备机正常时多数派提交。
- 2:表示最大性能,本地提交。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
alarm_ddb_unhealth_threshold
参数说明:ddb不健康告警上报阈值。
参数类型:整型
参数单位:无
取值范围:0 ~ 2592000
默认值:5
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
enable_e2e_rto
参数说明:端到端RTO功能开关,开启后僵死检测周期及网络检测超时时间将缩短,CM可以达到端到端RTO指标(单实例故障RTO<=10s,叠加故障RTO<=30s)。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭端到端RTO功能。
- 1:表示开启端到端RTO功能。
默认值:
独立部署:1
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:建议设置为默认值,不做调整。如场景需要,可做适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
thread_effective_time
参数说明:线程运行一轮的有效超时时间。超时说明此线程卡住,进程将自动退出。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 1200,0表示关闭线程监控能力。
默认值:20
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:不建议调整参数值大小,如果需要调整请联系华为技术工程师提供技术支持。
设置不当的风险与影响:设置不当可能导致故障检测不准确、故障恢复不及时。
enable_synclist_single_inst
参数说明:控制是否开启降副本降至一主零备功能。开启后降副本会降至一主零备,参数设置错误时,按默认值处理。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示开启降副本降至一主零备功能。
- off:表示关闭降副本降至一主零备功能。
默认值:off
设置方式:该参数为CM参数,参数修改请参考表2中方式一、方式二进行设置。
设置建议:推荐使用默认值。如果需要调整请联系华为技术工程师提供技术支持。
设置不当的风险与影响:打开此参数时,在所有备机故障情况下,主机会自动转为本地提交方式,此时如果主机再故障,则可能产生不可恢复的影响。
ctl_thread_count
参数说明:ctl线程池的线程数。
参数类型:字符串
参数单位:无
取值范围:长度大于0的字符串。该参数分为2个部分,'worker_thread_count, io_ratio',这2个部分的具体含义如下:
-
worker_thread_count:CtlWorker的线程数量,取值范围0 ~ 1000。取值为0时,CtlWorker的线程数量等于集群内节点数。
-
io_ratio:io和worker线程的比例,值为n代表一个CtlIO线程对应n个CtlWorker线程,取值范围1 ~ 100。CtlIO线程最少一个。
默认值:"(0,1)"
设置方式:该参数为CM参数,参数修改请参考表3中方式一进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置不当可能导致CM性能降低。
asyn_log_enable
参数说明:异步日志开关,打开后cm_server启动异步日志。
参数类型:布尔型
参数单位:无
取值范围:
- on:表示cm_server开启异步日志。
- off:表示cm_server不开启异步日志,使用串行日志。
默认值:on
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:关闭可能导致日志丢失。
asyn_log_max_buf_size
参数说明:异步日志缓存大小,当异步日志发生堆积,且积压的日志超过了缓存大小,后续的日志无法记录。
参数类型:整型
参数单位:kB
取值范围:1 ~ 1048576
默认值:1024
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:根据内存和硬盘大小适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
asyn_log_fault_solution
参数说明:识别到日志磁盘故障后,异步日志处理方案。当CM识别到日志盘故障或异步日志缓存溢出,CM会根据配置来处理异步日志。
参数类型:整型
参数单位:无
取值范围:0 ~ 2
- 0:表示不对日志做多余的处理,缓存区保留所有日志,直到缓存大小达到上限,达到上限后不会记录更多日志。
- 1:表示对日志进行筛选,识别到日志磁盘故障后,只将关键日志、告警和ERROR级别以上的日志保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。
- 2:表示丢弃日志,识别到日志磁盘故障后,只将关键日志、告警保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。
默认值:0
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:根据内存和硬盘大小适当调整。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
enable_isolate
参数说明:隔离实例开关。该参数仅支持DCF模式。
参数类型:整型
参数单位:无
取值范围:0 ~ 1
- 0:表示关闭该功能。
- 1:表示开启该功能。开启后,cm_server会自动隔离故障实例。
默认值:1
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:请在充分理解参数含义,并经过测试验证后进行修改。
barrier_restart_threshold
参数说明:灾备集群barrier重启等待时间。当灾备集群barrier推进持续停滞超过该时间后,会重启barrier推进。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2592000,0表示禁止barrier重启。
默认值:30
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置不当可能导致故障检测不准确、故障恢复不及时。
enable_topology_network_arbitrate
参数说明:网络拓扑仲裁开关。开启该参数GaussDB将根据网络拓扑结构进行仲裁。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:无
取值范围:
- 0:表示关闭。
- 1:表示开启。开启后,cm_server会自动进行网络拓扑仲裁。
默认值:1
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
topology_network_arbitrate_wait_time
参数说明:网络拓扑仲裁等待网络拓扑数据稳定的时间。如果在该参数时间内,网络拓扑数据发生变化,则不会进行网络拓扑仲裁。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:s(秒)
取值范围:5 ~ 600
默认值:10
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
topology_network_collecting_failed_times
参数说明:数据面网络拓扑连续断连次数,断连失败次数超过此参数,则判断为数据面网络拓扑异常。需要和cma的topology_network_collecting_failed_times值保持一致。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:次
取值范围:3 ~ 50
默认值:5
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
topology_network_stable_cn_percent
参数说明:数据面网络拓扑判定CN可负载的剩余CN比例,网络仲裁根据该参数计算最少保留的CN个数(所有CN个数 * 该比例,如果计算个数小于1则取1)。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:无
取值范围:0 ~ 100
默认值:50
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:无
设置不当的风险与影响:无
topology_network_check_max_cn_count
参数说明:数据面网络拓扑检测支持的集群中最大CN个数,CN个数超过该值,则不进行数据面网络拓扑仲裁。参数设置为0表示关闭网络仲裁。该参数仅支持QUORUM模式。
参数类型:整型
参数单位:个
取值范围:0 ~ 256
默认值:16
设置方式:该参数为CM参数,参数修改请参考表3中方式一进行设置。
设置建议:无
设置不当的风险与影响:无
replica_reduce_delay_time
参数说明:降副本延迟基础时长。当检测到多数派数据节点处于unknown状态时,需持续观测该状态达到此延时时长后,才会触发降副本操作;当检测到多数派数据节点处于building、need_repair、starting等不可用状态时,需持续观测该状态达到此延迟时长的5倍后,才触发降副本操作。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:12
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会增加短时间网络断连等故障导致的误降副本概率,设置过大多数派节点故障时集群会长时间不可用。
replica_increase_delay_time
参数说明:升副本延迟基础时长。当检测到副本状态恢复可以加回时,即副本状态为normal且日志同步大于等于99%,需等待此延迟时长,才触发自动升副本操作。此参数用于避免降副本后立即升副本导致的资源震荡。
参数类型:整型
参数单位:s(秒)
取值范围:0 ~ 2147483647
默认值:60
设置方式:该参数为CM参数,参数修改请参考表3中方式二进行设置。
设置建议:推荐使用默认值。
设置不当的风险与影响:设置过小会导致降副本后立即升副本造成资源震荡,设置过大时副本恢复正常后升副本时间会变长。