配置MRS集群对接Syslog服务器上报告警
如果用户需要在统一的告警平台查看集群的告警和事件,管理员可以在FusionInsight Manager使用Syslog协议将相关数据上报到告警平台。
Syslog协议未做加密,传输数据容易被窃取,存在安全风险。
前提条件
对接服务器对应的弹性云服务器需要和MRS集群的Master节点在相同的VPC,且Master节点可以访问对接服务器的IP地址和指定端口。
配置MRS集群对接Syslog服务器上报告警
- 登录Manager,进入SNMP配置界面。
- MRS 3.x及之后版本
- 登录FusionInsight Manager。
- 选择 。
- 开启“Syslog服务”开关。
- MRS 3.x之前版本
- 登录MRS Manager,单击“系统设置”。
- 在“配置”区域“监控和告警配置”下,开启“Syslog配置”开关。
- MRS 3.x及之后版本
- 根据表1所示的说明填写北向参数。
表1 Syslog对接参数 参数区域
参数
示例
参数说明
Syslog协议
服务IP模式
IPV4
设置对接服务器IP地址模式,可选择“IPV4”或者“IPV6”。(仅MRS 3.x及之后版本)
服务IP
192.168.xxx.xxx
设置对接服务器IP地址。
服务端口
514
设置对接端口。
协议
UDP
设置协议类型,包括:
- TCP
- UDP
安全级别
Informational
设置上报消息的严重程度,取值范围:
- Emergency
- Alert
- Critical
- Error
- Warning
- Notice
- Informational(默认值)
- Debug
说明:
“安全级别”和“Facility”共同组成发出消息的优先级(Priority)。
优先级(Priority)=“Facility”× 8 +“安全级别”
“安全级别”和“Facility”各项对应的数值请参考表2。
Facility
local use 0 (local0)
设置产生日志的模块。可选项参考表2,推荐使用默认值“local use 0 (local0)”。
标识符
FusionInsight Manager
设置产品标识。
标识符可以包含字母、数字、下划线、 空格、|、 $、 {、 }、 点、中划线,并且不能超过256个字符。
- MRS 3.x及之后版本:默认为“FusionInsight Manager”。
- MRS 3.x之前版本:默认为“MRS Manager”。
报告信息
报文格式
${alarm.id}
设置告警报告的消息格式,具体要求请参考界面帮助。
报文格式可以包含字母、数字、下划线、 空格、|、 $、 {、 }、 点、中划线,并且不能超过1024个字符。
说明:报文格式中信息域的说明请参考表3。
报告信息类型
故障
设置需要上报的告警类型。
- MRS 3.x及之后版本:请参考表3。
- MRS 3.x之前版本:
- “故障”表示Manager产生告警时会上报Syslog告警消息。
- “清除”表示清除Manager告警时会上报Syslog告警消息。
- “事件”表示Manager产生事件时会上报Syslog告警消息。
上报消息级别
重要
设置需要上报的告警级别。
- MRS 3.x及以后版本:请参考表3。
- MRS 3.x之前版本:支持“提示”、“一般”、“严重”和“致命”。
未恢复告警上报设置
周期上报未恢复告警
开启
设置是否按指定周期上报未清除的告警。打开开关表示启用此功能,关闭开关表示不启用。开关默认为关闭。
间隔时间(分钟)
30
设置周期上报告警的时间间隔,当“周期上报未恢复告警”开关设置为打开时启用。单位为分钟,默认值为“15”,支持范围为“5”到“1440”(1天)。
心跳设置
上报心跳
开启
设置是否开启周期上报Syslog心跳消息。打开开关表示开启此功能,关闭开关表示不启用。开关默认为关闭。
心跳周期(分钟)
15
设置周期上报心跳的时间间隔,当“上报心跳”开关设置为打开时启用。单位为分钟,默认值为“15”,支持范围为“1”到“60”。
心跳报文
FusionInsight Syslog Heartbeat
设置心跳上报的内容,当“上报心跳”开关设置为打开时启用,不能为空。支持数字、字母、下划线、竖线、冒号、空格、英文逗号和句号字符,长度小于等于256。
设置周期上报心跳报文后,在某些集群容错自动恢复的场景下(例如主备OMS倒换)可能会出现报文上报中断的现象,此时等待自动恢复即可。
- 单击“确定”,设置完成。
参考信息
安全级别 |
Facility |
数值编码 |
---|---|---|
Emergency |
kernel messages |
0 |
Alert |
user-level messages |
1 |
Critical |
mail system |
2 |
Error |
system daemons |
3 |
Warning |
security/authorization messages (note 1) |
4 |
Notice |
messages generated internally by syslog |
5 |
Informational |
line printer subsystem |
6 |
Debug |
network news subsystem |
7 |
- |
UUCP subsystem |
8 |
- |
clock daemon (note 2) |
9 |
- |
security/authorization messages (note 1) |
10 |
- |
FTP daemon |
11 |
- |
NTP subsystem |
12 |
- |
log audit (note 1) |
13 |
- |
log alert (note 1) |
14 |
- |
clock daemon (note 2) |
15 |
- |
local use 0~7 (local0 ~ local7) |
16~23 |
信息域 |
描述 |
---|---|
dn |
集群名称 |
id |
告警ID |
name |
告警名称 |
serialNo |
告警序列号
说明:
故障告警及其对应的恢复告警的告警序列号相同。 |
category |
告警类型,取值范围:
|
occurTime |
告警产生时间 |
clearTime |
告警清除时间 |
isAutoClear |
告警是否自动清除,取值范围:
|
locationInfo |
告警位置信息 |
clearType |
告警清除类型,取值范围:
|
level |
告警级别,取值范围:
|
cause |
告警原因 |
additionalInfo |
附加信息 |
object |
告警对象 |