文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ 查看与配置MRS告警事件/ 配置MRS集群对接Syslog服务器上报告警
更新时间:2024-11-25 GMT+08:00
分享

配置MRS集群对接Syslog服务器上报告警

如果用户需要在统一的告警平台查看集群的告警和事件,管理员可以在FusionInsight Manager使用Syslog协议将相关数据上报到告警平台。

Syslog协议未做加密,传输数据容易被窃取,存在安全风险。

前提条件

对接服务器对应的弹性云服务器需要和MRS集群的Master节点在相同的VPC,且Master节点可以访问对接服务器的IP地址和指定端口。

配置MRS集群对接Syslog服务器上报告警

  1. 登录Manager,进入SNMP配置界面。

    • MRS 3.x及之后版本
      1. 登录FusionInsight Manager。
      2. 选择系统 > 对接 > Syslog
      3. 开启“Syslog服务”开关。
    • MRS 3.x之前版本
      1. 登录MRS Manager,单击“系统设置”。
      2. 在“配置”区域“监控和告警配置”下,开启“Syslog配置”开关。

  2. 根据表1所示的说明填写北向参数。

    表1 Syslog对接参数

    参数区域

    参数

    示例

    参数说明

    Syslog协议

    服务IP模式

    IPV4

    设置对接服务器IP地址模式,可选择“IPV4”或者“IPV6”。(仅MRS 3.x及之后版本)

    服务IP

    192.168.xxx.xxx

    设置对接服务器IP地址。

    服务端口

    514

    设置对接端口。

    协议

    UDP

    设置协议类型,包括

    • TCP
    • UDP

    安全级别

    Informational

    设置上报消息的严重程度,取值范围:

    • Emergency
    • Alert
    • Critical
    • Error
    • Warning
    • Notice
    • Informational(默认值)
    • Debug
      说明:

      “安全级别”“Facility”共同组成发出消息的优先级(Priority)。

      优先级(Priority)=“Facility”× 8 +“安全级别”

      “安全级别”“Facility”各项对应的数值请参考表2

    Facility

    local use 0 (local0)

    设置产生日志的模块。可选项参考表2,推荐使用默认值“local use 0 (local0)”

    标识符

    FusionInsight Manager

    设置产品标识。

    标识符可以包含字母、数字、下划线、 空格、|、 $、 {、 }、 点、中划线,并且不能超过256个字符。

    • MRS 3.x及之后版本:默认为“FusionInsight Manager”。
    • MRS 3.x之前版本:默认为“MRS Manager”。

    报告信息

    报文格式

    ${alarm.id}

    设置告警报告的消息格式,具体要求请参考界面帮助。

    报文格式可以包含字母、数字、下划线、 空格、|、 $、 {、 }、 点、中划线,并且不能超过1024个字符。

    说明:

    报文格式中信息域的说明请参考表3

    报告信息类型

    故障

    设置需要上报的告警类型。

    • MRS 3.x及之后版本:请参考表3
    • MRS 3.x之前版本:
      • “故障”表示Manager产生告警时会上报Syslog告警消息。
      • “清除”表示清除Manager告警时会上报Syslog告警消息。
      • “事件”表示Manager产生事件时会上报Syslog告警消息。

    上报消息级别

    重要

    设置需要上报的告警级别。

    • MRS 3.x及以后版本:请参考表3
    • MRS 3.x之前版本:支持“提示”“一般”“严重”“致命”

    未恢复告警上报设置

    周期上报未恢复告警

    开启

    设置是否按指定周期上报未清除的告警。打开开关表示启用此功能,关闭开关表示不启用。开关默认为关闭。

    间隔时间(分钟)

    30

    设置周期上报告警的时间间隔,当“周期上报未恢复告警”开关设置为打开时启用。单位为分钟,默认值为“15”,支持范围为“5”到“1440”(1天)。

    心跳设置

    上报心跳

    开启

    设置是否开启周期上报Syslog心跳消息。打开开关表示开启此功能,关闭开关表示不启用。开关默认为关闭。

    心跳周期(分钟)

    15

    设置周期上报心跳的时间间隔,当“上报心跳”开关设置为打开时启用。单位为分钟,默认值为“15”,支持范围为“1”到“60”。

    心跳报文

    FusionInsight Syslog Heartbeat

    设置心跳上报的内容,当“上报心跳”开关设置为打开时启用,不能为空。支持数字、字母、下划线、竖线、冒号、空格、英文逗号和句号字符,长度小于等于256。

    设置周期上报心跳报文后,在某些集群容错自动恢复的场景下(例如主备OMS倒换)可能会出现报文上报中断的现象,此时等待自动恢复即可。

  3. 单击“确定”,设置完成。

参考信息

表2 “安全级别”“Facility”字段数值编码

安全级别

Facility

数值编码

Emergency

kernel messages

0

Alert

user-level messages

1

Critical

mail system

2

Error

system daemons

3

Warning

security/authorization messages (note 1)

4

Notice

messages generated internally by syslog

5

Informational

line printer subsystem

6

Debug

network news subsystem

7

-

UUCP subsystem

8

-

clock daemon (note 2)

9

-

security/authorization messages (note 1)

10

-

FTP daemon

11

-

NTP subsystem

12

-

log audit (note 1)

13

-

log alert (note 1)

14

-

clock daemon (note 2)

15

-

local use 0~7 (local0 ~ local7)

16~23

表3 报文格式信息域表

信息域

描述

dn

集群名称

id

告警ID

name

告警名称

serialNo

告警序列号

说明:

故障告警及其对应的恢复告警的告警序列号相同。

category

告警类型,取值范围:

  • 0:故障告警
  • 1:恢复告警
  • 2:事件

occurTime

告警产生时间

clearTime

告警清除时间

isAutoClear

告警是否自动清除,取值范围:

  • 1:是
  • 0:否

locationInfo

告警位置信息

clearType

告警清除类型,取值范围:

  • -1:未清除
  • 0:自动清除
  • 2:手动清除

level

告警级别,取值范围:

  • 1:紧急告警
  • 2:重要告警
  • 3:次要告警
  • 4:提示告警

cause

告警原因

additionalInfo

附加信息

object

告警对象

相关文档