更新时间:2022-09-29 GMT+08:00

Manager基本原理

Manager功能

Manager是MRS的运维管理系统,为部署在集群内的服务提供统一的集群管理能力。

Manager支持大规模集群的性能监控、告警、用户管理、权限管理、审计、服务管理、健康检查、日志采集等功能。

Manager结构

Manager的整体逻辑架构如图1所示。

图1 Manager逻辑架构

Manager由OMS和OMA组成:

  • OMS:操作维护系统的管理节点,OMS一般有两个,互为主备。
  • OMA:操作维护系统中的被管理节点,一般有多个。

图1中各模块的说明如表1所示:

表1 业务模块说明

模块名称

描述

Web Service

是一个部署在Tomcat下的Web服务,提供Manager的https接口,用于通过浏览器访问Manager。同时还提供基于Syslog和SNMP协议的北向接入能力。

OMS

操作维护系统的管理节点,OMS节点一般有两个,互为主备。

OMA

操作维护系统中的被管理节点,一般有多个。

Controller

Controller是Manager的控制中心,负责汇聚来自集群中所有节点的信息,统一向MRS集群管理员展示,以及负责接收来自MRS集群管理员的操作指令,并且依据操作指令所影响的范围,向集群的所有相关节点同步信息。

Manager的控制进程,负责各种管理动作的执行:

  1. Web Service将各种管理动作(安装、启停服务、修改配置等)下发到Controller。
  2. Controller将命令分解,分解后将动作下发到每一个Node Agent。例如启动一个服务,会涉及多个角色和实例。
  3. Controller负责监控每一个动作的执行情况。

Node Agent

Node Agent存在于每一个集群节点,是Manager在单个节点的使能器。

  • Node Agent代表本节点上部署的所有组件与Controller交互,实现整个集群多点到单点的汇聚。
  • Node Agent是Controller对部署在该节点上组件做一切操作的使能器,其代表着Controller的功能。

Node Agent每隔3秒向Controller发送心跳信息,不支持配置时间间隔。

IAM

负责记录审计日志。在Manager的UI上每一个非查询类操作,都有对应的审计日志。

PMS

性能监控模块,搜集每一个OMA上的性能监控数据并提供查询。

CEP

汇聚功能模块。比如将所有OMA上的磁盘已用空间汇总成一个性能指标。

FMS

告警模块,搜集每一个OMA上的告警并提供查询。

OMM Agent

OMA上面性能监控和告警的Agent,负责收集该Agent Node上的性能监控数据和告警数据。

CAS

统一认证中心,登录Web Service时需要在CAS进行登录认证,浏览器通过URL自动跳转访问CAS。

AOS

权限管理模块,管理用户和用户组的权限。

ACS

用户和用户组管理模块,管理用户及用户归属的用户组。

Kerberos

在OMS与集群中各部署一个。

  • OMS Kerberos提供单点登录及Controller与Node Agent间认证的功能。
  • 集群中Kerberos提供组件用户安全认证功能,其服务名称为KrbServer,包含两种角色实例:
    • KerberosServer:认证服务器,为MRS提供安全认证使用。
    • KerberosAdmin:管理Kerberos用户的进程。

Ldap

在OMS与集群中各部署一个。

  • OMS Ldap为用户认证提供数据存储。
  • 集群中的Ldap作为OMS Ldap的备份,其服务名称为LdapServer,角色实例为SlapdServer。

Database

Manager的数据库,负责存储日志、告警等信息。

HA

高可用性管理模块,主备OMS通过HA进行主备管理。

NTP Server

NTP Client

负责同步集群内各节点的系统时钟。