Manager基本原理
Manager功能
Manager是MRS的运维管理系统,为部署在集群内的服务提供统一的集群管理能力。
Manager支持大规模集群的性能监控、告警、用户管理、权限管理、审计、服务管理、健康检查、日志采集等功能。
Manager结构
Manager的整体逻辑架构如图1所示。
Manager由OMS和OMA组成:
- OMS:操作维护系统的管理节点,OMS一般有两个,互为主备。
- OMA:操作维护系统中的被管理节点,一般有多个。
模块名称 |
描述 |
---|---|
Web Service |
是一个部署在Tomcat下的Web服务,提供Manager的https接口,用于通过浏览器访问Manager。同时还提供基于Syslog和SNMP协议的北向接入能力。 |
OMS |
操作维护系统的管理节点,OMS节点一般有两个,互为主备。 |
OMA |
操作维护系统中的被管理节点,一般有多个。 |
Controller |
Controller是Manager的控制中心,负责汇聚来自集群中所有节点的信息,统一向MRS集群管理员展示,以及负责接收来自MRS集群管理员的操作指令,并且依据操作指令所影响的范围,向集群的所有相关节点同步信息。 Manager的控制进程,负责各种管理动作的执行:
|
Node Agent |
Node Agent存在于每一个集群节点,是Manager在单个节点的使能器。
Node Agent每隔3秒向Controller发送心跳信息,不支持配置时间间隔。 |
IAM |
负责记录审计日志。在Manager的UI上每一个非查询类操作,都有对应的审计日志。 |
PMS |
性能监控模块,搜集每一个OMA上的性能监控数据并提供查询。 |
CEP |
汇聚功能模块。比如将所有OMA上的磁盘已用空间汇总成一个性能指标。 |
FMS |
告警模块,收集每一个OMA上的告警并提供查询。 |
OMM Agent |
OMA上面性能监控和告警的Agent,负责收集该Agent Node上的性能监控数据和告警数据。 |
CAS |
统一认证中心,登录Web Service时需要在CAS进行登录认证,浏览器通过URL自动跳转访问CAS。 |
AOS |
权限管理模块,管理用户和用户组的权限。 |
ACS |
用户和用户组管理模块,管理用户及用户归属的用户组。 |
Kerberos |
在OMS与集群中各部署一个。
|
Ldap |
在OMS与集群中各部署一个。
|
Database |
Manager的数据库,负责存储日志、告警等信息。 |
HA |
高可用性管理模块,主备OMS通过HA进行主备管理。 |
NTP Server NTP Client |
负责同步集群内各节点的系统时钟。 |