资源监控
登录FusionInsight Manager以后,选择“集群 > 服务”后,选择待操作的服务,单击“资源”,进入资源监控页面。
集群中部分服务提供服务级别的资源监控项,默认显示12小时的监控数据。用户可单击自定义时间区间,缺省时间区间包括:12小时、1天、1周、1月。单击可导出相应报表信息,无数据的监控项无法导出报表。支持资源监控的服务及监控项如表1所示。
服务 |
监控指标 |
说明 |
---|---|---|
ClickHouse |
Part信息 |
检测ClickHouse各节点part数量top 10的表。 |
Elasticsearch |
线程池信息 |
Elasticsearch集群中线程池的信息。 |
索引信息 |
Elasticsearch集群中各索引的信息。 |
|
用户资源信息 |
Elasticsearch集群中各用户创建的索引的总个数、索引分片的总个数、索引文档的总个数以及索引存储量的总和。 |
|
索引数据量 |
Elasticsearch集群中各索引的文档数和存储数据量信息。 |
|
HDFS |
资源使用(按租户) |
|
资源使用(按用户) |
|
|
资源使用(按目录) |
|
|
资源使用(按副本) |
|
|
资源使用(按文件大小) |
|
|
回收站(按用户) |
|
|
操作数 |
|
|
自动balance |
|
|
NameNode RPC连接数(按用户) |
|
|
慢DataNode节点 |
集群中数据传输或处理慢的DataNode节点。 |
|
慢磁盘 |
集群中DataNode节点上数据处理慢的磁盘。 |
|
HBase |
表级别操作请求次数 |
所有RegionServer上的所有表中put、delete、get、scan、increment、append操作请求次数。 |
RegionServer级别操作请求次数 |
RegionServer中put、delete、get、scan、increment、append操作请求次数以及所有操作请求次数。 |
|
服务级别操作请求次数 |
RegionServer上所有Region中put、delete、get、scan、increment、append操作请求次数。 |
|
RegionServer级别HFile数 |
所有RegionServer中HFile数。 |
|
HetuEngine |
Coordinator 资源使用 |
选取的队列中的coordinator资源使用情况。 |
Coordinator 资源使用率 |
选取的队列中的coordinator资源使用率。 |
|
Worker 资源使用 |
选取的队列中的worker资源使用情况。 |
|
Worker 资源使用率 |
选取的队列中的worker资源使用率。 |
|
Coordinators 和 Workers 个数 |
选取的队列中的coordinator和worker的数量。 |
|
Hive |
HiveServer2-Background-Pool线程数(按IP) |
周期内统计并显示Top用户的HiveServer2-Background-Pool线程数。 |
HiveServer2-Handler-Pool线程数(按IP) |
周期内统计并显示Top用户的HiveServer2-Handler-Pool数监控。 |
|
MetaStore使用数(按IP) |
Hive周期内统计并显示Top用户的MetaStore使用数。 |
|
Hive的Job数 |
Hive周期内统计并显示用户相关的Job数目。 |
|
Split阶段访问的文件数 |
统计Hive周期内Split阶段访问底层文件存储系统(默认:HDFS)的文件数。 |
|
Hive基本操作时间 |
Hive周期内统计底层创建目录(mkdirTime)、创建文件(touchTime)、写文件(writeFileTime)、重命名文件(renameTime)、移动文件(moveTime)、删除文件(deleteFileTime)、删除目录(deleteCatalogTime)所用的时间。 |
|
表分区个数 |
Hive所有表分区个数监控,返回值的格式为:数据库#表名,表分区个数。 |
|
HQL的Map数 |
Hive周期内执行的HQL与执行过程中调用的Map数统计,展示的信息包括:用户、HQL语句、Map数目。 |
|
HQL访问次数 |
周期内HQL访问次数统计信息。 |
|
Kafka |
Kafka磁盘使用率分布 |
Kafka集群的磁盘使用率分布统计。 |
Spark |
HQL访问次数 |
周期内HQL访问次数统计信息,展示信息包括用户名,HQL语句,执行该语句的次数。 |
Yarn |
资源使用(按任务) |
|
资源使用(按租户) |
|
|
资源使用比例(按租户) |
|
|
任务耗时排序 |
对Yarn任务耗时进行排序显示。 |
|
ResourceManager RPC连接数(按用户) |
统计连接到RM的Client RPC请求中,各个用户的连接数。 |
|
操作数 |
统计Yarn每种操作类型对应的操作数及占比。 |
|
队列中任务资源使用排序 |
|
|
队列中用户资源使用排序 |
|
|
ZooKeeper |
资源使用(按二级Znode) |
|
连接数(按客户端IP) |
ZooKeeper客户端连接资源状况。 |