监控AI DataLake存储资源
AI DataLake支持查看存储资源的监控信息,方便管理员在日常运维工作中,实时掌握存储资源的运行状态,了解带宽使用、容量使用、Inode使用等信息。
通过可视化监控,管理员可以:
- 直观了解存储资源中各类资源的实时使用情况。
- 判断是否需要进行资源池的扩缩容操作。
- 优化资源管理,避免资源浪费或不足。
- 保障业务稳定,及时发现资源瓶颈。
查看存储资源监控
- 登录AI DataLake管理控制台。
- 在左侧导航栏单击“运维监控 > 资源监控”。
- 选择“存储资源”页签,在存储资源监控页面中,可查看当前工作空间下,存储资源的资源使用信息。
如果当前空间未购买存储资源,则不显示存储资源监控数据,可以单击“去购买”,并参考购买存储资源进行创建。
图1 查看存储资源监控
表1 资源池监控指标 指标名称
单位
描述
客户端连接数
Count
该指标用于统计测量客户端连接数。
说明:- 连接数统计的是活跃的客户端连接。
- 如果客户端长时间无I/O,网络连接会自动断开,当有I/O时客户端会自动重新建立网络连接。
IOPS
Count
该指标用于统计测量单位时间内处理的I/O数。
带宽统计
Byte/s
该指标用于统计测量I/O负载情况。
可以在监控图表右上角切换查看总带宽、读带宽、写带宽、元数据读写带宽。
容量使用统计
- 使用量:Byte
- 使用率:%
该指标用于统计文件系统已使用的容量,或已使用的容量占总容量的比例。
可以在监控图表右上角切换查看使用量、使用率。
Inode使用统计
- 使用量:Count
- 使用率:%
该指标用于统计文件系统已使用的Inode数,或已使用的Inode数占总已Inode数的比例。
可以在监控图表右上角切换查看使用量、使用率。
- 运维人员可以通过配置监控参数来查看存储资源的实时运行状态。
系统提供了灵活的监控配置选项,支持自定义监控数据统计周期、选择特定存储资源以及调整页面刷新频率,满足不同场景下的监控需求。
设置监控数据统计周期后,在界面右上角可选择“按分钟”、“按小时”或者“按天”的维度查看图表,图表数据会按照所选聚合粒度计算平均值呈现。- 监控数据统计周期为近1小时/6小时,监控图表内的数据周期最小为1分钟。
- 监控数据统计周期为近1天/7天,监控图表内的数据周期最小为1小时,图表不支持按分钟呈现。
- 监控数据统计周期为近30天,监控图表内的数据周期最小为1天,图表不支持按分钟或者按小时呈现。
- 自定义监控数据统计周期最大选择30天,超过1天时监控图表内的数据周期最小为1小时,超过7天时监控图表内的数据周期最小为1天。