文档首页/ 智能数据湖 AIDataLake/ 用户指南/ 创建AI DataLake Aura引擎端点/ 查看Aura端点监控

更新时间：2026-07-03 GMT+08:00

查看Aura端点监控

在日常运维工作中，管理员需要实时掌握AuraJob和AuraJobV2端点的资源使用情况和作业状态监控信息。通过可视化监控，管理员可以：

直观了解资源池中各类资源的实时使用情况。
判断是否需要进行资源池的扩缩容操作。
优化资源管理，避免资源浪费或不足。
保障业务稳定，及时发现资源瓶颈。

查看Aura端点监控

登录AI DataLake管理控制台。
在页面左上角切换至对应的工作空间。
在左侧导航栏选择“引擎端点 > 多模数据引擎Aura”，在端点列表中单击运行作业的端点名称进入概览页面。

选择“监控”页签，即可查看端点的资源使用情况。

表1 AuraJob端点监控指标
监控分类	指标分类	监控指标	指标名称	单位	指标说明
资源监控	CPU资源分配量&实际使用率	CPU_RESERVED_ALLOCATION	预留资源实时分配量	vCPUs	当前端点被实时分配的CPU预留资源数量。
		CPU_ELASTIC_ALLOCATION	弹性资源实时分配量	vCPUs	当前端点被实时分配的CPU弹性资源数量。
		CPU_RATE	实际使用率	%	当前端点实际使用CPU资源占被分配的CPU资源的比例。
		CPU_SCALE_MIN	资源最小配额	vCPUs	当前端点被分配的最小CPU资源数量。
	内存资源分配量&实际使用率	MEM_RESERVED_ALLOCATION	预留资源实时分配量	GiB	当前端点被实时分配的预留资源内存数量。
		MEM_ELASTIC_ALLOCATION	弹性资源实时分配量	GiB	当前端点被实时分配的弹性资源内存数量。
		MEM_RATE	实际使用率	%	当前端点实际使用内存资源占被分配的内存资源的比例。
		MEM_SCALE_MIN	资源最小配额	GiB	当前端点被分配的最小内存资源数量。
	GPU资源分配量&实际使用率	GPU_RATE	实际使用率	%	当前端点实际使用GPU卡数占被分配的GPU卡数的比例。
		GPU_SCALE_MIN	资源最小配额	卡	当前端点被分配的最低可用GPU卡数。
		GPU_ALLOCATION	实时分配量	卡	当前端点被分配的实时GPU卡数。
	NPU资源分配量&实际使用率	NPU_RATE	实际使用率	%	当前端点实际使用NPU卡数占被分配的NPU卡数的比例。
		NPU_SCALE_MIN	资源最小配额	卡	当前端点被分配的最低可用NPU卡数。
		NPU_ALLOCATION	实时分配量	卡	当前端点被分配的实时NPU卡数。
作业监控	作业数	JOB_SUCCEED_COUNT	成功作业数	Count	当前端点已运行成功的作业数统计。
		JOB_FAILED_COUNT	失败作业数	Count	当前端点运行失败的作业数统计。
		JOB_PENDING_COUNT	排队中作业数	Count	当前端点中正在排队的作业数统计。
		JOB_CANCELED_COUNT	已取消作业数	Count	当前端中已取消的作业数统计。

表2 AuraJobV2端点监控指标
指标分类	监控指标	指标名称	单位	说明
CPU资源分配量&实际使用率	CPU_RESERVED_ALLOCATION	预留资源实时分配量	vCPUs	当前端点被分配的CPU预留资源数量。
	CPU_ELASTIC_ALLOCATION	弹性资源实时分配量	vCPUs	当前端点被分配的CPU弹性资源数量。
	CPU_RATE	实际使用率	%	当前端点实际使用CPU资源占被分配的CPU资源的比例。
	CPU_SCALE_MIN	资源最小配额	vCPUs	当前端点被分配的最小CPU资源数量。
内存资源分配量&实际使用率	MEM_RESERVED_ALLOCATION	预留资源实时分配量	GiB	当前端点被实时分配的预留资源的内存。
	MEM_ELASTIC_ALLOCATION	弹性资源实时分配量	GiB	当前端点被实时分配的弹性资源的内存。
	MEM_RATE	实际使用率	%	当前端点实际使用的内存资源占被分配的内存资源的比例。
	MEM_SCALE_MIN	资源最小配额	GiB	当前端点被分配的最小内存。
GPU资源分配量&实际使用率	GPU_RESERVED_ALLOCATION	预留资源实时分配量	卡	当前端点被实时分配的GPU预留资源Worker卡数。
	GPU_ELASTIC_ALLOCATION	弹性资源实时分配量	卡	当前端点被实时分配的GPU弹性资源Worker卡数。
	GPU_RATE	实际使用率	%	当前端点实际使用的GPU Worker卡数占被分配的的GPU Worker卡数的比例。
	GPU_SCALE_MIN	资源最小配额	卡	当前端点被分配的最小GPU Worker卡数。
NPU资源分配量&实际使用率	NPU_RESERVED_ALLOCATION	预留资源实时分配量	卡	当前端点所被分配的NPU预留资源的Worker卡数。
	NPU_ELASTIC_ALLOCATION	弹性资源实时分配量	卡	当前端点被分配的NPU弹性资源的Worker卡数。
	NPU_RATE	实际使用率	%	当前端点实际使用的NPU Worker卡数占被分配的的NPU Worker卡数的比例。
	NPU_SCALE_MIN	资源最小配额	卡	当前端点被分配的最小NPU Worker卡数。

您可以通过配置监控参数来查看端点资源实时运行状态，系统提供了灵活的监控配置选项，支持自定义监控数据统计周期、调整页面刷新频率，满足不同场景下的监控需求。设置监控数据统计周期后，在界面右上角可选择“按分钟”、“按小时”或者“按天”的维度查看图表，图表数据会按照所选聚合粒度计算平均值呈现。
- 监控数据统计周期为近1小时/6小时，监控图表内的数据周期最小为1分钟。
- 监控数据统计周期为近1天/7天，监控图表内的数据周期最小为1小时，图表不支持按分钟呈现。
- 监控数据统计周期为近30天，监控图表内的数据周期最小为1天，图表不支持按分钟或者按小时呈现。
- 自定义监控数据统计周期最大选择30天，超过1天时监控图表内的数据周期最小为1小时，超过7天时监控图表内的数据周期最小为1天。

父主题： 创建AI DataLake Aura引擎端点

上一篇：会话管理

下一篇：查看Aura作业监控

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问