更新时间:2024-11-21 GMT+08:00
分享

查看ModelArts模型详情

查看模型列表

当模型创建成功后,您可在模型列表页查看所有创建的模型。模型列表页包含以下信息。

表1 模型列表

参数

说明

模型名称

模型的名称。

最新版本

模型的当前最新版本。

状态

模型当前状态。

部署类型

模型支持部署的服务类型。

版本数量

模型的版本数量。

请求模式

在线服务的请求模式。

  • 同步请求:单次推理,可同步返回结果(约<60s)。例如: 图片、较小视频文件。
  • 异步请求:单次推理,需要异步处理返回结果(约>60s)。例如: 实时视频推理、大视频文件。

创建时间

模型的创建时间。

描述

模型的描述。

操作

  • 部署:将模型发布为在线服务、批量服务或边缘服务。
  • 创建新版本:创建新的模型版本。参数配置除版本外,将默认选择上一个版本的配置信息,您可以对参数配置进行修改。
  • 删除:删除对应的模型。
    说明:

    如果模型的版本已经部署服务,需先删除关联的服务后再执行删除操作。模型删除后不可恢复,请谨慎操作。

单击模型的“版本数量”,可查看版本列表信息。

图1 版本列表

版本列表中包含以下信息。

表2 版本列表

参数

说明

版本

模型当前版本。

状态

模型当前状态。

部署类型

模型支持部署的服务类型。

模型大小

模型的大小。

模型来源

显示模型的来源。

创建时间

模型的创建时间。

描述

模型的描述。

操作

  • 部署:将模型发布为在线服务、批量服务或边缘服务。
  • 发布:将模型发布至AI Gallery,详情请参见发布ModelArts模型
  • 删除:针对模型的某一版本进行删除。

查看模型详情

当模型创建成功后,您可以进入模型详情页查看模型的信息。
  1. 登录ModelArts管理控制台,在左侧菜单栏中选择模型管理,进入“自定义模型”列表页面。
  2. 单击目标模型名称,进入模型详情页面。

    您可以查看模型的基本信息、模型精度,以及切换页签查看更多信息。

    表3 模型基本信息

    参数

    说明

    名称

    模型的名称。

    状态

    模型当前状态。

    版本

    模型当前版本。

    ID

    模型的ID。

    描述

    单击编辑按钮,可以添加模型的描述。

    部署类型

    模型支持部署的服务类型。

    元模型来源

    显示元模型的来源,主要有从训练中选择、从对象存储服务(OBS)中选择、从容器镜像中选择。不同来源的元模型,模型显示的参数会不同。

    训练作业名称

    如果元模型来源于训练作业,则显示关联的训练作业,单击训练作业名称可以直接跳转到训练作业详情页面。

    训练作业版本

    如果元模型来源于训练作业且为旧版训练作业,显示训练作业版本。

    元模型存储路径

    如果元模型来源于对象存储服务,显示元模型的存放路径。

    容器镜像存储路径

    如果元模型来源于容器镜像,显示容器镜像存储路径。

    AI引擎

    如果元模型来源于训练作业/对象存储服务,显示模型使用的AI引擎。

    引擎包地址

    如果元模型来源于对象存储服务(AI引擎为Custom),显示引擎包地址。

    运行环境

    如果元模型来源于训练作业/对象存储服务(AI引擎为预置引擎),显示元模型依赖的运行环境。

    容器调用接口

    如果元模型来源于对象存储服务(AI引擎为Custom)/容器镜像,显示模型启动的协议和端口号。

    推理代码

    如果元模型来源于训练作业且为旧版训练作业,则显示推理代码的存放路径。

    镜像复制

    如果元模型来源于容器镜像,显示镜像复制功能状态。

    动态加载

    如果元模型来源于训练作业/对象存储服务,显示模型是否支持动态加载。

    大小

    模型的大小。

    健康检查

    如果元模型来源于对象存储服务/容器镜像,显示健康检查状态。当健康检查为开启时,会根据您启用的探针显示对应探针的参数设置情况。

    • 启动探针:用于检测应用实例是否已经启动。如果提供了启动探针(startup probe),则禁用所有其他探针,直到它成功为止。如果启动探针失败,将会重启实例。如果没有提供启动探针,则默认状态为成功Success。
    • 就绪探针:用于检测应用实例是否已经准备好接收流量。如果就绪探针失败,即实例未准备好,会从服务负载均衡的池中剔除该实例,不会将流量路由到该实例,直到探测成功。
    • 存活探针:用于检测应用实例内应用程序的健康状态。如果存活探针失败,即应用程序不健康,将会自动重启实例。

    每种探针下会显示以下字段:检查方式、健康检查URL(检查方式为“HTTP请求检查”时显示)、健康检查命令(检查方式为“执行命令检查”时显示)、健康检查周期、延迟时间、超时时间、最大失败次数。

    模型说明

    显示创建模型时添加的模型说明文档信息。

    系统运行架构

    显示系统运行架构。

    推理加速卡类型

    显示推理加速卡类型。

    表4 模型页签详情

    参数

    说明

    模型精度

    显示该模型的模型召回率、精准率、准确率和F1值。

    参数配置

    可以查看模型的apis定义详情,以及模型的入参和出参。

    运行时依赖

    查看模型对环境的依赖。当构建任务失败后可以编辑运行时依赖,保存修改后将触发镜像重新构建。

    事件

    展示模型创建过程中的关键操作进展。

    事件保存周期为3个月,3个月后自动清理数据。

    查看模型的事件类型和事件信息,请参见查看ModelArts模型事件

    使用约束

    根据创建模型时的设置,显示部署服务的使用约束,如请求模式、启动命令、模型加密等。对于异步请求模式的模型,可显示输入模式、输出模式、服务启动参数和作业配置参数等参数。

    关联服务

    展示使用该模型部署的服务列表,单击服务名称可以直接跳转到服务详情页面。

相关文档