文档首页 > > API参考> 服务管理> 更新模型服务

更新模型服务

分享
更新时间: 2019/12/30 GMT+08:00

功能介绍

更新模型服务。也可以使用此接口启停模型服务。

URI

PUT /v1/{project_id}/services/{service_id}

参数说明如 表1所示。
表1 参数说明

参数

是否必选

参数类型

说明

project_id

String

用户项目ID。

service_id

String

服务ID。

请求消息

请求参数如 表2所示。
表2 请求参数

参数

是否必选

参数类型

说明

description

String

服务描述,不超过100个字符,不设置此参数表示不更新。

status

String

服务状态,可设置状态为“running”“stopped”来启动、停止服务,不设置此参数则不修改状态。status不可跟config同时修改,同时存在则只修改status。

config

对应infer_type的config结构数组

服务配置,不设置此参数表示不更新。

schedule

schedule结构数组

服务调度配置,仅在线服务可配置,默认不使用,服务长期运行。请参见表6

表3 real-time config结构

参数

是否必选

参数类型

说明

model_id

String

模型ID。

weight

Integer

权重百分比,分配到此模型的流量权重,仅当infer_type为real-time时需要配置,多个权重相加必须等于100。

specification

String

资源规格,当前版本可选modelarts.vm.cpu.2u/modelarts.vm.gpu.p4/modelarts.vm.ai1.a310。

instance_count

Integer

模型部署的实例数。

envs

Map<String, String>

运行模型需要的环境变量键值对,可选填,默认为空。

表4 batch config结构

参数

是否必选

参数类型

说明

model_id

String

模型ID。

specification

String

资源规格,当前版本可选modelarts.vm.cpu.2u/modelarts.vm.gpu.p4。

instance_count

Integer

模型部署的实例数。

envs

Map<String, String>

运行模型需要的环境变量键值对,可选填。

src_path

String

批量任务输入数据的OBS路径。

dest_path

String

批量任务输出结果的OBS路径。

req_uri

String

批量任务中调用的推理路径,针对不同的推理路径可能有不同的输入参数和输入数据。

mapping_type

String

输入数据的映射类型,可选“file”“csv”

  • file指每个推理请求对应到输入数据目录下的一个文件,当使用此方式时,此模型对应req_uri只能有一个输入参数且此参数的类型是file。
  • 选择csv时指每个推理请求对应到csv里的一行数据,当使用此方式时,输入数据目录下的文件只能以.csv为后缀,且需配置mapping_rule参数,以表达推理请求体中各个参数对应到csv的索引。

mapping_rule

Map

输入参数与csv数据的映射关系,仅当mapping_type为csv时需要填写。

映射规则与模型配置文件config.json中输入参数的定义方式相似,只需要在每一个基本类型(string/number/integer/boolean)的参数下配置index参数,指定使用csv数据中对应索引下标的数据作为此参数的值去发送推理请求,csv数据必须以英文半角逗号分隔,index从0开始计数,特殊地,当index为-1时忽略此参数。具体可参考创建批量服务的样例。

表5 edge config结构

参数

是否必选

参数类型

说明

model_id

String

模型ID,暂不支持修改。

specification

String

资源规格,暂不支持修改。

envs

Map<String, String>

运行模型需要的环境变量键值对,可选填。暂不支持修改。

nodes

String数组

边缘节点ID数组。

表6 schedule结构

参数

是否必选

参数类型

说明

type

String

调度类型,当前仅支持取值为stop。

time_unit

String

调度时间单位,可选DAYS/HOURS/MINUTES。

duration

Integer

对应时间单位的数值,比如2小时后停止,则time_unit填HOURS,duration填2。

响应消息

无响应参数说明。

示例

如下以更新“real-time”类型的服务为例。

  • 请求示例
    PUT    https://endpoint/v1/{project_id}/services/{service_id}
    {
        "description": "",
        "status": "running",
        "config": [{
            "model_id": "xxxx",
            "weight": "100",
            "specification": "modelarts.vm.cpu.2u",
            "instance_count": 1
        }]
    }
  • 响应示例
    {}

状态码

状态码请参见表1

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区