更新时间:2024-11-08 GMT+08:00

查询服务详情

查询当前服务对象的详细信息。

示例代码

在ModelArts notebook平台,Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权

  • 方式1:根据部署在线服务生成的服务对象进行服务详情查询
    1
    2
    3
    4
    5
    6
    7
    from modelarts.session import Session
    from modelarts.model import Predictor
    
    session = Session()
    predictor_instance = Predictor(session, service_id="your_service_id")
    predictor_info = predictor_instance.get_service_info()
    print(predictor_info)
    
  • 方式2:根据查询服务对象列表返回的服务对象进行服务详情查询
    1
    2
    3
    4
    5
    6
    7
    8
    from modelarts.session import Session
    from modelarts.model import Predictor
    
    session = Session()
    predictor_object_list = Predictor.get_service_object_list(session)
    predictor_instance = predictor_object_list[0]                
    predictor_info = predictor_instance.get_service_info()
    print(predictor_info)
    

参数说明

表1 get_service_info返回参数说明

参数

参数类型

描述

service_id

String

服务ID。

service_name

String

服务名称。

description

String

服务描述。

tenant

String

服务归属租户。

project

String

服务归属项目。

owner

String

服务归属用户。

publish_at

Number

服务最新的发布时间,距'1970.1.1 0:0:0 UTC'的毫秒数。

infer_type

String

推理方式,取值为real-time/batch。

vpc_id

String

服务实例所在的虚拟私有云ID,服务自定义网络配置时返回。

subnet_network_id

String

服务实例所在的子网的网络ID,服务自定义网络配置时返回。

security_group_id

String

服务实例所在的安全组,服务自定义网络配置时返回。

status

String

服务状态,取值为:running/deploying/concerning/failed/stopped/finished。

error_msg

String

错误信息,当status为failed时,返回注明部署失败原因。

config

不同infer_type的config结构数组

不同infer_type的config结构数组

服务配置(如果是共享过来的服务,只返回model_id ,model_name,model_version)

access_address

String

推理请求的访问地址,当infer_type为real-time时会返回此值

invocation_times

Number

服务的总调用次数。

failed_times

Number

服务调用失败次数。

is_shared

Boolean

是否是订阅的服务。

shared_count

Number

订阅的服务数。

progress

Integer

部署进度,当状态是deploying时,返回此参数。

表2 real-time config结构

参数

参数类型

描述

model_id

String

模型ID。“model_id”可以通过查询模型列表或者ModelArts管理控制台获取。

model_name

String

模型名称。

model_version

String

模型版本。

source_type

String

模型来源,当模型是由自动学习产生时,返回此字段,取值为:auto。

status

String

模型实例运行状态,取值为:

  • ready:已就绪(所有实例已启动)
  • concerning:部分就绪(部分实例已启动、部分实例未启动)
  • notReady:未就绪(所有实例都没启动)

weight

Integer

权重,分配到此模型的流量权重。

specification

String

资源规格,取值为:modelarts.vm.cpu.2u/modelarts.vm.gpu.p4/modelarts.vm.ai1.a310。

envs

Map<String, String>

运行模型需要的环境变量键值对。

instance_count

Integer

模型部署的实例数。

scaling

Boolean

是否启用弹性伸缩。

表3 batch config结构

参数

参数类型

描述

model_id

String

模型ID。“model_id”可以通过查询模型列表或者ModelArts管理控制台获取。

model_name

String

模型名称。

model_version

String

模型版本。

specification

String

资源规格,取值为:modelarts.vm.cpu.2u/modelarts.vm.gpu.p4。

envs

Map<String, String>

运行模型需要的环境变量键值对。

instance_count

Integer

模型部署的实例数。

src_path

String

批量任务输入数据的OBS路径。

dest_path

String

批量任务输出结果的OBS路径。

req_uri

String

批量任务中调用的推理路径。

mapping_type

String

输入数据的映射类型,取值为:file或csv。

mapping_rule

Map

输入参数与csv数据的映射关系,仅当mapping_type为csv时,会返回。