更新时间:2024-03-21 GMT+08:00

查询训练作业详情

示例代码

在ModelArts notebook平台,Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权

  • 方式一:根据指定的job_id和version_id查询
    1
    2
    3
    4
    5
    6
    from modelarts.session import Session
    from modelarts.estimator import Estimator
    session = Session()
    estimator = Estimator(modelarts_session=session, job_id="182626", version_id="278813")
    job_info = estimator.get_job_info()
    print(job_info)
    
  • 方式二:根据创建训练作业生成的训练作业对象查询
    1
    2
    job_info = job_instance.get_job_info()
    print(job_info)
    
  • 方式三:根据查询训练作业版本列表返回的指定训练作业版本对象查询
    1
    2
    job_info = job_version_instance_list[0].get_job_info()
    print(job_info)
    

参数说明

表1 Estimator请求参数说明

参数

是否必选

参数类型

描述

modelarts_session

Object

会话对象,初始化方法请参见Session鉴权

job_id

String

训练作业的ID。job_id可通过创建训练作业生成的训练作业对象查询,如“job_instance.job_id”。或可通过查询训练作业列表的响应中获取。

version_id

String

训练作业的版本ID。version_id可通过创建训练作业生成的训练作业对象查询,如“job_instance.version_id”。或可通过查询训练作业列表的响应获取。

表2 get_job_info返回参数说明

参数

参数类型

描述

error_msg

String

调用失败时的错误信息。

调用成功时无此字段。

error_code

String

调用失败时的错误码,具体请参见错误码

调用成功时无此字段。

is_success

Boolean

接口调用是否成功。

job_id

Long

训练作业的ID。

job_name

String

训练作业的名称。

job_desc

String

训练作业的描述信息。

version_id

Long

训练作业的版本ID。

version_name

String

训练作业的版本名称。

pre_version_id

Long

训练作业前一版本的名称。

engine_type

Short

训练作业的引擎类型。“engine_type”“engine_name”对应关系如下:

  • engine_type:1,engine_name: "TensorFlow"
  • engine_type:2,engine_name: "MXNet"
  • engine_type:3,engine_name: "Ray"
  • engine_type:4,engine_name:"Caffe"
  • engine_type:5,engine_name: "Spark_MLlib"
  • engine_type:9,engine_name: "XGBoost-Sklearn"
  • engine_type:10,engine_name: "PyTorch"
  • engine_type:12,engine_name: "Horovod"

engine_name

String

训练作业的引擎名称。目前支持的引擎名称如下:

  • Caffe
  • Horovod
  • MXNet
  • PyTorch
  • Ray
  • Spark_MLlib
  • TensorFlow
  • XGBoost-Sklearn

engine_id

Long

训练作业的引擎ID。

engine_version

String

训练作业使用的引擎版本。

status

Integer

训练作业的状态,详细作业状态列表请参见作业状态参考

app_url

String

训练作业的代码目录。

boot_file_url

String

训练作业的代码启动文件。

create_time

Long

训练作业的创建时间。

parameter

JSON Array

训练作业的运行参数,为label-value格式;当为自定义镜像训练作业的时候,此参数为容器环境变量。

duration

Long

训练作业的运行时间,单位为毫秒。

spec_id

Long

训练作业资源规格ID。

core

String

资源规格的核数。

cpu

String

资源规格CPU内存。

gpu_num

Integer

资源规格GPU的个数。

gpu_type

String

资源规格GPU的类型。

worker_server_num

Integer

训练作业worker的个数。

data_url

String

训练作业的数据集。

train_url

String

训练作业输出文件OBS路径。

dataset_version_id

String

训练作业的数据集版本ID。

dataset_id

String

训练作业的数据集ID。

data_source

JSON Array

训练作业使用的多数据集。

model_id

Long

训练作业的模型ID。

model_metric_list

JSON Array

训练作业的模型评测参数。

system_metric_list

JSON Array

训练作业的系统监控指标。

user_image_url

String

自定义镜像训练作业的自定义镜像的SWR-URL。

user_command

String

自定义镜像训练作业的自定义镜像的容器的启动命令。

表3 data_source属性列表

参数

参数类型

描述

dataset_id

String

训练作业的数据集ID。

dataset_version

String

训练作业的数据集版本ID。

type

String

数据集类型。

“obs”:表示使用OBS的数据。

“dataset”:表示使用数据集的数据。

data_url

String

OBS的桶路径。

表4 model_metric_list属性列表

参数

参数类型

描述

metric

JSON Array

训练作业的模型单个分类测评参数。

total_metric

JSON Array

训练作业的模型总测评参数。

表5 system_metric_list属性列表

参数

参数类型

描述

cpuUsage

JSON Array

训练作业CPU资源占用率。

memUsage

JSON Array

训练作业内存资源占用率。

gpuUtil

JSON Array

训练作业GPU资源占用率。

表6 metric属性列表

参数

参数类型

描述

metric_values

JSON Array

训练作业模型单个分类测评参数指标。

reserved_data

JSON Array

预留字段。

metric_meta

JSON Array

训练作业模型单个分类,包含类ID和类名。

表7 metric_values属性列表

参数

参数类型

描述

recall

JSON Array

训练作业模型单个分类召回率。

precision

JSON Array

训练作业模型单个分类精确率。

accuracy

JSON Array

训练作业模型单个分类准确率。

表8 total_metric属性列表

参数

参数类型

描述

total_metric_meta

JSON Array

预留字段。

total_reserved_data

JSON Array

预留字段。

total_metric_values

JSON Array

训练作业模型总测评参数指标。

表9 total_metric_values属性列表

参数

参数类型

描述

f1_score

Float

训练作业模型总召回。

recall

Float

训练作业模型总召回率。

precision

Float

训练作业模型总精确率。

accuracy

Float

训练作业模型总准确率。