更新时间:2024-10-30 GMT+08:00
分享

算法文件说明

用户可将本地算法文件包上传到Octopus平台,算法文件包需要满足一定要求,请详细阅读本节,有助于用户快速完成算法开发。

算法文件基本要求

算法文件目录结构可参考如下,需要包括启动文件“xxx.py”(启动文件名可自定义),以及一些必要的训练文件。

  • 启动文件(必选)

    算法的启动文件,直接填写相对路径,如 “main.py” 或“tools/main.py”。

  • 需要编译的依赖(可选)

    如果使用了第三方的需要编译的算法库,将编译脚本或编译产物或依赖库添加到算法文件根目录下。推荐将通用依赖编译安装操作放在算法绑定的用户自定义镜像。

算法训练运行态不支持动态联网安装依赖,包括但不限于apt/apt-get/pip等命令,建议提前安装在自定义镜像中。

相关参数说明

表1 相关参数说明

名称

环境变量

默认值

备注

数据集目录

DATASET

CCE: /tmp/data/dataset

ModelArts: /home/ma-user/datasets

数据集在训练任务中的存放路径,可自行获取各种数据集信息。

数据集映射

DATASET_MAP

{key1: value1, key2: value2}

以键值对提供数据集名称和容器内路径的变量,其中容器内路径参考数据集目录

模型存放目录

RESULT

CCE: /tmp/result

ModelArts: /home/ma-user/modelarts/result

训练产物的存放路径,产物输出到此路径后,在任务结束时。可在任务详情页的输出模型版本中浏览及执行各种操作。

增量训练模型目录

MODEL

CCE: /tmp/data/model

ModelArts: /home/ma-user/modelarts/user-job-dir/model

待增量模型版本在训练任务中的存放路径,可自行获取模型文件信息。

  • 平台如果支持多类型资源池,强烈建议用户使用环境变量适配算法提交任务,可免去更换默认值的环节。

以CCE集群多数据集训练为例,数据集分别命名为“dataset-0”,“dataset-1” ,实际路径为/tmp/data/dataset/dataset-0和/tmp/data/dataset/dataset-1 (DATASET环境变量始终保持/tmp/data/dataset不变)。

推荐使用环境变量获取以上变量,获取方式为

# 获取数据集总目录
DATASET_DIR = os.getenv("DATASET")
# 训练任务最多可使用5个数据集,通过迭代方式获取每个数据集路径
DATASETS_DIR_LIST = [os.path.join(DATASET_DIR), path for path in os.listdir(DATASET_DIR)]

相关文档