算法文件说明
用户可将本地算法文件包上传到Octopus平台,算法文件包需要满足一定要求,请详细阅读本节,有助于用户快速完成算法开发。
算法文件基本要求
算法文件目录结构可参考如下,需要包括启动文件“xxx.py”(启动文件名可自定义),以及一些必要的训练文件。
算法训练运行态不支持动态联网安装依赖,包括但不限于apt/apt-get/pip等命令,建议提前安装在自定义镜像中。
相关参数说明
名称 |
环境变量 |
默认值 |
备注 |
---|---|---|---|
数据集目录 |
DATASET |
CCE: /tmp/data/dataset ModelArts: /home/ma-user/datasets |
数据集在训练任务中的存放路径,可自行获取各种数据集信息。 |
数据集映射 |
DATASET_MAP |
{key1: value1, key2: value2} |
以键值对提供数据集名称和容器内路径的变量,其中容器内路径参考数据集目录 |
模型存放目录 |
RESULT |
CCE: /tmp/result ModelArts: /home/ma-user/modelarts/result |
训练产物的存放路径,产物输出到此路径后,在任务结束时。可在任务详情页的输出模型版本中浏览及执行各种操作。 |
增量训练模型目录 |
MODEL |
CCE: /tmp/data/model ModelArts: /home/ma-user/modelarts/user-job-dir/model |
待增量模型版本在训练任务中的存放路径,可自行获取模型文件信息。 |
- 平台如果支持多类型资源池,强烈建议用户使用环境变量适配算法提交任务,可免去更换默认值的环节。
以CCE集群多数据集训练为例,数据集分别命名为“dataset-0”,“dataset-1” ,实际路径为/tmp/data/dataset/dataset-0和/tmp/data/dataset/dataset-1 (DATASET环境变量始终保持/tmp/data/dataset不变)。
推荐使用环境变量获取以上变量,获取方式为
# 获取数据集总目录 DATASET_DIR = os.getenv("DATASET") # 训练任务最多可使用5个数据集,通过迭代方式获取每个数据集路径 DATASETS_DIR_LIST = [os.path.join(DATASET_DIR), path for path in os.listdir(DATASET_DIR)]