训练人脸识别的数据集_使用预置算法训练时，训练失败，报“bndbox”错误-华为云

能够在图像中快速检测人脸、分析人脸关键点信息、获取人脸属性、实现人脸的精确比对和检索。该服务可应用于身份验证、电子考勤、客流分析等场景

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

训练人脸识别的数据集更多内容

使用预置算法训练时，训练失败，报“bndbox”错误

使用预置算法训练时，训练失败，报“bndbox”错误问题现象使用预置算法创建训练作业，训练失败，日志中出现如下报错。 KeyError: 'bndbox' 原因分析用于训练的数据集中，使用了“非矩形框”标注。而预置使用算法不支持“非矩形框”标注的数据集。处理方法此问题有两种解决方法：

来自：帮助中心

查看更多 →
数据工程使用流程

高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的采集、清洗、标注、评估、发布等环节，成为数据开发中不可或缺的重要步骤。数据工程操作流程见图1、表1。

来自：帮助中心

查看更多 →
流通文本类数据集

流通文本类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。单个文本类数据集支持发布的格式为：默认格式：平台默认的格式。在默认格式中，context和target是键值对。示例如下： {"context": "你好，请介绍自己", "target":

来自：帮助中心

查看更多 →
我创建的微调数据集会被其他用户调用去训练他们的大模型吗？

我创建的微调数据集会被其他用户调用去训练他们的大模型吗？用户个人创建的数据集是属于个人账号下的专属数据，未经本人许可不会被其他人员查看到，且不会被其他用户在大模型训练时调用。父主题： AI原生应用引擎

来自：帮助中心

查看更多 →
数据集

数据集硬盘故障检测模板中，已经预置了四份数据实例，已无需再上传数据。如果用户需要了解数据上传操作，可以查看本地上传数据集操作说明。单击菜单栏中的“数据集”，进入数据集菜单页。可以看到预置的四个硬盘故障检测数据集实例，如图1所示。图1 预置数据集单击预置的数据集实例右侧的图标，可查看数据实例中的数据文件。

来自：帮助中心

查看更多 →

免费体验中心

免费领取体验产品，快速开启云上之旅

个人用户企业用户

免费

图像搜索 Image Search

帮助客户从指定图库中搜索相同及相似的图片

新用户专享限购1台

¥0.00

云数据库免费试用

金融核心交易系统、政企OA办公等场景适用

注册申请

¥0.00

训练型横向联邦作业流程

配置作业的执行脚本，训练模型文件。执行脚本是每个参与方的计算节点在本地会执行的模型训练、评估程序，用于基于本地的数据集训练子模型。训练模型文件则定义了模型的结构，会用于每个参与方在本地初始化模型。图2 配置执行脚本、训练模型文件配置已方、对方数据集。在作业的数据集配置中，

来自：帮助中心

查看更多 →
流通图片类数据集

流通图片类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。单个图片类数据集支持发布的格式为：默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要将数据集格式发布为“盘古格式”。创建文本类数据集流通任务步骤如下：登录ModelArts

来自：帮助中心

查看更多 →
发布ModelArts数据集中的数据版本

证模型的样本数据比例。“训练验证比例”会影响训练模板的性能。 “描述” 针对当前发布的数据集版本的描述信息。 “开启难例属性” 仅“图像分类”和“物体检测”类型数据集支持难例属性。默认不开启。启用后，会将此数据集的难例属性等信息写入对应的Manifest文件中。数据集版本文件目录结构

来自：帮助中心

查看更多 →
数据工程

。通过数据合成技术，可以生成大量高质量的训练数据，这些数据可以用于大模型的预训练，增强模型的泛化能力和性能。数据标注：平台支持对无标签的数据添加标签或对现有的标签进行重新标注，以提升数据集的标注质量。用户可以针对不同的数据集灵活地选择对应的标注项，还可以自定义选择多人标注、审核

来自：帮助中心

查看更多 →
发布数据集

针对当前发布的数据集版本的描述信息。 “开启难例属性” 仅“图像分类”和“物体检测”类型数据集支持难例属性。默认不开启。启用后，会将此数据集的难例属性等信息写入对应的Manifest文件中。图2 发布数据集版本发布后，您可以前往版本管理查看详细信息。系统默认将最新的版本作为当前目录。

来自：帮助中心

查看更多 →

域名注册服务Domains

.com .cn多款热门域名

新用户专享限购1个

立即前往

华为云企业邮箱免费试用

即开即用，不限账号数

无限邮箱容量 4GB超大附件

¥0.00

免费试用

会打字就会建站

3300+模板，30000+企业选择

立即购买

功能介绍

功能介绍数据集模型训练服务统一的数据集管理菜单，可本地导入10G以内大数据文件，或对接数据集服务，导入已订阅的数据集。且支持在线查看代码、图片、音视频等多种格式的文件内容。特征工程特征工程是模型训练的必要过程，可以实现数据集的特征组合、筛选和转换，最大限度的从数据集中提取关键特征，供模型训练使用。

来自：帮助中心

查看更多 →
ModelArts Studio大模型开发平台使用流程

服务，便捷地构建自己的模型和应用。数据工程工具链：数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分，具备数据获取、数据加工和数据发布等功能，确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据，满足不同训练任务的需求，并提供强大的数据存储和管理能力，为大模型训练提供坚实的数据支持。

来自：帮助中心

查看更多 →
数据集下载成功后有哪些使用方式

数据集下载成功后有哪些使用方式数据集下载成功后，目前主要可用作AI模型训练和数据分析挖掘。根据已下载的数据集生成训练数据集、测试集用于AI模型训练。基于已下载的数据集直接进行数据分析及挖掘，开发数据应用。父主题：数据集

来自：帮助中心

查看更多 →
自然语言处理套件（使用文本分类工作流开发应用）

nlp/data-in”。数据集输出位置待新建的数据集存储至OBS的位置。单击“数据集输出位置”右侧的“修改”，在弹出的“数据集输出位置”对话框中，选择“OBS桶”和“文件夹”，然后单击“确定”。选择步骤1：准备数据中提前创建好的输出数据集的OBS路径“mapro-nlp/data-out”。

来自：帮助中心

查看更多 →
视觉套件（使用零售商品识别工作流开发应用）

待新建的数据集存储至OBS的位置。单击“数据集输出位置”右侧的“修改”，在弹出的“数据集输出位置”对话框中，选择“OBS桶”和“文件夹”，然后单击“确定”。选择步骤1：准备数据中提前创建好的输出数据集的OBS路径“mapro-vison/data-out”。勾选已上传的数据集。

来自：帮助中心

查看更多 →

跨境电商建站

10分钟快速建站，低成本开启跨境生意

试用14天跨境电商

￥0.00

/次

好会计，免费试用

全场景智能报销

免费体验15天

¥0.00

元/年

零代码构建平台

创建nocosys平台客户账号

智能协作企业办公

¥0.00

元/次

准备数据

准备数据本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。 Alpaca数据集本教程使用Alpaca数据集，数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令数据可

来自：帮助中心

查看更多 →
应用场景

PUE优化：通过快速寻优DC制冷系统参数组合，降低DC能耗。提供2个训练集（冷站数据，末端数据），157维特征。跨域训练数据集提供用于跨域场景AI模型训练的数据，包括视频体验相关的端到端数据集合。场景案例视频优化：基于视频终端（STB）的KPI、KQI、告警等数据的分析，建立视频质差预警模型，提升视频故

来自：帮助中心

查看更多 →
如何切分ModelArts数据集？

”自动填充。“训练集比例”加“验证集比例”等于1。 “训练集比例”即用于训练模型的样本数据比例；“验证集比例”即用于验证模型的样本数据比例。“训练验证比例”会影响训练模板的性能。父主题： Standard数据准备

来自：帮助中心

查看更多 →
数据集加工场景介绍

据，确保数据的准确性与一致性，从而提高数据质量，为模型训练提供可靠的输入。扩展数据集的多样性和泛化能力在数据量不足或样本不平衡的情况下，数据合成可以生成新数据，扩展数据集的规模和多样性。通过增加数据的多样性，能够提升模型在各种场景下的泛化能力，增强其对未知数据的适应性。增强模型训练的有效性

来自：帮助中心

查看更多 →
数据集下载成功后有哪些使用方式

数据集下载成功后有哪些使用方式数据集下载成功后，目前主要可用作AI模型训练和数据分析挖掘。根据已下载的数据集生成训练数据集、测试集用于AI模型训练。基于已下载的数据集直接进行数据分析及挖掘，开发数据应用。父主题：常见问题

来自：帮助中心

查看更多 →
训练迁移适配

accelerate==0.30.1 timm==0.9.16 准备数据集。下载Kaggle官网提供的imagenet-mini数据集，解压之后文件大小4.1GB。该数据集是从[imagenet-2012]数据集中筛选的少量数据集。准备预训练权重。下载Hugging Face权重。迁移适配。

来自：帮助中心

查看更多 →