对象存储服务 OBS     

对象存储服务(Object Storage Service)是一款稳定、安全、高效、易用的云存储服务,具备标准Restful API接口,可存储任意数量和形式的非结构化数据。

 
 

    数据处理和存储 更多内容
  • 预训练数据处理

    -workers:设置数据处理使用执行卡数量 -append-eod:参数用于控制是否在每个输入序列的末尾添加一个特殊的标记。这个标记表示输入序列的结束,可以帮助模型更好地理解处理长序列。 seq-length:是一个用于计算序列长度的函数。它接收一个序列作为输入,并返回序列的长度,需训练时参数保持一致。

    来自:帮助中心

    查看更多 →

  • 热数据存储和冷数据存储的区别?

    热数据存储冷数据存储的区别? 热数据存储冷数据存储最大的区别在于存储介质不同: 热数据存储是直接将频繁被查询或更新,对访问的响应时间要求很高的热数据存储在DN数据盘中。 冷数据存储将不更新,偶尔被查询,对访问的响应时间要求不高的冷数据存储在OBS中。 因为其存储介质的不同,决

    来自:帮助中心

    查看更多 →

  • 数据处理(OT应用)

    数据处理(OT应用) IoT边缘云服务为应用提供总线对接能力、设备命令下发能力。IoTEdge对应用的日志、数据存储目录进行统一配置,应用相关设置通过环境变量传递给应用。 App从输入点接受来自总线的设备数据上报,对数据进行处理,将处理后的数据通过输出点发送到总线。 App也可以

    来自:帮助中心

    查看更多 →

  • 预训练数据处理

    预训练数据处理 训练前需要对数据集进行预处理,转化为.bin.idx格式文件,以满足训练要求。 Alpaca数据处理说明 数据预处理脚本preprocess_data.py存放在代码包的“llm_train/AscendSpeed/ModelLink/tools/”目录中,脚本具体内容如下。

    来自:帮助中心

    查看更多 →

  • 算子数据处理规则

    字符截取的起点位置或终点位置,大于输入字段的长度时,当前行成为脏数据。 EL操作转换 传入数据为NULL值,不做转换处理。 输入一个或多个字段的值,输出计算结果。 输入类型算子不兼容时,当前行为脏数据。 字符串大小写转换 传入数据为NULL值,不做转换处理。 配置输入字段列数,大于原始数据实际包含的字段列数,全部数据成为脏数据。

    来自:帮助中心

    查看更多 →

  • 创建数据处理任务

    填写基本信息。基本信息包括“名称”、“版本”“描述”。其中“版本”信息由系统自动生成,按“V0001”、“V0002”规则命名,用户无法修改。 您可以根据实际情况填写“名称”“描述”信息。 图1 创建数据处理基本信息 设置场景类别。场景类别当前支持“图像分类”“物体检测”。 设置数据处理类型。数据处理类型支持

    来自:帮助中心

    查看更多 →

  • 预训练数据处理

    预训练数据处理 训练前需要对数据集进行预处理,转化为.bin.idx格式文件,以满足训练要求。 这里以Llama2-70B为例,对于Llama2-7BLlama2-13B,操作过程与Llama2-70B相同,只需修改对应参数即可。 Alpaca数据处理说明 数据预处理脚本preprocess_data

    来自:帮助中心

    查看更多 →

  • 预训练数据处理

    预训练数据处理 训练前需要对数据集进行预处理,转化为.bin.idx格式文件,以满足训练要求。 这里以Qwen-14B为例,对于Qwen-7BQwen-72B,操作过程与Qwen-14B相同,只需修改对应参数即可。 Alpaca数据处理说明 数据预处理脚本preprocess_data

    来自:帮助中心

    查看更多 →

  • 创建数据处理任务版本

    template 否 TemplateParam object 数据处理模板,如算法ID参数等。 version_id 否 String 数据集版本ID。 work_path 否 WorkPath object 数据处理任务的工作目录。 workspace_id 否 String

    来自:帮助中心

    查看更多 →

  • 数据处理支持什么类型脚本?

    数据处理支持什么类型脚本? 目前数据处理仅支持Python脚本。数据处理集成了华为公有云ModelArts服务的引擎,用来执行用户自编码的Python脚本。 父主题: 数据处理

    来自:帮助中心

    查看更多 →

  • 对象存储与SAN存储和NAS存储相比较有什么优势?

    对象存储与SAN存储NAS存储相比较有什么优势? SAN存储提供给应用的是一个LUN或者是一个卷,LUN卷是面向磁盘空间的一种组织方式,上层应用要通过FC或者IS CS I协议访问SAN。SAN存储处理的是管理磁盘的问题,其他事情都要依靠上层的应用程序实现。 NAS存储提供给应用

    来自:帮助中心

    查看更多 →

  • 转换桶和对象的存储类别

    转换桶对象的存储类别 操作场景 本章节指导用户如何修改桶对象的存储类别。 约束与限制 桶存储类别仅支持手动修改。对象存储类别支持手动修改使用生命周期自动转换。 转换存储类别时数据冗余策略保持不变。如果桶或对象是多AZ,那就只能转换成支持多AZ的存储类型(标准存储、低频存储支持

    来自:帮助中心

    查看更多 →

  • 数据处理预置算子说明

    数据处理预置算子说明 数据校验 数据清洗 数据选择 数据增强

    来自:帮助中心

    查看更多 →

  • 个人数据处理说明

    个人数据处理说明 个人数据清单 使用目的 存留期 用户屏幕图像 投屏中屏幕镜像信息投放 IdeaShare不保存个人数据 用户音频输出口 投屏中音频信息投放 用户IP地址 投屏连接

    来自:帮助中心

    查看更多 →

  • 功能包和存储包分别是什么?

    功能包存储包分别是什么? 功能包:需要备份的 云服务器 的磁盘空间。 存储包:备份数据所占用的存储空间。 例如:某用户拥有一个分配空间为100GB的云 服务器 ,初始数据容量20GB,后续每日新写入1GB数据。该用户购买了一个月的100GB云服务器功能包100GB的存储包,配置自动备

    来自:帮助中心

    查看更多 →

  • 设置桶和对象的存储类别

    设置桶对象的存储类别 操作场景 本章节指导用户在创建桶上传对象时,初次设置桶对象的存储类别。如果桶对象已有存储类别,而您想要修改其存储类别,请查看转换桶对象的存储类别。 桶存储类别对象存储类别 创建桶时支持设置桶存储类别,也可在桶创建完成后修改桶存储类别。 上传对象时

    来自:帮助中心

    查看更多 →

  • 桶存储类别和对象存储类别有什么关系?

    存储类别对象存储类别有什么关系? 上传对象时,对象的存储类别默认继承桶的存储类别。您也可以重新指定对象的存储类别,同时也支持在对象上传完成后修改对象的存储类别。 修改桶的存储类别,桶内已有对象的存储类别不会修改,新上传对象时的默认对象存储类别随之修改。 父主题: 桶对象相关

    来自:帮助中心

    查看更多 →

  • 停止数据处理任务的版本

    String 用户项目ID。获取方法请参见获取项目ID名称。 task_id 是 String 数据处理任务ID。 version_id 是 String 数据处理任务的版本ID。 请求参数 无 响应参数 无 请求示例 停止数据处理任务的版本 POST https://{endpo

    来自:帮助中心

    查看更多 →

  • SFT全参微调数据处理

    SFT全参微调数据处理 SFT全参微调(SFT fine-tuning)前需要对数据集进行预处理,转化为.bin.idx格式文件,以满足训练要求。 下载数据 SFT全参微调涉及的数据下载地址:https://huggingface.co/datasets/silk-road/a

    来自:帮助中心

    查看更多 →

  • 查询数据处理的算法类别

    tems 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID名称。 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer 分页列表的起始页,默认为0。 limit 否

    来自:帮助中心

    查看更多 →

  • 存储

    存储 存储是保存数据的对象,通常来说,同一种设备的数据会保存在同一个存储中。存储中定义了设备的标签与设备的属性。其中设备ID(deviceId)就是最常用的一种标签(tag)。一个标签包括标签名与标签值,例如设备ID:标签名为 deviceId,而它的标签值则是具体的某个设备ID

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了