创建迁移任务组
本节介绍创建迁移任务组的操作步骤。
- OMS默认会将等待超过30天未调度的任务自动设置为失败,并且会自动清除该任务的AK/SK。为防止大量任务阻塞在等待中,请控制创建任务的频率。
- 如果单个对象大小超过500G,建议您通过提交工单的方式,开通并发分片白名单配置,提升迁移速率。
- 在迁移过程中,系统将自动在目的端桶创建一个名为“OMS”的临时文件夹。严禁手动操作此文件夹,包括但不限于修改、删除或添加内容。对该文件夹进行的任何手动操作都可能导致迁移流程中断或失败。
适用场景
适用于单个桶数据量大于3 TB或对象个数大于500万的对象迁移场景,迁移任务组将源端待迁移对象智能分解到多个迁移任务中并行迁移。
前提条件
- 已注册华为账号并开通华为云,完成实名认证。
- 已创建URL列表文件并上传至OBS,确保URL列表文件中的URL可通过HEAD请求和GET请求正常访问。
如果URL列表文件中的URL无法通过HEAD请求和GET请求正常访问,则该场景不适合HTTP/HTTPS方式迁移,建议通过桶迁移方式迁移或者咨询OBS其他方案。
- 已获取目的端账号的AK/SK并授予相关权限。
- 目的端桶需要的权限包括:列举桶,获取桶位置,列举对象,获取对象元数据,获取对象内容,上传对象,列举已上传段,取回归档存储对象。获取方式参见目的端桶权限获取。
- 已在OBS服务中创建桶。
- 您过去24小时内已创建的迁移任务未满1000000个。
- 您名下处于“等待中”状态的迁移任务未满1000000个。
操作步骤
- 登录华为云控制台。
- 单击控制台左上角的,在下拉框中选择迁移目的端桶所在的Region,如图1所示。
- 单击控制台左侧“服务列表”,选择“迁移 > 对象存储迁移服务 OMS”,进入“对象存储迁移服务”页面。
您也可以在搜索框中输入“OMS”,快速查找“对象存储迁移服务 OMS”,如图2所示。
- 在左侧导航树,选择“迁移任务组”,切换到“迁移任务组”页面。
- 在“迁移任务组”页面,单击页面右上角的“创建迁移任务组”,如图3所示。
- 仔细阅读弹出的服务声明,勾选“同意以上服务声明”,单击“确定”,进入“创建迁移任务组”的“选择源端/目的端”页面,如图4所示。
- 在选择源端区域,数据源选择“HTTP/HTTPS数据源”。
- 设置“选择目的端”区域的参数,参见表1。
- 单击“下一步”,进入“设置任务参数”页面,如图5所示。
- 选择“指定URL列表目录”迁移方式。
- 在“列表目录所在桶(华为云)”下拉列表中,选择存放URL列表文件的OBS桶。
请确保URL列表文件所在桶与目的端桶处于同一区域,否则后续将无法选择对象列表文件。
- 在“选择URL列表目录”参数后面,单击“选择”按钮,弹出“选择URL列表目录”窗口,选择存放URL列表文件的文件夹,单击“确定”。
请确保URL列表文件中的URL可通过HEAD和GET请求正常访问。
- 在“列表目录所在桶(华为云)”下拉列表中,选择存放URL列表文件的OBS桶。
- 选择元数据迁移方式。
- 选择“忽略元数据”,OMS只迁移源端ContentType元数据。
- 选择“保留元数据”,OMS会迁移支持范围内的元数据。
仅支持中文字符、英文字符、数字和中划线【-】迁移。除上述字符外,其他所有字符均不支持。
- 设置迁移指定时间后的对象,使用时间过滤源端待迁移对象。
- 选择“否”,不过滤源端待迁移对象。
- 选择“是”,设置迁移指定时间后,OMS服务仅迁移在指定时间之后修改的源端待迁移对象。
- 设置“目的端配置选项”区域参数。
- 服务端加密。目的端为并行文件系统(PFS)时,不支持KMS加密。
- 不勾选“KMS”,迁移后对象均不加密。
- 勾选“KMS”,所有对象在迁移到OBS桶后都将被加密存储。
- 使用KMS服务端加密可能会降低迁移速率10%左右。
- 当前区域支持KMS加密时,此参数才可用。
- 保存到指定前缀。
- 选择“否”,源端对象迁移到目的端后,对象名保持不变。
- 选择“是”,如图6所示,输入指定前缀,源端对象迁移到目的端后,会在对象名前增加设置的前缀。
关于“保存到指定前缀”参数的详细设置方法请参考指定前缀参数设置规则。
- 配置存储策略
选择迁移到华为云OBS后,对象的存储类型。存储策略说明请参见存储类型介绍。
- 服务端加密。目的端为并行文件系统(PFS)时,不支持KMS加密。
- 单击“高级选项”展开。根据表2参数说明,设置“高级选项”参数。
表2 参数说明 参数
说明
记录失败对象
默认“是”。
- 选择“否”,不记录迁移失败的对象。如果迁移失败,只能全量重传。
- 选择“是”,记录迁移失败的对象。如果迁移失败,支持只对迁移失败对象进行重传。
发送通知
默认“否”,选择是否使用SMN消息通知功能,该功能可以通知您迁移任务的结果。
- 选择“否”,不接收SMN消息。
- 选择“是”,接收SMN消息。
流量控制
默认“否”,设置迁移任务在指定时段的最大流量带宽。
- 选择“否”,不进行流量控制。
- 选择“是”,进行流量控制。
同名对象覆盖方式
- 大小/最后修改时间对比覆盖:对于源端和目的端存在的同名对象,保留最后修改时间较新的对象;如果最后修改时间相同,大小不同,则源端覆盖目的端;如果最后修改时间和大小都相同,则跳过迁移。
- 不覆盖:对于源端和目的端存在的同名对象,跳过源端对象,保留目的端对象。
- 全覆盖:对于源端和目的端存在的同名对象,源端对象直接覆盖目的端对象。
一致性校验
- 大小/最后修改时间校验:默认配置,通过对比源端和目的端对象大小+最后修改时间,判断迁移后数据是否完整。
- 不校验:
- 当源端对象无法通过标准http协议中content-length字段获取数据大小时,默认数据下载成功即迁移成功,不对数据做额外校验,且迁移时源端对象默认覆盖目的端同名对象。
- 当源端对象能正常通过标准http协议中content-length字段获取数据大小时,则采用大小/最后修改时间校验方式来校验。
任务优先级
任务较多时,可以通过设置任务优先级制定迁移顺序。
- 单击“下一步”,进入“确认信息”页面。
- 确认源端信息、目的端信息、任务参数、高级选项等参数无误后,单击“开始迁移”。提示任务提交成功。查看迁移任务组列表已新增该任务组。