增量同步下载对象
功能说明
将OBS源桶指定路径下的所有对象同步到本地目标路径,使两边内容保持一致。这里的增量同步有两层含义:1)增量,依次比较源对象和目标文件,只下载存在变化的源对象;2)同步,命令执行完成后,保证OBS指定源桶指定路径是本地目标路径的子集,即OBS源桶指定路径下的所有对象均能在本地目标路径下找到对应文件。
- 同步下载时,请确保OBS桶中的源对象不发生变化,否则可能产生同步失败或者数据不一致的问题。
- 如果待下载对象的存储类型为cold,必须首先恢复待下载对象,否则无法下载成功。
- 同步下载每个对象时会对比本地对应路径的文件,仅在文件不存在,或者文件大小与对象大小不一致,或者文件的最后修改时间早于对象的最后修改时间时进行下载。
在比较每个本地文件与桶内对象差异时,会产生一次HEAD请求费用。
命令结构
- Windows操作系统
obsutil sync obs://bucket[/key] folder_url [-tempFileDir=xxx] [-dryRun] [-vlength] [-vmd5] [-j=1] [-p=1] [-threshold=52428800] [-ps=auto] [-include=*.xxx] [-exclude=*.xxx] [-timeRange=time1-time2] [-mf] [-o=xxx] [-cpd=xxx] [-config=xxx] [-e=xxx] [-i=xxx] [-k=xxx] [-t=xxx]
- macOS/Linux操作系统
./obsutil sync obs://bucket[/key] folder_url [-tempFileDir=xxx] [-dryRun] [-vlength] [-vmd5] [-j=1] [-p=1] [-threshold=52428800] [-ps=auto] [-include=*.xxx] [-exclude=*.xxx] [-timeRange=time1-time2] [-mf] [-o=xxx] [-cpd=xxx] [-config=xxx] [-e=xxx] [-i=xxx] [-k=xxx] [-t=xxx]
运行示例
- 以Windows操作系统为例,运行obsutil sync obs://bucket-test/temp d:\ temp,同步下载对象。
obsutil sync obs://bucket-test/temp d:\temp Start at 2024-09-30 08:53:22.327072 +0000 UTC Parallel: 5 Jobs: 5 Threshold: 50.00MB PartSize: auto VerifyLength: false VerifyMd5: false CheckpointDir: xxxx Task id: 3066a4b0-4d21-4929-bb84-4829c32cbd0f OutputDir: xxxx TempFileDir: xxxx [======================================================] 100.00% tps:17.86 155.59 KB/s 7.20MB/7.20MB 0s Succeed count: 6 Failed count: 0 Succeed bytes: xxxx Metrics [max cost:153 ms, min cost:129 ms, average cost:92.00 ms, average tps:17.86, transfered size: 7.20MB] Task id: 3066a4b0-4d21-4929-bb84-4829c32cbd0f
- 更多运行示例,请参见同步下载示例。
参数说明
参数 |
约束 |
描述 |
---|---|---|
folder_url |
必选 |
本地文件夹路径。 |
bucket |
必选 |
桶名。 |
key |
可选 |
待同步下载的对象名前缀。 规则如下:
说明:
|
tempFileDir |
附加参数,可选 |
同步下载时保存临时文件的文件夹,默认为配置文件中的defaultTempFileDir。
说明:
|
dryRun |
附加参数,可选 |
测试模式运行,不执行实际的下载操作。 |
vlength |
附加参数,可选 |
下载完成后,验证本地文件大小是否与桶中对象的大小一致。 |
vmd5 |
附加参数,可选 |
下载完成后,验证本地文件的MD5值是否与桶中对象的MD5值一致。
说明:
桶中对象必须包含元数据x-obs-meta-md5chksum,否则会忽略MD5值校验。
注意:
如果您的业务涉及加密场景,请勿使用该参数。 |
p |
附加参数,可选 |
每个分段下载任务的最大并发数,默认为配置文件中的defaultParallels。 |
threshold |
附加参数,可选 |
开启分段下载任务的阈值,单位:字节,默认为配置文件中的defaultBigfileThreshold。
说明:
|
ps |
附加参数,可选 |
每个分段下载任务的段大小,单位:字节,默认为配置文件中的defaultPartSize。
说明:
|
cpd |
附加参数,可选 |
生成断点记录文件的文件夹,默认为运行obsutil命令的用户目录的子文件夹.obsutil_checkpoint。
说明:
每个分段下载任务会产生唯一对应的断点记录文件并保存至该文件夹的down子文件夹下,分段任务执行成功后,对应的断点记录文件会被自动删除;分段任务执行失败或被中断后,下次执行该分段任务时会尝试通过对应的断点记录文件恢复任务。 |
j |
附加参数,批量下载时可选 |
同步下载时的最大并发数,默认为配置文件中的defaultJobs。
说明:
工具会保证该值至少为1。 |
exclude |
附加参数,批量下载时可选 |
不包含源对象的匹配模式,如:*.txt。
说明:
须知:
|
include |
附加参数,批量下载时可选 |
包含源对象的匹配模式,如:*.jpg。
说明:
须知:
|
timeRange |
附加参数,可选 |
同步下载对象时的时间段匹配模式,仅下载最后修改时间在该时间段内的对象。 该匹配模式优先级低于对象名匹配模式:exclude和include,优先执行对象名匹配模式后才会执行该匹配模式。
说明:
须知:
|
mf |
附加参数,可选 |
设置名称匹配模式(include、exclude)和时间匹配模式(timeRange)对对象名以“/”结尾的对象也生效。 |
o |
附加参数,可选 |
生成结果清单文件的文件夹,命令执行完成后,会在该文件夹下生成结果清单文件(可能包含成功结果、失败结果和警告结果三个文件),默认为运行obsutil命令的用户目录的子文件夹.obsutil_output。
说明:
|
config |
附加参数,可选 |
运行当前命令时的自定义配置文件,可支持的配置参数请参考配置参数说明。 |
e |
附加参数,可选 |
指定终端节点。 |
i |
附加参数,可选 |
指定用户的AK。 |
k |
附加参数,可选 |
指定用户的SK。 |
t |
附加参数,可选 |
指定用户的securitytoken。 |
响应结果
请参考上传对象的响应结果。