数据管理
基因容器使用对象存储服务OBS和弹性文件服务SFS存储分析前后产生的数据,其中包括原始基因数据、流程执行中间数据及执行结果数据。CCE环境支持对象存储服务OBS和弹性文件服务SFS存储数据,而由于目前CCI环境不支持OBS挂载,CCI环境只能使用SFS存储数据。
基因容器的数据存储包括“公共数据”和“私有数据”。
- 公共数据中存放的是GCS提供的参考组数据,供您查看和使用。
- 私有数据中存放的是分析前后产生的数据。在“私有数据”页面您可以上传原始基因数据、查看流程执行的中间数据及执行结果数据。
数据上传
开始基因测试前,请先将用于分析的原始数据上传到已创建好的OBS桶里。
- 登录GCS控制台,选择左侧导航栏的“数据管理>私有数据”。
若CCE环境中有默认环境,私有数据将展示默认环境关联桶的数据;若CCE环境中无默认环境,私有数据将展示按默认排序(gene-container开头的OBS桶在前,其他桶在后)后的第一个桶的数据。您可以通过切换桶,将数据上传到您需使用的OBS桶内。
- 建议在OBS桶内,将不同的数据存放在不同的文件夹里。此处,建议为原始数据新建文件夹,并对应命名。
单击“新建文件夹”,将所有的原始数据传至该文件夹内。
- 页面上传:单击“页面上传”,直接上传文件。该方法适用于小于5M单文件上传。
- 工具上传:数据量较大时推荐使用OBS客户端上传数据。单击“工具上传”,根据提示登录OBS客户端,在OBS客户端中上传数据,具体方法请参考OBS Browser入门。该方法适用于批量上传多个文件或上传文件大于5M时。
- 数据快递:单击“数据快递”,进入数据快递控制台上传数据。该方法适用于TB或PB级数据上云。
图1 数据上传
- 数据上传成功后,您还可以做如下操作:
- 下载:选择左侧导航栏的“数据管理>私有数据”,进入数据上传的文件夹中,单击“下载”,将数据下载到本地。
- 删除:选择左侧导航栏的“数据管理>私有数据”,进入数据上传的文件夹中,单击“删除”,删除数据。数据删除后不能恢复,请谨慎操作。
图2 数据下载及删除