基因容器 GCS
基因容器 GCS
- 最新动态
- 产品介绍
- 快速入门
- 用户指南
- Cromwell引擎使用指南
- 最佳实践
- 流程语法参考
- Python SDK参考
- API参考
-
CLI参考
- 命令总览
- 安装命令行工具
- 示例:使用命令行执行简单脚本
-
gcs 命令详情
- gcs version
- gcs config add
- gcs config list
- gcs get kubectl
- gcs get enviroment
- gcs set env
- gcs get sfs
- gcs set sfs
- gcs get obscli
- gcs obs upload
- gcs get workflow
- gcs create workflow
- gcs del workflow
- gcs update workflow
- gcs sub workflow
- gcs get execution
- gcs create execution
- gcs del execution
- gcs set execution
- gcs sub job
- gcs sub repjob
- gcs get tool
- gcs sub wdl
- gcs get wdl
- gcs set wdl
- get get fr
- config.ini配置说明
- 常见问题
- 视频帮助
- 文档下载
- 通用参考
本文导读
展开导读
链接复制成功!
数据管理
基因容器使用对象存储服务OBS和弹性文件服务SFS存储分析前后产生的数据,其中包括原始基因数据、流程执行中间数据及执行结果数据。CCE环境支持对象存储服务OBS和弹性文件服务SFS存储数据,而由于目前CCI环境不支持OBS挂载,CCI环境只能使用SFS存储数据。
基因容器的数据存储包括“公共数据”和“私有数据”。
- 公共数据中存放的是GCS提供的参考组数据,供您查看和使用。
- 私有数据中存放的是分析前后产生的数据。在“私有数据”页面您可以上传原始基因数据、查看流程执行的中间数据及执行结果数据。
数据上传
开始基因测试前,请先将用于分析的原始数据上传到已创建好的OBS桶里。
- 登录GCS控制台,选择左侧导航栏的“数据管理>私有数据”。
若CCE环境中有默认环境,私有数据将展示默认环境关联桶的数据;若CCE环境中无默认环境,私有数据将展示按默认排序(gene-container开头的OBS桶在前,其他桶在后)后的第一个桶的数据。您可以通过切换桶,将数据上传到您需使用的OBS桶内。
- 建议在OBS桶内,将不同的数据存放在不同的文件夹里。此处,建议为原始数据新建文件夹,并对应命名。
单击“新建文件夹”,将所有的原始数据传至该文件夹内。
- 页面上传:单击“页面上传”,直接上传文件。该方法适用于小于5M单文件上传。
- 工具上传:数据量较大时推荐使用OBS客户端上传数据。单击“工具上传”,根据提示登录OBS客户端,在OBS客户端中上传数据。该方法适用于批量上传多个文件或上传文件大于5M时。
- 数据快递:单击“数据快递”,进入数据快递控制台上传数据。该方法适用于TB或PB级数据上云。
图1 数据上传
- 数据上传成功后,您还可以做如下操作:
- 下载:选择左侧导航栏的“数据管理>私有数据”,进入数据上传的文件夹中,单击“下载”,将数据下载到本地。
- 删除:选择左侧导航栏的“数据管理>私有数据”,进入数据上传的文件夹中,单击“删除”,删除数据。数据删除后不能恢复,请谨慎操作。
图2 数据下载及删除