数据导入
使用import命令引用数据到当前所在项目或者导入网上数据。
命令结构
health import data <src-dir> <dest-dir> [flags]
参数 |
简写 |
是否必选 |
说明 |
---|---|---|---|
src-dir |
无 |
是 |
源路径,支持四种格式,分别是医疗项目、外部桶、外部并行文件系统或者网络数据下载链接,对应格式分别为ProjectName:/path、OBS:BucketName:/path、OBSFS:ObsfsName:/path、下载url。
须知:
源路径中如果要填写多个路径,路径之间用空格分隔。如果路径中有特殊字符或者空格,用""包裹单个路径;如果路径中有""则使用''包裹,如路径中有''则使用""包裹。 |
dest-dir |
无 |
否 |
要导入的本项目路径,导入网上数据时必选,路径样式为:path/;引用数据时目的存放路径为本项目的根目录,故无需指定destdir。 |
--md5s |
-m |
否 |
网络下载链接对应的md5列表,值用; 分隔,和网络数据链接一一对应。值用于下载完后对文件进行md5校验。 |
--project |
无 |
否 |
指定项目名。未填写则使用配置文件中的项目名。 |
命令示例
本节以Windows为例介绍eihealth-toolkit的使用过程,Linux和macOS环境使用方法基本相同,可参考。
- 从医疗项目中引用数据
health import data eihealth-project-name:/path1/ # 返回结果如下 reference data successfully!
- 从外部桶中引用数据
health import data OBS:obs-buckt-name:/path1/ # 返回结果如下 reference data successfully!
- 从外部并行文件系统中引用数据
health import data OBSFS:obsfs-buckt-name:/path1/ # 返回结果如下 reference data successfully!
执行上述三个命令成功后,项目根目录层级显示如下:
├─lmx-test-project # 本项目名称 │ ├─path1 │ ├─path2 │ ├─..... ├─eihealth-project-name # 引用的项目名 │ ├─path1 # 引用的项目的源路径 ├─OBS:obs-bucket-name # 引用的外部桶名 │ ├─path1 # 引用的外部桶的源路径 ├─OBSFS:obsfs-bucket-name: # 引用的外部并行系统名称 │ ├─path1 # 引用的外部并行系统的源路径
- 导入网络数据
health import data https://eihealth-lmx-test-01-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test1.csv? https://eihealth-lmx-test-02-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test2.csv path/ --md5=your-md5-value1;your-md5-value2 # 返回结果如下 import data form network successfully! the result import path is xxxx.
Linux:./health import data https://eihealth-lmx-test-01-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test1.csv? https://eihealth-lmx-test-02-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test2.csv path/ --md5=your-md5-value1;your-md5-value2 # 返回结果如下 import data form network successfully! the result import path is xxxx.