更新时间:2022-11-08 GMT+08:00
分享

数据导入

使用import命令引用数据到当前所在项目或者导入网上数据。

命令结构

health import data <src-dir> <dest-dir> [flags]
表1 参数说明

参数

简写

是否必选

说明

src-dir

源路径,支持四种格式,分别是医疗项目、外部桶、外部并行文件系统或者网络数据下载链接,对应格式分别为ProjectName:/path、OBS:BucketName:/path、OBSFS:ObsfsName:/path、下载url。

须知:

源路径中如果要填写多个路径,路径之间用空格分隔。如果路径中有特殊字符或者空格,用""包裹单个路径;如果路径中有""则使用''包裹,如路径中有''则使用""包裹。

dest-dir

要导入的本项目路径,导入网上数据时必选,路径样式为:path/;引用数据时目的存放路径为本项目的根目录,故无需指定destdir。

--md5s

-m

网络下载链接对应的md5列表,值用; 分隔,和网络数据链接一一对应。值用于下载完后对文件进行md5校验。

--project

指定项目名。未填写则使用配置文件中的项目名。

命令示例

本节以Windows为例介绍eihealth-toolkit的使用过程,Linux和macOS环境使用方法基本相同,可参考。

  • 从医疗项目中引用数据
    health import data eihealth-project-name:/path1/
    # 返回结果如下
    reference data successfully!
  • 从外部桶中引用数据
    health import data OBS:obs-buckt-name:/path1/
    # 返回结果如下
    reference data successfully!
  • 从外部并行文件系统中引用数据
    health import data OBSFS:obsfs-buckt-name:/path1/
    # 返回结果如下
    reference data successfully!

执行上述三个命令成功后,项目根目录层级显示如下:

├─lmx-test-project       	#  本项目名称
│  ├─path1               
│  ├─path2
│  ├─.....
├─eihealth-project-name	    #  引用的项目名
│  ├─path1			        #  引用的项目的源路径
├─OBS:obs-bucket-name    	#  引用的外部桶名
│  ├─path1			        #  引用的外部桶的源路径
├─OBSFS:obsfs-bucket-name:	#  引用的外部并行系统名称
│  ├─path1			#  引用的外部并行系统的源路径
  • 导入网络数据

    Windows:

    health import data https://eihealth-lmx-test-01-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test1.csv? https://eihealth-lmx-test-02-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test2.csv path/ --md5=your-md5-value1;your-md5-value2
    # 返回结果如下
    import data form network successfully! the result import path is xxxx.
    Linux:
    ./health import data https://eihealth-lmx-test-01-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test1.csv? https://eihealth-lmx-test-02-aad9f09b.obs.cn-north-4.myhuaweicloud.com/test2.csv path/ --md5=your-md5-value1;your-md5-value2
    # 返回结果如下
    import data form network successfully! the result import path is xxxx.

相关文档