健康医疗数据通过EDS共享和安全管控实践
场景介绍
本实践以xx医疗集团和某慢病院交换“风湿病患者医疗数据”为例,指导用户在医疗场景中如何安全的进行数据交换。
操作流程
- xx医疗集团开通交换数据空间,请参见xx医疗集团开通交换数据空间。
- xx医疗集团分别为自己集团(数据提供方)与某慢性病院(数据消费方)创建“xx医疗集团连接器”和“某慢性病院连接器”用于交换数据,请参见开通连接器。
- xx医疗集团(数据提供方)将拥有的风湿病患者医疗数据上传到空间实例下的“xx医疗集团连接器”,请参见xx医疗集团(数据提供方)新增资源。
- xx医疗集团在连接器中将“风湿病患者医疗数据”制定控制策略后打包成数据Offer(数据商品)上架到数据市场,请参见xx医疗集团(数据提供方)上架Offer。
- 某慢性病院前往数据市场搜索风湿病患者医疗数据并订阅该Offer,请参见某慢性病院连接器(消费方连接器)订阅Offer。
数据提供方审批通过后,双方即刻自动收到合约,合约即通过技术手段保证双方间约定的控制策略。
- XX医疗集团(数据提供方)确认某慢性病院提交的Offer申请是否在安全可控范围内,请参见xx医疗集团(数据提供方)审批Offer。
- 某慢性病院(数据消费方)在收到数据合约后,即可接收资源,并根据双方制定的控制策略安全可控使用数据,具体请参见某慢性病院(数据消费方)接收资源。
前提条件
- 已注册华为账号并开通华为云。
- 已完成企业实名认证。
xx医疗集团开通交换数据空间
- 登录管理控制台,进入购买交换数据空间页面。
- 配置交换数据空间实例基本信息,具体参数说明如表1所示。
表1 参数说明 参数
说明
区域
不同区域的云服务产品之间内网互不相通,目前仅支持华北-北京四。
计费模式
仅支持包年/包月的计费模式。
空间类型
多种空间类型适用于数据交换的不同场景,具体类型如下:
- 内部数据空间:适用于组织内部不同部门间的数据交换,打破部门交换的壁垒。
- 上下游数据空间:适用于上下游组织之间的数据交换,更能保证组织对数据的共享和管控。
该类型的空间允许其他租户和其名下的子用户加入,创建者和他的子用户可以与任何用户进行数据交换,其他租户只允许与创建者和他的子用户进行数据交换,其他租户间无法进行交换。
- 开放数据空间:同一行业的不同组织之间在保障所有权的情况下进行数据的交换,如工业、医疗和电力等行业。
该类型的空间不限制人员加入,不限制人员间的数据交换。购买该类型的数据空间前,需要进行邮件申请,由运营人员审核,审核通过后,方能购买该类型空间,具体请参见申请开放数据空间购买资质。
本示例选择“开放数据空间”。
空间名称
填写实例的名称,根据规划自定义。要求如下:
- 长度范围为1位~64位。
- 名称由中文、英文、数字、下划线(_)和中划线(-)等组成。
- 只能以中文或者英文开头。
本示例命名为“xx医疗集团”。
描述
用户可以根据需要在文本框中输入对该实例的描述信息。
本示例描述为“xx医疗集团向某慢病院共享数据”。
承诺
签署承诺并描述了不同空间类型下数据传输的限制范围。
实例规格
规格分为“基础版”和“专业版”。
- 基础版:适用于中小企业和少量企业间数据交换,支持开通少量连接器,共享带宽。
- 专业版:适用于大型企业多部门之间或行业中多个企业之间数据交换,支持开通大量连接器,专享带宽。
实例规格用户根据需要自定义选择。
- 购买时长用户根据需要自定义选择。
- 勾选“我已阅读《隐私协议》”,单击“立即购买”,界面跳转至“费用中心 > 订单管理 > 我的订单”。
- 确认订单信息无误,单击“去支付”,跳转至支付界面。
- 选择支付方式,确认付款,等待订单状态为“已完成”,交换数据空间实例的创建完成。
购买连接器
- 登录交换数据空间官网。
- 单击“管理控制台”,进入交换数据空间控制台界面。
- 单击“我的空间”,在交换数据空间实例中,选择已审批并成功开通连接器的实例,单击实例卡片上的“连接器”。
- 单击连接器卡片购买连接器,跳转至“购买连接器”界面,具体参数说明如表3所示。
表3 参数说明 参数
说明
区域
不同区域的云服务产品之间内网互不相通,目前仅支持华北-北京四。
计费模式
仅支持包年/包月的计费模式。
连接器规格
规格分为“赠送版”和“基础版”。
- 赠送版:购买交换数据空间实例获得的免费连接器,只有40G的结构化数据存储容量和200G的非机构化数据存储容量,容量无法扩容。只有实例管理员在控制台可购买“赠送版”的连接器。
- 基础版:按需购买,可扩容数据存储容量。
规格用户可以根据需要自定义选择。
连接器名称
填写连接器的名称,根据规划自定义。要求如下:
- 长度范围为1位~36位。
- 名称由中文、英文、数字、下划线(_)和中划线(-)组成。
- 只能以中文或者英文开头。
连接器描述
用户可以根据需要在文本框中输入对该连接器的描述信息。
非结构化数据存储容量
不方便用数据库二维逻辑来表现的数据,如文档、文本、XML和图片等数据。
购买连接器时,首次需购买20G非结构化数据,后续可扩容。
结构化数据存储容量
用关系型数据库来表示和存储的数据,如CSV文件,数据库数据等。
购买连接器时,首次需购买10G结构化数据,后续可扩容。
- 购买“赠送版”的连接器,无需支付,直接开通成功。
- 购买时长用户可以根据需要自定义选择。
- 勾选“我已阅读《隐私协议》”,单击“立即购买”,界面跳转至“费用中心 > 订单管理 > 我的订单”。
- 确认订单信息无误,单击“去支付”,跳转至支付界面。
- 选择支付方式,确认付款,等待订单状态为“已完成”,购买成功。
xx医疗集团(数据提供方)新增资源
- 进入交换数据空间控制台界面,单击“我的空间”,在“xx医疗集团”实例中,单击实例卡片上的“连接器”。
- 单击实例下的“xx医疗集团连接器”,选择界面左侧导航栏中的“数据目录”,选择“我的数据 > 本地接入”单击“新增资源”。
- 在“新增资源”界面中,定义资源,具体的参数说明如表4所示。
表4 参数说明 参数
说明
资源类型
- 文件:非结构化的数据资源,当前支持xlsx,pdf,xls,ppt,pptx,doc,dot,docx,jpeg,jpg,png,gif,bmp等类型文件。每次仅能上传单份数据文件,单次上传文件大小不能超过20MB。该类型的数据在交换时会自动添加水印。
- 数据集:结构化的数据资源,当前支持上传CSV格式的单份数据文件,单次上传数据集大小不能超过20MB。支持上传JDBC类型的数据,每次只能选择一张表的数据上传,单个表大小不超过20GB,单个表最大行数不超过20万行。
资源名称
文件上传后在数据目录展示的名称。要求如下:
- 长度范围为1~100位。
- 名称由中文、英文字母、数字、下划线(_)、中划线(-)和英文括号(())组成。
- 只能以中文或者英文开头。
本示例上传的资源命名为“风湿病患者医疗数据”。
- 定义资源后,添加对应数据。
- 资源类型为文件时,具体的参数说明如表5所示。
表5 参数说明 数据来源
参数
说明
文件上传
新增文件
用户本地上传文件到EDS空间下的连接器。
单击“新增文件”,添加待上传的数据文件后,界面将显示文件的文件名称、类型、大小、状态、上传时间、操作等基本信息。
FTP上传
数据源
FTP数据源,用户从FTP数据库服务器获取数据。如没有FTP数据源,可通过接入数据源接入。
访问路径
FTP服务器中要访问的文件夹的路径,该路径下文件需符合以下规则:
- 该路径下的文件数量包括文件夹不能超过5000个。
- 单个文件的大小不能超过5120MB。
文件名称
上传文件的名称,如不输入,默认上传该路径下所有文件。
OBS上传
数据源
OBS数据源,用户从OBS桶中获取数据。如没有OBS数据源,可通过接入数据源接入。
访问路径
OBS桶中存放文件的路径,该路径下文件需符合以下规则:
- 该路径下的文件数量包括文件夹不能超过5000个。
- 单个文件的大小不能超过5120MB。
文件名称
上传文件的名称,如不输入,默认上传该路径下所有文件。
API
数据源
API数据源,通过调用接口获取数据。
如没有API数据源,可通过接入数据源接入。
入参配置
Params:配置调用接口请求参数。
Headers:配置调用接口请求消息头信息。
Body:配置调用接口请求消息体。
- 资源类型为数据集时,具体的参数说明如表6所示。
表6 参数说明 数据来源
参数
说明
CSV
添加文件
用户本地上传CSV文件到EDS空间下的连接器。
单击“新增文件”,添加待上传的数据文件后,界面将显示文件名称和大小,并展示预览CSV文件数据。
说明:CSV格式的文件表头不可为中文且不能重复。
JDBC
数据源
用户可以选择ORACLE、MYSQL、DWS或MRS_HIVE数据源,从数据库中获取数据。如没有数据源,可通过接入数据源接入。
- 上传Oracle需要上传表所在的schema的只读权限,同时需要赋予该用户DBA_CONSTRAINTS 、DBA_CONS_COLUMNS、DBA_TAB_COLUMNS、DBA_TABLES这四个表的查询权限。
- 上传mysql需要具有数据库的只读权限。
- 上传dws需要上传表所在的schema的只读权限。
- 下载结构化数据到mysql需要数据库的建表(create)和写入(insert)权限,而下载到Oracle和dws需要下载至目标schema的写入(insert)和建表(create)权限。
表
数据库中的表,可通过下拉框选择相应的表数据。
- 资源类型为文件时,具体的参数说明如表5所示。
- (可选)如果您选择的资源类型为数据集且数据来源为JDBC时,可选择是否定时采集数据,具体的参数说明如表7所示。
- 数据添加完成后,单击“确定”,提交上传的数据资源,通过数据目录列表的“传输状态”查看数据上传结果。
xx医疗集团(数据提供方)上架Offer
- 进入交换数据空间控制台界面,单击“我的空间”,在交换数据空间实例中,选择“xx医疗集团”,单击实例卡片上的“连接器”。
- 单击实例下的“xx医疗集团连接器”,选择界面左侧导航栏中的“数据目录”,选择“我的数据 > 本地接入”,选择“我的数据 > 本地接入”,单击“风湿病患者医疗数据”右侧“操作”列的“上架Offer”。
- 在“上架Offer”界面填写基本信息,具体参数说明如表8所示。
- 设置完成后,选择“合约终止策略”,该策略支持数据提供方可提前终止合约,并收回数据,无需消费方同意。
- :关闭合约终止策略,提供方无法提前终止合约。
- :开启合约终止策略,提供方可提前终止合约。
- 检查数据清单内容是否正确。支持用户对数据清单内容增加、清空和查看。
- 增加:数据清单为空时,单击“选择资源”,在弹出的“选择连接器资源”界面选择要上传的数据资源文件。单击“确定”,添加文件。
- 清空:单击“清空”,清空数据清单中的数据资源文件。
- 查看:单击对应数据资源文件右侧的“查看”,查看该数据资源的详细信息,目前仅支持查看Excel格式和PDF格式的数据资源文件。
- 可选:(可选)JDBC类型数据用户可自定义配置字符串类型数据脱敏规则。脱敏规则通过配置前后缀保留位数来对结构化数据中字符串类型指定字段值进行脱敏,如果前后缀均不配置规则,则该字段的值在传输过程中不会进行脱敏。
数据脱敏规则:
- 如果只配置前缀脱敏规则,则只会对前缀进行保留。例如:数据为“交换数据空间”,填写前缀保留位数为1,数据脱敏后内容显示为“交XXXXX”。
- 如果只配置后缀脱敏规则,则只会对后缀进行保留。例如:数据为“交换数据空间”,填写后缀保留位数为2,数据脱敏后内容显示为“XXXX空间”。
- 如果前后缀脱敏均配置,则会对前后缀一起进行保留。例如:数据为“交换数据空间”,填写前缀保留位数为1,填写后缀保留位为2,数据脱敏后内容显示为“交XXX空间”。
- 如果同时配置了前缀和后缀脱敏规则,并且前缀和后缀的保留位数之和超过字段值的长度,则该值将按原样显示。例如,对于值“交换数据空间”,如果前缀中的保留位数为5,后缀中的保留位数为7,则结果为“交换数据空间”。
- 编辑使用策略,相关参数说明如表9所示。
表9 参数说明 参数
说明
可用操作
数据提供方对数据消费方操作数据的限制方法,通过“约束条件”对查看、加工和下载进一步限制。
- 查看:用户可以查看资源文件详细信息。
- 加工:用户可以在预览的时候处理数据资源文件。
- 下载:用户可以通过限制下载次数和限制可用应用将数据资源文件下载到应用所描述的地方。
默认勾选“查看”,可勾选“加工”和“下载”,给数据消费方指定使用规则。
说明:PDF格式文件、图片格式文件和结构化数据不支持勾选加工,其余限制方法皆可使用。Excel格式文件都可以使用。
约束条件
通过When和How many两个方面限制数据消费方对数据的使用。
- When:控制使用的时间,包括起始时间和截止时间。当前支持指定时间区间。若不设置,以系统当前时间为初始时间,默认一个月后为截止时间。
- How many:限制可用操作的次数,默认不输入,则不限制次数。限制不同的操作方法使用的应用。如果暂无可用应用,可前往应用实例注册应用。
可见列名(数据集限定控制策略)
控制使用的数据集列字段的内容,选择数据集列的字段会进行数据交换,不选择的列字段不会进行数据交换。至少选择一个字段。
可见行(数据集限定控制策略)
控制使用的数据集行字段的内容,进行条件设置如大于、大于等于、等于、小于等,再输入值,根据值筛选内容如id=123,会筛选出id=123的数据,进行交换。
- 选择“合约审批策略”,确认数据消费方下载数据衍生物时,是否需要提供方审批。如数据没有开放下载权限,无法选择合约审批策略。
- :关闭合约审批策略,消费方下载数据衍生物无需提供方审批。
- :开启合约审批策略,消费方下载数据衍生物需要提供方审批。
- 选择审批人,即选择Offer上架的审批对象。
审批人选择自己时跳过审批环节,资源直接上架成功。当审批人选择其他用户时,需要走审批流程。
- 选择完成后,单击“确定”,等待审批人审批后,完成上架Offer。
某慢性病院连接器(消费方连接器)订阅Offer
- 进入交换数据空间控制台界面,单击“我的空间”,在交换数据空间实例中,选择“xx医疗集团”,单击实例卡片上的“连接器”。
- 单击实例下的“某慢性病院连接器”,选择界面左侧导航栏中的“数据市场”。
- 在搜索框中输入“风湿病患者医疗数据”,单击跳转到数据Offer列表界面。
- 用户通过选择“创建人”以及“数据提供方”进行进一步筛选。
- 筛选到所需的数据Offer后,单击Offer名称,进入“Offer详情”界面,可查看数据基本信息、使用控制策略和数据列表信息。
- 单击界面右上角“订阅”,在“订阅详情”界面中,编辑使用策略,相关参数说明如表10。输入订阅原因(单击订阅后,才能显示订阅详情)。
表10 参数说明 参数
说明
可用操作
数据提供方对数据消费方操作数据的限制方法,通过“约束条件”对查看、加工和下载进一步限制。
- 查看:用户可以查看资源文件详细信息。
- 加工:用户可以在预览的时候处理数据资源文件。
- 下载:用户可以下载数据资源文件到本地。
消费方无法更改操作数据的限制方法。
约束条件
通过When和How many两个方面限制数据消费方对数据的使用。
- When:控制使用的时间,包括有效期、截止日期、指定区间、指定区间内之间的间隔时间。当前支持指定时间区间。若不设置,以系统当前时间为初始时间,默认一个月后为截止时间。
- How many:首先限制可用操作的次数,默认不输入,则不限制次数。其次限制不同的操作方法使用的应用。
消费方无法更换可用应用。
可见列名(数据集限定控制策略)
不支持消费方更改对列字段的限制。
可见行(数据集限定控制策略)
不支持消费方更改对行字段的限制。
订阅Offer时,数据消费方可以在数据上架Offer时提供的使用控制策略上申请新的策略,覆盖提供方的策略。目前仅支持申请“可用次数”和“可用期限”。
- 输入完成后,单击“确定”,等待数据提供方审批。用户可在“工作台”的“任务清单”中选择“查看我的申请”页签查看申请任务的状态。
Offer列表的每个Offer卡片标注了受控和公开标签,卡片右下角会显示订阅、查看和收藏的数量,同时卡片提供了收藏功能。
xx医疗集团(数据提供方)审批Offer
- 进入交换数据空间控制台界面,单击“我的空间”,在交换数据空间实例中,选择“xx医疗集团”,单击实例卡片上的“连接器”。
- 单击实例下的“xx医疗集团连接器”,选择界面左侧导航栏中的“工作台”,进入“连接器”界面。
- 在界面下方选择“我的待办”页签,选择某慢性病院连接器的“订阅请求”任务,单击“操作”列的“审批”。
- 在“订阅请求详情”界面中,确认任务的基本信息,确认无误后单击“通过”。
- 在弹出的“生成合约”对话框中,设置合约基本信息,相关参数说明如表11所示。
- 设置完成后,单击“提交”,完成订阅请求审批。