更新时间:2024-11-12 GMT+08:00
分享

简介

背景信息

本案例以“小微企业信用评分”的场景为例。 社保、水电气和资助金等数据统一存储在某政务云,由不同的局进行管理,机构想单独申请进行企业相关评分的计算会非常困难。 因此可以由市政数局出面,统一制定隐私规则,审批数据提供方的数据使用申请, 并通过华为TICS可信智能计算平台进行安全计算。

图1 企业信用评估应用场景示意图

数据准备

  • 以下数据和表结构是根据场景进行模拟的数据,并非真实数据。
  • 以下数据需要提前存导入到MySQL\Hive\Oracle等用户所属数据源中,TICS本身不会持有这些数据,这些数据会通过用户购买的计算节点进行加密计算,保障数据安全。
  • 政府信息提供方的数据tax和support,在用户计算节点agent_gov上发布。
  • 能源信息提供方的数据power,在用户计算节点agent_power上发布。
表1 企业税收和资助金情况表tax

列名

含义

字段分类

Id

企业id

唯一标识

tax_bal

税收

敏感

Industry

行业类型

不敏感

表2 企业政府资助金数据表support

列名

含义

字段分类

Id

企业id

唯一标识

supp_bal

资助金的金额

敏感

Industry

行业类型

不敏感

表3 企业水电情况表power

列名

含义

字段分类

Id

企业id

唯一标识

electric_bal

电费

敏感

water_bal

水费

敏感

从业务角度考虑,安排五个阶段,来对TICS系统进行验证和测试。本章重点讲述如何端到端实现一个该场景下的隐私计算作业完整执行流程。

导入数据

  1. 在第一个合作方Partner1的MySQL数据源中,通过如下的SQL语句创建数据表:

    CREATE TABLE tax (
             id integer COMMENT '企业id' , 
             tax_bal integer COMMENT '税收金额' , 
             industry varchar(150) COMMENT '行业' 
    );
    CREATE TABLE support (
             id integer COMMENT '企业id' , 
             supp_bal integer COMMENT '资助金额',
             industry varchar(150) COMMENT '行业'
    );

  2. 在第二个合作方Partner2的MySQL数据源中,通过如下的SQL语句创建数据表:

    CREATE TABLE power (
             id integer COMMENT '企业id' , 
             electric_bal integer COMMENT '电费',
             water_bal integer COMMENT '水费'
    );

  3. 将下面的数据分别导入csv文件并上传到MySQL数据源所在服务器。

    • Tax表的数据如下:
      id,tax_bal,industry
      123400999,745,互联网
      123400998,324,其他
      123400997,664,其他
      123400996,243,金融
      123400995,715,互联网
      123400994,475,通讯
      123400993,526,其他
      123400992,272,互联网
      123400991,646,金融
      123400990,510,其他
    • Support表的数据如下:
      id,supp_bal,industry
      123400999,314,互联网
      123400998,405,其他
      123400997,371,其他
      123400996,484,金融
      123400995,381,互联网
      123400994,405,通讯
      123400993,292,其他
      123400992,503,互联网
      123400991,303,金融
      123400990,412,其他
    • Power表的数据如下:
      id,electric_bal,water_bal
      123400999,79,48
      123400998,57,70
      123400997,69,37
      123400996,50,57
      123400995,66,50
      123400994,56,55
      123400993,63,53
      123400992,45,76
      123400991,80,36
      123400990,39,63

  4. 执行如下SQL语句,将csv文件内的数据导入创建的数据表。

    LOAD DATA INFILE 'csv数据文件名' INTO TABLE 表名

    或者执行如下的插入语句:

    • Tax表:
      insert into tax values 
      (123400999,745,'互联网'), 
      (123400998,324,'其他' ), 
      (123400997,664,'其他' ), 
      (123400996,243,'金融' ), 
      (123400995,715,'互联网' ), 
      (123400994,475,'通讯' ), 
      (123400993,526,'其他'), 
      (123400992,272,'互联网' ), 
      (123400991,646,'金融' ), 
      (123400990,510,'其他');
    • Support表:
      insert into support values 
      (123400999,314,'互联网' ), 
      (123400998,405,'其他' ), 
      (123400997,371,'其他' ), 
      (123400996,484,'金融' ), 
      (123400995,381,'互联网' ), 
      (123400994,405,'通讯' ), 
      (123400993,292,'其他' ), 
      (123400992,503,'互联网' ), 
      (123400991,303,'金融' ), 
      (123400990,412,'其他');
    • Power表:
      insert into power values 
      (123400999,79,48), 
      (123400998,57,70), 
      (123400997,69,37), 
      (123400996,50,57), 
      (123400995,66,50 ),
      (123400994,56,55), 
      (123400993,63,53), 
      (123400992,45,76), 
      (123400991,80,36), 
      (123400990,39,63);

相关文档