数据准备
数据准备
- 以下数据和表结构是根据场景进行模拟的数据,并非真实数据。
- 以下数据需要提前存导入到MySQL\Hive\Oracle等用户所属数据源中,TICS本身不会持有这些数据,这些数据会通过用户购买的计算节点进行加密计算,保障数据安全。
- 政府信息提供方的数据tax和support,在用户计算节点agent_gov上发布。
- 能源信息提供方的数据power,在用户计算节点agent_power上发布。
列名 |
含义 |
字段分类 |
---|---|---|
Id |
企业id |
唯一标识 |
tax_bal |
税收 |
敏感 |
Industry |
行业类型 |
不敏感 |
列名 |
含义 |
字段分类 |
---|---|---|
Id |
企业id |
唯一标识 |
supp_bal |
资助金的金额 |
敏感 |
Industry |
行业类型 |
不敏感 |
列名 |
含义 |
字段分类 |
---|---|---|
Id |
企业id |
唯一标识 |
electric_bal |
电费 |
敏感 |
water_bal |
水费 |
敏感 |
从业务角度考虑,安排五个阶段,来对TICS系统进行验证和测试。本章重点讲述如何端到端实现一个该场景下的隐私计算作业完整执行流程。
导入数据
- 在第一个合作方Partner1的MySQL数据源中,通过如下的SQL语句创建数据表:
CREATE TABLE tax ( id integer COMMENT '企业id' , tax_bal integer COMMENT '税收金额' , industry varchar(150) COMMENT '行业' );
CREATE TABLE support ( id integer COMMENT '企业id' , supp_bal integer COMMENT '资助金额', industry varchar(150) COMMENT '行业' );
- 在第二个合作方Partner2的MySQL数据源中,通过如下的SQL语句创建数据表:
CREATE TABLE power ( id integer COMMENT '企业id' , electric_bal integer COMMENT '电费', water_bal integer COMMENT '水费' );
- 将下面的数据分别导入csv文件并上传到MySQL数据源所在服务器。
- Tax表的数据如下:
id,tax_bal,industry 123400999,745,互联网 123400998,324,其他 123400997,664,其他 123400996,243,金融 123400995,715,互联网 123400994,475,通讯 123400993,526,其他 123400992,272,互联网 123400991,646,金融 123400990,510,其他
- Support表的数据如下:
id,supp_bal,industry 123400999,314,互联网 123400998,405,其他 123400997,371,其他 123400996,484,金融 123400995,381,互联网 123400994,405,通讯 123400993,292,其他 123400992,503,互联网 123400991,303,金融 123400990,412,其他
- Power表的数据如下:
id,electric_bal,water_bal 123400999,79,48 123400998,57,70 123400997,69,37 123400996,50,57 123400995,66,50 123400994,56,55 123400993,63,53 123400992,45,76 123400991,80,36 123400990,39,63
- Tax表的数据如下:
- 执行如下SQL语句,将csv文件内的数据导入创建的数据表。
LOAD DATA INFILE 'csv数据文件名' INTO TABLE 表名
或者执行如下的插入语句:
- Tax表:
insert into tax values (123400999,745,'互联网'), (123400998,324,'其他' ), (123400997,664,'其他' ), (123400996,243,'金融' ), (123400995,715,'互联网' ), (123400994,475,'通讯' ), (123400993,526,'其他'), (123400992,272,'互联网' ), (123400991,646,'金融' ), (123400990,510,'其他');
- Support表:
insert into support values (123400999,314,'互联网' ), (123400998,405,'其他' ), (123400997,371,'其他' ), (123400996,484,'金融' ), (123400995,381,'互联网' ), (123400994,405,'通讯' ), (123400993,292,'其他' ), (123400992,503,'互联网' ), (123400991,303,'金融' ), (123400990,412,'其他');
- Power表:
insert into power values (123400999,79,48), (123400998,57,70), (123400997,69,37), (123400996,50,57), (123400995,66,50 ), (123400994,56,55), (123400993,63,53), (123400992,45,76), (123400991,80,36), (123400990,39,63);
- Tax表: