可信智能计算服务 TICS
可信智能计算服务 TICS
- 最新动态
- 功能总览
- 产品介绍
- 快速入门
- 用户指南
- 最佳实践
- 开发指南
- API参考
-
常见问题
- 什么是区域和可用区?
- 什么是项目?
- 什么是配额?
- 一个CCE集群可以为同一用户的多个空间使用吗?
- 节点的可用资源如何查询?
- 合作方如何获取租户名称?
- 计算节点如何切换状态?
- 部署计算节点时,“状态”列长时间显示为“部署中”(超过20分钟),如何查看计算节点部署情况?
- 运行作业前,提示“Privacy rule verification failed”,怎么处理?
- 运行作业时,提示存在数据泄露风险,怎么处理?
- 为什么空间详情中“作业执行统计”实例数与空间作业中实例数统计不一致?
- 执行分析作业时,提示“节点内存不足,已拒绝在节点中运行该任务”,如何解决?
- 为什么我的计算结果每次计算时结果都不一样?
- 执行作业时,提示“启动新任务失败,服务器任务队列超出缓存长度”,如何解决?
- 联邦sql分析作业运行过慢,如何提升执行速度?
- 可信计算节点发生主备切换,原节点登录地址不可用,如何处理?
- 如何创建及查找sfs_turbo文件系统的ID?
- 如何确认在跨VPC的情况下计算节点与SFS_Turbo文件系统连通性
- 如何排查可信环境互信状态
- 边缘节点部署模式下创建节点,该如何配置资源分配策略?
- 创建数据集时,不允许使用哪些名字?
- 如何更换计算节点db私钥?
- 如何修改结果文件的权限?
- 执行联邦学习作业时,报“ERROR UNAVAILABLE:Network closed for unknown reason”,如何解决?
- 文档下载
- 通用参考
本文导读
展开导读
链接复制成功!
准备数据
企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。
字段名称 |
字段类型 |
描述 |
---|---|---|
id |
string |
hash过后的手机号字符串 |
col0-col4 |
float |
企业A数据特征 |
industry_predict.csv
id,col0,col1,col2,col3,col4 4e07408562bedb8b60ce05c1decfe3ad16b72230967de01f640b7e4729b49fce,-0.823913755,0.787712038,0.429635596,-1.315646486,-1.652321611 2c624232cdd221771294dfbb310aca000a0df6ac8b66b696d90ef06fdefb64a3,3.041881096,-0.651684341,3.661649955,0.035548734,3.477873904 8527a891e224136950ff32ca212b45bc93f69fbb801c3b1ebedac52775f99e61,0.162210842,0.177167621,4.553682264,-1.103220799,2.375621631
注意由于这是新产生的业务数据,企业A并不知道这些用户是否是高价值用户,因此没有label用户标签字段。
字段名称 |
字段类型 |
描述 |
---|---|---|
id |
string |
hash过后的手机号字符串 |
f0-f4 |
float |
大数据厂商数据特征 |
bigdata_all.csv
id,f0,f1,f2,f3,f4 5feceb66ffc86f38d952786c6d696c79c2dbc239dd4e91b46729d73a27fb57e9,-0.246852445,-1.761531756,-2.840375975,-0.562750693,-2.23499737 6b86b273ff34fce19d6b804eff5a3f5747ada4eaa22f1d49c01e52ddb7875b4b,-1.216062821,-1.093614452,-1.632396806,0.887601314,-4.40930101 4e07408562bedb8b60ce05c1decfe3ad16b72230967de01f640b7e4729b49fce,-0.150047899,-1.323266508,3.01679156,1.728583156,0.656158732 4b227777d4dd1fc61c6f884f48641d02b4d121d3fd328cb08b5531fcacdabf8a,-0.333871414,-1.21968931,-0.082894791,0.020390259,-0.076884947 ef2d127de37b942baad06145e54b0c619a1f22327b2ebbcfbec78f5564afe39d,-2.438861166,0.111880807,-3.51428545,1.123004835,0.228893969 e7f6c011776e8db7cd330b54174fd76f7d0216b612387a5ffcfb81e6f0919683,-2.759963795,0.405262468,1.264947591,1.027350049,1.293868423 7902699be42c8a8e46fbbb4501726517e86b22c56a189f7625a6da49081b2451,0.189352371,-0.607297495,-0.808339321,2.048455567,1.303872778 2c624232cdd221771294dfbb310aca000a0df6ac8b66b696d90ef06fdefb64a3,0.390064223,0.664175034,3.20228741,0.380574513,0.017733811 19581e27de7ced00ff1ce50b2047e7a567c76b1cbaebabe5ef03f7c3017bb5b7,0.379250902,1.962293246,0.066277661,3.083228267,1.952626328 4a44dc15364204a80fe80e9039455cc1608281820fe2b24f1e5233ade6af1dd5,-0.070919538,-2.219653517,1.461645551,1.66185096,0.778770954 4fc82b26aecb47d2868c4efbe3581732a3e7cbcc6c2efb32062c08170a05eeb8,-0.771151327,-1.184821181,-0.674077615,-0.379858223,0.158957184 6b51d431df5d7f141cbececcf79edf3dd861c3b4069f0b11661a3eefacbba918,-0.738091802,-1.474822882,2.93475295,-3.763763721,-1.817301398 3fdba35f04dc8c462986c992bcf875546257113072a909c162f7e470e581e278,-0.483250226,0.616586578,3.001851708,2.407914633,0.856369412 8527a891e224136950ff32ca212b45bc93f69fbb801c3b1ebedac52775f99e61,-0.789268594,1.071733834,3.763254446,-3.760298263,0.49776472 e629fa6598d732768f7c726b4b621285f9c3b85303900aa912017db7617d8bdb,-0.372531118,1.559382514,2.403559204,-0.041093457,0.169341125 b17ef6d19c7a5b1ee83b907c595526dcb1eb06db8227d650d5dda0a9f4ce8cd9,-2.773477116,-1.137653133,-1.50133841,0.82842642,-1.25476711 4523540f1504cd17100c4835e85b7eefd49911580f8efff0599a8f283be6b9e3,-1.542814756,1.019110477,1.395515599,0.539956076,0.100325065 4ec9599fc203d176a301536c2e091a19bc852759b255bd6818810a42c5fed14a,0.024227451,-1.087235302,3.67470964,-2.420729037,-3.132456573
其中为了保证数据安全,企业A和大数据厂商B通过讨论决定使用hash过后的手机号作为已有数据的唯一标识id字段,并将唯一标识作为数据对齐的依据。
父主题: 使用TICS联邦预测进行新数据离线预测