可信智能计算服务 TICS
可信智能计算服务 TICS
- 最新动态
- 功能总览
- 产品介绍
- 快速入门
- 用户指南
- 最佳实践
- 开发指南
- API参考
-
常见问题
- 什么是区域和可用区?
- 什么是项目?
- 什么是配额?
- 一个CCE集群可以为同一用户的多个空间使用吗?
- 节点的可用资源如何查询?
- 合作方如何获取租户名称?
- 计算节点如何切换状态?
- 部署计算节点时,“状态”列长时间显示为“部署中”(超过20分钟),如何查看计算节点部署情况?
- 运行作业前,提示“Privacy rule verification failed”,怎么处理?
- 运行作业时,提示存在数据泄露风险,怎么处理?
- 为什么空间详情中“作业执行统计”实例数与空间作业中实例数统计不一致?
- 执行分析作业时,提示“节点内存不足,已拒绝在节点中运行该任务”,如何解决?
- 为什么我的计算结果每次计算时结果都不一样?
- 执行作业时,提示“启动新任务失败,服务器任务队列超出缓存长度”,如何解决?
- 联邦sql分析作业运行过慢,如何提升执行速度?
- 可信计算节点发生主备切换,原节点登录地址不可用,如何处理?
- 如何创建及查找sfs_turbo文件系统的ID?
- 如何确认在跨VPC的情况下计算节点与SFS_Turbo文件系统连通性
- 如何排查可信环境互信状态
- 边缘节点部署模式下创建节点,该如何配置资源分配策略?
- 创建数据集时,不允许使用哪些名字?
- 如何更换计算节点db私钥?
- 如何修改结果文件的权限?
- 执行联邦学习作业时,报“ERROR UNAVAILABLE:Network closed for unknown reason”,如何解决?
- 文档下载
- 通用参考
本文导读
展开导读
链接复制成功!
数据准备
乳腺癌数据集从UCI获取,该数据集只包含连续类型特征,因此对所有特征使用Scikit-Learn的StandardScaler进行了归一化。为了模拟横向联邦学习场景,将数据集随机划分为三个大小类似的部分:(1)xx医院的训练集;(2)其他机构的训练集;(3)独立的测试集,用于准确评估横向联邦学习得到的模型准确率。此外由于原始的数据集较小,采用了Imbalanced-Learn中的SMOTE算法,进行了数据集的扩充。下表为扩充过后的数据集统计信息。
乳腺癌数据集统计信息。
统计量 |
取值 |
---|---|
特征数目 |
30 |
xx医院的训练样本数目 |
7366 |
其他机构的训练样本数目 |
7366 |
测试集样本数目 |
7257 |
操作步骤
- 进入TICS服务控制台。
- 在计算节点管理中,找到购买的计算节点,通过登录地址,进入计算节点控制台。
图1 前往计算节点
- 登录到计算节点后,进入数据管理并进行数据集发布。
图2 数据管理中新建数据集
- 参考下图填写参数信息。(1)指定连接器为localConnector,选择数据文件的路径,填写数据名称;(2)字段配置中特征字段(x_{特征序号})均配置为字段类型:FLOAT,字段类别:特征,特征类型:连续;标签字段(label)配置为字段类型:INTEGER,字段类别:标签。
图3 配置数据集参数
- 发布数据集。
图4 发布数据集
说明:
数据集发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。
父主题: 测试步骤