中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    沪深300大数据 更多内容
  • 准备数据

    基于已设计好的热轧钢板表面缺陷标签准备图片数据。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example │ IMG_20180919_114732

    来自:帮助中心

    查看更多 →

  • 准备数据

    “编码”选择“UTF-8”格式。 以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 文本数据至少包含2个及以上的标签。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 多语种文本分类工作流仅支持对单语种的文本

    来自:帮助中心

    查看更多 →

  • 准备数据

    不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 数据集样本数应大于100,用于测试的已标注数据应不少于20张,样本数达1万张以上性能更优。 为了准确率,建议数据集中标注数据占总数

    来自:帮助中心

    查看更多 →

  • 选择数据

    新建训练数据集 在“数据选择”页面,单击“新建训练数据集”,右侧弹出“新建数据集”页面,根据数据存储位置和数据标注情况,按表1填写数据集基本信息,然后单击“确定”。 图3 新建训练数据集 表1 新建训练数据集参数说明 参数 说明 数据集名称 待新建的数据集名称。 描述 数据集简要描述。

    来自:帮助中心

    查看更多 →

  • 数据调度

    导出:勾选列表订单批量导出,不勾选默认为当前页面所有订单 刷新:刷新页面订单的最新数据。 搜索:支持任务ID条件搜索,可以模糊搜索或者精确条件 列表订单操作:维护集成任务订单,操作字段可以查看历史调度,操作日志数据。并且集成任务部署完成了之后,可以手工操作执行调度,输入调度参数 图3 列表订单操作

    来自:帮助中心

    查看更多 →

  • 数据全景

    技术资产详情 逻辑实体详情:展示所选业务资产名的业务对象、数据分布、属性、数据评论等详细信息;通过单击下钻查看对应的技术资产详情和样例数据。 图4 逻辑实体详情 样例数据:展示所选逻辑实体中对应数据表的样例数据 图5 样例数据数据列表:由数据全景首页,搜索栏下方的主题域分组进入,展示各主

    来自:帮助中心

    查看更多 →

  • 数据质检

    数据质检 数据质检主要是将库中错误数据检测出来,与治理流程的清洗定义中的过滤规则不同的是,独立质检是将不规范的数据检测出来,并不改变质检表的数据,治理流程中的过滤规则是将不符合规范的数据过滤掉,改变质检表的数据。检测出错误数据后,可以查看错误数据原因、导出错误数据到 excel

    来自:帮助中心

    查看更多 →

  • 数据开发

    数据开发 项目创建 数据开发项目需为开发环境和生产环境配置数据鉴权模式,选择计算资源组,同时可以指定运行账号及运行队列。 图1 项目创建 离线任务开发 离线数据开发支持 HiveSQL、ImpalaSQL、SparkSQL、Python、Shell、Jar、Spark 等任务类型。

    来自:帮助中心

    查看更多 →

  • 管理数据

    管理数据数据管理中查看HDMI技能的数据时,为什么没有任何数据输出? 如何配置数据存储位置(OBS存储路径)? HDMI输出黑屏或者卡住是什么原因? 是否可以将HiLens Kit摄像头拍摄的画面或者技能运行结果录成视频保存下来? 如何不通过HDMI,使用其他方式输出技能结果?

    来自:帮助中心

    查看更多 →

  • 数据标准

    据标准关联到各个业务上的数据库中。其中,标识符、数据类型、表示格式、值域是数据交换的基础,它们用于描述表的字段元信息,规范字段所存储的数据信息。 进入规范设计单击左侧数据标准菜单,进入数据标准。 图1 数据标准1 为数据标准建立目录分类,用于存放相应的数据标准。单击左侧的加号,输入目录名称,单击保存即可。

    来自:帮助中心

    查看更多 →

  • 数据调研

    表注释 更新周期 数据是否存在物理删除 主键 新增数据时间戳 更新时间戳 总体记录数量(条) 月均增量(条) 数据表所属业务系统 表名称 中文注释 日周月年 从数据库表中彻底删除 主键字段说明 数据新增的时间戳字段 数据同步机制为增量的需填写,提供时间戳字段 总数据记录条数 根据历年数据增量计算平均值

    来自:帮助中心

    查看更多 →

  • 数据质量

    数据质量 数据质量监控 数据质量管理围绕着数据从产生要销毁的全生命周期,共分为事前防范、事中监控与事后治理三个阶段。事前防范即依照数据标准对业务源端数据产生的过程进行约束,规避问题数据的产生,同时对已发现的存量数据问题进行修正,从而规避由于数据质量问题导致的后续数据使用异常。在数

    来自:帮助中心

    查看更多 →

  • 基础数据

    用/启用字典项,上移/下移字典项。 数据字典:指对数据数据项、数据结构、数据流、数据存储、处理逻辑等进行定义和描述,简而言之,数据字典是描述数据的信息集合,是对系统中使用的所有数据元素的定义的集合。 操作人员:系统管理人员。 路径:基础数据→字典管理。 图7 字典管理 计量单位

    来自:帮助中心

    查看更多 →

  • 下载数据

    下载数据 使用download命令将 EIHealth 平台的数据下载到本地,此命令不支持下载引用项目中的数据数据在下载的过程中,受网络影响可能出现损坏,下载命令默认会在下载完成后,验证项目中数据的MD5值与本地数据的MD5值的一致性,以及验证项目中数据的大小与本地数据大小一致性。

    来自:帮助中心

    查看更多 →

  • 数据导入

    数据导入 使用import命令引用数据到当前所在项目或者导入网上数据。 命令结构 health import data <src-dir> <dest-dir> [flags] 表1 参数说明 参数 简写 是否必选 说明 src-dir 无 是 源路径,支持四种格式,分别是医疗项

    来自:帮助中心

    查看更多 →

  • 下载数据

    下载数据 在EIHealth平台下载数据 下载数据操作会产生流量费用,计费方式为按需计费,计费详情请参考OBS数据下载费用。 以下操作步骤是在“数据”页面下载数据至本地。您也可以使用命令行工具实现数据的下载。 在EIHealth平台“项目 > 数据”页面,展开数据文件夹,选择待下载的数据。

    来自:帮助中心

    查看更多 →

  • 数据规划

    数据规划 网络规划 SAP HANA节点规划 SAP应用节点规划 其他节点规划 父主题: 开发系统和测试系统部署

    来自:帮助中心

    查看更多 →

  • 数据总览

    数据总览 您可以定期查看机器人的统计数据和运营数据,并根据数据情况提出解决方案,如补充知识库、管理词典等措施,来提升 对话机器人 的体验效果。当前 对话机器人服务 提供了数据总览功能方便用户查看问答数据数据总览界面入口: 进入对话机器人服务管理控制台,在左侧菜单栏中选择“智能问答机器

    来自:帮助中心

    查看更多 →

  • 数据总览

    数据总览 表1 数据总览权限 权限 对应API接口 授权项(Action) IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据服务总览 GET /v1.0/{project_id}/data/overview octopus:dataOverview:get

    来自:帮助中心

    查看更多 →

  • 数据导入

    数据导入 表1 数据导入权限 权限 对应API接口 授权项(Action) IAM项目 (Project) 企业项目 (Enterprise Project) 获取导入任务列表 GET /v1.0/{project_id}/data/import-records octopus:

    来自:帮助中心

    查看更多 →

  • 数据回放

    数据回放 获取数据片段统计 获取数据片段列表 数据片段详情 获取数据包topic回放索引 获取数据包topic回放数据临时链接 创建回放转仿真场景作业 查询回放转仿真场景作业状态 父主题: API

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了