中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    大数据数据质量 更多内容
  • 数据实施质量检查

    数据实施质量检查 实施质量检查包含数据实例实施过程中的工具,旨在帮助客户在进行数据治理过程中,能够更好地监控实施过程中的质量,包含数据模型设计、源系统和SDI层数据一致性检测、数据平台检测、脚本规范检测、 DataArts Studio 命名规范检测和作业监控。 表1 实施质量检查功能介绍

    来自:帮助中心

    查看更多 →

  • 获取质量报告业务报告数据

    获取质量报告业务报告数据 功能介绍 获取质量报告业务报告数据。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/quality/report/business/scores 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是

    来自:帮助中心

    查看更多 →

  • 获取质量报告技术报告数据

    String 数据连接名称。 database_name String 数据库名称。 table_name String 数据表名名称。 data_connection_score Double 数据连接评分。 database_score Double 数据库评分。 table_score

    来自:帮助中心

    查看更多 →

  • 新建数据质量规则

    新建数据质量规则 数据质量支持对离线数据的监控,质量规则是数据质量的核心。DataArts Studio系统内置的模板规则共计34种,分为库级规则、表级规则、字段级规则和跨字段级规则、跨源级规则等规则类型,如表1所示。 表1 系统内置的规则模板一览表 规则类型 维度 模板名称 适用引擎

    来自:帮助中心

    查看更多 →

  • 通过数据质量对比数据迁移前后结果

    通过数据质量对比数据迁移前后结果 数据对账对数据迁移流程中的数据一致性至关重要,数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。 本章以DWS数据迁移到 MRS Hive分区表为例,介绍如何通过DataArts Studio中的数据质量模块实现数据迁移前后的一致性校验。

    来自:帮助中心

    查看更多 →

  • 数据开发调用数据质量算子并且作业运行的时候需要传入质量参数

    数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 由于数据质量作业在执行SQL语句时不支持传参,通过数据开发调用数据质量算子,运行的时候可以把数据质量作业的参数传递给数据质量算子作业,实现数据质量的参数传递。 使用场景 数据质量需要传递参数到数据质量算子作业里面并且能够正常运行。

    来自:帮助中心

    查看更多 →

  • 创建数据质量任务时,怎么选不出数据实体?

    创建数据质量任务时,怎么选不出数据实体? 可能原因 数据实体未创建单数据实体属性约束规则。 处理方法 选择“模型设计 > 数据模型管理”,进入数据实体页面。 单击对应实体“编码”链接进入实体详情页,切换到“单数据实体属性约束规则”。 新增检查规则后,即可在质量检查任务中选到对应实体。

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • 大容量数据库

    容量数据容量数据库背景介绍 表分区技术 数据分区查找优化 数据分区运维管理 父主题: 分区表

    来自:帮助中心

    查看更多 →

  • 数据质量运维管理操作处理&记录

    数据质量运维管理操作处理&记录 功能介绍 该接口用于数据质量监控实例的问题处理,在控制台上可通过“更多>处理&记录”进入问题处理界面。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/quality/instances/{instance_id}

    来自:帮助中心

    查看更多 →

  • 数据架构中的指标与数据质量的指标的区别?

    数据架构中的指标与数据质量的指标的区别? 问题描述 数据架构中的指标与数据质量的指标的区别,需要具体说明一下,便于用户理解。 解决方案 数据架构中指标侧重业务维度,用来衡量目标总体特征的统计数值;数据质量中指标侧重监控维度,用来管理所有业务指标,包括指标的来源、定义等。 注意,数

    来自:帮助中心

    查看更多 →

  • 快速搭建数据大屏

    示。 图11 屏效果 单击右上角右“保存”,输入屏的名称,单击“确定”,屏保存成功。 步骤5:管理屏 切换屏发布状态 在控制台右侧“我的项目”单击项目名称,进入项目页面。 单击“数据分析 > 屏”,进入屏页面。 单击屏名称,进入屏编辑页面。 发布屏:单击页面右上角“保存并发布”,大屏发布成功。

    来自:帮助中心

    查看更多 →

  • 使用数据工程构建NLP大模型数据集

    使用数据工程构建NLP模型数据集 NLP模型支持接入的数据集类型 盘古NLP模型仅支持接入文本类数据集,该数据集格式要求请参见文本类数据集格式要求。 构建NLP模型所需数据量 使用数据工程构建盘古NLP模型数据集进行模型训练时,所需数据量见表1。 表1 构建NLP模型所需数据量

    来自:帮助中心

    查看更多 →

  • 数据量和质量均满足要求,为什么盘古大模型微调效果不好

    数据量和质量均满足要求,为什么盘古模型微调效果不好 这种情况可能是由于以下原因导致的,建议您排查: 训练参数设置:您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题,这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或

    来自:帮助中心

    查看更多 →

  • 质量建模

    质量建模 质检项 功能概述:该模块主要是对质检项进行管理,主要功能包括新增、编辑、删除、复制、查询质检项。 操作人员:系统管理人员。 路径:质量建模→质检项 。 图1 质检项 质检模板 功能概述:该模块主要是对质检模板进行管理,主要功能包括新增、编辑、删除、复制、查看、查询质检模板。

    来自:帮助中心

    查看更多 →

  • 查询CDN上行推流质量数据接口

    查询CDN上行推流质量数据接口 功能介绍 查询CDN上行推流质量数据。 最大查询跨度1天,最大查询周期7天。 返回的CDN上行推流质量数据列表粒度为1分钟。 接口约束 该接口暂只支持查询部署在新版视频直播服务上的 域名 的相关数据(不包含“华北-北京一”)。此约束条件仅适用于中国站。

    来自:帮助中心

    查看更多 →

  • 大容量数据库背景介绍

    子问题的解的合并。对于容量数据场景,数据库提供对数据进行“分治处理”的方式即分区,将逻辑数据库或其组成元素划分为不同的独立部分,每一个分区维护逻辑上存在相类似属性的数据,这样就把庞大的数据整体进行了切分,有利于数据的管理、查找和维护。 父主题: 容量数据

    来自:帮助中心

    查看更多 →

  • 使用数据工程构建科学计算大模型数据集

    使用数据工程构建科学计算模型数据集 科学计算模型支持接入的数据集类型 盘古科学计算模型仅支持接入气象类数据集,该数据集格式要求请参见气象类数据集格式要求。 构建科学计算模型训练数据要求 构建科学计算模型进行训练的数据要求见表1。 表1 科学计算模型训练数据要求 模型类别

    来自:帮助中心

    查看更多 →

  • 获取大屏指定组件数据

    获取屏指定组件数据 功能介绍 获取屏指定组件数据。 URI POST /v1/{project_id}/screens/{screen_id}/query-data 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法请参考获取项目ID。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了