中软国际数据治理专业服务解决方案实践

中软国际数据治理专业服务解决方案实践

    数据并行处理 更多内容
  • 数据控制与数据审计

    数据控制与数据审计 数据保护策略 项目内的数据支持精细化的权限控制,可对数据分享、下载、删除进行设置。您可以在项目的“设置”页面设置数据权限。数据权限仅可以有项目所有者设置。 分享:关闭分享后,项目内数据不允许分享给其他项目,包括拷贝、引用两种方式。 下载:关闭下载后,项目内数据不允许下载至本地。

    来自:帮助中心

    查看更多 →

  • Impala客户端使用实践

    xxx.xxx.xxx:21000。要自动连接到特定的Impala数据库,请使用-d <database>选项。例如,如果您的所有Kudu表都位于数据库“impala_kudu”中,则-d impala_kudu可以使用此数据库。要退出Impala Shell,请使用quit命令。 根

    来自:帮助中心

    查看更多 →

  • 数据聚合

    数据聚合 算子简介 名称: 数据聚合 功能说明: 数据聚合算子,将数据按窗口周期进行汇聚计算,以达到规约数据的目的。 约束:下游不允许对接数据源及产品过滤算子。 算子配置 基础配置项 算子名称: 配置项英文名:name 说明: 算子名称,对算子进行个性化的命名,以辅助增加可读性。

    来自:帮助中心

    查看更多 →

  • 绘制组合片段

    片段重复一定次数,可以在临界中指示片段重复的条件。 break 中断 如果执行此片段,则放弃序列的其余部分。 可以使用临界来指示发生中断的条件。 par 并行 并行处理。 片段中的事件可以交错。 critical 关键 用在 Par 或 Seq 片段中。 指示此片段中的消息不能与其他消息交错。 seq 弱顺序

    来自:帮助中心

    查看更多 →

  • HMaster等待NameSpace表上线时超时退出

    timeout”(默认为3600000ms) 通过RegionServer worker增加并行split任务执行数,保证RegionServer worker能并行处理split work(RegionServer需要有更多的核心)。在“客户端安装路径/HBase/hbase/conf/hbase-site

    来自:帮助中心

    查看更多 →

  • HMaster等待NameSpace表上线时超时退出

    timeout”(默认为3600000ms) 通过RegionServer worker增加并行split任务执行数,保证RegionServer worker能并行处理split work(RegionServer需要有更多的核心)。在“客户端安装路径/HBase/hbase/conf/hbase-site

    来自:帮助中心

    查看更多 →

  • 数据提取作业(数据集)

    数据提取作业(数据集) 作业输入输出规范 示例代码 构建镜像 父主题: 算子示例

    来自:帮助中心

    查看更多 →

  • 查询数据集监控数据

    查询数据集监控数据 功能介绍 查询数据集在指定时间范围内的监控数据。 调试 您可以在 API Explorer 中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/dat

    来自:帮助中心

    查看更多 →

  • 数据源元数据获取

    数据源元数据获取 获取数据库列表 获取schemas 获取数据源中的表 获取数据源中表的字段 父主题: 管理中心API

    来自:帮助中心

    查看更多 →

  • 数据探索

    数据探索 什么是数据探索? 什么样的用户可以使用数据探索? 为什么别人可以看到HDFS数据源,我却看不到? 为什么在HIVE数据源中,我只能看到少量的表,有的表也只能看到部分字段? 数据探索支持跨不同数据源关联数据么? 什么是异步任务?什么场景下会触发异步任务? 什么是模板?什么时候使用模板?

    来自:帮助中心

    查看更多 →

  • 数据规划

    华为云帮助中心,为用户提供产品简介、价格说明、购买指南、用户指南、API参考、最佳实践、常见问题、视频帮助等技术文档,帮助您快速上手使用华为云服务。

    来自:帮助中心

    查看更多 →

  • 数据合并

    数据合并 数据连接 数据连接是将特征列维度不完全相同的数据集连接成一份数据数据集特征不完全相同的原因,比如现网中不同 系统采集的数据。其原理与“数据集”界面的数据连接原理相同,具体请参见数据连接。 操作步骤如下所示。 单击界面右上角的图标,选择“数据处理 > 数据合并 > 数据连接”,界面新增“数据连接”内容。

    来自:帮助中心

    查看更多 →

  • 数据采样

    数据采样 如果数据量太大,造成特征操作等待的时间长,用户可以通过采样功能减少特征处理的数据量,提升特征处理的速度。 数据采样提供如下两种方式,请根据实际情况进行选择: 随机采样:按照比例进行样本数据的随机采样。 分层采样:如果一个特征或多个特征组合样本值的类型多样,为保证采样数据

    来自:帮助中心

    查看更多 →

  • 数据解析

    数据解析 创建解析任务 启动解析任务 父主题: 应用数据

    来自:帮助中心

    查看更多 →

  • 数据准备

    数据准备 数据服务的优势是什么 私有模板和公共模板的区别是什么 父主题: 常见问题

    来自:帮助中心

    查看更多 →

  • 数据过滤

    数据过滤 算子简介 名称:数据过滤 功能说明:根据设置的条件过滤数据,满足条件的数据则输出,不满足条件的数据将被丢弃。 约束:下游不允许对接数据源及产品过滤算子。 算子配置 基础配置项 算子名称: 配置项英文名:name 说明:算子名称,对算子进行个性化的命名,以辅助增加可读性。

    来自:帮助中心

    查看更多 →

  • 数据准备

    数据准备 数据集中的数据导入特征工程后,可能存在空值、冗余、数据不足等情况,或者用户需要将多次导入的数据集实例进行数据联合。以上情况,都可以在数据准备中进行操作。当前数据准备包含的功能有:数据修复、数据过滤、数据联合、数据连接、数据去噪。 数据修复 用户可以在数据修复中对单列进行

    来自:帮助中心

    查看更多 →

  • 数据探索

    数据探索 本章节以“NormalDistribution.csv”(正态分布图的展示)为例,介绍数据探索的基本操作方法。 创建查询 配置查询条件 查看查询结果 父主题: 应用数据

    来自:帮助中心

    查看更多 →

  • 数据探索

    数据探索 管理任务 管理模板 父主题: 管理基础工具

    来自:帮助中心

    查看更多 →

  • 数据接入

    数据接入 角色访问权限 管理软件包 管理采集机(运维) 管理采集机(用户) 管理采集任务 管理本地上传任务 数据源配置参考 安装采集Agent 父主题: 管理数据上云

    来自:帮助中心

    查看更多 →

  • 数据计算

    数据计算 算子简介 名称:数据计算 功能说明:按照表达式进行数值计算,计算的结果赋值给某个属性。举例:原消息中有温度属性,其数值是以摄氏度数值表示,可以通过本算子设置计算公式,将摄氏温度计算转换成华氏度读数再赋予给原来的温度属性,或者可以选择将计算转换后的数值赋予一个新属性。 约

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了