大数据字段合并规则引擎_合并文件（API名称：file/mergeFile）-华为云

合并文件（API名称：file/mergeFile）

合并文件（API名称：file/mergeFile）功能介绍该接口用于大文件的分片文件合并。相关接口接口名称调用说明获取Token 调用该接口获取到Token，再调用其他接口时，需要在请求消息头中添加“Authorization”，其值即为Token。 URL 请求方式

来自：帮助中心

查看更多 →
云备份存储库可以合并吗？

云备份存储库可以合并吗？暂时不支持合并存储库。您可以扩容其中一个存储库后，将另一存储库的资源迁移到前者即可。具体操作请参见《云备份用户指南》扩容存储库和迁移存储库的资源章节。父主题：其他类

来自：帮助中心

查看更多 →
获取合并请求的变化

参数类型描述 id Integer 合并请求ID iid Integer 合并请求IID project_id Integer 仓库ID title String 标题 description String 描述 state String 合并请求状态 created_at String

来自：帮助中心

查看更多 →
使用Spark小文件合并工具说明

合并前请确保HDFS上有足够的存储空间，至少需要被合并表大小的一倍以上。合并表数据的操作需要单独进行，在此过程中读表，可能临时出现找不到文件的问题，合并完成后会恢复正常；另外在合并过程中请注意不要对相应的表进行写操作，否则可能会产生数据一致性问题。若合并完成后，在一直处于连接状态的spark-beeline/spark-sql

来自：帮助中心

查看更多 →
规则管理

在左侧导航栏单击【规则引擎】模块展开子级菜单导航，选择【规则引擎>规则管理】，进入规则管理界面，在规则管理列表选择需要启用的规则，单击“启用”按钮，启用成功，如下图：图4 启用规则禁用规则操作步骤：在左侧导航栏单击【规则引擎】模块展开子级菜单导航，选择【规则引擎>规则管理】，进

来自：帮助中心

查看更多 →
设置云端结构化字段和tag字段

设置云端结构化字段和tag字段设置云端结构化字段在进行结构化配置字段提取之后，可对结构化字段进行设置，详细请参考表1。表1 结构化字段设置规则日志提取方式字段名称字段类型是否可修改字段是否可删除正则分析（自动生成）用户自定义。名称必须以字母开始，且仅包含字母和数字。

来自：帮助中心

查看更多 →
对于千万或亿级的超大表如何高效写入数据或创建索引

读写业务分离。读业务放到备库上，避免因IO导致插入慢。大表高效创建索引的方法对于千万或亿级大数据量的表，建议使用如下方法提升创建索引的效率。索引字段尽量小。选择区分度高的列作为索引列。如果表中每个字段都无法保证唯一、无法保证NOT NULL，或者不适合做索引，推荐自定义一个ID自增列作为主键，自动满足有序插入。

来自：帮助中心

查看更多 →
新增基础扩展字段

新增基础扩展字段操作步骤以租户管理员角色登录AICC，选择“配置中心 > 扩展与集成 > 接触记录数据项”。新增基础扩展字段。单击“接触记录字段”，进入配置页面，单击“新建”。根据表1，填入参数值。表1 基础扩展字段参数说明属性说明字段类别选择“基础扩展字段”。字段名称

来自：帮助中心

查看更多 →
自定义字段

为内置字段，自定义字段避免使用。自定义字段总个数不能超过10个，key的长度范围为[1,36]，可以由数字、字母、下划线和中划线组成。 String类型的value长度范围为[1,256]，可以由数字、字母、下划线和中划线组成。字段重复定义会被覆盖。不支持数值类型添加后缀的输入方式，如1

来自：帮助中心

查看更多 →
默认字段类型

默认字段类型当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”。选择特定的字段类型后，将会按照指定的字段类型对字符串处理后再输出。比如，未激活任何字段类型时的输出为“发证日期：2021年09月12日”，为了精准提取日期

来自：帮助中心

查看更多 →
什么是增量字段？

什么是增量字段？增量字段是数据表里的一个时间格式字段，其作用是为了后续数据联接入图调度时，确认数据入图的时间范围。父主题：数字主线引擎相关问题

来自：帮助中心

查看更多 →
查询项目字段配置

uri String 字段配置URI标识 updator NameAndIdVo object 服务类型信息 description String 描述 customName String 项目用例自定义字段名称 table_field_name String 字段名（对应后端参数名）

来自：帮助中心

查看更多 →
字段值提取函数

参数类型是否必填说明源字段名任意是源字段名。如果字段不存在，则不进行任何操作。目标字段列表任意是字段值经过分隔符分隔后的每个值对应的字段名。可以是字符串的列表，例如：["error", "message", "result"]。当字段名中不包含逗号时，也可以直

来自：帮助中心

查看更多 →
对于千万或亿级的超大表如何高效写入数据或创建索引

读写业务分离。读业务放到备库上，避免因IO导致插入慢。大表高效创建索引的方法对于千万或亿级大数据量的表，建议使用如下方法提升创建索引的效率。索引字段尽量小。选择区分度高的列作为索引列。如果表中每个字段都无法保证唯一、无法保证NOT NULL，或者不适合做索引，推荐自定义一个ID自增列作为主键，自动满足有序插入。

来自：帮助中心

查看更多 →
Hudi简介

Incrementals。用来管理Hadoop大数据体系下存储在DFS上大型分析数据集。 Hudi不是单纯的数据格式，而是一套数据访问方法（类似 GaussDB (DWS)存储的access层），在Apache Hudi 0.9版本，大数据的Spark，Flink等组件都单独实现各自客户端。Hudi的逻辑存储如下图所示：

来自：帮助中心

查看更多 →
设置云端结构化字段和tag字段

设置云端结构化字段和tag字段设置云端结构化字段在进行结构化配置字段提取之后，可对结构化字段进行设置，详细请参考表1。表1 结构化字段设置规则日志提取方式字段名称字段类型是否可修改字段是否可删除正则分析（自动生成）用户自定义。名称必须以字母开始，且仅包含字母和数字。

来自：帮助中心

查看更多 →
分段上传-合并段(Go SDK)

分段上传-合并段(Go SDK) 功能说明如果用户上传完所有的段，就可以调用合并段接口，系统将在服务端将用户指定的段合并成一个完整的对象。在执行“合并段”操作以前，用户不能下载已经上传的数据。在合并段时需要将多段上传任务初始化时记录的附加消息头信息拷贝到对象元数据中，其处理过程

来自：帮助中心

查看更多 →
获取仓库合并请求详情

Double 参数解释：合并请求差异ID。 state String 参数解释：合并请求状态。取值范围：取值为以下类型中的一种： opened : 开启中的合并请求。 closed：已关闭的合并请求。 merged：已合并的合并请求。 locked：已锁定的合并请求。 merge_request_id

来自：帮助中心

查看更多 →
伙伴申请的激励可否合并开票？

伙伴申请的激励可否合并开票？解决方案提供商申请激励合并开票时按账期结算，如果账期合并结算，就可以合并开票；如果本身账期包含多个申付单，就不能合并开票。激励根据申付单（一个申付单是一次提交激励申付产生的，可以多个账期一起申付，此时只会产生一个申付单）来进行开票，几个申付单开几张票。

来自：帮助中心

查看更多 →
使用Spark小文件合并工具说明

使用Spark小文件合并工具说明本章节仅适用于 MRS 3.3.0及之后版本。配置场景小文件自动合并特性开启后，Spark将数据先写入临时目录，再去检测每个分区的平均文件大小是否小于16MB（默认值）。如果发现平均文件大小小于16MB，则认为分区下有小文件，Spark会启动一

来自：帮助中心

查看更多 →
支持的大数据平台简介

华为云 MapReduce服务（MRS）是华为云提供的大数据服务，可以在华为云上部署和管理Hadoop系统，一键即可部署Hadoop集群。 MRS提供用户完全可控的一站式企业级大数据集群云服务，完全兼容开源接口，结合华为云计算、存储优势及大数据行业经验，为客户提供高性能、低成本、灵活易用的全栈大数据平台，轻松运行H

来自：帮助中心

查看更多 →