华为云 APP

您的云计算服务助手——让您安全、实时、高效、便捷的掌控云端资源。

立即下载
 
 
 

    大数据应用开发 更多内容
  • 应用集成开发概述

    应用集成开发概述 集成开发包括连接器、数据接入和开放接口三部分。其中,数据接入(DataAccess)和连接器(Connector),是将外部数据或功能模块集成到AstroZero中使用,而开放接口是将AstroZero中开发的脚本、服务编排等包装成自定义REST接口,供第三方系统使用。

    来自:帮助中心

    查看更多 →

  • Impala应用开发规范

    Impala应用开发规范 Impala应用开发规则 Impala应用开发建议

    来自:帮助中心

    查看更多 →

  • HBase应用开发规范

    HBase应用开发规范 HBase应用开发规则 HBase应用开发建议

    来自:帮助中心

    查看更多 →

  • HBase应用开发建议

    设计时应避免HBase随机查找、排序的应用场景。 业务表设计建议 预分Region,使Region分布均匀,提高并发 避免过多的热点Region。根据应用场景,可考虑将时间因素引入Rowkey。 同时访问的数据尽量连续存储。同时读取的数据相邻存储;同时读取的数据存放在同一行;同时读取的数据存放在同一cell。 查询

    来自:帮助中心

    查看更多 →

  • HDFS应用开发规范

    HDFS应用开发规范 HDFS应用开发规则 HDFS应用开发建议

    来自:帮助中心

    查看更多 →

  • HDFS应用开发规则

    HDFS应用开发规则 HDFS NameNode元数据存储路径 NameNode元数据信息的默认存储路径为“${BIGDATA_DATA_HOME}/namenode/data”,该参数用于确定HDFS文件系统的元数据信息的保存路径。 HDFS需要开启NameNode镜像备份 NameNode的镜像备份参数为“fs

    来自:帮助中心

    查看更多 →

  • HDFS应用开发建议

    HDFS应用开发建议 HDFS的读写文件注意点 HDFS不支持随机读和写。 HDFS追加文件内容只能在文件末尾添加,不能随机添加。 只有存储在HDFS文件系统中的数据才支持append,edit.log以及数据元文件不支持Append。Append追加文件时,需要将“hdfs-site

    来自:帮助中心

    查看更多 →

  • Hive应用开发规范

    Hive应用开发规范 Hive应用开发规则 Hive应用开发建议

    来自:帮助中心

    查看更多 →

  • Hive应用开发建议

    MyGenericUDAFEvaluator implements Closeable { 表分区优化建议 当数据量较大,且经常需要按天统计时,建议使用分区表,按天存放数据。 为了避免在插入动态分区数据的过程中,产生过多的小文件,在执行插入时,在分区字段上加上distribute by。 存储文件格式优化建议

    来自:帮助中心

    查看更多 →

  • Kafka应用开发规范

    Kafka应用开发规范 Kafka应用开发规则 Kafka应用开发建议

    来自:帮助中心

    查看更多 →

  • Spark应用开发规范

    Spark应用开发规范 Spark应用开发规则 Spark应用开发建议

    来自:帮助中心

    查看更多 →

  • HBase应用开发简介

    能够同时处理结构化和非结构化的数据。 不需要完全拥有传统关系型数据库所具备的ACID特性。ACID特性指原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation,又称独立性)、持久性(Durability)。 HBase中的表具有如下特点: :一个表可以有上亿行,上百万列。

    来自:帮助中心

    查看更多 →

  • HBase应用开发流程

    HBase应用开发流程 本文档主要基于Java API对HBase进行应用开发开发流程中各阶段的说明如图1和表1所示。 图1 HBase应用程序开发流程 表1 HBase应用开发的流程说明 阶段 说明 参考文档 了解基本概念 在开始开发应用前,需要了解HBase的基本概念,了解场景需求,设计表等。

    来自:帮助中心

    查看更多 →

  • HetuEngine应用开发简介

    Worker:负责执行任务和处理数据。 Connector:HetuEngine访问数据库的接口,HetuEngine通过Connector的驱动连接数据源,读取数据源元数据和对数据进行增删改查等操作。 Catalog:HetuEngine中一个catalog配置文件对应一个数据源,一个数据源可以有多

    来自:帮助中心

    查看更多 →

  • Oozie应用开发步骤

    Oozie应用开发步骤 业务分析。 可以使用客户端样例目录中Mapreduce程序对日志目录的数据进行分析、处理。 将Mapreduce程序的分析结果移动到数据分析结果目录,并将数据文件的权限设置成660。 为了满足每天分析一次的需求,需要每天重复执行一次1.a~1.b。 业务实现。

    来自:帮助中心

    查看更多 →

  • Hive应用开发简介

    HCatalog是建立在Hive元数据之上的一个表信息管理层,吸收了Hive的DDL命令。为MapReduce提供读写接口,提供Hive命令行接口来进行数据定义和元数据查询。基于 MRS 的HCatalog功能,Hive、MapReduce开发人员能够共享元数据信息,避免中间转换和调整,能够提升数据处理的效率。

    来自:帮助中心

    查看更多 →

  • Kafka应用开发简介

    Kafka应用开发简介 Kafka简介 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性,主要用于处理活跃的流式数据。 Kafka有很多适用的场景:消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点:

    来自:帮助中心

    查看更多 →

  • 开发Manager应用

    开发Manager应用 Manager样例程序开发思路 Manager登录认证 添加Manager用户 查找Manager用户 修改Manager用户 删除Manager用户 导出Manager用户列表 父主题: Manager管理开发指南

    来自:帮助中心

    查看更多 →

  • 开发ClickHouse应用

    开发ClickHouse应用 ClickHouse应用程序开发思路 配置ClickHouse连接属性 建立ClickHouse连接 创建ClickHouse数据库 创建ClickHouse表 插入ClickHouse数据 查询ClickHouse数据 删除ClickHouse表 父主题:

    来自:帮助中心

    查看更多 →

  • 开发IoTDB应用

    开发IoTDB应用 IoTDB JDBC样例程序 IoTDB Session样例程序 IoTDB Flink样例程序 IoTDB Kafka样例程序 IoTDB自定义函数(UDF)样例程序 父主题: IoTDB开发指南(普通模式)

    来自:帮助中心

    查看更多 →

  • 快速开发Kafka应用

    MRS对外提供了基于Kafka组件的应用开发样例工程,本实践用于指导您创建MRS集群后,获取并导入样例工程并在本地进行编译调测,用于实现流式数据的处理。 本章节对应示例场景的开发思路: 使用Kafka客户端创建两个Topic,用于输入Topic和输出Topic。 开发一个Kafka Stre

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了