MapReduce服务 MRS

 

MapReduce服务(MapReduce Service)提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件。包年更优惠,买1年只需付10个月费用

 
 

    hive去重 更多内容
  • Hive应用开发简介

    Hive应用开发简介 Hive简介 Hive是一个开源的,建立在Hadoop上的 数据仓库 框架,提供类似SQL的HiveQL语言操作结构化数据,其基本原理是将HiveQL语言自动转换成MapReduce任务或Spark任务,从而完成对Hadoop集群中存储的海量数据进行查询和分析。

    来自:帮助中心

    查看更多 →

  • 调测Hive应用

    调测Hive应用 在Windows中调测Hive JDBC应用 在Linux中调测Hive JDBC应用 在Linux中调测Hive HCatalog应用 父主题: Hive开发指南

    来自:帮助中心

    查看更多 →

  • Hive应用开发概述

    Hive应用开发概述 Hive应用开发简介 Hive应用开发常用概念 Hive应用开发流程 Hive应用开发样例工程介绍 父主题: Hive开发指南(普通模式)

    来自:帮助中心

    查看更多 →

  • Hive JDBC接口介绍

    Hive JDBC接口介绍 Hive JDBC接口遵循标准的JAVA JDBC驱动标准。 Hive作为数据仓库类型数据库,其并不能支持所有的JDBC标准API。例如事务类型的操作:rollback、setAutoCommit等,执行该类操作会获得“Method not suppo

    来自:帮助中心

    查看更多 →

  • Hive应用开发概述

    Hive应用开发概述 Hive应用开发简介 Hive应用开发常用概念 Hive应用开发开发流程 Hive应用开发样例工程介绍 父主题: Hive开发指南(安全模式)

    来自:帮助中心

    查看更多 →

  • Hive应用开发简介

    Hive应用开发简介 Hive简介 Hive是一个开源的,建立在Hadoop上的数据仓库框架,提供类似SQL的HQL语言操作结构化数据,其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务,从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下:

    来自:帮助中心

    查看更多 →

  • Hive配置类问题

    ericStatsEvaluator.init. 解决方案:set hive.map.aggr=false; Hive SQL设置hive.auto.convert.join = true(默认开启)和hive.optimize.skewjoin=true执行报错:ClassCastException

    来自:帮助中心

    查看更多 →

  • Hive对接外部LDAP

    Hive对接外部LDAP 本操作适用于 MRS 3.1.0及之后版本。 登录Manager。 在Manager界面,选择“集群 > 待操作集群的名称 > 服务 > Hive > 配置 > 全部配置 > HiveServer(角色) > 安全”。 配置如下参数的值。 表1 参数配置 参数名称

    来自:帮助中心

    查看更多 →

  • Hive服务启动失败

    Hive服务启动失败 Hive服务启动失败最常见的原因是metastore实例无法连接上DBservice,可以查看metastore日志中具体的错误信息。 可能原因 DBservice没有初始化好Hive的元数据库hivemeta。 DBservice的浮动IP配置有误,导致m

    来自:帮助中心

    查看更多 →

  • 重启Hive服务失败

    重启Hive服务失败 用户问题 修改Hive服务配置后,保存配置失败,Manager页面Hive服务的配置状态为配置失败。 问题现象 用户A在MRS节点后台上打开了Hive相关配置文件且未关闭,此时用户B在MRS Manager页面的“服务管理”中修改Hive配置项,保存配置并重

    来自:帮助中心

    查看更多 →

  • Hive用户权限管理

    Hive用户权限管理 Hive用户权限说明 创建Hive角色 配置Hive表、列或数据库的用户权限 配置Hive业务使用其他组件的用户权限 父主题: 使用Hive

    来自:帮助中心

    查看更多 →

  • Hive Group By语句优化

    By Key分发到Reduce中完成最终的聚合操作。 Count Distinct聚合问题 当使用聚合函数count distinct完成重计数时,处理值为空的情况会使Reduce产生很严重的数据倾斜,可以将空值单独处理,如果是计算count distinct,可以通过wher

    来自:帮助中心

    查看更多 →

  • Hive SQL逻辑优化

    Hive SQL逻辑优化 操作场景 在Hive上执行SQL语句查询时,如果语句中存在“(a&b) or (a&c)”逻辑时,建议将逻辑改为“a & (b or c)”。 样例 假设条件a为“p_partkey = l_partkey”,优化前样例如下所示: select

    来自:帮助中心

    查看更多 →

  • Hive运维管理

    Hive运维管理 Hive常用配置参数 Hive日志介绍 导入导出Hive数据库 导入导出Hive表/分区数据 使用Hive异常文件定位定界工具 父主题: 使用Hive

    来自:帮助中心

    查看更多 →

  • 恢复Hive业务数据

    恢复Hive业务数据 操作场景 在用户意外修改、删除或需要找回数据时,系统管理员对Hive进行重大操作(如升级、重大数据调整等)后,系统数据出现异常或未达到预期结果,模块全部故障无法使用,或者迁移数据到新集群的场景中,需要对Hive进行恢复数据操作。 系统管理员可以通过 FusionInsight

    来自:帮助中心

    查看更多 →

  • 备份Hive业务数据

    Manager创建备份Hive任务。支持创建任务自动或手动备份数据。 Hive备份恢复功能不支持识别用户的Hive表、索引、视图等对象在业务和结构上存在的关联关系。用户在执行备份恢复任务时,需要根据业务场景管理统一的恢复点,防止影响业务正常运行。 Hive备份恢复功能不支持Hive on R

    来自:帮助中心

    查看更多 →

  • Hive应用开发规范

    Hive应用开发规范 Hive应用开发规则 Hive应用开发建议

    来自:帮助中心

    查看更多 →

  • Hive应用开发建议

    Hive应用开发建议 HQL编写之隐式类型转换 查询语句使用字段的值做过滤时,不建议通过Hive自身的隐式类型转换来编写HQL。因为隐式类型转换不利于代码的阅读和移植。 建议示例: select * from default.tbl_src where id = 10001; select

    来自:帮助中心

    查看更多 →

  • 配置Hive源端参数

    配置Hive源端参数 作业中源连接为Hive连接时,源端作业参数如表1所示。 表1 Hive作为源端时的作业参数 参数类型 参数名 说明 取值样例 基本参数 数据库名称 输入或选择数据库名称。单击输入框后面的按钮可进入数据库选择界面。 default 表名 输入或选择Hive表名

    来自:帮助中心

    查看更多 →

  • 查询Hive表数据

    查询Hive表数据 功能介绍 本小节介绍了如何使用HQL对数据进行查询分析。从本节中可以掌握如下查询分析方法: SELECT查询的常用特性,如JOIN等。 加载数据进指定分区。 如何使用Hive自带函数。 如何使用自定义函数进行查询分析,如何创建、定义自定义函数请见创建Hive用户自定义函数。

    来自:帮助中心

    查看更多 →

  • 调测Hive应用

    调测Hive应用 在Windows中调测JDBC样例程序 在Linux中调测JDBC样例程序 调测HCatalog样例程序 调测Hive SpringBoot样例程序 调测Hive Python样例程序 调测Hive Python3样例程序 父主题: Hive开发指南(普通模式)

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了