sparksql 调优 更多内容
  • 离线Compaction配置

    Compaction作业配置的资源,vcore数至少要大于等于单个分区的桶数,vcore数与内存的比例应为1:4即1个vcore配4G内存。 父主题: Bucket示例

    来自:帮助中心

    查看更多 →

  • 新建MRS SparkSQL数据连接

    新建 MRS SparkSQL数据连接 连接MRS SparkSQL前,需要满足以下条件: 已创建一个包含Spark组件的MRS 2.x之前版本集群,并且请确保MRS集群已关闭Kerberos认证。对于开启Kerberos认证的MRS SparkSQL数据源, DLV 暂不支持。 已获取MRS

    来自:帮助中心

    查看更多 →

  • MetaStore动态分区数超出阈值导致SQL报错

    执行set hive.exec.max.dynamic.partitions = XXX;命令大“hive.exec.max.dynamic.partitions”参数值。 SparkSQL中需要设置“spark.hadoop.hive.exec.max.dynamic.partitions”参数。

    来自:帮助中心

    查看更多 →

  • SparkSQL建表时的目录权限

    SparkSQL建表时的目录权限 问题 新建的用户,使用SparkSQL建表时出现类似如下错误: 0: jdbc:hive2://192.168.169.84:22550/default> create table testACL(c string); Error: org.apache

    来自:帮助中心

    查看更多 →

  • SparkSQL建表时的目录权限

    SparkSQL建表时的目录权限 问题 新建的用户,使用SparkSQL建表时出现类似如下错误: 0: jdbc:hive2://192.168.169.84:22550/default> create table testACL(c string); Error: org.apache

    来自:帮助中心

    查看更多 →

  • SparkSQL UDF功能的权限控制机制

    SparkSQL UDF功能的权限控制机制 问题 SparkSQL中UDF功能的权限控制机制是怎样的? 回答 目前已有的SQL语句无法满足用户场景时,用户可使用UDF功能进行自定义操作。 为确保数据安全以及UDF中的恶意代码对系统造成破坏,SparkSQL的UDF功能只允许具备a

    来自:帮助中心

    查看更多 →

  • SparkSQL UDF功能的权限控制机制

    SparkSQL UDF功能的权限控制机制 问题 SparkSQL中UDF功能的权限控制机制是怎样的? 回答 目前已有的SQL语句无法满足用户场景时,用户可使用UDF功能进行自定义操作。 为确保数据安全以及UDF中的恶意代码对系统造成破坏,SparkSQL的UDF功能只允许具备a

    来自:帮助中心

    查看更多 →

  • SparkSQL UDF功能的权限控制机制

    SparkSQL UDF功能的权限控制机制 问题 SparkSQL中UDF功能的权限控制机制是怎样的? 回答 目前已有的SQL语句无法满足用户场景时,用户可使用UDF功能进行自定义操作。 为确保数据安全以及UDF中的恶意代码对系统造成破坏,SparkSQL的UDF功能只允许具备a

    来自:帮助中心

    查看更多 →

  • 在Hue WebUI使用SparkSql编辑器

    在左侧导航栏单击,然后选择“SparkSql”,进入“SparkSql”。 “SparkSql”支持以下功能: 执行和管理SparkSql语句。 在“保存的查询”中查看当前访问用户已保存的SparkSql语句。 在“查询历史记录”中查看当前访问用户执行过的SparkSql语句。 执行SparkSql语句

    来自:帮助中心

    查看更多 →

  • 优化数据倾斜场景下的Spark SQL性能

    targetPostShuffleInputSize 每个task处理的shuffle数据的最小数据量。单位:Byte。 67108864 父主题: Spark SQL性能

    来自:帮助中心

    查看更多 →

  • 优化数据倾斜场景下的Spark SQL性能

    targetPostShuffleInputSize 每个task处理的shuffle数据的最小数据量。单位:Byte。 67108864 父主题: Spark SQL性能

    来自:帮助中心

    查看更多 →

  • Spark SQL样例程序开发思路

    筛选出停留时间大于两个小时的女性网民信息。 打包项目 通过IDEA自带的Maven工具,打包项目,生成jar包。具体操作请参考在Linux环境中测Spark应用。 将打包生成的jar包上传到Spark客户端所在 服务器 的任意目录(例如“ /opt/female/” )下。 运行任务 进

    来自:帮助中心

    查看更多 →

  • Spark输入

    Spark输入 概述 “Spark输入”算子,将SparkSQL表的指定列转换成同等数量的输入字段。 输入与输出 输入:SparkSQL表列 输出:字段 参数说明 表1 算子参数说明 参数 含义 类型 是否必填 默认值 Spark数据库 SparkSQL的数据库名称。 String 否 default

    来自:帮助中心

    查看更多 →

  • Spark输出

    “Spark输出”算子,用于配置已生成的字段输出到SparkSQL表的列。 输入与输出 输入:需要输出的字段 输出:SparkSQL表 参数说明 表1 算子参数说明 参数 含义 类型 是否必填 默认值 Spark文件存储格式 配置SparkSQL表文件的存储格式(目前支持四种格式: CS V、ORC、RC和PARQUET)。

    来自:帮助中心

    查看更多 →

  • Spark输出

    “Spark输出”算子,用于配置已生成的字段输出到SparkSQL表的列。 输入与输出 输入:需要输出的字段 输出:SparkSQL表 参数说明 表1 算子参数说明 参数 含义 类型 是否必填 默认值 Spark文件存储格式 配置SparkSQL表文件的存储格式(目前支持四种格式:CSV、ORC、RC和PARQUET)。

    来自:帮助中心

    查看更多 →

  • Spark输入

    Spark输入 概述 “Spark输入”算子,将SparkSQL表的指定列转换成同等数量的输入字段。 输入与输出 输入:SparkSQL表列 输出:字段 参数说明 表1 算子参数说明 参数 含义 类型 是否必填 默认值 Spark数据库 SparkSQL的数据库名称。 String 否 default

    来自:帮助中心

    查看更多 →

  • Spark用户权限管理

    Spark用户权限管理 SparkSQL用户权限介绍 创建SparkSQL角色 配置Spark表、列和数据库的用户权限 配置SparkSQL业务用户权限 配置Spark Web UI ACL Spark客户端和服务端权限参数配置说明 父主题: 使用Spark/Spark2x

    来自:帮助中心

    查看更多 →

  • 采集数据时报错HoodieKeyException

    org.apache.hudi.HoodieSparkSqlWriter$$anonfun$1.apply(HoodieSparkSqlWriter.scala:104) at org.apache.hudi.HoodieSparkSqlWriter$$anonfun$1.appl

    来自:帮助中心

    查看更多 →

  • 配置Spark表、列和数据库的用户权限

    nsight Manager的“编辑角色”页面进行授权时,该列将无法正确显示。 相关概念 SparkSQL的语句在SparkSQL中进行处理,权限要求如表1所示。 表1 使用SparkSQL表、列或数据库场景权限一览 操作场景 用户需要的权限 CREATE TABLE “创建”,

    来自:帮助中心

    查看更多 →

  • Spark用户权限管理

    Spark用户权限管理 SparkSQL权限介绍 创建SparkSQL角色 配置Spark表、列和数据库的用户权限 配置SparkSQL业务用户权限 配置Spark2x Web UI ACL Spark客户端和服务端权限参数配置说明 父主题: 使用Spark2x(MRS 3.x及之后版本)

    来自:帮助中心

    查看更多 →

  • 配置Spark表、列和数据库的用户权限

    nsight Manager的“编辑角色”页面进行授权时,该列将无法正确显示。 相关概念 SparkSQL的语句在SparkSQL中进行处理,权限要求如表1所示。 表1 使用SparkSQL表、列或数据库场景权限一览 操作场景 用户需要的权限 CREATE TABLE “创建”,RWX+ownership(for

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了