sparksql 更多内容
  • Spark JDBCServer接口介绍

    JD BCS erver是一个JDBC接口,用户可以通过JDBC连接JDB CS erver来访问SparkSQL的数据。JDBCServer在启动的时候,会启动一个sparkSQL的应用程序,而通过JDBC连接进来的客户端共同分享这个sparkSQL应用程序的资源,也就是说不同的用户之间可以共享数据。JDBCSe

    来自:帮助中心

    查看更多 →

  • 查询脚本信息

    本名称不能重复。 id 是 String 脚本ID。 type 是 String 脚本类型,包含: FlinkSQL DLI SQL SparkSQL HiveSQL DWSSQL RDSSQL Shell PRESTO ClickHouseSQL HetuEngineSQL PYTHON

    来自:帮助中心

    查看更多 →

  • 读取Hudi数据概述

    Hive Y Y Spark(SparkSQL) Y Y Spark(SparkDataSource API) Y Y HetuEngine Y N 表2 mor表 查询引擎 实时视图 增量视图 读优化视图 Hive Y Y Y Spark(SparkSQL) Y Y Y Spark(SparkDataSource

    来自:帮助中心

    查看更多 →

  • Spark on Hudi开发规范

    Spark on Hudi开发规范 SparkSQL建表参数规范 Spark增量读取Hudi参数规范 Spark异步任务执行表compaction参数设置规范 Spark表数据维护规范 父主题: DLI Hudi开发规范

    来自:帮助中心

    查看更多 →

  • 运行MRS作业

    运行 MRS 作业 运行MapReduce作业 运行SparkSubmit作业 运行HiveSql作业 运行SparkSql作业 运行Flink作业 运行HadoopStream作业 父主题: 提交MRS作业

    来自:帮助中心

    查看更多 →

  • Spark on Hudi开发规范

    Spark on Hudi开发规范 SparkSQL建表参数规范 Spark增量读取Hudi参数规范 Spark异步任务执行表compaction参数设置规范 Spark on Hudi表数据维护规范 Spark并发写Hudi建议 Spark读写Hudi资源配置建议 Spark On

    来自:帮助中心

    查看更多 →

  • Spark2x样例工程介绍

    sparknormal-examples/SparkSQLJavaExample Spark SQL任务的Java/Python/Scala示例程序。 本工程应用程序实现从HDFS上读取文本数据并计算分析。 sparknormal-examples/SparkSQLPythonExample

    来自:帮助中心

    查看更多 →

  • Spark JDBCServer接口介绍

    JDBCServer是一个JDBC接口,用户可以通过JDBC连接JDBCServer来访问SparkSQL的数据。JDBCServer在启动的时候,会启动一个sparkSQL的应用程序,而通过JDBC连接进来的客户端共同分享这个sparkSQL应用程序的资源,也就是说不同的用户之间可以共享数据。JDBCSe

    来自:帮助中心

    查看更多 →

  • 查询脚本列表

    本名称不能重复。 id 是 String 脚本ID。 type 是 String 脚本类型,包含: FlinkSQL DLISQL SparkSQL HiveSQL DWSSQL RDSSQL Shell PRESTO ClickHouseSQL HetuEngineSQL PYTHON

    来自:帮助中心

    查看更多 →

  • Hudi Schema演进

    Hudi Schema演进 Schema演进介绍 配置SparkSQL支持Hudi Schema演进 Hudi Schema演进及语法说明 Hudi Schema演进并发说明 父主题: 使用Hudi

    来自:帮助中心

    查看更多 →

  • Spark ThriftServer接口介绍

    ThriftServer是一个JDBC接口,用户可以通过JDBC连接ThriftServer来访问SparkSQL的数据。ThriftServer在启动的时候,会启动一个SparkSQL的应用程序,而通过JDBC连接进来的客户端共同分享这个sparkSQL应用程序的资源,也就是说不同的用户之间可以共享数据。Thrif

    来自:帮助中心

    查看更多 →

  • Spark SQL样例程序开发思路

    bin/spark-submit --master yarn --deploy-mode client /opt/female/SparkSQLPythonExample/SparkSQLPythonExample.py <inputPath> 其中,<inputPath>指HDFS文件系统中input的路径

    来自:帮助中心

    查看更多 →

  • 创建Hue操作任务

    创建Hue操作任务 在Hue WebUI使用HiveQL编辑器 在Hue WebUI使用SparkSql编辑器 在Hue WebUI使用元数据浏览器 在Hue WebUI使用文件浏览器 在Hue WebUI使用作业浏览器 在Hue WebUI使用HBase 父主题: 使用Hue(MRS

    来自:帮助中心

    查看更多 →

  • Spark JDBCServer接口介绍

    JDBCServer是一个JDBC接口,用户可以通过JDBC连接JDBCServer来访问SparkSQL的数据。JDBCServer在启动的时候,会启动一个sparkSQL的应用程序,而通过JDBC连接进来的客户端共同分享这个sparkSQL应用程序的资源,也就是说不同的用户之间可以共享数据。JDBCSe

    来自:帮助中心

    查看更多 →

  • Spark JDBCServer接口介绍

    JDBCServer是一个JDBC接口,用户可以通过JDBC连接JDBCServer来访问SparkSQL的数据。JDBCServer在启动的时候,会启动一个sparkSQL的应用程序,而通过JDBC连接进来的客户端共同分享这个sparkSQL应用程序的资源,也就是说不同的用户之间可以共享数据。JDBCSe

    来自:帮助中心

    查看更多 →

  • 创建Hue操作任务

    创建Hue操作任务 通过Hue执行HiveQL 通过Hue执行SparkSQL 通过Hue查看Hive元数据 通过Hue管理HDFS文件 通过Hue管理Oozie作业 通过Hue管理HBase表 通过Hue执行HetuEngine SQL 父主题: 使用Hue

    来自:帮助中心

    查看更多 →

  • Spark SQL性能调优

    优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优 配置多并发客户端连接JDBCServer 配置SparkSQL的分块个数 Spark动态分区插入场景内存优化 小文件优化 聚合算法优化 Datasource表优化 合并CBO优化 多级嵌套子查询以及混合Join的SQL调优

    来自:帮助中心

    查看更多 →

  • Spark SQL企业级能力增强

    配置过滤掉分区表中路径不存在的分区 配置Hive表分区动态覆盖 配置Spark SQL开启Adaptive Execution特性 配置SparkSQL的分块个数 父主题: 使用Spark2x(MRS 3.x及之后版本)

    来自:帮助中心

    查看更多 →

  • Spark SQL样例程序开发思路

    bin/spark-submit --master yarn --deploy-mode client /opt/female/SparkSQLPythonExample/SparkSQLPythonExample.py <inputPath> 其中,<inputPath>指HDFS文件系统中input的路径

    来自:帮助中心

    查看更多 →

  • Schema演进语法说明

    Schema演进语法说明 功能介绍 该能力用于支持SparkSql对Hudi表的列进行Alter变更,使用该能力前必须开启Schema演进。 Schema演进支持的范围 Schema演进支持范围: 支持列(包括嵌套列)相关的增、删、改、位置调整等操作。 不支持对分区列做演进。 不

    来自:帮助中心

    查看更多 →

  • 作业管理

    作业管理 MRS作业管理为用户提供向集群提交作业的入口,支持包括MapReduce、Spark、HQL和SparkSQL等类型的作业。 结合华为云 数据治理中心 DataArts Studio,提供一站式的大数据协同开发环境、全托管的大数据调度能力,帮助用户快速构建大数据处理中心。 通过 数据治理 中心DataArts

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了