华为云

面向未来的智能世界,数字化是企业发展的必由之路。数字化成功的关键是以云原生的思维践行云原生,全数字化、全云化、AI驱动,一切皆服务。

华为云将持续创新,携手客户、合作伙伴和开发者,致力于让云无处不在,让智能无所不及,共建智能世界云底座。

 
 

    spark 华为云 更多内容
  • DIS Spark Streaming概述

    DIS Spark Streaming概述 DIS Spark Streaming是 数据接入服务 (DIS)提供的一个sdk,支持将DIS作为数据源创建DStream对接SparkStreaming。dis-spark-streaming使用流程如图1所示。 图1 DIS Spark

    来自:帮助中心

    查看更多 →

  • pyspark样例代码

    print_function from pyspark.sql import SparkSession if __name__ == "__main__": # Create a SparkSession session. sparkSession = SparkSession.builder

    来自:帮助中心

    查看更多 →

  • pyspark样例代码

    from pyspark.sql.types import StructType, StructField, IntegerType, StringType from pyspark.sql import SparkSession 创建session 1 sparkSession

    来自:帮助中心

    查看更多 →

  • SparkRTC Demo怎么体验?

    SparkRTC Demo怎么体验? 您可以提交工单联系华为云技术客服,获取各平台对应的Demo进行体验。 父主题: 产品咨询

    来自:帮助中心

    查看更多 →

  • 创建并提交Spark作业

    创建并提交Spark作业 场景描述 本章节指导用户通过API创建并提交Spark作业。 约束限制 新队列第一次运行作业时,需要一定的时间,通常为6~10分钟。 涉及接口 创建队列:创建队列。 上传分组资源:上传Spark作业所需的资源包。 查询组内资源包:确认上传的资源包是否正确。

    来自:帮助中心

    查看更多 →

  • 查看Spark任务日志失败

    查看目录下是否有对应的appid文件(Spark的eventlog存放目录: MRS 3.x及以后版本的目录是hdfs://hacluster/spark2xJobHistory2x,MRS 3.x以前版本的目录是hdfs://hacluster/sparkJobHistory,任务运行日

    来自:帮助中心

    查看更多 →

  • Spark连接Kafka认证错误

    Spark连接Kafka认证错误 问题现象 MRS 2.1.0版本集群中Spark消费kafka数据,过一天以后就会出现认证失败的报错: 原因分析 集群版本和运行的程序包版本不匹配。 处理步骤 参考运行Spark Streaming 对接Kafka0-10样例程序进行相关配置。 当前集群为MRS

    来自:帮助中心

    查看更多 →

  • Spark作业管理概述

    Spark作业管理概述 DLI 在开源Spark基础上进行了大量的性能优化与服务化改造,兼容Apache Spark生态和接口,执行批处理任务。 DLI还支持使用Spark作业访问DLI元数据,具体请参考《 数据湖探索 开发指南》。 Spark作业管理主要包括如下功能: 创建Spark作业

    来自:帮助中心

    查看更多 →

  • SparkSQL权限介绍

    操作可参考添加Spark2x的Ranger访问权限策略。 Spark2x开启或关闭Ranger鉴权后,需要重启Spark2x服务,并重新下载客户端,或刷新客户端配置文件spark/conf/spark-defaults.conf: 开启Ranger鉴权:spark.ranger.plugin

    来自:帮助中心

    查看更多 →

  • 访问Spark Web UI界面

    访问Spark Web UI界面 Spark Web UI界面主要用于查看Spark应用程序运行情况,推荐使用Google chrome浏览器以获得更好的体验。 Spark主要有两个Web页面。 Spark UI页面,用于展示正在执行的应用的运行情况。 页面主要包括了Jobs、S

    来自:帮助中心

    查看更多 →

  • 使用Spark客户端

    如果集群为安全模式,执行以下命令进行用户认证。普通模式集群无需执行用户认证。 kinit 组件业务用户 直接执行Spark Shell命令。例如: spark-beeline 父主题: 使用Spark

    来自:帮助中心

    查看更多 →

  • Spark Streaming调优

    处理器调优 Spark Streaming的底层由Spark执行,因此大部分对于Spark的调优措施,都可以应用在Spark Streaming之中,例如: 数据序列化 配置内存 设置并行度 使用External Shuffle Service提升性能 在做Spark Strea

    来自:帮助中心

    查看更多 →

  • Python和Spark开发平台

    Python和Spark开发平台 创建特征工程 数据采样 列筛选 数据准备 特征操作 Notebook开发 全量数据应用 发布服务 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 配置Spark对接LakeFormation

    配置Spark对接LakeFormation 使用pyspark时,需要将以下配置中“spark.hadoop”开头的参数去掉“spark.hadoop”后配置到hive-site.xml配置文件中。 对接通用配置 在“spark/conf/spark-defaults.conf”中添加以下配置:

    来自:帮助中心

    查看更多 →

  • pyspark样例代码

    DoubleType from pyspark.sql import SparkSession if __name__ == "__main__": # Create a SparkSession session. sparkSession = SparkSession.builder

    来自:帮助中心

    查看更多 →

  • pyspark样例代码

    DoubleType from pyspark.sql import SparkSession if __name__ == "__main__": # Create a SparkSession session. sparkSession = SparkSession.builder

    来自:帮助中心

    查看更多 →

  • pyspark样例代码

    。 创建Spark作业完成后,在控制台单击右上角“执行”提交作业,页面显示“批处理作业提交成功”说明Spark作业提交成功,可以在Spark作业管理页面查看提交的作业的状态和日志。 创建Spark作业时选择的“所属队列”为创建跨源连接时所绑定的队列。 如果选择spark版本为2.3

    来自:帮助中心

    查看更多 →

  • SparkRTC支持白板功能吗?

    SparkRTC支持白板功能吗? 不支持,白板功能是为APP层级的应用。 父主题: SDK使用

    来自:帮助中心

    查看更多 →

  • SparkRTC支持旁路推流吗?

    SparkRTC支持旁路推流吗? 支持,具体请参见startPublishStream、updateTransCoding、stopPublishStream接口。 父主题: SDK使用

    来自:帮助中心

    查看更多 →

  • Spark开源命令支持说明

    Spark开源命令支持说明 本章节介绍了目前DLI对开源的Spark SQL语法的支持情况。详细的语法、参数说明,示例等信息请参考Spark官方文档。 表1 DLI Spark开源命令支持说明 功能描述 语法示例 DLI Spark 2.4.5 DLI Spark 3.3.1 创建数据库

    来自:帮助中心

    查看更多 →

  • 使用Spark2x

    使用Spark2x 使用前须知 基本操作 Spark2x日志介绍 获取运行中Spark应用的Container日志 小文件合并工具 CarbonData首查优化工具 Spark2x性能调优 Spark2x常见问题

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了