华为云

面向未来的智能世界,数字化是企业发展的必由之路。数字化成功的关键是以云原生的思维践行云原生,全数字化、全云化、AI驱动,一切皆服务。

华为云将持续创新,携手客户、合作伙伴和开发者,致力于让云无处不在,让智能无所不及,共建智能世界云底座。

 
 

    spark 华为云 更多内容
  • Spark应用调优

    Spark应用调优 Spark Core调优 SQL和DataFrame调优 Spark Streaming调优 Spark CBO调优 父主题: Spark应用开发常见问题

    来自:帮助中心

    查看更多 →

  • Spark Core调优

    Spark Core调优 数据序列化 配置内存 设置并行度 使用广播变量 使用External Shuffle Service提升性能 Yarn模式下动态资源调度 配置进程参数 设计DAG 经验总结 父主题: Spark应用调优

    来自:帮助中心

    查看更多 →

  • Spark CBO调优

    。 操作步骤 Spark CBO的设计思路是,基于表和列的统计信息,对各个操作算子(Operator)产生的中间结果集大小进行估算,最后根据估算的结果来选择最优的执行计划。 设置配置项。 在“spark-defaults.conf”配置文件中增加配置项“spark.sql.cbo

    来自:帮助中心

    查看更多 →

  • 调测Spark应用

    调测Spark应用 在本地Windows环境中调测Spark应用 在Linux环境中调测Spark应用 父主题: Spark2x开发指南(安全模式)

    来自:帮助中心

    查看更多 →

  • Spark任务提交失败

    Spark任务提交失败 问题现象 Spark提交任务直接提示无法提交任务。 Spark提示无法获取到yarn的相关jar包。 提示多次提交一个文件。 原因分析 问题1: 最常见的无法提交任务原因是认证失败, 还有可能是参数设置不正确。 问题2: 集群默认会把分析节点的hadoop

    来自:帮助中心

    查看更多 →

  • Spark常用API介绍

    Spark常用API介绍 Spark Java API接口介绍 Spark Scala API接口介绍 Spark Python API接口介绍 Spark client CLI介绍 Spark JD BCS erver接口介绍 父主题: Spark应用开发常见问题

    来自:帮助中心

    查看更多 →

  • Spark运维管理

    Spark运维管理 快速配置参数 常用参数 Spark2x日志介绍 调整Spark日志级别 配置WebUI上查看Container日志 获取运行中Spark应用的Container日志 配置Spark Eventlog日志回滚 配置WebUI上显示的Lost Executor信息的个数

    来自:帮助中心

    查看更多 →

  • Spark使用说明

    Spark使用说明 MRS 3.3.0-LTS及之后的版本中,Spark2x服务改名为Spark,服务包含的角色名也有差异,例如JobHistory2x变更为JobHistory。 相关涉及服务名称、角色名称的描述和操作请以实际版本为准。 Spark是一个开源的,并行数据处理框架

    来自:帮助中心

    查看更多 →

  • Spark运维管理

    Spark运维管理 快速配置Spark参数 Spark常用配置参数 Spark日志介绍 获取运行中Spark应用的Container日志 调整Spark日志级别 配置WebUI上查看Container日志 配置WebUI上显示的Lost Executor信息的个数 配置JobHistory本地磁盘缓存

    来自:帮助中心

    查看更多 →

  • Spark on Hudi开发规范

    Spark on Hudi开发规范 SparkSQL建表参数规范 Spark增量读取Hudi参数规范 Spark异步任务执行表compaction参数设置规范 Spark表数据维护规范 父主题: DLI Hudi开发规范

    来自:帮助中心

    查看更多 →

  • 查询Spark作业日志

    设置DLI作业桶 查询Spark作业日志 登录DLI管理控制台,单击“作业管理 > Spark作业”。 选择待查询的Spark作业,单击操作列的“更多 > 归档日志”。 系统自动跳转至DLI作业桶日志路径下。 选择需要查看的日期,单击操作列的“下载”下载Spark日志到本地。 图3 下载Spark作业日志

    来自:帮助中心

    查看更多 →

  • 实时音视频 SparkRTC

    实时音视频和直播有什么区别? SparkRTC支持哪些平台? SparkRTC有哪些计费项? SparkRTC最多可以支持多少个人同时视频通话? SparkRTC是否支持连麦互动? SparkRTC RoomID是什么?取值区间值是多少? 两台手机同时运行SparkRTC APP,为什么无法互通?

    来自:帮助中心

    查看更多 →

  • Spark2.4.x与Spark3.3.x版本差异对比

    Spark2.4.x与Spark3.3.x版本差异对比 Spark2.4.x与Spark3.3.x版本在SQL队列的差异对比 Spark2.4.x与Spark3.3.x版本在通用队列的差异对比 DLI datasourceV1表和datasourceV2表 父主题: 版本支持公告

    来自:帮助中心

    查看更多 →

  • SparkRTC Demo怎么体验?

    SparkRTC Demo怎么体验? 您可以提交工单联系华为云技术客服,获取各平台对应的Demo进行体验。 父主题: 产品咨询

    来自:帮助中心

    查看更多 →

  • DIS Spark Streaming概述

    DIS Spark Streaming概述 DIS Spark Streaming是 数据接入服务 (DIS)提供的一个sdk,支持将DIS作为数据源创建DStream对接SparkStreaming。 DIS Spark Streaming使用流程如图1所示。 图1 DIS Spark

    来自:帮助中心

    查看更多 →

  • 创建并提交Spark作业

    创建并提交Spark作业 场景描述 本章节指导用户通过API创建并提交Spark作业。 约束限制 新队列第一次运行作业时,需要一定的时间,通常为6~10分钟。 涉及接口 创建弹性资源池:创建弹性资源池。 创建队列:在弹性资源池中添加队列。 上传分组资源:上传Spark作业所需的资源包。

    来自:帮助中心

    查看更多 →

  • Spark Core内存调优

    Spark Core内存调优 操作场景 Spark是内存计算框架,计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC(Garbage Collection),评估内存中RDD的大小来判断内存是否变成性能瓶颈,并根据情况优化。 监控节点进程的GC情况(在客户端的conf/spark-default

    来自:帮助中心

    查看更多 →

  • 使用Spark客户端

    如果集群为安全模式,执行以下命令进行用户认证。普通模式集群无需执行用户认证。 kinit 组件业务用户 直接执行Spark Shell命令。例如: spark-beeline 父主题: 使用Spark(MRS 3.x之前版本)

    来自:帮助中心

    查看更多 →

  • 配置Spark Core广播变量

    配置Spark Core广播变量 操作场景 Broadcast(广播)可以把数据集合分发到每一个节点上,Spark任务在执行过程中要使用这个数据集合时,就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast,每次任务需要数据集合时,都会把数据序列化到任务里面,不但耗时,还使任务变得很大。

    来自:帮助中心

    查看更多 →

  • 访问Spark Web UI界面

    访问Spark Web UI界面 Spark Web UI界面主要用于查看Spark应用程序运行情况,推荐使用Google chrome浏览器以获得更好的体验。 Spark主要有两个Web页面。 Spark UI页面,用于展示正在执行的应用的运行情况。 页面主要包括了Jobs、S

    来自:帮助中心

    查看更多 →

  • Spark应用开发流程介绍

    Spark应用开发流程介绍 Spark应用程序开发流程 Spark包含Spark Core、Spark SQL和Spark Streaming三个组件,其应用开发流程都是相同的。 开发流程中各阶段的说明如图1和表1所示。 图1 Spark应用程序开发流程 表1 Spark应用开发的流程说明

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了