华为云

面向未来的智能世界,数字化是企业发展的必由之路。数字化成功的关键是以云原生的思维践行云原生,全数字化、全云化、AI驱动,一切皆服务。

华为云将持续创新,携手客户、合作伙伴和开发者,致力于让云无处不在,让智能无所不及,共建智能世界云底座。

 
 

    在华为云上搭配spark集群 更多内容
  • ARM环境python pipeline运行报139错误码规避方案

    配置 > 全部配置”,搜索参数spark.driver.extraLibraryPath和spark.executor.extraLibraryPath,并清空其参数值。 “全部配置”中选择“ SparkResource2x”。 SparkResource2x中的custom中添加方案一中的三个参数,如下图所示:

    来自:帮助中心

    查看更多 →

  • MapReduce服务 MRS

    自定义购买 MRS 集群 快速购买MRS集群 04 使用 根据业务发展需要,您可以随时扩容/缩容集群、升级Master节点规格、设置弹性伸缩策略。除此之外,你还可以实时查看监控指标及审计日志,以便及时了解集群和节点的健康状态。 如何创建集群 自定义购买集群 创建存算分离集群 扩容集群 配置弹性伸缩规则

    来自:帮助中心

    查看更多 →

  • 安装补丁

    重启相关组件。 MRS控制台,选择“现有集群”,单击集群名称进入集群详情页面。单击“组件管理”,选择需要重启的服务,进入服务页面。“服务状态”页签单击“更多”,选择“重启服务”或“滚动重启服务”。 FusionInsight Manager界面,选择“集群 > 服务 > 待

    来自:帮助中心

    查看更多 →

  • MRS各组件样例工程汇总

    Spark同时访问两个集群中的HBase的Scala示例程序。 本示例不支持未开启Kerberos认证的集群SparkSQLJavaExample Spark SQL任务的Java/Python/Scala示例程序。 本工程应用程序实现从HDFS读取文本数据并计算分析。 SparkSQLPythonExample

    来自:帮助中心

    查看更多 →

  • 从零开始使用Spark

    登录MRS控制台,在左侧导航栏选择“现有集群”,单击集群名称。 提交sparkPi作业。 MRS控制台选择“作业管理”,单击“添加”,进入“添加作业”页面,具体请参见运行Spark作业。 图2 sparkPi作业 作业类型选择“SparkSubmit”。 作业名称为“sparkPi”。 执行程序路径配置为OB

    来自:帮助中心

    查看更多 →

  • 在CCE集群节点中安装Agent

    CCE集群节点中安装Agent 导入对象存储卷 创建配置项 创建Agent守护进程集工作负载 父主题: 容器化部署数据库安全审计Agent

    来自:帮助中心

    查看更多 →

  • Spark Core

    执行大数据量的shuffle过程时Executor注册shuffle service失败 Spark应用执行过程中NodeManager出现OOM异常 安全集群使用HiBench工具运行sparkbench获取不到realm 父主题: Spark常见问题

    来自:帮助中心

    查看更多 →

  • 在本地Windows环境中查看Spark程序调试结果

    本地Windows环境中查看Spark程序调试结果 SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/D:/mavenlocal/org/apache/l

    来自:帮助中心

    查看更多 →

  • 回滚补丁后操作

    回退手动的操作 不涉及。 补丁卸载完成后重新打开弹性伸缩 如果卸载补丁前关闭了弹性伸缩,请卸载完成后重新打开。 登录华为云MRS管理控制台,“现有集群”列表中选择对应集群,单击“弹性伸缩”页签。 请开启卸载前关闭的弹性策略。 父主题: 回滚补丁

    来自:帮助中心

    查看更多 →

  • 在Hue WebUI使用SparkSql编辑器

    Hue WebUI使用SparkSql编辑器 操作场景 用户需要使用图形化界面集群中执行SparkSql语句时,可以通过Hue完成任务。 配置Spark2x 使用SparkSql编辑器之前需要先修改Spark2x配置。 进入Spark2x的全部配置页面,具体操作请参考修改集群服务配置参数。

    来自:帮助中心

    查看更多 →

  • 准备本地应用开发环境

    spark-env.sh Spark环境变量配置文件。 应用开发过程中,如需本地Windows系统中调测应用程序,需要复制解压目录下的“hosts”文件中的内容到客户端所在节点的hosts文件中,确保本地机器能与解压目录下“hosts”文件中所列出的各主机在网络互通。 当客户端所在

    来自:帮助中心

    查看更多 →

  • 自定义SparkStreaming作业

    commitAsync(offsetRanges) } 验证sparkStreaming作业 实际场景中,SparkStreming作业需要提交Spark集群运行,但本次验证只介绍本地IDE测试,目的是了解sdk基本使用方法。测试完成后用户可自行创建集群(如MRS集群)并提交作业验证。 使用注册账户登录DIS控制台。

    来自:帮助中心

    查看更多 →

  • 常用参数

    rue”。由于文件系统限制,ext3该设置可能会降低8核以上机器的处理性能。 false spark.shuffle.sort.bypassMergeThreshold 该参数只适用于spark.shuffle.manager设置为sort时。不做map端聚合并且reduc

    来自:帮助中心

    查看更多 →

  • 场景说明

    实例对外服务。hdfs创建"/home/data"目录,新增包含如下内容的文件并上传到hdfs的"/home/data"目录下。 Miranda,32 Karlie,23 Candice,27 确保其对启动JD BCS erver的用户有读写权限。 确保$SPARK_HOME/conf下有"hive-site

    来自:帮助中心

    查看更多 →

  • executor内存不足导致查询性能下降

    executor内存不足导致查询性能下降 现象描述 不同的查询周期内运行查询功能,查询性能会有起伏。 可能原因 处理数据加载时,为每个executor程序实例配置的内存不足,可能会产生更多的Java GC(垃圾收集)。当GC发生时,会发现查询性能下降。 定位思路 Spark UI,会发现某些execu

    来自:帮助中心

    查看更多 →

  • 如何使用PySpark连接MRS Spark?

    如何使用PySpark连接MRS Spark? 问:如何在E CS 服务器用PySpark连接内网开启Kerberos认证的MRS Spark集群? 答:将Spark的“spark-defaults.conf”文件中“spark.yarn.security.credentials.hbase

    来自:帮助中心

    查看更多 →

  • 编包并运行Spark应用

    编包并运行Spark应用 操作场景 程序代码完成开发后,您可以将打包好的jar包上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序Spark客户端的运行步骤是一样的。 Spark应用程序只支持Linux环境下运行,不支持Windows环境下运行。

    来自:帮助中心

    查看更多 →

  • JDBCServer长时间运行导致磁盘空间不足

    JDBCServer长时间运行导致磁盘空间不足 用户问题 连接Spark的JDBCServer服务提交spark-sql任务到yarn集群,在运行一段时间以后会出现Core节点的数据盘被占满的情况。 问题现象 客户连接Spark的JDBCServer服务提交spark-sql任务到yarn集群,在运行一段时间以后会出现Core节点的数据盘被占满的情况。

    来自:帮助中心

    查看更多 →

  • 常用参数

    rue”。由于文件系统限制,ext3该设置可能会降低8核以上机器的处理性能。 false spark.shuffle.sort.bypassMergeThreshold 该参数只适用于spark.shuffle.manager设置为sort时。不做map端聚合并且reduc

    来自:帮助中心

    查看更多 →

  • 本地运行Spark程序连接MRS集群的Hive、HDFS

    本地运行Spark程序连接MRS集群的Hive、HDFS 问题 本地运行Spark程序时,如何连接MRS集群的Hive和HDFS? 回答 为每一个Master节点申请并绑定弹性公网IP。 本地Windows配置集群的ip与主机名映射关系。登录集群后台,执行命令cat /etc

    来自:帮助中心

    查看更多 →

  • 安装补丁

    重启相关组件。 MRS控制台,选择“现有集群”,单击集群名称进入集群详情页面。单击“组件管理”,选择需要重启的服务,进入服务页面。“服务状态”页签单击“更多”,选择“重启服务”或“滚动重启服务”。 FusionInsight Manager界面,选择“集群 > 服务 > 待

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了