更新时间:2025-08-20 GMT+08:00
安装补丁前准备
安装补丁前需要手动进行以下相关检查。
检查MRS集群的委托的OBS桶权限
安装补丁前需要检查Spark作业在DataArts上配的作业OBS桶路径。用户委托中如果只配置了MRS作业业务桶,可能会导致安装补丁后SparkScript/SparkSubmit作业提交失败。
- 检查MRS集群是否存在SparkScript/SparkSubmit作业。
登录MRS管理控制台前往MRS管控面作业管理,搜索作业列表中是否存在SparkScript/SparkSubmit作业类型, 查看作业详情里是否存在obs://xxx.sql 或者obs://xxx.py 或者obs://xxx.jar的文件。
- 登录MRS管理控制台。
- 选择“现有集群”,单击集群名称,进入集群信息页面。
- 单击“作业管理”,搜索作业列表中是否存在SparkScript/SparkSubmit作业类型,且作业详情里是否存在obs://xxx.sql 或者obs://xxx.py 或者obs://xxx.jar文件。
- 存在,则执行步骤 2。
- 不存在,操作结束。
- 检查MRS集群是否配置委托。
- 登录MRS管理控制台。
- 选择“现有集群”,单击集群名称,进入集群信息页面。
- 在“运维管理”区域, 查看委托是否配置。
图1 委托 - 查看DataArts空间管理中配置的作业默认OBS桶名。
- 登录DataArts管理控制台。
- 选择要检查的实例,在空间管理中选择使用的空间,单击“编辑”。
- 查看作业日志OBS路径中的值,并复制OBS桶名。如果作业日志OBS路径为空,则默认桶名为“dlf-log-{projectId}/{workspaceId}”。
- projectId为租户的项目ID。
- workspaceId为空间ID。
图3 获取OBS路径
- 配置DataArts提交MRS SparkScript/SparkSubmit作业文件所在的OBS桶的读权限。如果不配置,可能会造成安装补丁后执行MRS SparkScript/SparkSubmit作业失败。
- 登录IAM管理管理控制台,单击“委托”。
- 选择存算分离配置的委托,单击委托名称,选择“授权记录”,配置步骤 3查到的OBS桶的读权限,例如data-arts-obs-1。
检查所有节点管理平面网络是否互通
- 登录MRS集群Manager界面。
登录集群Manager界面请参考访问MRS集群Manager。
- 选择“运维 > 告警 > 告警”。
- 查看当前集群是否存在“ALM-12089 节点间网络互通异常”或“节点故障”等告警。
- 是,节点间网络不互通,请联系运维人员修复。
- 否,节点间网络互通,检查结束。
检查弹性伸缩是否关闭
- 登录华为云管理控制台界面,选择对应MRS集群,单击“弹性伸缩”。
- 查看当前集群的弹性伸缩策略是否是关闭状态。
- 否,请跟业务方确认是否可以关闭,如果可以请关闭弹性伸缩,否则请另择时间进行补丁升级。
- 是,弹性伸缩关闭,检查结束。
检查Manager是否有正在运行的任务
- 登录MRS集群Manager界面。
登录集群Manager界面请参考访问MRS集群Manager。
- 查看右上角任务。
- 查看当前集群是否存在正在运行的任务。
- 是,等待任务运行结束。
- 否,检查结束。
检查主备节点磁盘空间
- 分别登录主备OMS节点,查看磁盘使用信息。
- 执行以下命令,查看“/”目录的可用空间是否大于30GB。
df -h /
- 否,清理磁盘空间。
- 是,检查结束。
检查集群是否有非标修改组件配置的操作
- 询问客户是否有做过相关操作。
- 查看该客户档案,是否有记录相关非标操作。
- 是,需要详细评估补丁跟非标配置的兼容性。
- 否,检查结束。
检查集群是否有安装紧急补丁
- 登录客户集群的主备节点,进入“/home/omm”目录。
- 查看是否存在紧急补丁的目录,比如MRSxxx或者xxxpatch。
- 是,需要详细评估紧急补丁的兼容性。
- 否,检查结束。
检查集群是否安装了Doris组件,且是否创建了UDF函数
- 咨询用户或者检查Doris是否有使用自定义函数功能。
连接Doris,执行以下命令查询是否有自定义函数:
show global functions;
show functions from {db};
- 是,使用drop function语句删除所有自定义函数。
- 否,检查结束。