更新时间:2025-08-20 GMT+08:00

安装补丁前准备

安装补丁前需要手动进行以下相关检查。

检查MRS集群的委托的OBS桶权限

安装补丁前需要检查Spark作业在DataArts上配的作业OBS桶路径。用户委托中如果只配置了MRS作业业务桶,可能会导致安装补丁后SparkScript/SparkSubmit作业提交失败

  1. 检查MRS集群是否存在SparkScript/SparkSubmit作业。

    登录MRS管理控制台前往MRS管控面作业管理,搜索作业列表中是否存在SparkScript/SparkSubmit作业类型, 查看作业详情里是否存在obs://xxx.sql 或者obs://xxx.py 或者obs://xxx.jar的文件。

    1. 登录MRS管理控制台。
    2. 选择“现有集群”,单击集群名称,进入集群信息页面。
    3. 单击“作业管理”,搜索作业列表中是否存在SparkScript/SparkSubmit作业类型,且作业详情里是否存在obs://xxx.sql 或者obs://xxx.py 或者obs://xxx.jar文件。
      • 存在,则执行步骤 2
      • 不存在,操作结束。

  2. 检查MRS集群是否配置委托。

    1. 登录MRS管理控制台。
    2. 选择“现有集群”,单击集群名称,进入集群信息页面。
    3. 在“运维管理”区域, 查看委托是否配置。
      • 存在,如果委托中配了对所有OBS桶授读写权限,如图2所示,检查结束。如果委托中配置单个OBS桶的权限, 则执行步骤 3
      • 不存在,请配置委托。
    图1 委托
    图2 OBS桶授权限

  3. 查看DataArts空间管理中配置的作业默认OBS桶名。

    1. 登录DataArts管理控制台。
    2. 选择要检查的实例,在空间管理中选择使用的空间,单击“编辑”。
    3. 查看作业日志OBS路径中的值,并复制OBS桶名。如果作业日志OBS路径为空,则默认桶名为“dlf-log-{projectId}/{workspaceId}”。

      其中:

      • projectId为租户的项目ID。
      • workspaceId为空间ID。
    图3 获取OBS路径

  1. 配置DataArts提交MRS SparkScript/SparkSubmit作业文件所在的OBS桶的读权限。如果不配置,可能会造成安装补丁后执行MRS SparkScript/SparkSubmit作业失败

    1. 登录IAM管理管理控制台,单击“委托”。
    2. 选择存算分离配置的委托,单击委托名称,选择“授权记录”,配置步骤 3查到的OBS桶的读权限,例如data-arts-obs-1。

检查所有节点管理平面网络是否互通

  1. 登录MRS集群Manager界面。

    登录集群Manager界面请参考访问MRS集群Manager

  2. 选择“运维 > 告警 > 告警”。
  3. 查看当前集群是否存在“ALM-12089 节点间网络互通异常”或“节点故障”等告警。

    • 是,节点间网络不互通,请联系运维人员修复。
    • 否,节点间网络互通,检查结束。

检查弹性伸缩是否关闭

  1. 登录华为云管理控制台界面,选择对应MRS集群,单击“弹性伸缩”。
  2. 查看当前集群的弹性伸缩策略是否是关闭状态。

    • 否,请跟业务方确认是否可以关闭,如果可以请关闭弹性伸缩,否则请另择时间进行补丁升级。
    • 是,弹性伸缩关闭,检查结束。

检查Manager是否有正在运行的任务

  1. 登录MRS集群Manager界面。

    登录集群Manager界面请参考访问MRS集群Manager

  2. 查看右上角任务。
  3. 查看当前集群是否存在正在运行的任务。

    • 是,等待任务运行结束。
    • 否,检查结束。

检查主备节点磁盘空间

  1. 分别登录主备OMS节点,查看磁盘使用信息。
  2. 执行以下命令,查看“/”目录的可用空间是否大于30GB。

    df -h /

    • 否,清理磁盘空间。
    • 是,检查结束。

检查集群是否有非标修改组件配置的操作

  1. 询问客户是否有做过相关操作。
  2. 查看该客户档案,是否有记录相关非标操作。

    • 是,需要详细评估补丁跟非标配置的兼容性。
    • 否,检查结束。

检查集群是否有安装紧急补丁

  1. 登录客户集群的主备节点,进入“/home/omm”目录。
  2. 查看是否存在紧急补丁的目录,比如MRSxxx或者xxxpatch。

    • 是,需要详细评估紧急补丁的兼容性。
    • 否,检查结束。

检查集群是否安装了Doris组件,且是否创建了UDF函数

  1. 咨询用户或者检查Doris是否有使用自定义函数功能。

    连接Doris,执行以下命令查询是否有自定义函数:

    show global functions;

    show functions from {db};

    • 是,使用drop function语句删除所有自定义函数。
    • 否,检查结束。