更新时间:2024-06-26 GMT+08:00

工作负载FAQ

本文主要为您介绍在Autopilot集群中遇到的工作负载相关问题。

创建工作负载时无法拉取SWR镜像如何解决?

在Autopilot集群中创建工作负载时,出现以下错误:

Failed to pull image "swr.cn-north-**.myhuaweicloud.com/**/nginx:latest": rpc error: code = Unknown desc = failed to pull and unpack image "swr.cn-north-7.myhuaweicloud.com/**/nginx:latest": failed to resolve reference "swr.cn-north-7.myhuaweicloud.com/**/nginx/latest": failed to do request: Head "https://swr.cn-north-**.myhuaweicloud.com/v2/**/nginx/manifests/latest": dial tcp 100.79.**.**:443: i/o timeout

报错信息中说明创建工作负载时无法拉取SWR镜像,请检查OBS和SWR终端节点是否正常。

解决方案

如果未创建OBS和SWR终端节点,请参考配置访问SWR和OBS服务的VPC终端节点进行配置。

创建工作负载时无法拉取公网镜像如何解决?

在Autopilot集群中创建工作负载时,事件中出现以下错误:

Failed to pull image "100.125.**.**:32334/**/nginx:1.0": rpcerror: code =DeadlineExceeded desc = failed to pulland unpack image "100.125.**.**:32334/**/nginx:1.0": failed to resolve reference "100.125.**.**:32334/**/nginx:1.0": failed to do request Head: Head "https://100.125.**.**:32334/v2/**/nginx/manifests/1.0": dial tcp 100.125.**.**:32334: i/o timeout

Autopilot集群从公网拉取镜像时,请检查NAT网关是否可正常访问公网。如果集群的子网路由表缺失,则会导致集群NAT网关无法访问公网。

解决方案

集群的子网需要在默认路由表下或者自定义表中添加0.0.0.0/0到NAT网关的路由。

  1. 登录CCE控制台,单击集群名称进入集群。
  2. 在左侧选择“总览”,在“网络信息”中查看集群容器子网。
  3. 在网络控制台中,单击左侧导航栏中的“虚拟私有云 > 子网”,筛选集群容器子网名称,并单击对应的路由表名称。

  4. 在路由表页面,单击“基本信息”页签,检查是否存在NAT网关的路由。

    如果没有,则需要手动添加路由,单击“添加路由”

    • 目的地址:填写为0.0.0.0/0,表示所有IP地址。
    • 下一跳类型:选择“NAT网关”
    • 下一跳:选择NAT网关名称。

    填写完成后单击“确定”

工作负载事件中出现Cluster pod max limit exceeded如何解决?

创建工作负载时,事件中出现以下错误:

Cluster pod max limit exceeded(x)

该事件信息表示集群中的Pod数量达到上限值,无法再新建Pod,其中x为集群Pod数量上限,默认为500。

解决方案

请合理规划集群中的Pod数量,避免达到上限值。

集群中安装的插件实例会占用Pod配额,请合理规划。