文档首页/ 云容器引擎 CCE/ 常见问题/ 域名DNS/ CCE集群内域名解析失败,如何快速规避保障业务运行?
更新时间:2025-10-27 GMT+08:00
分享

CCE集群内域名解析失败,如何快速规避保障业务运行?

场景一:CCE集群内少量Pod解析域名失败

恢复方案:在异常Pod内配置hosts文件

  • 方式1:直接编辑Pod内的/etc/hosts文件

    Pod重启后添加的hosts配置会丢失。

    操作步骤:

    1. 执行kubectl exec -it命令,进入Pod。
      kubectl exec -it <pod_name> -- /bin/sh
    2. 通过vi /etc/hosts命令添加解析异常域名的hosts配置。

      配置形式如下:

      127.0.x.x example.com
  • 方式2:使用hostAliases参数配置Pod的/etc/hosts文件,详情请参见使用hostAliases参数配置Pod的/etc/hosts文件

场景二:CCE集群内所有Pod解析域名失败

恢复方案:在CoreDNS上配置hosts解析。

操作步骤:请参见使用CoreDNS实现自定义域名解析

场景三:CCE集群内少量节点解析域名失败

  • 恢复方案1:资源充足时优先尝试隔离异常节点,重启业务容器迁移到其他正常节点。您可以使用节点排水功能将异常节点上的容器驱逐至其他节点,并将故障节点进行隔离,操作步骤详情请参见节点排水
  • 恢复方案2:在异常节点内配置hosts。

    节点重启后添加的hosts配置不会丢失。

    操作步骤:

    1. 通过vnc或者ssh的方式登录异常节点。
    2. 通过vi /etc/hosts命令添加解析异常域名的hosts配置。

      配置形式如下:

      127.0.x.x example.com

场景四:CCE集群内所有节点解析域名失败

恢复方案:在DNS配置解析异常域名的解析记录,操作步骤详情请参见添加公网域名解析记录

如果使用自建DNS,请在自建DNS侧配置解析异常域名的解析记录。

验证

在解析异常的客户端Pod或者节点内执行ping、curl、nslookup等命令测试域名解析是否恢复正常。

相关文档