CCE集群内域名解析失败,如何快速规避保障业务运行?
场景一:CCE集群内少量Pod解析域名失败
恢复方案:在异常Pod内配置hosts文件
- 方式1:直接编辑Pod内的/etc/hosts文件 
       Pod重启后添加的hosts配置会丢失。 操作步骤: - 执行kubectl exec -it命令,进入Pod。 
       kubectl exec -it <pod_name> -- /bin/sh 
- 通过vi /etc/hosts命令添加解析异常域名的hosts配置。 
       配置形式如下: 127.0.x.x example.com 
 
- 执行kubectl exec -it命令,进入Pod。 
       
- 方式2:使用hostAliases参数配置Pod的/etc/hosts文件,详情请参见使用hostAliases参数配置Pod的/etc/hosts文件。
场景三:CCE集群内少量节点解析域名失败
- 恢复方案1:资源充足时优先尝试隔离异常节点,重启业务容器迁移到其他正常节点。您可以使用节点排水功能将异常节点上的容器驱逐至其他节点,并将故障节点进行隔离,操作步骤详情请参见节点排水。
- 恢复方案2:在异常节点内配置hosts。 
       节点重启后添加的hosts配置不会丢失。 操作步骤: - 通过vnc或者ssh的方式登录异常节点。
- 通过vi /etc/hosts命令添加解析异常域名的hosts配置。 
       配置形式如下: 127.0.x.x example.com 
 
验证
在解析异常的客户端Pod或者节点内执行ping、curl、nslookup等命令测试域名解析是否恢复正常。
 
  