更新时间:2022-09-16 GMT+08:00
分享

已知问题

本文介绍了不同发行平台的镜像已知问题,私有镜像同样适用。

Windows Server DHCP租约设置过长(大于99天),可能导致网络不通的问题

问题描述:

Windows Server操作系统的DHCP Client服务存在已知问题,当租约设置过长(大于99天)会导致您的实例无法自动续约IP。当第一次的租约到期时会导致实例网络不通。

涉及镜像:

Windows Server 2008、Windows Server 2012 R2、Windows Server 2016、Windows Server 2019公共镜像及私有镜像

解决方案:

  1. 调整实例所在的子网DHCP租约为1天或者无限租约。
  2. 执行以下命令,使租约设置生效。

    如下操作会短暂影响网络连接,请暂停业务或者在业务低峰期进行操作。

    ipconfig /renew

内核在网卡增删场景下,概率性导致系统异常的问题

问题描述:

在云服务器上进行网卡热插拔事件或者等价行为,概率性出现以下两种情况:

  • 触发内核panic,OS自动重启
  • 软中断使用率冲高,网络收发包异常

Patch链接如下:https://git.kernel.org/pub/scm/linux/kernel/git/stable/linux-stable.git/commit/?id=f00e35e259948b995aa1f3ee7fddb05f34a50157

涉及镜像:

CentOS 7公共镜像及私有镜像

解决方案:

建议进行内核版本升级修复对应Bug,升级至CentOS 7内核版本3.10.0-1160.25.1.e17.x86_64。

部分内核TCP网络概率性不通

问题描述:

修复CVE-2019-11477(TCP SACK)的内核引入新问题,在Socket buffer很低的情况下可能导致网络不通。

涉及镜像:

镜像类型

内核版本

2019-06-26至2019-09-29期间的CentOS 7公共镜像

3.10.0-957.21.3.e17.x86_64

2019-06-26至2019-10-15期间的Ubuntu 16、Ubuntu 18公共镜像

Ubuntu 16.04:4.4.0-151-generic

Ubuntu 18.04:4.15.0-52-generic

2019-06-26至2019-10-15期间的Debian 9.0公共镜像

4.9.0-9-amd64

2019-06-27至2019-10-15期间的Fedora 29、openSUSE 15.0公共镜像

Fedora 29:5.1.11-200.fc29.x86_64

openSUSE 15.0:4.12.14-1p150.12.64-default

解决方案:

升级到最新的内核。各镜像类型升级内核的命令如下:

  • CentOS/Fedora:yum update kernel
  • Ubuntu:apt-get update && apt-get install linux-image-generic
  • openSUSE:zypper refresh && zypper install kernel-default
  • Debian:apt-get update && apt search linux-image && apt-get install linux-image-xxx

    其中,apt search linux-image可以查询最新的内核版本;apt-get install linux-image-xxx用于升级到最新内核版本。

部分OS参数配置不生效问题

问题描述:

在“/etc/sysctl.conf”中配置net.ipv4.tcp_max_tw_buckets后,使用sysctl -a检查没有生效。原因是公共镜像已内置部分优化配置,放“/etc/sysctl.d/huawei.conf” 和“/etc/security/limits.d/huawei-nofile.conf”里,这些优先级比“/etc/sysctl.conf”的要高,导致客户配置不生效。

影响的参数为:

镜像优化过的参数

修改的文件

vm.swappiness

net.core.somaxconn

net.ipv4.tcp_max_tw_buckets

net.ipv4.tcp_max_syn_backlog

/etc/sysctl.d/huawei.conf

* soft nofile 65535

* hard nofile 65535

/etc/security/limits.d/huawei-nofile.conf

涉及镜像:

  • 2018-09-25至2019-09-29期间的所有CentOS 7公共镜像
  • 2018-09-25至2019-10-10期间的所有CentOS 6公共镜像
  • 2018-09-28至2019-10-15期间的所有Ubuntu、openSUSE 15.0、Debian、Fedora 29公共镜像

解决方案:

  1. 删除内置的配置文件

    rm -rf /etc/sysctl.d/huawei.conf

    rm -rf /etc/security/limits.d/huawei-nofile.conf

  2. 修改内核参数配置文件(“limits.conf”和“sysctl.conf”)

    cat >>/etc/security/limits.conf <<EOF

    root soft nofile 65535

    root hard nofile 65535

    * soft nofile 65535

    * hard nofile 65535

    EOF

    cat >>/etc/sysctl.conf <<EOF

    vm.swappiness=0

    net.core.somaxconn=1024

    net.ipv4.tcp_max_tw_buckets=5000

    net.ipv4.tcp_max_syn_backlog=1024

    EOF

1822网卡卸载实例不兼容Linux 3.16.x内核的问题

问题描述:

使用华为自研25GE智能高速网卡硬件卸载功能的弹性云服务器(包含但不限于c3ne、m3ne、c6、m6、g5、p2v、g5r、p2vs、p2s、pi2、fp1cn1、ai1、e3.26xlarge.14、e3.52xlarge.14、e3.52xlarge.20、kc1、km1)与Linux 3.16.x内核分支(3.16.47~3.16.x)操作系统版本存在兼容性问题,会概率性导致网络不通等现象。

涉及镜像:

Debian 8.2.0 64bit、Debian 8.8.0公共镜像

解决方案:

当前已在相关规格下线Debian 8公共镜像。使用涉及镜像创建的云服务器尽快迁移到S3、C3上面。

Windows Server 2012 R2的Server Manager工具与VMTools不兼容导致磁盘错误重置数据丢失

问题描述:

Windows Server 2012 R2系统云服务器配置了2块数据盘,使用Windows系统自带的Server Manager工具去重置第二块数据盘时,发现第一块数据盘被重置,导致第一块数据盘数据丢失。

涉及镜像:

2019-02-19之前的Windows Server 2012 R2公共镜像

解决方案:

涉及的云服务器请将VMTools升级至2.5.0.156及之后较新的版本。

未关闭CLOSE_WAIT状态连接,导致部分业务中断

问题描述:

一键式重置密码插件进程创建的TCP连接,没有关闭socket,产生CLOSE_WAIT状态连接,导致部分业务中断。

涉及镜像:

  • 2019-06-05之前的CentOS、EulerOS公共镜像
  • 2019-06-03之前的Ubuntu、Debian公共镜像

解决方案:

涉及的云服务器请更新一键式重置密码插件。

相关文档