已知问题
本文介绍了不同发行平台的镜像已知问题,私有镜像同样适用。
Windows Server DHCP租约设置过长(大于99天),可能导致网络不通的问题
问题描述:
Windows Server操作系统的DHCP Client服务存在已知问题,当租约设置过长(大于99天)会导致您的实例无法自动续约IP。当第一次的租约到期时会导致实例网络不通。
涉及镜像:
Windows Server 2008、Windows Server 2012 R2、Windows Server 2016、Windows Server 2019公共镜像及私有镜像
解决方案:
- 调整实例所在的子网DHCP租约为1天或者无限租约。
- 执行以下命令,使租约设置生效。
如下操作会短暂影响网络连接,请暂停业务或者在业务低峰期进行操作。
ipconfig /renew
内核在网卡增删场景下,概率性导致系统异常的问题
问题描述:
在云服务器上进行网卡热插拔事件或者等价行为,概率性出现以下两种情况:
- 触发内核panic,OS自动重启
- 软中断使用率冲高,网络收发包异常
涉及镜像:
CentOS 7公共镜像及私有镜像
解决方案:
建议进行内核版本升级修复对应Bug,升级至CentOS 7内核版本3.10.0-1160.25.1.e17.x86_64。
部分内核TCP网络概率性不通
问题描述:
修复CVE-2019-11477(TCP SACK)的内核引入新问题,在Socket buffer很低的情况下可能导致网络不通。
涉及镜像:
镜像类型 |
内核版本 |
---|---|
2019-06-26至2019-09-29期间的CentOS 7公共镜像 |
3.10.0-957.21.3.e17.x86_64 |
2019-06-26至2019-10-15期间的Ubuntu 16、Ubuntu 18公共镜像 |
Ubuntu 16.04:4.4.0-151-generic Ubuntu 18.04:4.15.0-52-generic |
2019-06-26至2019-10-15期间的Debian 9.0公共镜像 |
4.9.0-9-amd64 |
2019-06-27至2019-10-15期间的Fedora 29、openSUSE 15.0公共镜像 |
Fedora 29:5.1.11-200.fc29.x86_64 openSUSE 15.0:4.12.14-1p150.12.64-default |
解决方案:
升级到最新的内核。各镜像类型升级内核的命令如下:
- CentOS/Fedora:yum update kernel
- Ubuntu:apt-get update && apt-get install linux-image-generic
- openSUSE:zypper refresh && zypper install kernel-default
- Debian:apt-get update && apt search linux-image && apt-get install linux-image-xxx
其中,apt search linux-image可以查询最新的内核版本;apt-get install linux-image-xxx用于升级到最新内核版本。
部分OS参数配置不生效问题
问题描述:
在“/etc/sysctl.conf”中配置net.ipv4.tcp_max_tw_buckets后,使用sysctl -a检查没有生效。原因是公共镜像已内置部分优化配置,放“/etc/sysctl.d/huawei.conf” 和“/etc/security/limits.d/huawei-nofile.conf”里,这些优先级比“/etc/sysctl.conf”的要高,导致客户配置不生效。
影响的参数为:
镜像优化过的参数 |
修改的文件 |
---|---|
vm.swappiness net.core.somaxconn net.ipv4.tcp_max_tw_buckets net.ipv4.tcp_max_syn_backlog |
/etc/sysctl.d/huawei.conf |
* soft nofile 65535 * hard nofile 65535 |
/etc/security/limits.d/huawei-nofile.conf |
涉及镜像:
- 2018-09-25至2019-09-29期间的所有CentOS 7公共镜像
- 2018-09-25至2019-10-10期间的所有CentOS 6公共镜像
- 2018-09-28至2019-10-15期间的所有Ubuntu、openSUSE 15.0、Debian、Fedora 29公共镜像
解决方案:
- 删除内置的配置文件
rm -rf /etc/sysctl.d/huawei.conf
rm -rf /etc/security/limits.d/huawei-nofile.conf
- 修改内核参数配置文件(“limits.conf”和“sysctl.conf”)
cat >>/etc/security/limits.conf <<EOF
root soft nofile 65535
root hard nofile 65535
* soft nofile 65535
* hard nofile 65535
EOF
cat >>/etc/sysctl.conf <<EOF
vm.swappiness=0
net.core.somaxconn=1024
net.ipv4.tcp_max_tw_buckets=5000
net.ipv4.tcp_max_syn_backlog=1024
EOF
1822网卡卸载实例不兼容Linux 3.16.x内核的问题
问题描述:
使用华为自研25GE智能高速网卡硬件卸载功能的弹性云服务器(包含但不限于c3ne、m3ne、c6、m6、g5、p2v、g5r、p2vs、p2s、pi2、fp1cn1、ai1、e3.26xlarge.14、e3.52xlarge.14、e3.52xlarge.20、kc1、km1)与Linux 3.16.x内核分支(3.16.47~3.16.x)操作系统版本存在兼容性问题,会概率性导致网络不通等现象。
涉及镜像:
Debian 8.2.0 64bit、Debian 8.8.0公共镜像
解决方案:
当前已在相关规格下线Debian 8公共镜像。使用涉及镜像创建的云服务器尽快迁移到S3、C3上面。
Windows Server 2012 R2的Server Manager工具与VMTools不兼容导致磁盘错误重置数据丢失
问题描述:
Windows Server 2012 R2系统云服务器配置了2块数据盘,使用Windows系统自带的Server Manager工具去重置第二块数据盘时,发现第一块数据盘被重置,导致第一块数据盘数据丢失。
涉及镜像:
2019-02-19之前的Windows Server 2012 R2公共镜像
解决方案:
涉及的云服务器请将VMTools升级至2.5.0.156及之后较新的版本。
未关闭CLOSE_WAIT状态连接,导致部分业务中断
问题描述:
一键式重置密码插件进程创建的TCP连接,没有关闭socket,产生CLOSE_WAIT状态连接,导致部分业务中断。
涉及镜像:
- 2019-06-05之前的CentOS、EulerOS公共镜像
- 2019-06-03之前的Ubuntu、Debian公共镜像
解决方案:
涉及的云服务器请更新一键式重置密码插件。