DDS实例连接失败怎么办
问题分析
主要从九个方面考虑:
- 排除数据库实例异常
例如:DDS系统故障,实例状态异常,实例或表被锁定。
- (常见)使用正确的客户端连接方式
- 数据库安装包须从官网下载并正确安装,请参见如何安装MongoDB客户端。
- 建议使用4.0版本以上的MongoDB客户端连接实例。
- 内网连接需要DDS与ECS实例必须在同一区域、VPC内。
- 公网连接需要购买或使用已有EIP,并对DDS实例绑定该EIP 。
- 使用正确的SSL方式安全连接
界面SSL开关开启和关闭,分别对应不用的连接命令。例如:
- 开关开启:./mongo --host<DB_HOST>--port<DB_PORT>-u<DB_USER>-p--authenticationDatabaseadmin--ssl --sslCAFile<FILE_PATH> --sslAllowInvalidHostnames
- 开关关闭:./mongo --host<DB_HOST>--port<DB_PORT>-u<DB_USER>-p --authenticationDatabase admin
- 排除连接命令错误
例如:连接地址错误、端口参数配置错误、用户名和密码错误、SSL方式下命令错误。
- (常见)排除网络不通
内网访问
- 确认ECS与DDS是否在同一个区域、同一个VPC。
ECS与DDS在不同VPC的场景,可以通过建立VPC对等连接实现网络互通。
- 检查安全组规则。
- 安全组外访问安全组内的DDS集群实例时,需要为安全组添加相应的入方向规则。
- 在ECS上测试是否可以正常连接到DDS实例地址的端口。
公网访问
- 检查安全组规则。
- 安全组外访问安全组内的DDS集群实例时,需要为安全组添加相应的入方向规则。
- 检查网络ACL规则。
- 相同区域主机进行ping测试。
跨网段访问(配置IP映射)
通过内网连接副本集实例时,当客户端和副本集实例部署在不同网段时,且客户端所在的网段不在“192.168.0.0/16”,“172.16.0.0/24”和“10.0.0.0/8”时,需要进行跨网段访问配置,以实现网络互通。
- 确认ECS与DDS是否在同一个区域、同一个VPC。
- (常见)排除实例的连接数满的情况
实例连接数过多,可能会导致业务侧无法正常连接。
- (常见)排除磁盘满的情况
实例磁盘使用率过高会导致实例状态异常,无法正常连接实例。
- 排除CPU使用率飙升问题
CPU使用率很高或接近100%,会导致数据读写处理缓慢、无法获取连接、出现报错等,从而影响业务正常运行。
- 连接失败的常见报错
包含连接失败的常见报错,以及相应的解决方法。
排查思路
- 排除数据库实例异常
检查办法:请在控制台检查数据库实例状态是否为“正常”。
可能原因:DDS系统故障,实例状态异常,实例或表被锁定等。
解决方法
- DDS实例状态异常请及时联系运维人员协助处理。
- 系统故障、实例或表被锁定等,请尝试重启功能,详细操作请参考重启实例。
图1 查看实例状态
- 使用正确的客户端连接方式
建议使用4.0版本以上的MongoDB客户端连接实例,安装客户端操作请参见如何安装MongoDB客户端。
以集群为例:
- 内网连接实例的具体操作步骤,请参见通过内网连接集群实例。
- 公网连接实例的具体操作步骤,请参见通过公网连接集群实例。
表1 客户端连接方式 连接方式
使用场景
内网方式
系统默认提供内网IP地址。
当应用部署在ECS上,且该ECS与DDS实例处于同一区域,同一VPC时,建议单独使用内网IP连接ECS与DDS实例。
公网方式
不能通过内网IP地址访问DDS实例时,使用公网访问,建议单独绑定弹性公网IP连接ECS(或公网主机)与DDS实例。
用户需要购买弹性公网IP,请参见弹性公网IP计费说明。
- 使用正确的SSL方式安全连接
- 排除连接命令错误
请获取正确的连接地址、端口参数配置、用户名和密码、SSL方式下命令,并重试连接实例。
SSL内网连接集群示例:./mongo mongodb://rwuser:<password>@<DB_HOST>:<DB_PORT>,<DB_HOST>:<DB_PORT>/test?authSource=admin --ssl --sslCAFile <FILE_PATH> --sslAllowInvalidHostnames
- 连接地址
图4 连接地址
- 数据库端口
- 用户名和密码
root管理员账号及其对应的密码,如若密码不正确或者忘记了密码,可通过重置管理员密码来修改密码。
- 证书名称
SSL公网连接集群示例:./mongo mongodb://rwuser:<password>@<DB_HOST>:<DB_PORT>/test?authSource=admin --ssl --sslCAFile <FILE_PATH> --sslAllowInvalidHostnames
- 连接地址
- 数据库端口
- 用户名和密码
root管理员账号及其对应的密码,如若密码不正确或者忘记了密码,可通过重置管理员密码来修改密码。
- 证书名称
- 连接地址
- 排除网络不通
内网访问
- 检查ECS与DDS是否在同一个区域、同一个VPC。
- 不同区域的云服务之间内网互不相通,无法访问实例。请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。
- 不同VPC下,可以通过建立VPC对等连接实现网络互通。
- 检查安全组规则。
安全组外访问安全组内的DDS实例时,需要为安全组添加相应的入方向规则。
- 在ECS上测试是否可以正常连接到DDS实例地址的端口。
telnet <实例地址> {8635}
- 可以通信,说明网络是正常的。
- 无法通信,请提交工单联系华为云客服协助解决。
公网访问
- 检查安全组规则。
安全组外访问安全组内的DDS实例时,需要为安全组添加相应的入方向规则。
- 检查网络ACL规则。
- 进入虚拟私有云网络ACL列表。
- 检查EIP绑定的网卡是否在网络ACL关联的子网下。
- 查看网络ACL当前是“开启”状态还是“关闭”状态。
若网络ACL为“开启”状态,需要添加ICMP放通规则进行流量放通。
注意:网络ACL的默认规则是丢弃所有出入方向的包,关闭“网络ACL”后,其默认规则仍然生效。
- 相同区域主机进行ping测试。
如果在原ECS上没有ping通DDS实例绑定的EIP,请在相同区域的另一台ECS上去ping该EIP,如果可以正常ping通,说明虚拟网络正常,请提交工单联系华为云客服协助解决。
跨网段访问(配置IP映射)
通过内网连接副本集实例时,当客户端和副本集实例部署在不同网段时,且客户端所在的网段不在“192.168.0.0/16”,“172.16.0.0/24”和“10.0.0.0/8”时,需要进行跨网段访问配置,以实现网络互通。
- 检查ECS与DDS是否在同一个区域、同一个VPC。
- 排除实例的连接数满的情况
- 查看实例的连接数是否已达上限,请参见如何查询及限制连接数。
若实例连接数已满请参见实例的连接数满怎么处理。
- 云监控服务目前可以监控数据库CPU、内存、磁盘、连接数等指标,并且设置告警策略,出现告警时可以提前识别风险。
- 查看实例的连接数是否已达上限,请参见如何查询及限制连接数。
- 排除磁盘满的情况
检查方法:磁盘空间使用率可通过管理控制台或云监控服务查看。
可能原因:当实例处于“磁盘空间满”状态时,需扩容至磁盘空间使用率小于80%才可使实例处于可用状态,使数据库恢复正常的写入操作。
解决方案:
- 随着业务数据的增加,原来申请的数据库磁盘容量可能会不足,建议用户扩容磁盘空间,确保磁盘空间足够。具体操作请参见扩容磁盘。
- 请及时处理过期数据文件。
- 云监控服务目前可以监控数据库CPU、内存、磁盘、连接数等指标,并且设置告警策略,出现告警时可以提前识别风险。
- 排除CPU使用率过高的情况
CPU使用率很高或接近100%,会导致数据读写处理缓慢、无法获取连接、出现报错等,从而影响业务正常运行。
解决方案:请参见如何排查DDS实例CPU使用率高的问题。
- 连接失败的常见报错
- 连接失败,提示:network error while attempting to run command ‘isMaster’
使用如下命令连接DDS实例时报错。
./mongo --host 192.168.168.182 --port 8635 -u rwuser -p xxxxxxxxxx --authenticationDatabase admin
图6 连接失败
具体处理方法请参见连接失败,提示:network error while attempting to run command ‘isMaster’。
- 连接失败,提示:No route to host以及connection attempt failed
使用如下命令连接DDS实例时报错。
mongo --host 192.168.1.6 --port 8635 -u rwuser -p xxxxxxxxx --authenticationDatabase admin --ssl --sslCAFile /root/ca.crt --sslAllowInvalidHostnames
报错信息如下:
MongoDB shell version v3.4.17 connecting to: mongodb://192.168.1.6:8635/ 2019-09-19T09:38:36.954+0800 W NETWORK [thread1] Failed to connect to 192.168.1.6:8635, in(checking socket for error after poll), reason: No route to host 2019-09-19T09:38:36.954+0800 E QUERY [thread1] Error: couldn't connect to server 192.168.1.6:8635, connection attempt failed : connect@src/mongo/shell/mongo.js:240:13 @(connect):1:6 exception: connect failed
具体处理方法请参见连接失败,提示:No route to host以及connection attempt failed。
- 连接失败,提示:No route to host以及connection attempt failed
mongo --host 192.168.168.116 --port 8635 -u rwuser -p xxxxxxxxx --authenticationDatabase admin --ssl --sslCAFile /root/ca.crt --sslAllowInvalidHostnames
报错信息如下:
MongoDB shell version v3.4.17 connecting to: mongodb://192.168.168.116:8635/ 2019-09-19T09:39:24.306+0800 W NETWORK [thread1] The server certificate does not match the host name. Hostname: 192.168.168.116 does not match CN: 172.16.2.65 MongoDB server version: 4.0.3 WARNING: shell and server versions do not match 2019-09-19T09:39:24.329+0800 E QUERY [thread1] Error: Authentication failed. : DB.prototype._authOrThrow@src/mongo/shell/db.js:1461:20 @(auth):6:1 @(auth):1:2 exception: login failed
具体处理方法请参见连接失败,提示:No route to host以及connection attempt failed。
- 连接失败,提示:couldn’t connect to server
使用如下命令连接DDS实例时报错。
mongo --host 192.168.64.201 --port 8635 -u rwuser -p xxxxxxxxx --authenticationDatabase admin --ssl --sslCAFile /root/ca.crt --sslAllowInvalidHostnames
报错信息如下:
MongoDB shell version v3.4.17 connecting to: mongodb://192.168.64.201:8635/ 2019-09-19T09:45:48.168+0800 W NETWORK [thread1] Failed to connect to 192.168.64.201:8635 after 5000ms milliseconds, giving up. 2019-09-19T09:45:48.168+0800 E QUERY [thread1] Error: couldn't connect to server 192.168.64.201:8635, connection attempt failed : connect@src/mongo/shell/mongo.js:240:13 @(connect):1:6 exception: connect failed
具体处理方法请参见连接失败,提示:couldn’t connect to server。
- 连接失败,提示:cannot list multiple servers in URL without ‘replicaSet’ option
使用如下命令连接DDS副本集实例时报错。
./mongo mongodb://rwuser:xxxxxxxxxxx@192.168.168.116:8635,192.168.200.147:8635/test?authSource=admin&replicaSet=replica
报错信息如下:
FailedToParse: Cannot list multiple servers in URL without 'replicaSet' option try 'mongo --help' for more information.
使用如下命令连接兼容MongoDB 3.4版本的DDS实例时报错。
mongo "mongodb://rwuser:xxxxxxxxx@192.168.95.167:8635,192.168.92.43:8635/test?authSource=admin"
报错信息如下:
FailedToParse: Cannot list multiple servers in URL without 'replicaSet' option try 'mongo --help' for more information.
具体处理方法请参见连接失败,提示:cannot list multiple servers in URL without ‘replicaSet’ option。
- Java驱动连接实例失败,提示:Timeout while receiving message
使用Java驱动连接DDS实例时报错。
报错信息如下:
org.springframework.data.mongodb.UncategorizedMongoDbException: Timeout while receiving message; nested exception is com.mongodb.MongoSocketReadTimeoutException: Timeout while receiving message
- 连接失败,提示:exception: login failed 以及 U_STRINGPREP_PROHIBITED_ERROR
使用如下命令连接DDS实例时报错。
./mongo "mongodb://rwuser:xxxxxx@192.168.0.45:8635,192.168.0.96:8635/test?authSource=admin&replicaSet=replica"
报错信息如下:
MongoDB shell version v4.0.3 connecting to: mongodb://192.168.0.45:8635,192.168.0.96:8635/test?authSource=admin&replicaSet=replica 2021-11-05T05:52:53.717+0000 I NETWORK [js] Starting new replica set monitor for replica/192.168.0.45:8635,192.168.0.96:8635 2021-11-05T05:52:53.718+0000 I NETWORK [ReplicaSetMonitor-TaskExecutor] Successfully connected to 192.168.0.45:8635 (1 connections now open to 192.168.0.45:8635 with a 5 second timeout) 2021-11-05T05:52:53.718+0000 I NETWORK [js] Successfully connected to 192.168.0.96:8635 (1 connections now open to 192.168.0.96:8635 with a 5 second timeout) Implicit session: session { "id" : UUID("5945d2a5-8275-4e3c-b06f-632f062a2ead") } MongoDB server version: 4.0.3 2021-11-05T05:52:53.722+0000 I NETWORK [js] Marking host 192.168.0.96:8635 as failed :: caused by :: Location50692: can't authenticate against replica set node 192.168.0.96:8635 :: caused by :: Error preflighting normalization: U_STRINGPREP_PROHIBITED_ERROR 2021-11-05T05:52:53.722+0000 I NETWORK [js] Successfully connected to 192.168.0.45:8635 (1 connections now open to 192.168.0.45:8635 with a 0 second timeout) 2021-11-05T05:52:53.723+0000 I NETWORK [js] Marking host 192.168.0.45:8635 as failed :: caused by :: Location50692: can't authenticate against replica set node 192.168.0.45:8635 :: caused by :: Error preflighting normalization: U_STRINGPREP_PROHIBITED_ERROR 2021-11-05T05:52:53.724+0000 I NETWORK [js] Marking host 192.168.0.96:8635 as failed :: caused by :: Location50692: can't authenticate against replica set node 192.168.0.96:8635 :: caused by :: Error preflighting normalization: U_STRINGPREP_PROHIBITED_ERROR 2021-11-05T05:52:53.725+0000 I NETWORK [js] Marking host 192.168.0.45:8635 as failed :: caused by :: Location50692: can't authenticate against replica set node 192.168.0.45:8635 :: caused by :: Error preflighting normalization: U_STRINGPREP_PROHIBITED_ERROR 2021-11-05T05:52:53.725+0000 E QUERY [js] Error: can't authenticate against replica set node 192.168.0.45:8635 :: caused by :: Error preflighting normalization: U_STRINGPREP_PROHIBITED_ERROR : DB.prototype._authOrThrow@src/mongo/shell/db.js:1685:20 @(auth):6:1 @(auth):1:2 exception: login failed
具体处理方法请参见连接失败,提示:exception: login failed 以及 U_STRINGPREP_PROHIBITED_ERROR。
- 连接失败,提示:network error while attempting to run command ‘isMaster’
- 如果上述方法均不能解决您的疑问,请提交工单联系华为云客服为您解答。