RDS实例连接失败怎么办
问题分析
主要从八个方面考虑:
- 排除数据库实例异常
例如:关系型数据库系统故障,实例状态异常,实例或表被锁定。
- (常见)使用正确的客户端连接方式
- 内网连接需要RDS与ECS实例必须在同一区域、VPC内。
- 公网连接需要购买或使用已有EIP,并对RDS实例绑定该EIP 。
- 使用正确的SSL方式安全连接
界面SSL开关开启和关闭,分别对应不用的连接命令。例如:
- 开关开启:mysql -h 172.16.0.31 -P 3306 -u root -p --ssl-ca=/tmp/ca.pem
- 开关关闭:mysql -h 172.16.0.31 -P 3306 -u root -p
- 排除连接命令错误
例如:连接地址错误、端口参数配置错误、用户名和密码错误、SSL方式下命令错误。
- (常见)排除网络不通
内网访问
- 确认ECS与RDS是否在同一个区域,VPC。
- 检查安全组规则。
安全组外访问安全组内的RDS实例时,需要为安全组添加相应的入方向规则。
- 在ECS上测试是否可以正常连接到RDS实例地址的端口。
公网访问
- 检查安全组规则。
安全组外访问安全组内的RDS实例时,需要为安全组添加相应的入方向规则。
- 检查网络ACL规则。
- 相同区域主机进行ping测试。
- (常见)排除实例的连接数满的情况
实例连接数过多,可能会导致业务侧无法正常连接。
- (常见)排除实例的磁盘满的情况
当实例处于“磁盘空间满”状态时,影响数据的正常读写操作。
排查思路
- 排除数据库实例异常
检查办法:请在控制台检查云实例状态是否为“正常”。
可能原因:关系型数据库系统故障,实例状态异常,实例或表被锁定等。
解决方案:如果实例状态为“异常”,请尝试重启。
- 使用正确的客户端连接方式
建议安装不低于数据库实例版本的引擎客户端。
内网和公网连接实例的具体操作步骤,请参见外部服务器能否访问RDS数据库。
表1 客户端连接方式 连接方式
使用场景
连接样例
内网方式
系统默认提供内网IP地址。
当应用部署在ECS上,且该ECS与RDS实例处于同一区域,同一VPC时,建议单独使用内网IP连接ECS与RDS实例。
以RDS for MySQL为例:
mysql -h <内网地址> -P 3306 -u root -p --ssl-ca=/tmp/ca.pem
公网方式
不能通过内网IP地址访问RDS实例时,使用公网访问,建议单独绑定弹性公网IP连接ECS(或公网主机)与RDS实例。
以RDS for MySQL为例:
mysql -h <弹性公网IP> -P 3306 -u root -p --ssl-ca=/tmp/ca.pem
- 使用正确的SSL方式安全连接
- 排除连接命令错误
请获取正确的连接地址、端口参数配置、用户名和密码、SSL方式下命令错误,并重试连接实例。
SSL内网连接RDS for MySQL示例:mysql -h 172.16.0.31 -P 3306 -u root -p --ssl-ca=/tmp/ca.pem
- 连接地址
- 数据库端口
- 用户名和密码
- 证书名称
SSL公网连接RDS for MySQL示例:mysql -h 公网地址 -P 3306 -u root -p --ssl-ca=/tmp/ca.pem
- 排除网络不通
公网访问
- 排除实例的连接数满的情况
检查办法:
- 通过show variables like '%max%connections%';命令查看实例连接数,示例:
- max_connections:允许同时连接的客户端总数。如果设定值为default,表示该参数随内存规格变化,具体请参见RDS数据库实例支持的最大数据连接数是多少。
- max_user_connections:特定RDS for MySQL账户允许的最大同时连接数。
- 查看实例的连接数指标是否已达上限,可查看目标实例的“数据库总连接数”和“当前活跃连接数”,判断是否需要释放连接。
可能原因:数据库连接数过多,可能会导致业务侧无法正常连接,也会导致实例全量备份和增量备份失败,影响业务的正常使用。
解决方案:- 请及时排查业务侧连接是否有效,优化实例连接,释放不必要的连接。
- 如果设定值为default,可以对数据库进行规格扩容,用以提高max_connections的值,具体请参见变更实例的CPU和内存规格。
- 目前可以查看数据库CPU、内存、磁盘、连接数等指标,并且设置告警策略,出现告警时可以提前识别风险。支持的指标请参见支持的指标。
- 通过show variables like '%max%connections%';命令查看实例连接数,示例:
- 排除实例的磁盘满的情况