RDS数据库主备切换
管理主备切换
当主实例异常无法使用时,或实例存在潜在风险并在备实例中进行了紧急修复时,RDS会自动触发主备切换,将主实例和备实例进行互换,切换后实例连接地址保持不变,应用自动连接到新的主实例(原备实例),从而保障实例的高可用性。此外,您还可以手动切换主备实例。
前提条件
- 如果实例为主实例,必须为如下系列:
- 高可用系列
- 集群系列
说明
基础系列实例没有备实例,不支持主备切换。
- 如果实例为只读实例,系列必须为高可用系列,存储类型必须为云盘。
背景信息
- 自动切换:实例默认开启自动切换,当主实例出现故障无法访问时,会自动切换到备实例。主备切换的触发时机,请参见主备切换原因。
- 手动切换:即使自动切换是开启状态,您也可以手动进行主备切换。手动切换可用于容灾演练或多可用区场景下的就近连接等需求。
说明
- 主备实例的数据会实时同步,您只能访问主实例,备实例仅作为备份形式存在,不提供业务访问。
- 高可用系列的只读实例也支持主备库切换和查看主备切换日志功能。
其他引擎切换主备实例请参见:
影响
- 主备实例切换过程中通常会出现不超过30秒的服务不可用,请确保您的应用程序具有自动重连机制。
如果您的应用程序使用的是较早版本的Druid组件进行数据库连接管理,可能会遇到数据库连接断开后不会自动重连恢复的问题,建议您将Druid升级到1.1.16或之后版本,以避免此问题。
- 如果实例下挂载有只读实例,那么主备实例切换后,只读实例的数据会有几分钟的延迟,因为需要重建复制链路、同步增量数据等。
- 主备切换不会导致 实例连接地址 变更,但后台对应的IP地址可能会变化。使用实例连接地址时,主备切换不会对您的应用正常运行造成影响。
- 当实例发生故障时,切换时间可能会延长。
手动切换主备实例
1. 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
2. 在左侧导航栏中,选择服务可用性。
3. 在实例可用性区域,单击主备库切换。
4. 选择切换时间,然后单击确定。重要
在主备实例切换期间,有很多操作无法执行,例如管理数据库和账号、切换网络类型等,建议您选择在设置时间内切换当前设置。
对于集群系列实例,您也可以在实例的基本信息页面的实例拓扑图上进行主备节点切换操作。
临时关闭主备自动切换
自动切换默认为开启,主实例出现故障会自动切换到备实例,在遇到如下情形时您可以选择临时关闭主备自动切换:
- 大促活动等,不希望主备切换影响系统可用性。
- 重要应用系统升级等,不希望主备切换引入其他变数。
- 重大事件或者稳定保障期,不希望主备切换影响系统稳定性。
- 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
- 在左侧导航栏中,选择服务可用性。
- 在实例可用性区域,单击自动切换主备。
说明
如果看不到自动切换主备按钮,请再次确认本文的前提条件。
- 选择临时关闭,并设置临时关闭截止时间,然后单击确定。
- 到达临时关闭截止时间后,实例恢复为自动进行主备切换。
- 默认为临时关闭1天,最长可设置为7天后的23:59:59。
说明
设置完毕后,您可以在服务可用性页面查看临时关闭主备自动切换的截止时间。
查看主备切换日志
1. 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
2. 在左侧导航栏中,选择服务可用性。
3. 在主备切换日志区域,调整查询时间范围,查看主备切换日志。
常见问题
- Q:备实例可以访问吗?
只有集群系列实例的备实例可以访问,其他系列的备实例不可以访问。
- Q:主备切换后,是否需要手动切换回主实例?
不需要,主备实例的数据完全一致,主备切换后原备实例被选举成为新的主实例,无需进行额外操作。
- Q:主备切换后,超过十分钟,实例状态仍未恢复运行中,可能是什么原因?如何处理?
RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。为了避免无效连接,建议配置connectTimeout和socketTimeout,防止出现网络错误时一直等待的情况,从而缩短故障时间。
超时配置值需要根据业务负载和使用方式进行评估,在线事务场景中建议connectTimeout配置为1~2秒,socketTimeout配置为60~90秒,此配置仅供参考。
相关API
API | 描述 |
切换RDS主备实例。 | |
开启或关闭RDS实例主备自动切换。 | |
查看RDS实例主备自动切换设置。 |
主备切换原因
RDS实例进行主备切换后,会发送短信通知您,告知切换原因。
RDS实例进行主备切换的原因有如下几种:
- 风险隐患
阿里云检测到实例存在潜在风险,可能影响实例的正常使用,系统会在备实例修复风险项,并且在可维护时间段发起主备切换。紧急风险修复类事件通常会在第一时间修复并触发主备切换。
- 人工操作
您或者您授权的阿里云技术专家手动发起的主备切换。
- 实例异常
阿里云检测到实例发生异常,无法正常使用,系统会发起主备切换,及时恢复业务正常运转,缩小异常影响范围。
主备切换后,实例状态会显示运行中,您不需要进行任何操作,实例可以正常运行。您可以在实例的服务可用性页面查看主备切换日志。
Loading...