容错性

notion image

01 复制

复制是指在不同节点或地点创建多个数据或服务副本
例如 Cassandra 和 HBase 等分布式数据库会在多个节点上复制数据,以确保即使某些节点发生故障,数据也能可用。

02 冗余

冗余是指在发生故障时,有额外的组件或系统可以接替。
例如 RAID(独立磁盘冗余阵列)系统使用多个硬盘冗余存储数据,提供硬盘故障容错。

03 负载均衡

负载均衡将进入的网络流量分配给多个服务器,确保没有一个服务器成为故障点。
例如:使用 NGINX 或 HAProxy 等负载均衡在多个服务器之间分配网络流量,确保网络应用程序的高可用性。

04 故障切换机制

当主系统或组件出现故障时,故障切换机制会自动切换到备用系统或组件。
例如:AWS 等云服务将故障转移机制用于数据库(如 Amazon RDS Multi-AZ),以便在出现故障时切换到备用实例。

05 优雅降级

优雅降级可确保系统在功能降低的情况下继续运行,而不是在某些组件出现故障时完全失效。
例如:禁用非必要功能的网络应用程序,同时仍允许用户在部分系统故障时访问关键功能。

06 监控和警报

持续监控系统的健康状况和性能,并为任何异常或故障设置警报。
例如:使用 Prometheus 等工具纠正单比特错误,确保计算机系统的数据完整性。
这些策略可以根据具体的使用情况进行组合和定制,以设计出稳健的容错系统。
Loading...
目录
文章列表
王小扬博客
产品
Think
Git
软件开发
计算机网络
CI
DB
设计
缓存
Docker
Node
操作系统
Java
大前端
Nestjs
其他
PHP