翻车Case
数据库清理
mysql删除数据真实数据空间并不会清理,需要手动清理
清理的时候会占用当前表2~3倍空间,会导致锁标,数据量大情况下io、cpu都会飙升
一定要在人少情况下进行,尽量采用无锁变更方式进行
并发问题
- 队列的用户均分导致重入,时间短频率高,历史采用redis作为队列cpu飙升
- k8s部署各种configMap挂载,supervisor启动并发执行,导致修改脚本未执行启动数据错误
- 对数据库修改的返回结果不做验证,无法判断是否可以继续,导致并发问题
异常暂停
- 内存泄露、错误导致程序退出,进行中数据状态无法修正
- 部署未优雅退出导致数据状态异常
- 要定期扫表处理异常状态数据,补偿用户(从用户侧,定时任务侧,自己的管理系统为用户处理)
- 大规模数据操作未在预期时间执行完成,到用户使用高峰导致阻塞
非预期异常
- 队列任务执行中,新增用户磁盘空间不足清理磁盘操作,每次都走清理不下去浪费时间导致队列阻塞
- 修改系统配置或者机器配置未做备份,执行异常无法回退
Loading...