翻车Case

数据库清理

mysql删除数据真实数据空间并不会清理,需要手动清理
清理的时候会占用当前表2~3倍空间,会导致锁标,数据量大情况下io、cpu都会飙升
一定要在人少情况下进行,尽量采用无锁变更方式进行

并发问题

  1. 队列的用户均分导致重入,时间短频率高,历史采用redis作为队列cpu飙升
  1. k8s部署各种configMap挂载,supervisor启动并发执行,导致修改脚本未执行启动数据错误
  1. 对数据库修改的返回结果不做验证,无法判断是否可以继续,导致并发问题

异常暂停

  1. 内存泄露、错误导致程序退出,进行中数据状态无法修正
  1. 部署未优雅退出导致数据状态异常
    1. 要定期扫表处理异常状态数据,补偿用户(从用户侧,定时任务侧,自己的管理系统为用户处理)
    2. 大规模数据操作未在预期时间执行完成,到用户使用高峰导致阻塞

非预期异常

  1. 队列任务执行中,新增用户磁盘空间不足清理磁盘操作,每次都走清理不下去浪费时间导致队列阻塞
  1. 修改系统配置或者机器配置未做备份,执行异常无法回退
     
    Loading...
    目录
    文章列表
    王小扬博客
    产品
    Think
    Git
    软件开发
    计算机网络
    CI
    DB
    设计
    缓存
    Docker
    Node
    操作系统
    Java
    大前端
    Nestjs
    其他
    PHP