舍得 在提供平台的服务时,我们要学会舍得。 这种智慧提现在很多地方。 比如: 1)日志 ES 落库太长,截断落库。 2)日志脱敏等处理,日志太长,截断+舍弃 3)任务如果执行耗时特别长、特别吃性能,考虑将数据直接禁用掉,避免影响其他服务。 隔离+限制 当然类似的还有限流 资源隔离 限制 cpu/mem 等等 预警 还有需要有对应的预警配套措施。 小结 舍得 舍得 有舍才有得 我们要学会舍弃一些小的细节,顾全大局。 参考资料 无 舍得 隔离+限制 预警 小结 参考资料 更多学习 个人 Github 个人公众号 更多实时资讯,前沿技术,生活趣事。尽在【老马啸西风】 交流社群:交流群信息 监控系统实战-05-分布式调度等如何实现 HA? 跨机房 监控系统实战-08-指标与规则