随笔

从千万粉丝“何同学”抄袭开源项目说起,为何纯技术死路一条?

数据源的统一与拆分

监控报警系统的指标、规则与执行闭环

一张表格,看懂应用监控项配置

监控报警系统如何实现自监控?

java 老矣,尚能饭否?

一骑红尘妃子笑,无人知是荔枝来!

应用监控指北

我们千辛万苦搭建好了一个监控平台,但是应该配置哪些监控项呢?

本文将以通俗易懂的方式,梳理简单梳理一下需要的关键监控项。

类别 监控内容 关键点 推荐工具
基础设施层 服务器硬件资源 - CPU使用率:避免性能瓶颈
- 内存使用率:防止崩溃
- 磁盘IO和空间:监控耗尽与瓶颈
- 网络带宽和延迟:关注丢包与延迟
Prometheus, Zabbix
  虚拟化和容器 - 容器资源限制:防异常
- 主机节点资源:保证稳定运行
Prometheus, Zabbix
应用层 服务健康状态 - 接口可用性:核心接口稳定
- 响应时间:监控性能下降
- 错误率:快速定位异常
CAT
  应用性能 - QPS/TPS:系统负载能力
- 线程池状态:避免耗尽
- GC时间/频率:优化内存管理
CAT
  日志异常 - 关键字监控:快速排查问题
- 日志流量突增:预警故障
日志采集工具
数据库层 连接池 - 连接池使用率:避免耗尽 CAT, Prometheus
  查询性能 - 慢查询:找性能瓶颈
- 查询失败率:预警问题
日志分析工具
  数据库资源 - CPU/内存/磁盘IO:监控数据库压力
- 主从延迟:保证一致性
Prometheus, 日志工具
网络层 API网关 - 请求数量/延迟:评估流量与性能
- 限流/熔断次数:发现异常流量
日志分析工具
  网络连接 - HTTP错误率:检查超时/中断
- 防火墙日志:检测恶意访问
日志分析工具
安全监控 用户行为 - 登录失败次数:防暴力破解
- 敏感操作日志:追踪高风险
安全监控平台
  系统漏洞 - 异常文件改动:检测入侵
- 未授权访问:发现非法操作
安全监控平台
业务指标 核心业务流程 - 订单数量/支付成功率:保障业务正常
- 用户转化率:优化策略
业务监控平台
  自定义指标 根据业务模型设置,如库存状态、广告点击率 业务监控平台

小结

希望本文对你有所帮助,如果喜欢,欢迎点赞收藏转发一波。

我是老马,期待与你的下次相遇。

随笔

从千万粉丝“何同学”抄袭开源项目说起,为何纯技术死路一条?

数据源的统一与拆分

监控报警系统的指标、规则与执行闭环

我们的系统应该配置哪些监控报警项?

监控报警系统如何实现自监控?

java 老矣,尚能饭否?

一骑红尘妃子笑,无人知是荔枝来!

张居正的考成法,对我们有何参考价值?

mongodb/redis/neo4j 如何自己打造一个 web 数据库可视化客户端?

DevOps 平台越发展,开发运维越快失业?

开源如何健康长久的发展

为什么会有流水线?

既然选择了远方 便只顾风雨兼程

银行是如何挣钱的?

参考资料