前言

任何一个系统,都不可能是完美的。

如果出问题怎么办?引入大量的监控,然后让人去看。

核心内容

思想:用人,引入另一个维度的东西。

监控视角:汇总、报警、事件待处理等。

定时刷新:一般都是大盘,定时刷新+闪烁+声音

实时数据

计时查询:夜莺的报警查询页面:表格/图形 指定时间范围内

图表:nqe / grafana / DataX

CAT 监控

CAT 组件

业务域/应用

ERROR 次数 + 同比

其他

普米

SQL

日志

zabbix

业务大盘

数据 SQL

黄金指标:成功率 同比/环比

可视化中心

数据集

报表

费用

处理情况

参考资料