个人简介

Echo Blog


江湖无名 安心练剑
  • Zabbix 监控系统-03-windows wls 安装 zabbix 实战
    wsl docker $ docker --version Docker version 24.0.5, build ced0996 指定配置文件 3. 配置 Docker Compose 文件 在 WSL 的 Linux 环境中创建一个目录并创建 docker-compose.yml 文件: mkdir zabbix-docker cd zabbix-docker nano ...
    2018-11-25 01:14:43 | Devops
  • Zabbix 监控系统-02-chat
    详细介绍一下 zabbix k Zabbix是一个开源的监控解决方案,用于监控各种网络和应用程序的健康状况和性能。 它支持分布式监控,能够监控成千上万的服务器、虚拟机、网络设备等。Zabbix的主要特点包括: 分布式监控:Zabbix可以部署在多个服务器上,以实现分布式监控。 广泛的监控类型:可以监控CPU负载、内存使用、磁盘使用、网络流量、数据库...
    2018-11-25 01:14:43 | Devops
  • Zabbix 监控系统介绍
    Zabbix Zabbix 是由 Alexei Vladishev 创建,目前是由 Zabbix SIA 在持续开发和提供支持。 Zabbix 是一种企业级的分布式开源监控解决方案。 Zabbix 是一款能够监控众多网络参数和服务器的健康度和完整性的软件。Zabbix 使用灵活的通知机制,允许用户为几乎任何事件配置基于邮件的警报。这样可以快速相应服务器问题。Zabbix 基于存储的数据...
    2018-11-25 01:14:43 | Devops
  • 监控系统实战-17-RCA 根本原因分析(Root Cause Analysis) 变更事件的处理实现+推广
    推广 说明 如果变更事件存在变更的话,那么这个功能可以通过平台推送给用户。 试运行 可以考虑添加一个模拟的功能,不做实际的发送,但是数据会落库。 按照业务域 可以按照业务域进行数据的推送处理。 参考资料 推广 说明 试运行 按照业务域 参考资料
    2018-11-25 01:14:43 | Devops
  • 监控系统实战-16-RCA 根本原因分析(Root Cause Analysis) 如何实现?华为 网络云根因智荐的探索与实践
    背景与痛点 NFV将云计算技术引入到电信网络中来,推动电信网络IT化、设备软件化、硬件标准化变革,形成以“功能软件化”、“业务统一编排”和“硬件云资源池”为主要特征的网络云化体系,大幅提升网络的灵活性,助力新业务的开发和部署,提升网络的管理和运营效率。 也正因此,云化虚拟化网络颠覆了过去电信设备一种功能一种设备形态的传统维护模式,需要电信运营商的运维系统基于业务负载的实时动态智能资源配置...
    2018-11-25 01:14:43 | Devops
  • 监控系统实战-15-RCA 根本原因分析(Root Cause Analysis) 如何实现?数据库异常智能分析与诊断 美团
    DAS DAS(Database Autonomy Service, 数据库自治服务)面向研发和DBA,是一款为用户提供数据库性能分析、故障诊断、安全管理等功能的数据库自治服务。 DAS利用大数据手段、机器学习、专家经验,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定和高效运行。 本文主要讲述DAS的历史背景、演进策略、重要功能及实现思路,希望能对从事...
    2018-11-25 01:14:43 | Devops
  • 监控系统实战-13-RCA 根本原因分析(Root Cause Analysis) 如何实现?基于Trace的根因分析
    前言 AI paper 的一些,主要看一下思路。 Trace 的演进之路 接下来的几个月里,将继续不定期总结基于 Traces 的根因定位方法。 Trace 记录了请求在分布式应用程序中运行的轨迹,能够完整的串联起请求的上下文关系,在大规模分布式系统根因定位中的作用举足轻重 。 在讨论基于 Traces 的根因定位之前,本文先简单介绍 Trace 的出现及其演进的过程。 02_D...
    2018-11-25 01:14:43 | Devops
  • 监控系统实战-14-RCA 根本原因分析(Root Cause Analysis) 如何实现?多模态融合
    前言 AI paper 的一些,主要看一下思路。 基于多模态运维数据的根因定位(一):异构数据时序化 为了使故障诊断方法能够诊断更多种类的故障,融合多模态运维数据进行自动化故障诊断,已经成为当前学术界和工业界的重要研究热点。 将文本类型的 Log 和 Trace 转换成与 Metric 同构的时间序列表示,然后输入到故障诊断算法中进行分析,是融合多模态运维数据分析最直接的方式,今天将...
    2018-11-25 01:14:43 | Devops