个人简介

Echo Blog


江湖无名 安心练剑
  • java 应用性能下降,如何分析定位原因?
    现象 测试在压测环境,发现因为了升级了一下日志包组件,导致性能下降厉害(30%)。 需要分析原因? 思路 代码是否真的存在问题 是否所有的性能都下降? 如果全部下降,则针对升级的部分做代码分析+本地结合 jvisual 分析慢在哪里即可。 发现不是,那么就针对这一个应用具体分析。 这里发现就是特定应用的一个压测变慢了。 QPS 下降初步判断 整体看是压测的 QPS 下降。...
    2023-07-25 00:00:00 | Test
  • 分布式可视化系统 Observability-12-AIOPS Artificial Intelligence for IT Operations 介绍
    chat 详细介绍一下分布式系统的可观测 AIOPS AIOps 在分布式系统可观测性中的应用 AIOps(Artificial Intelligence for IT Operations)通过人工智能和机器学习技术,增强 IT 运维的自动化和智能化,尤其在分布式系统的可观测性中具有重要价值。随着分布式系统的规模扩大和复杂度增加,传统监控工具难以有效应对海量指标和日志的分析需求,而 ...
    2023-07-25 00:00:00 | Trace
  • 分布式可视化系统 Observability-11-eBPF extended Berkeley Packet Filter 介绍
    chat 详细介绍一下分布式系统的可观测 eBPF eBPF(extended Berkeley Packet Filter)是一种强大的技术,可以在不改变内核代码的情况下运行用户定义的程序。 近年来,eBPF 被广泛应用于分布式系统的可观测性领域,因为它能深入了解内核和应用程序的运行状态,帮助开发者构建高性能、低开销的监控和分析工具。 以下是关于 eBPF 在分布式系统可观测性中的...
    2023-07-25 00:00:00 | Trace
  • 分布式可视化系统 Observability-10-serviceMesh
    chat 详细介绍一下分布式系统的可观测 serviceMesh 在分布式系统中,可观测性(Observability)是指系统能够提供足够的信息,以便开发者或运维人员能够有效地理解系统的健康状态、行为和性能。Service Mesh(服务网格)是一个用于处理服务间通信的基础设施层,它可以提供丰富的可观测性功能,如流量管理、故障注入、日志、监控和追踪等。 Service Mesh 的可...
    2023-07-25 00:00:00 | Trace
  • 分布式可视化系统-09-alarm 报警
    chat 详细介绍一下分布式系统的 alarm 报警 分布式系统中的 报警(Alarm) 是监控体系的重要组成部分,旨在通过告警机制及时通知系统管理员和开发者,帮助快速响应异常或故障。以下从报警的概念、组成、触发机制、处理流程及其应用等方面详细介绍。 一、报警的概念和意义 1. 什么是报警 报警是指监控系统在检测到异常状态时,根据预设规则向相关人员或系统发送通知的一种机制。它包括...
    2023-07-25 00:00:00 | Trace
  • 分布式可视化系统-08-monitor 监控
    chat 详细介绍一下分布式系统的 monitor 监控 分布式系统中的 监控(Monitor) 是保障系统稳定性和性能的关键技术之一。通过对系统运行状态的全面监测,监控可以帮助开发和运维团队快速发现问题、定位瓶颈并采取优化措施。以下详细介绍监控的概念、组成部分、实现流程及应用。 一、监控的概念和重要性 1. 什么是监控 监控是指通过采集、存储、分析和展示系统的运行指标、日志、事...
    2023-07-25 00:00:00 | Trace
  • 分布式可视化系统-07-FLOW 流程的产生+采集+处理+应用
    chat 详细介绍一下分布式系统的 FLOW 在分布式系统中,Flow(流) 主要指的是系统内数据、任务或请求的流动过程与控制,涵盖了数据在不同组件、服务或节点之间的传递路径。 Flow 的核心目的是高效传递信息和完成业务处理,同时保证系统的可靠性、可扩展性和一致性。 以下从 定义、产生、采集、处理、应用 五个维度,详细剖析分布式系统中的 Flow。 一、Flow 的定义与作用...
    2023-07-25 00:00:00 | Trace
  • 分布式可视化系统-06-profiling 性能数据的产生+采集+处理+应用
    chat profiling 是什么? Profiling 是一种分析方法,用于收集和研究程序运行时的性能数据,以便优化或排查问题。 具体而言,它帮助开发者了解程序的性能瓶颈、资源使用情况以及代码的行为表现。 1. Profiling 的定义 Profiling 是通过工具或代码插桩,分析程序在运行时的以下信息: CPU 使用情况:哪些函数或代码段消耗了最多的 CPU 时间...
    2023-07-25 00:00:00 | Trace