个人简介

Echo Blog


江湖无名 安心练剑
  • 金融系列概览
    # chat 详细介绍一下金融 金融的全面解析 金融作为现代经济的核心系统,贯穿于社会资源配置、风险管理和经济发展的全过程。 以下从定义、历史脉络、功能结构、体系构成及前沿趋势等维度展开全面阐述: 一、金融的定义与核心功能 金融的本质是资金融通,但其内涵远超货币流动本身。广义上,金融涵盖货币发行流通(如央行货币政策)、信用活动(如贷款发放)、资本运作(如证券交易)及风险管理(...
    2025-04-19 06:31:52 | Note
  • 个人的资源保护+创建
    前言 开源的作用在于初期的宣传+验证+推动发展 但是不会给开源者带来太多的收入,基本为 0, 纯属热爱 开发者应该为自己规划一条,如果我要从零开始创业,我需要哪些基础服务? 然后围绕着这些服务,来创建自己的基础设施。 痛点 解决用户的痛点 到底有什么业务价值 站在公司的用户思考,未来要如何发展??? 生态 生态很重要 轮子 基础建设,可以拿来、二开、商业 一些价值 ...
    2025-04-19 06:31:52 | Note
  • RCA 根因分析推断-06-alarm 基本的分析流程
    思路 场景 我们需要分析报警,但是资源信息等很多,所以需要分级+剪枝过滤 基本的步骤 1)从 alarm==>app 从报警关联到所有的 app 2) 从 alarm 找到所有的关联报警的资源 app phy / vm / redis / mysql / pod / … 包括网络: vm / phy ====> nginx 3) app 的进一步关联资源 ...
    2025-04-19 06:31:52 | Note
  • RCA 根因分析推断-05-alarm sync neo4j 报警数据同步到图数据库
    思路 场景 我们接收到报警之后,需要把报警信息落库。 其实有两种思路。 一种是流,一种是批模式。 优缺点 批 批模式可以做一些批量的优化操作。 比如 A2 的 disk 之类的无用异常过滤。 批模式如果改为 10 秒一次呢? 有什么问题? 批模式还可以支持数据的重跑,但是流没有这个能力。 可以两种模式都保留。 流 流模式可以在数据全部落库之后,最后做一下数据的落库...
    2025-04-19 06:31:52 | Note
  • RCA 根因分析推断-04-应用到物理机的基本资源?
    思路 应用 从报警的应用触发,经过 3 层左右,关联到所有报警的物理机器资源? 通用性 可以考虑将开头的 appList 放在入参,和目标存在问题的资源 ipList 放在那里? 精致的细分 可以把各种资源还是区分开? 统一调整一下【查看子图】的具体实现逻辑? 去重 去重的时候,不要把 app 之类的给去没有了?? 参考资料 思路 应用 ...
    2025-04-19 06:31:52 | Note
  • RCA 根因分析推断-03-变更事件的内因+依赖资源的异常
    变更事件 说明 要考虑哪些异常的内因呢? 同时考虑一些依赖资源的异常。 现状 特别精确的时间范围控制,会导致无法准确的命中。 内因 磁盘 一般 A2 以及以下可以忽略 mem 内存 A2 以及以下可以忽略? disk ? cpu ? 可以看一下 A2 以及以下的是不是没什么用? GC 服务不可用 依赖资源 公共资源 app vm phy redis m...
    2025-04-19 06:31:52 | Note
  • RCA 根因分析推断-02-变更事件笔记 appChangeRecord
    变更事件 说明 如果一个变更,可能会导致对应的异常。 标准化 首先要对报警的数据进行标准的格式化处理。 比如应用名,执行时间等等 变更的内容 ip + appName 时间范围 如果页面选择了一个时间范围 比如:18:00~18:30 那么,对应的变更事件应该怎么办呢? 1)create_time 事件的创建时间刚好介于 18:00~18:30 16:00 and...
    2025-04-19 06:31:52 | Note
  • RCA 根因分析推断笔记
    根因分析 相关内容以前记录的比较多。 逐渐级别推断 资源 应用视角==》单个报警 alarm 报警 报警的主视角 metric 指标 普米: (cpu/mem/disk/net) SQL: SQL 报警 CAT log===>异常日志 知识库 日志 top3 去重的异常日志? Trace cmdb rpc 事件 变更(标准化) 监听深入 变化值...
    2025-04-19 06:31:52 | Note