中间件体系(Middleware Platform)
目标:为业务系统提供统一、稳定、高可用、可治理的基础运行能力
P0(运行基础)
├── 网关(Kong / APISIX)
├── 配置中心(Nacos)
├── RPC 平台(Dubbo)
├── 数据存储(MySQL / PostgreSQL / Mongo)
P1(解耦与性能)
├── MQ(Kafka / RabbitMQ)
├── 缓存平台(Redis / Memcached)
├── 搜索(Elasticsearch)
├── 文件存储(MinIO)
P2(治理与稳定)
├── 缓存失效监控 & 一致性
├── 任务调度(Airflow / XXLJob)
├── 中间件监控与告警
P3(平台化)
├── 中间件统一管控台
├── 多租户 / 资源隔离
├── 成本 & 容量管理
中间件体系的本质不是“技术选型”,而是“运行能力抽象”:
数据存储
下面我将从企业级架构与中间件平台视角,对 数据存储(Data Storage Platform)做一次系统性、全景化、可落地的展开。内容不局限于 MySQL / PostgreSQL / MongoDB,而是覆盖存储模型、技术谱系、选型原则、平台化建设、与上层系统的协同,可直接作为技术蓝图或方案底稿。
一、数据存储的本质定位
一句话定义:
数据存储不是“数据库选型”,而是“数据模型 × 访问模式 × 一致性与成本”的系统工程。
企业级存储体系解决的是:
- 数据如何被建模
- 数据如何被访问
- 数据如何被保护
- 数据如何被长期演进
二、数据存储在整体架构中的位置
业务系统 / 分析系统
│
├── 数据访问层(ORM / DAO / SDK)
│
├── 数据存储平台(Storage Platform)
│ ├── OLTP
│ ├── OLAP
│ ├── KV / Cache
│ ├── Search
│ ├── Time-Series
│
├── 数据治理 / 安全 / 备份
│
└── 基础设施(本地 / 云)
三、数据存储的“六大模型谱系”
1️⃣ 关系型存储(Relational / OLTP)
代表
- MySQL / PostgreSQL
- Oracle / SQL Server
- NewSQL:TiDB / CockroachDB / Yugabyte
特征
- 强一致
- 事务(ACID)
- 复杂查询
适用
- 核心交易
- 财务 / 订单
- 权限 / 配置
2️⃣ 键值与宽表存储(KV / Wide Column)
代表
- Redis(非仅缓存)
- DynamoDB
- Cassandra / HBase
- FoundationDB
特征
- 高并发
- 水平扩展
- 简单模型
适用
- 状态存储
- 会话
- 用户画像
3️⃣ 文档存储(Document Store)
代表
- MongoDB
- Couchbase
- ArangoDB
特征
- Schema 灵活
- JSON 原生
- 易扩展
适用
- 内容管理
- 复杂结构对象
- 弱事务业务
4️⃣ 搜索与倒排存储(Search / Index)
代表
- Elasticsearch / OpenSearch
- Solr
- Meilisearch
特征
- 全文检索
- 高维过滤
- 聚合分析
适用
- 搜索
- 日志
- 事件分析
5️⃣ 时序与指标存储(Time-Series)
代表
- Prometheus / VictoriaMetrics
- InfluxDB
- TimescaleDB
特征
- 写多读少
- 时间窗口
- 压缩率高
适用
- 监控指标
- IoT
- 金融行情
6️⃣ 分析型与湖仓(OLAP / Lakehouse)
代表
- ClickHouse
- Druid
- BigQuery / Snowflake
- Iceberg / Delta Lake + Trino
特征
- 列式存储
- 高吞吐分析
- 批流融合
适用
- 报表
- BI
- 行为分析
四、一个成熟企业的“存储分层策略”
数据分层
├── 热数据(Redis / OLTP)
├── 业务数据(OLTP / KV)
├── 行为 & 日志(Search / TSDB)
├── 分析数据(OLAP)
└── 冷数据(对象存储 / Archive)
不要用一种数据库解决所有问题。
五、一致性、事务与 CAP 的现实取舍
| 场景 | 推荐 |
|---|---|
| 资金 / 交易 | CP / 强一致 |
| 用户体验 | AP / 最终一致 |
| 配置 / 元数据 | CP |
| 行为日志 | AP |
六、现代存储体系的关键技术点
1️⃣ 分布式与扩展
- 分片(Shard)
- 副本(Replica)
- Leader / Follower
- 自动 Rebalance
2️⃣ 数据生命周期管理(ILM)
- 热 / 温 / 冷 / 冻
- TTL
- 自动归档
3️⃣ 高可用与容灾
- 多 AZ
- 多活
- RPO / RTO
4️⃣ 备份与恢复
- 全量 + 增量
- 快照
- Point-in-Time Recovery
七、数据安全与合规(不可忽视)
- 访问控制(RBAC / ABAC)
- 加密(At Rest / In Transit)
- 数据脱敏
- 审计日志
八、存储平台化(真正的企业级)
存储平台应提供的能力
数据存储平台
├── 资源管理
│ ├── 实例 / 集群
│
├── 数据库即服务(DBaaS)
│
├── 生命周期管理
│
├── 监控 & 告警
│
├── 备份 & 恢复
│
├── 成本管理(FinOps)
└── 安全合规
九、数据访问与治理策略
- 禁止跨库 JOIN
- 明确主写 / 从读
- 明确冷热分离
- SQL 审计与限流
十、选型决策参考表(极实用)
| 需求 | 优先选型 |
|---|---|
| 强事务 | RDB / NewSQL |
| 高 QPS | KV / Wide Column |
| 搜索 | ES |
| 指标 | TSDB |
| 分析 | ClickHouse / Lakehouse |
十一、常见反模式
- ❌ 用 MySQL 存日志
- ❌ 用 ES 做事务
- ❌ 用 Mongo 做强一致交易
- ❌ 忽略冷热分层
十二、总结一句话
数据存储不是“选库”,而是“为数据的一生设计基础设施”。
