数据体系(Data Platform)
目标:让数据从“可采集”→“可信”→“可复用”→“可决策”
P0(数据基础)
├── 数据采集 / 埋点体系
├── 数据中台(数据湖 / 数据仓库)
├── ETL / ELT 平台(Airflow)
P1(数据可信)
├── 元数据平台(Data Catalog)
├── 指标平台
├── 数据质量平台(DQ)
P2(数据服务)
├── 数据 API 平台
├── 报表平台(BI)
├── 数据可视化平台
P3(数据资产化)
├── 数据资产管理
├── 数据权限与安全治理
├── 特征平台(Feature Store)
中间件体系的本质不是“技术选型”,而是“运行能力抽象”:
数据服务 – 数据可视化平台(Data Visualization Platform)
下面我把 数据服务 – 数据可视化平台(Data Visualization Platform) 单独拎出来,和 BI 报表平台做清晰区分,并从「它解决什么问题、长什么样、该怎么建、容易踩什么坑」四个层次,系统展开。
这块非常容易被误解成“BI 的一部分”,但在成熟的数据体系里,两者边界是清晰的。
一、先一句话把「数据可视化平台」说清楚
数据可视化平台 = 面向“感知与传播”的数据表达系统,目标是让“状态、趋势、异常、结构”被“一眼理解”。
关键词不是分析,而是:
- 直观
- 即时
- 强视觉
- 低认知成本
二、数据可视化平台 ≠ BI 报表平台(非常关键)
这是最容易混的地方,我直接给你一张“本质差异表”。
| 维度 | 数据可视化平台 | BI 报表平台 |
|---|---|---|
| 面向对象 | 看的人(非分析) | 用的人(分析/决策) |
| 使用场景 | 展示 / 传播 / 监控 | 分析 / 对比 / 决策 |
| 交互复杂度 | 低 | 高 |
| 实时性 | 高(秒级/分钟级) | 中(分钟/小时级) |
| 图表风格 | 强视觉、定制化 | 标准化 |
| 常见形态 | 大屏 / 看板 / 墙屏 | 报表 / 仪表盘 |
| 指标来源 | 指标平台 | 指标平台 |
| 核心目标 | 感知变化 | 理解原因 |
一句非常重要的判断标准:
如果用户需要“点很多下、筛很多条件才能看懂”,那不是数据可视化,而是 BI。
三、数据可视化平台的典型使用场景
1️⃣ 实时监控大屏(最常见)
- 业务实时状态(交易量、在线人数)
- 系统运行态势(QPS、错误率)
- 安全态势(攻击趋势、风险事件)
特点:
- 自动刷新
- 极少交互
- 异常要“跳出来”
2️⃣ 管理层 / 展厅展示
- 公司经营态势总览
- 区域 / 城市分布
- 战略指标达成情况
特点:
- 视觉冲击强
- 信息密度高
- 非操作型
3️⃣ 业务现场看板
- 客服中心
- 运营现场
- 生产/运维现场
特点:
- 实时
- 可轮播
- 与报警系统联动
4️⃣ 对外展示 / 数据传播
- 对外数据开放
- 行业白皮书可视化
- 舆情 / 公共数据展示
四、数据可视化平台的核心能力拆解
1. 可视化建模(不是 SQL 建模)
数据可视化平台关心的不是:
- 表结构
- Join 逻辑
而是:
- 指标 + 视觉表达方式
典型建模方式:
- 指标卡(KPI)
- 趋势线
- 排行榜
- 拓扑 / 关系图
- 地理地图
- 时间轴
2. 视觉组件体系(平台核心资产)
基础组件
- 数字翻牌
- 折线 / 柱状
- 饼图(谨慎)
- 表格(简化版)
高级组件
- 漏斗
- 留存曲线
- 热力图
- 关系网络图
- Sankey 流向图
工业级 / 企业级
- 拓扑图(服务 / 依赖)
- 时序动画
- GIS 地图(行政区 / 坐标)
- 3D 场景(慎用)
3. 实时数据驱动能力
数据可视化平台天然偏实时:
- 秒级 / 分钟级刷新
- 流式数据(Kafka / Flink)
- 推模式(WebSocket)
如果一个“可视化平台”只能 T+1 刷新,本质上是 BI。
4. 异常高亮与联动
这是 BI 很少做、但可视化平台非常关键的能力:
- 阈值触发颜色变化
- 指标闪烁 / 放大
- 与报警平台联动
- 自动切屏 / 聚焦异常区域
5. 模板化与编排能力
大屏编排能力
- 拖拽布局
- 分辨率自适应
- 多屏适配
- 轮播策略
模板化
- 业务模板
- 行业模板
- 场景模板
6. 权限与发布
- 看板访问控制
- 只读展示
- 对外发布(匿名 / Token)
五、数据可视化平台的典型架构
数据源
→ 实时计算 / OLAP
→ 指标平台
→ 数据 API 平台
→ 📌 数据可视化平台
├─ 可视化引擎
├─ 组件库
├─ 实时刷新 / 推送
├─ 编排 & 模板
→ 展示终端(Web / 大屏 / TV)
非常关键的一点:
数据可视化平台不应该直连数据库,只消费数据服务层。
六、与报警平台的关系(你前面问过指标差异,这里正好连上)
| 维度 | 报警平台 | 数据可视化平台 |
|---|---|---|
| 目标 | 发现异常 | 感知状态 |
| 触发 | 条件满足 | 周期刷新 |
| 结果 | 通知 / 工单 | 视觉呈现 |
| 交互 | 处理 | 观看 |
| 关系 | 触发可视化聚焦 | 展示报警态势 |
成熟体系里: 报警触发 → 可视化聚焦 → 人介入处理
七、常见技术选型
前端
- ECharts / AntV
- D3(高定制)
- Three.js(3D,慎用)
后端
- Java / Node.js
- WebSocket / SSE
- Redis / Kafka
开源 / 产品
- DataV(阿里)
- Superset(偏 BI)
- Grafana(监控型)
- 自研大屏平台(非常常见)
八、最容易踩的 7 个坑(非常重要)
- 把 BI 当可视化平台用
- 图表过多,信息过载
- 一屏什么都想展示
- 为炫酷上 3D
- 数据刷新频率失控
- 指标没有来源说明
- 没有异常高亮,只是“好看”
九、建设建议(落地视角)
什么时候该建?
- 有大屏 / 实时展示需求
- 有对外数据展示
- 有现场监控场景
怎么建?
- 指标来源统一(指标平台)
- 数据出口统一(数据 API)
- 场景驱动,而不是图表驱动
- 少而精,一屏一个主题
