数据体系(Data Platform)

目标:让数据从“可采集”→“可信”→“可复用”→“可决策”

P0(数据基础)
├── 数据采集 / 埋点体系
├── 数据中台(数据湖 / 数据仓库)
├── ETL / ELT 平台(Airflow)

P1(数据可信)
├── 元数据平台(Data Catalog)
├── 指标平台
├── 数据质量平台(DQ)

P2(数据服务)
├── 数据 API 平台
├── 报表平台(BI)
├── 数据可视化平台

P3(数据资产化)
├── 数据资产管理
├── 数据权限与安全治理
├── 特征平台(Feature Store)

中间件体系的本质不是“技术选型”,而是“运行能力抽象”:

数据服务 – 数据可视化平台(Data Visualization Platform)

下面我把 数据服务 – 数据可视化平台(Data Visualization Platform) 单独拎出来,和 BI 报表平台做清晰区分,并从「它解决什么问题、长什么样、该怎么建、容易踩什么坑」四个层次,系统展开。

这块非常容易被误解成“BI 的一部分”,但在成熟的数据体系里,两者边界是清晰的


一、先一句话把「数据可视化平台」说清楚

数据可视化平台 = 面向“感知与传播”的数据表达系统,目标是让“状态、趋势、异常、结构”被“一眼理解”。

关键词不是分析,而是:

  • 直观
  • 即时
  • 强视觉
  • 低认知成本

二、数据可视化平台 ≠ BI 报表平台(非常关键)

这是最容易混的地方,我直接给你一张“本质差异表”。

维度 数据可视化平台 BI 报表平台
面向对象 看的人(非分析) 用的人(分析/决策)
使用场景 展示 / 传播 / 监控 分析 / 对比 / 决策
交互复杂度
实时性 高(秒级/分钟级) 中(分钟/小时级)
图表风格 强视觉、定制化 标准化
常见形态 大屏 / 看板 / 墙屏 报表 / 仪表盘
指标来源 指标平台 指标平台
核心目标 感知变化 理解原因

一句非常重要的判断标准:

如果用户需要“点很多下、筛很多条件才能看懂”,那不是数据可视化,而是 BI。


三、数据可视化平台的典型使用场景

1️⃣ 实时监控大屏(最常见)

  • 业务实时状态(交易量、在线人数)
  • 系统运行态势(QPS、错误率)
  • 安全态势(攻击趋势、风险事件)

特点:

  • 自动刷新
  • 极少交互
  • 异常要“跳出来”

2️⃣ 管理层 / 展厅展示

  • 公司经营态势总览
  • 区域 / 城市分布
  • 战略指标达成情况

特点:

  • 视觉冲击强
  • 信息密度高
  • 非操作型

3️⃣ 业务现场看板

  • 客服中心
  • 运营现场
  • 生产/运维现场

特点:

  • 实时
  • 可轮播
  • 与报警系统联动

4️⃣ 对外展示 / 数据传播

  • 对外数据开放
  • 行业白皮书可视化
  • 舆情 / 公共数据展示

四、数据可视化平台的核心能力拆解

1. 可视化建模(不是 SQL 建模)

数据可视化平台关心的不是:

  • 表结构
  • Join 逻辑

而是:

  • 指标 + 视觉表达方式

典型建模方式:

  • 指标卡(KPI)
  • 趋势线
  • 排行榜
  • 拓扑 / 关系图
  • 地理地图
  • 时间轴

2. 视觉组件体系(平台核心资产)

基础组件

  • 数字翻牌
  • 折线 / 柱状
  • 饼图(谨慎)
  • 表格(简化版)

高级组件

  • 漏斗
  • 留存曲线
  • 热力图
  • 关系网络图
  • Sankey 流向图

工业级 / 企业级

  • 拓扑图(服务 / 依赖)
  • 时序动画
  • GIS 地图(行政区 / 坐标)
  • 3D 场景(慎用)

3. 实时数据驱动能力

数据可视化平台天然偏实时

  • 秒级 / 分钟级刷新
  • 流式数据(Kafka / Flink)
  • 推模式(WebSocket)

如果一个“可视化平台”只能 T+1 刷新,本质上是 BI。


4. 异常高亮与联动

这是 BI 很少做、但可视化平台非常关键的能力:

  • 阈值触发颜色变化
  • 指标闪烁 / 放大
  • 与报警平台联动
  • 自动切屏 / 聚焦异常区域

5. 模板化与编排能力

大屏编排能力

  • 拖拽布局
  • 分辨率自适应
  • 多屏适配
  • 轮播策略

模板化

  • 业务模板
  • 行业模板
  • 场景模板

6. 权限与发布

  • 看板访问控制
  • 只读展示
  • 对外发布(匿名 / Token)

五、数据可视化平台的典型架构

数据源
 → 实时计算 / OLAP
 → 指标平台
 → 数据 API 平台
 → 📌 数据可视化平台
    ├─ 可视化引擎
    ├─ 组件库
    ├─ 实时刷新 / 推送
    ├─ 编排 & 模板
 → 展示终端(Web / 大屏 / TV)

非常关键的一点:

数据可视化平台不应该直连数据库,只消费数据服务层。


六、与报警平台的关系(你前面问过指标差异,这里正好连上)

维度 报警平台 数据可视化平台
目标 发现异常 感知状态
触发 条件满足 周期刷新
结果 通知 / 工单 视觉呈现
交互 处理 观看
关系 触发可视化聚焦 展示报警态势

成熟体系里: 报警触发 → 可视化聚焦 → 人介入处理


七、常见技术选型

前端

  • ECharts / AntV
  • D3(高定制)
  • Three.js(3D,慎用)

后端

  • Java / Node.js
  • WebSocket / SSE
  • Redis / Kafka

开源 / 产品

  • DataV(阿里)
  • Superset(偏 BI)
  • Grafana(监控型)
  • 自研大屏平台(非常常见)

八、最容易踩的 7 个坑(非常重要)

  1. 把 BI 当可视化平台用
  2. 图表过多,信息过载
  3. 一屏什么都想展示
  4. 为炫酷上 3D
  5. 数据刷新频率失控
  6. 指标没有来源说明
  7. 没有异常高亮,只是“好看”

九、建设建议(落地视角)

什么时候该建?

  • 有大屏 / 实时展示需求
  • 有对外数据展示
  • 有现场监控场景

怎么建?

  1. 指标来源统一(指标平台)
  2. 数据出口统一(数据 API)
  3. 场景驱动,而不是图表驱动
  4. 少而精,一屏一个主题