AI Platform
当企业从 单个 AI 功能(聊天、RAG)走向 规模化 AI 应用 时,通常需要构建一个 AI Platform(AI 系统平台)。
这个平台的目标是:把 LLM、RAG、Agent、数据、工具统一管理和服务化,让多个业务团队都能复用。
可以把 AI Platform 理解为:
AI Platform = AI 的 DevOps 平台
类似于软件开发中的:
- CI/CD 平台
- Kubernetes 平台
- DevOps 平台
只是对象变成 LLM 应用。
一、AI Platform 的核心目标
企业 AI 平台通常解决 5 个核心问题:
1 模型管理
2 Prompt管理
3 RAG服务
4 Agent服务
5 AI应用接入
换句话说:
统一 AI 能力
二、AI Platform 总体架构
一个典型 AI Platform 架构:
AI Applications
(Chatbot / Copilot / Search / Agents)
│
▼
AI Gateway
│
┌──────────────┼──────────────┐
▼ ▼ ▼
Prompt Service RAG Service Agent Service
│ │ │
▼ ▼ ▼
Model Router Vector Database Tool Registry
│ │ │
▼ ▼ ▼
LLM APIs Embedding External APIs
这个架构可以理解为 AI 中台。
三、AI Gateway(AI 网关)
所有 AI 请求都会先进入:
AI Gateway
作用类似:
API Gateway
主要功能:
鉴权
限流
日志
成本统计
例如:
token 使用统计
用户权限
模型选择
四、Prompt Service
Prompt 是 AI 应用的核心逻辑。
企业通常会把 Prompt 管理成:
Prompt Service
功能:
Prompt 模板管理
Prompt 版本控制
Prompt A/B测试
Prompt 回滚
例如:
prompt_v1
prompt_v2
prompt_v3
可以随时切换。
五、Model Router(模型路由)
企业通常不会只用一个模型。
例如:
| 任务 | 模型 |
|---|---|
| 聊天 | 大模型 |
| 总结 | 小模型 |
| 代码 | 代码模型 |
所以需要:
Model Router
逻辑:
根据任务类型
自动选择模型
示例:
复杂推理 → 大模型
简单问答 → 小模型
常见模型:
- DeepSeek
- Qwen
- Llama
六、RAG Service
企业 AI 平台一般会提供:
统一 RAG 服务
包括:
文档解析
chunk
embedding
vector search
rerank
典型流程:
文档
↓
Parser
↓
Chunk
↓
Embedding
↓
Vector DB
↓
Retrieve
↓
LLM
向量数据库通常是:
- Milvus
- Qdrant
七、Agent Service
Agent 功能也需要平台化。
通常包括:
Tool Registry
Agent Runtime
Workflow Engine
结构:
Agent
↓
LLM
↓
Tool Router
↓
Tools
工具可能是:
SQL
API
搜索
代码执行
常见框架:
- LangGraph
八、Tool Registry(工具注册中心)
Agent 调用的工具需要统一管理。
例如:
weather_api
sql_query
log_search
monitor_query
工具注册:
name
description
parameters
LLM 才能知道:
可以调用哪些工具
九、Memory Service
Agent 需要记忆。
企业平台通常提供:
Memory Service
包括:
conversation history
user profile
long-term memory
存储方式:
vector db
redis
database
十、Embedding Service
Embedding 通常也会独立成服务:
Embedding API
用于:
RAG
语义搜索
推荐系统
常见模型:
- sentence-transformers
十一、Observability(可观测性)
AI 系统必须有监控。
典型指标:
token usage
latency
cost
hallucination rate
retrieval accuracy
很多平台会做:
AI tracing
记录:
prompt
tool calls
model response
十二、AI Platform 技术栈
企业常见技术栈:
应用层
Java / Python
Java 生态:
- Spring AI
- LangChain4j
模型层
OpenAI API
私有化模型
推理框架:
- vLLM
- Ollama
数据层
Vector DB
Search Engine
Database
十三、AI Platform 的典型应用
AI Platform 建好后,可以快速构建:
AI Chatbot
AI Copilot
AI 搜索
AI 知识库
AI DevOps Agent
例如:
企业知识问答
代码助手
客服机器人
十四、AI Platform 与传统系统的区别
传统系统:
业务逻辑
AI 系统:
Prompt
+
数据
+
模型
所以 AI Platform 更像:
AI 操作系统
十五、AI 架构师真正的职责
AI 架构师通常负责:
AI 平台架构
模型选择
RAG 架构
Agent 架构
成本控制
而不是:
训练模型
如果你愿意继续深入,我可以带你讲 AI 平台最核心但很少有人讲清楚的一件事:
Prompt Engineering 的工程化(PromptOps)
这是很多企业 AI 项目成败的关键。
参考资料
- AI Platform
- 一、AI Platform 的核心目标
- 二、AI Platform 总体架构
- 三、AI Gateway(AI 网关)
- 四、Prompt Service
- 五、Model Router(模型路由)
- 六、RAG Service
- 七、Agent Service
- 八、Tool Registry(工具注册中心)
- 九、Memory Service
- 十、Embedding Service
- 十一、Observability(可观测性)
- 十二、AI Platform 技术栈
- 十三、AI Platform 的典型应用
- 十四、AI Platform 与传统系统的区别
- 十五、AI 架构师真正的职责
- 参考资料
