GitHub - NirDiamant/agents-towards-production:端到端、代码优先的教程,帮助构建生产级 GenAI Agent,从原型到企业部署
Agents Towards Production
将 AI Agent 转化为真实产品的开源指南
Agents Towards Production 是您构建生产就绪型 GenAI Agent 的首选资源,能够从原型扩展到企业级应用。
教程涵盖有状态工作流、向量记忆、实时网页搜索 API、Docker 部署、FastAPI 端点、安全护栏、GPU 扩展、浏览器自动化、微调、多 Agent 协调、可观测性、评估和 UI 开发。
⭐ 如果您觉得本项目有价值,请给一个 Star,帮助更多人发现这些教程!
同作者作品
RAG Made Simple — 亚马逊生成式 AI 类目 #1 畅销书。 涵盖 22 种 RAG 技术,包含直觉讲解、对比和插图。Kindle Unlimited 免费 或 $0.99 首发价(即将涨价)。### 在亚马逊上购买本书
28 个生产级教程,涵盖有状态工作流、向量记忆、网页搜索 API、Docker 部署、安全护栏、GPU 扩展、多 Agent 协调等内容。
申请 AI 工程岗位
以 AI 为先的公司正在通过 DiamantAI Collective 招聘。
教程赞助商
为本仓库贡献了逐步教程的公司。点击 Logo 打开教程。使用 Ctrl/⌘ + 点击可保持本页面打开。
- Agent 框架与工作流
- 记忆与向量数据库
- RAG 与知识管理
- 网页数据平台
- 实时网页搜索 API
- MCP Runtime
- Kotlin AI Agent 框架
- 自我优化的 AI 记忆
- GPU 云计算
综合赞助商
通过合作与资源支持本项目的公司。点击 Logo 访问其网站。
- AI 代码审查
成为赞助商
保持更新!
| **前沿更新 | 专家见解 | Top 0.1% 内容** |
加入超过 50,000 名 AI 爱好者,获取独特的前沿见解和免费教程!
此外,订阅者还可获得独家抢先体验,以及我的书籍和即将推出的课程的 33% 特别折扣!
加入我们的社区
r/EducationalAI
加入我们不断壮大的社区,共同探讨前沿 AI 研究、Agent 开发和生产实践!
✨ 引言
Agents Towards Production 是您亲身实践 GenAI Agent 技术栈各个模块的指南。所有知识都通过可运行的教程呈现,涵盖编排(orchestration)、记忆(memory)、可观测性(observability)、部署(deployment)、安全(security)等更多内容。每个教程都存放在自己的文件夹中,包含即开即用的笔记本或代码文件,让您能在几分钟内从概念走向可运行的 Agent。
🏗️ AI Agent 架构
此图展示了构建生产级 Agent 的流程。本仓库中的教程将逐步讲解这些组件中的每一个。
教程
🔧 工具集成
| 教程 | 描述 | 查看 |
|---|---|---|
| Secure Tool Calling (Arcade) | 让 Agent 能够安全地调用外部工具(Gmail、Slack、Notion),支持 OAuth2 认证和人在回路的安全控制。学习具有用户隔离和审批流程的生产就绪型工具集成。 | [查看] |
📊 数据处理
| 教程 | 描述 | 查看 |
|---|---|---|
| Web Data Collection for AI Agents (Bright Data) | 构建能够使用企业级爬虫基础设施大规模收集和处理网页数据的 Agent。学习集成代理网络、处理 CAPTCHA 以及从复杂网站提取结构化数据。 | [查看] |
| Real-Time Web Data Integration for Agents (Tavily) | 让 Agent 能够访问、搜索和提取实时网页数据。构建结合实时网页信息与私有知识的工作流,用于研究、监控和最新推荐。 | [查看] |
📚 RAG 与知识管理
| 教程 | 描述 | 查看 |
|---|---|---|
| Production-Ready RAG Agents with Contextual AI (Contextual AI) | 使用 Contextual AI 的托管平台在 15 分钟内构建企业级 RAG 系统。学习文档处理、智能索引、Agent 部署以及使用 LMUnit 测试框架对金融文档分析进行自动化评估。 | [查看] |
🧠 记忆
| 教程 | 描述 | 查看 |
|---|---|---|
| Agent Memory: Dual-Memory & Semantic Search (Redis) | 实现双重记忆(短期和长期)、语义搜索和持久化状态,让 Agent 能够记住用户偏好并从对话中学习。 | [查看] |
| Self-Improving Memory with Mem0: Hybrid Vector & Graph Storage | 构建具有自我优化记忆能力的智能 Agent,能够自动提取洞察、解决冲突,并在每次交互中不断进化。学习结合向量搜索(语义召回)和图数据库(关系映射)的混合记忆架构。 | [查看] |
| AI Memory with Cognee | 构建智能 AI 记忆系统,向 Python 的创造者学习并改进你的开发工作流。将分散的开发数据转化为具有上下文洞察的统一知识图谱。 | [查看] |
🚀 部署
| 教程 | 描述 | 查看 |
|---|---|---|
| AWS Bedrock AgentCore: Managed Agent Deployment | 在 AWS Bedrock AgentCore Runtime 上部署和管理 AI Agent。学习将本地 Agent 转化为生产就绪的托管服务,具备自动化的基础设施、请求追踪和标准化的通信模式。 | [查看] |
| Containerizing Agents with Docker | 将 Agent 容器化以实现可移植性和可扩展性。学习在不同环境中运行容器化 Agent 的基础模式。 | [查看] |
| On-Prem LLM Deployment with Ollama | 本地运行和交互大语言模型。用本地部署的模型替代云 API,实现隐私保护、成本控制和低延迟的 Agent 工作流。 | [查看] |
🤝 多 Agent 协调
| 教程 | 描述 | 查看 |
|---|---|---|
| Multi-Agent Communication with A2A Protocol | 使用开放的通信协议模拟协作式 Agent 工作流和消息交换,实现互操作性。 | [查看] |
🎮 GPU 部署
| 教程 | 描述 | 查看 |
|---|---|---|
| Scalable GPU Deployment for AI Agents (Runpod) | 在可扩展的 GPU 基础设施上部署 AI Agent。学习为高需求的 Agent 工作负载搭建经济高效、高性能的环境。 | [查看] |
🔒 安全
| 教程 | 描述 | 查看 |
|---|---|---|
| Comprehensive Agent Security (LlamaFirewall) | 为 Agent 应用全面的输入、输出和工具安全护栏。涵盖提示注入、行为对齐和工具访问控制。 | [查看] |
| Hands-On Agent Security Evaluation (Apex) | 动手实践提示注入攻击、防御方法,以及 AI Agent 的自动化安全测试。 | [查看] |
🏗️ Agent 框架
| 教程 | 描述 | 查看 |
|---|---|---|
| Tool & API Integration via Model Context Protocol (MCP) | 使用标准化协议将 Agent 与外部工具和 API 集成。示例:为高级 Agent 工作流实现无缝的工具和 API 集成。 | [查看] |
| Stateful Agent Workflows with LangGraph | 使用有向图架构设计复杂的有状态 Agent 工作流。示例:包含分类、实体提取和摘要生成的多步骤文本分析流水线。 | [查看] |
| Deploying Agents as APIs with FastAPI | 创建和部署 Agent 为高性能 API,支持同步和流式端点。 | [查看] |
| Building AI Agents in Kotlin with Koog | 使用 JetBrains 的 Koog 框架在 Kotlin 中构建你的第一个 AI Agent。从 hello world 到工具调用和结构化输出,30 分钟内逐步完成。 | [查看] |
🎯 模型定制
| 教程 | 描述 | 查看 |
|---|---|---|
| Fine-Tuning AI Agents for Domain Expertise & Efficiency | 学习如何微调语言模型以实现专业化的 Agent 行为、领域专长以及高效、经济的响应。涵盖数据准备、训练、评估以及集成到 Agent 工作流。 | [查看] |
🔍 追踪与调试
| 教程 | 描述 | 查看 |
|---|---|---|
| Agent Tracing & Debugging with LangSmith | 为 AI 系统添加全面的可观测性。捕获详细的追踪记录、决策点和时序数据,以调试、监控和系统性地改进 Agent 性能。 | [查看] |
📊 评估
| 教程 | 描述 | 查看 |
|---|---|---|
| Automated Agent Evaluation & Behavioral Analysis (IntellAgent) | 自动化 Agent 评估,包含行为分析、性能指标以及可操作的洞察,帮助提升 Agent 质量。 | [查看] |
🎨 UI 与前端
| 教程 | 描述 | 查看 |
|---|---|---|
| Building a Chatbot UI with Streamlit | 构建一个对初学者友好的聊天机器人网页应用,包含聊天界面、文件上传和会话状态,用于交互式 Agent 演示。 | [查看] |
开始使用
使用我们久经考验的模式和实现,将您的 AI Agent 想法转化为生产就绪的系统。
在线浏览
直接在 GitHub 上浏览教程,了解生产级实现、架构决策和集成模式。每个教程都包含全面的文档和代码,无需任何本地环境配置即可学习和适配您的特定需求。
📂 克隆并构建
下载仓库,在本地运行教程,尝试不同的配置,定制实现,并将经过验证的模式直接集成到您的 Agent 开发工作流中。
快速设置
1. 获取代码
git clone https://github.com/NirDiamant/agents-towards-production.git
cd agents-towards-production
2. 安装依赖
导航到目标教程并设置环境:
# 示例:多工具 Agent 编排
cd tutorials/agentic-applications-by-xpander.ai
pip install -r meeting-recorder-agent/requirements.txt
3. 部署与测试
通过首选界面启动教程:
# 运行交互式笔记本进行实验
jupyter notebook tutorial.ipynb
# 运行生产脚本进行集成测试
python app.py
推荐阅读
此列表包含亚马逊联盟链接。作为亚马逊联盟成员,我从符合条件的购买中获取收益。以下每一本书都是本人阅读过并真诚推荐给从事本领域工作的工程师的。
- 《Build a Large Language Model (From Scratch)》 by Sebastian Raschka — 在 PyTorch 中从头构建一个 GPT 风格的模型。
- 《AI Engineering: Building Applications with Foundation Models》 by Chip Huyen — 将基于基础模型的应用产品化的权威参考。
- 《Hands-On Large Language Models》 by Jay Alammar and Maarten Grootendorst — 可视化的、实践性的 LLM 讲解。
- 《Natural Language Processing with Transformers》 by Lewis Tunstall, Leandro von Werra, and Thomas Wolf — 来自 Hugging Face 团队。
- 《Designing Machine Learning Systems》 by Chip Huyen — 生产环境中的机器学习系统,至今仍是标准参考。
贡献
我们欢迎对支持 Agent 开发的工具、基础设施和框架的贡献。这包括监控、部署平台、安全工具、数据库、API 以及其他支持生产级 Agent 系统的横向服务。请参阅我们的贡献指南了解更多详情。
⚠️ 免责声明
仅限教育用途。 作者不对使用、误用或由此产生的后果承担任何责任。我们不认可、验证或保证本文件中引用的第三方公司、工具或服务的可靠性。不对引用方造成的损害、损失、安全漏洞或欺诈行为承担责任。
您的责任: 进行尽职调查、验证合法性、在隔离环境中测试、确保法律合规性。安全工具需在获得适当授权的情况下符合道德规范使用。
如果您觉得本仓库有帮助,请考虑给它一个 Star!
关键词: AI Agents,Production Deployment,LLM,Orchestration,Multi-agent Systems,Memory Systems,Monitoring,Security,Observability,Agent Frameworks,Infrastructure,Serverless,Enterprise AI,Tool Integration

