GitHub - dograh-hq/dograh:开源语音 Agent 平台

Dograh AI

Vapi 与 Retell 的开源、可自托管替代方案——使用拖拽式工作流构建器,打造生产级语音 Agent。

零基础到运行中的机器人,2 分钟内即可完成。

  • 100% 开源,可自托管——与 Vapi、Retell 不同,无供应商锁定
  • 完全掌控与透明——每一行代码都开放,灵活集成 LLM / TTS / STT
  • 由 YC 校友及成功退出的创业者维护,致力于保持语音 AI 的开放

⚖️ Dograh vs Vapi vs Retell

以下是对团队评估语音 AI 平台最为重要的几个方面的诚实对比:

特性 Dograh Vapi Retell
许可证 BSD 2-Clause(开源) 专有 专有
可自托管 ✅ 是——一条 Docker 命令 ❌ 仅限 SaaS ❌ 仅限 SaaS
定价 免费(自托管)· 按量付费(云版) 按分钟收费的 SaaS 按分钟收费的 SaaS
自带 LLM / STT / TTS ✅ 任意提供商,或使用 Dograh 内置服务 可在其集成范围内配置 可在其集成范围内配置
源码级定制 ✅ 每一行都可修改 ❌ 闭源 ❌ 闭源
数据驻留 你的基础设施,你的规则 他们的云端 他们的云端
供应商锁定 完全锁定 完全锁定

快速开始

在你的本地机器上下载并设置 Dograh

注意:我们会收集匿名使用数据以改进产品。你可以在下方命令中将 ENABLE_TELEMETRY 设置为 false 来选择退出。

注意:如果你希望在远程服务器上运行该平台,请查阅我们的文档

curl -o docker-compose.yaml https://raw.githubusercontent.com/dograh-hq/dograh/main/docker-compose.yaml && \
REGISTRY=ghcr.io/dograh-hq ENABLE_TELEMETRY=true docker compose up --pull always

注意:首次启动可能需要 2-3 分钟来下载所有镜像。启动后,打开 http://localhost:3010 即可创建你的第一个 AI 语音助手!

常见问题及解决方案请参阅 故障排查指南

🗣️ 你的第一个语音机器人

  1. 在浏览器中打开 http://localhost:3010
  2. 选择入站出站,为你的机器人命名(例如“潜在客户筛选”),并用 5–10 个词描述其用例(例如“筛选保险表单提交中的购买意向”)。
  3. 点击 Web Call——即刻与你的机器人对话。

无需 API 密钥。 Dograh 内置自动生成的密钥及其自己的 LLM / TTS / STT 技术栈。你随时可以接入自己的 LLM、TTS、STT 或电话提供商(如 Twilio、Vonage、Telnyx)。

功能特性

语音能力

  • 电话集成:内置 Twilio、Vonage、Vobiz、Cloudonix 等电话集成(可轻松添加其他供应商),支持将通话转接给人工客服
  • 语言支持:支持英语(可扩展至其他语言)
  • 自定义模型:自带 TTS/STT 模型
  • 实时处理:低延迟语音交互

开发者体验

  • 零配置启动:自动生成 API 密钥,可立即测试
  • 基于 Python:基于 Python 构建,易于定制
  • 优先 Docker:容器化部署,保障环境一致性
  • 模块化架构:按需替换各组件

测试与质量

  • 测试模式:发布前端到端测试你的 Agent,不影响生产通话或数据
  • 仪表盘内 Web 通话:构建过程中直接与机器人对话,无需设置电话通信
  • QA 节点:一个内置工作流节点,用于分析你其他节点的提示词质量

部署选项

本地开发

请参考本地设置

自托管部署

如需详细的部署说明,包括带 HTTPS 的远程服务器设置,请参阅我们的 Docker 部署指南

云版

请访问 https://www.dograh.com 了解我们的托管云服务。

文档

请访问 https://docs.dograh.com 查阅我们的文档。

社区与支持

来自 Better Stack 视频? 请在我们的置顶 GitHub 讨论贴中分享你的用例——我们会阅读每一条回复,创始人也亲自为新用户提供引导。

  • Slack——Dograh AI 贡献的核心交流平台。与维护者联系、在编码前讨论功能、获取设置帮助,并了解贡献进度。
  • GitHub 讨论区——分享用例、提问、交流工作流配置。
  • GitHub Issues——报告错误或提出功能请求。

加入我们→ Dograh 社区 Slack

贡献

我们热爱贡献!Dograh AI 是 100% 开源的,我们将始终保持这一理念。

开始贡献

  1. 复刻(Fork)本仓库
  2. 创建你的特性分支(git checkout -b feature/AmazingFeature
  3. 提交你的更改(git commit -m 'Add some AmazingFeature'
  4. 推送到分支(git push origin feature/AmazingFeature
  5. 开启一个拉取请求(Pull Request)

⭐ Star 历史

许可证

Dograh AI 采用 BSD 2-Clause 许可证——与构建 Dograh AI 所使用的一些项目相同,确保了兼容性以及使用、修改和分发的自由。

关于我们

❤️ 由 Dograh(Zansat Technologies Private Limited)倾心打造。

由 YC 校友及成功退出的创业者创立,致力于保持语音 AI 的开放和普惠。

⭐ 在 GitHub 上给我们加星 ☁️ 试用云版 加入 Slack

关于

开源语音 Agent 平台

主题

python open-source text-to-speech ai nextjs webrtc voice self-hosted fastapi voice-ai llm pipecat voice-agents

资源

许可证

贡献指南

安全策略

统计

发布

dograh: v1.30.1 最新版本 2026年5月17日

贡献者

14 位贡献者

编程语言

  • Python 55.6%
  • TypeScript 40.7%
  • Shell 2.3%
  • JavaScript 0.6%
  • PowerShell 0.6%
  • Dockerfile 0.1%
  • 其他 0.1%

📋 补充背景信息(基于第三方资料整理) **核心定位** Dograh 是一个开源、可自托管的语音 AI Agent 平台,旨在帮助开发者快速构建和部署语音助手。它被视为 Vapi、Retell 等专有商业方案的开源替代品。 **核心价值** - **开源与自托管**:BSD 2-Clause 许可证,通过一条 Docker 命令即可部署。 - **低成本**:自托管模式免费,能显著降低 AI 语音系统的总成本。 - **双模式运行**:同时支持入站(Inbound)和出站(Outbound)通话。 - **低代码/无代码**:通过直观的拖拽式工作流构建器(基于 ReactFlow)设计复杂的对话逻辑。 - **完整 AI 技术栈**: - 内置 LLM(大语言模型)、STT(语音转文本)、TTS(文本转语音)服务,开箱即用。 - 也允许开发者接入自定义或第三方 AI 服务,无需绑定特定供应商。 - **可扩展的电话通信**:原生集成 Twilio、Vonage 等流行电话服务商,并能通过 API 接入 Cloudonix 等企业级通信平台,轻松将 Agent 接入全球电话网络。 - **生产就绪特性**:内置变量提取、通话转录、录音存储、端到端测试模式和成本核算等功能,解决了从开源项目拼接到生产部署的“最后一公里”问题。 **技术架构(基于 DeepWiki 资料)** Dograh 采用基于 Docker 的**容器化微服务架构**,使用 Docker Compose 编排。主要包含 8 个核心服务,分为三层: | 服务名称 | 功能 | |---|---| | `postgres` | PostgreSQL 17 数据库(带 pgvector 扩展,用于 RAG) | | `redis` | 缓存层,ARQ 任务队列后端 | | `minio` | S3 兼容的对象存储(存放录音) | | `api` | FastAPI 后端,Pipecat 引擎编排器 | | `ui` | Next.js 15 前端,XYFlow 工作流构建器 | | `cloudflared` | Cloudflare Tunnel 服务 | | `coturn` | TURN/STUN 服务 | | `nginx` | 远程部署模式下的反向代理 | 为保障通话质量,系统最低配置要求为 **8GB RAM + 2 核 CPU**,推荐 16GB RAM + 4 核 CPU。

参考资料