GitHub - dograh-hq/dograh：开源语音 Agent 平台

Dograh AI

Vapi 与 Retell 的开源、可自托管替代方案——使用拖拽式工作流构建器，打造生产级语音 Agent。

零基础到运行中的机器人，2 分钟内即可完成。

100% 开源，可自托管——与 Vapi、Retell 不同，无供应商锁定
完全掌控与透明——每一行代码都开放，灵活集成 LLM / TTS / STT
由 YC 校友及成功退出的创业者维护，致力于保持语音 AI 的开放

⚖️ Dograh vs Vapi vs Retell

以下是对团队评估语音 AI 平台最为重要的几个方面的诚实对比：

特性	Dograh	Vapi	Retell
许可证	BSD 2-Clause（开源）	专有	专有
可自托管	✅ 是——一条 Docker 命令	❌ 仅限 SaaS	❌ 仅限 SaaS
定价	免费（自托管）· 按量付费（云版）	按分钟收费的 SaaS	按分钟收费的 SaaS
自带 LLM / STT / TTS	✅ 任意提供商，或使用 Dograh 内置服务	可在其集成范围内配置	可在其集成范围内配置
源码级定制	✅ 每一行都可修改	❌ 闭源	❌ 闭源
数据驻留	你的基础设施，你的规则	他们的云端	他们的云端
供应商锁定	无	完全锁定	完全锁定

快速开始

在你的本地机器上下载并设置 Dograh

注意：我们会收集匿名使用数据以改进产品。你可以在下方命令中将 ENABLE_TELEMETRY 设置为 false 来选择退出。

注意：如果你希望在远程服务器上运行该平台，请查阅我们的文档。

curl -o docker-compose.yaml https://raw.githubusercontent.com/dograh-hq/dograh/main/docker-compose.yaml && \
REGISTRY=ghcr.io/dograh-hq ENABLE_TELEMETRY=true docker compose up --pull always

注意：首次启动可能需要 2-3 分钟来下载所有镜像。启动后，打开 http://localhost:3010 即可创建你的第一个 AI 语音助手！

常见问题及解决方案请参阅 故障排查指南。

🗣️ 你的第一个语音机器人

在浏览器中打开 http://localhost:3010。
选择入站或出站，为你的机器人命名（例如“潜在客户筛选”），并用 5–10 个词描述其用例（例如“筛选保险表单提交中的购买意向”）。
点击 Web Call——即刻与你的机器人对话。

无需 API 密钥。 Dograh 内置自动生成的密钥及其自己的 LLM / TTS / STT 技术栈。你随时可以接入自己的 LLM、TTS、STT 或电话提供商（如 Twilio、Vonage、Telnyx）。

功能特性

语音能力

电话集成：内置 Twilio、Vonage、Vobiz、Cloudonix 等电话集成（可轻松添加其他供应商），支持将通话转接给人工客服
语言支持：支持英语（可扩展至其他语言）
自定义模型：自带 TTS/STT 模型
实时处理：低延迟语音交互

开发者体验

零配置启动：自动生成 API 密钥，可立即测试
基于 Python：基于 Python 构建，易于定制
优先 Docker：容器化部署，保障环境一致性
模块化架构：按需替换各组件

测试与质量

测试模式：发布前端到端测试你的 Agent，不影响生产通话或数据
仪表盘内 Web 通话：构建过程中直接与机器人对话，无需设置电话通信
QA 节点：一个内置工作流节点，用于分析你其他节点的提示词质量

部署选项

本地开发

请参考本地设置。

自托管部署

如需详细的部署说明，包括带 HTTPS 的远程服务器设置，请参阅我们的 Docker 部署指南。

云版

请访问 https://www.dograh.com 了解我们的托管云服务。

文档

请访问 https://docs.dograh.com 查阅我们的文档。

社区与支持

来自 Better Stack 视频？ 请在我们的置顶 GitHub 讨论贴中分享你的用例——我们会阅读每一条回复，创始人也亲自为新用户提供引导。

Slack——Dograh AI 贡献的核心交流平台。与维护者联系、在编码前讨论功能、获取设置帮助，并了解贡献进度。
GitHub 讨论区——分享用例、提问、交流工作流配置。
GitHub Issues——报告错误或提出功能请求。

加入我们→ Dograh 社区 Slack

贡献

我们热爱贡献！Dograh AI 是 100% 开源的，我们将始终保持这一理念。

开始贡献

复刻（Fork）本仓库
创建你的特性分支（git checkout -b feature/AmazingFeature）
提交你的更改（git commit -m 'Add some AmazingFeature'）
推送到分支（git push origin feature/AmazingFeature）
开启一个拉取请求（Pull Request）

⭐ Star 历史

许可证

Dograh AI 采用 BSD 2-Clause 许可证——与构建 Dograh AI 所使用的一些项目相同，确保了兼容性以及使用、修改和分发的自由。

关于我们

❤️ 由 Dograh（Zansat Technologies Private Limited）倾心打造。

由 YC 校友及成功退出的创业者创立，致力于保持语音 AI 的开放和普惠。

⭐ 在 GitHub 上给我们加星

☁️ 试用云版

加入 Slack

关于

开源语音 Agent 平台

主题

python open-source text-to-speech ai nextjs webrtc voice self-hosted fastapi voice-ai llm pipecat voice-agents

资源

许可证

贡献指南

安全策略

统计

Star 1.8k
Watcher 21
Fork 377

发布

dograh: v1.30.1 最新版本 2026年5月17日

贡献者

14 位贡献者

编程语言

Python 55.6%
TypeScript 40.7%
Shell 2.3%
JavaScript 0.6%
PowerShell 0.6%
Dockerfile 0.1%
其他 0.1%

📋 补充背景信息（基于第三方资料整理）

**核心定位** Dograh 是一个开源、可自托管的语音 AI Agent 平台，旨在帮助开发者快速构建和部署语音助手。它被视为 Vapi、Retell 等专有商业方案的开源替代品。 **核心价值** - **开源与自托管**：BSD 2-Clause 许可证，通过一条 Docker 命令即可部署。 - **低成本**：自托管模式免费，能显著降低 AI 语音系统的总成本。 - **双模式运行**：同时支持入站（Inbound）和出站（Outbound）通话。 - **低代码/无代码**：通过直观的拖拽式工作流构建器（基于 ReactFlow）设计复杂的对话逻辑。 - **完整 AI 技术栈**： - 内置 LLM（大语言模型）、STT（语音转文本）、TTS（文本转语音）服务，开箱即用。 - 也允许开发者接入自定义或第三方 AI 服务，无需绑定特定供应商。 - **可扩展的电话通信**：原生集成 Twilio、Vonage 等流行电话服务商，并能通过 API 接入 Cloudonix 等企业级通信平台，轻松将 Agent 接入全球电话网络。 - **生产就绪特性**：内置变量提取、通话转录、录音存储、端到端测试模式和成本核算等功能，解决了从开源项目拼接到生产部署的“最后一公里”问题。 **技术架构（基于 DeepWiki 资料）** Dograh 采用基于 Docker 的**容器化微服务架构**，使用 Docker Compose 编排。主要包含 8 个核心服务，分为三层： | 服务名称 | 功能 | |---|---| | `postgres` | PostgreSQL 17 数据库（带 pgvector 扩展，用于 RAG） | | `redis` | 缓存层，ARQ 任务队列后端 | | `minio` | S3 兼容的对象存储（存放录音） | | `api` | FastAPI 后端，Pipecat 引擎编排器 | | `ui` | Next.js 15 前端，XYFlow 工作流构建器 | | `cloudflared` | Cloudflare Tunnel 服务 | | `coturn` | TURN/STUN 服务 | | `nginx` | 远程部署模式下的反向代理 | 为保障通话质量，系统最低配置要求为 **8GB RAM + 2 核 CPU**，推荐 16GB RAM + 4 核 CPU。

参考资料