Voicebox 开源语音合成工作室
Voicebox
什么是 Voicebox?
Voicebox 是一个 本地优先的声音克隆工作室 —— 免费开源的 ElevenLabs 替代品。只需几秒钟的音频即可克隆声音,在 5 种 TTS 引擎上生成 23 种语言的语音,应用后期处理效果,并通过时间轴编辑器创作多声部项目。
完全隐私 —— 模型和声音数据保留在您的机器上
5 种 TTS 引擎 —— Qwen3-TTS、...
2026-04-15 13:01:55 |
AI
MarkItDown 用于将各种文件转换为 Markdown 格式,以便供 LLM 及相关文本分析流水线使用
MarkItDown
MarkItDown 是一个轻量级 Python 工具,用于将各种文件转换为 Markdown 格式,以便供 LLM 及相关文本分析流水线使用。从这个角度来说,它与 textract 最为相似,但侧重于保留重要的文档结构和内容为 Markdown(包括:标题、列表、表格、链接等)。
虽然输出结果通常具有良好的可读性和人工友好性,但其本意是供文本分析工具使用 —— 对...
2026-04-15 13:01:55 |
AI
Claude Cookbooks 提供了旨在帮助开发者使用 Claude 进行构建的代码和指南
Claude Cookbooks
Claude Cookbooks 提供了旨在帮助开发者使用 Claude 进行构建的代码和指南,提供了可直接复制并轻松集成到您自己项目中的代码片段。
前置条件
为了充分利用本 cookbook 中的示例,您需要一个 Claude API 密钥(可在此处免费注册)。
虽然代码示例主要使用 Python 编写,但这些概念可以适配到任何支持与 Claude...
2026-04-15 13:01:55 |
AI
阿波罗 11 号制导计算机(AGC)中指令模块(Comanche055)和登月模块(Luminary099)原始代码。
阿波罗 11 号
阿波罗 11 号制导计算机(AGC)中指令模块(Comanche055)和登月模块(Luminary099)原始代码。
由 [虚拟 AGC][3] 和 [MIT 科学博物馆][4] 的伙计们完成电子化。
本仓库存在的目的是存储阿波罗 11 号原始代码。
当然,倘若在本仓库或原始代码扫描件 [Luminary 099][5] 及 [Comanche 055][6] 发...
2026-04-15 13:01:55 |
AI
本地可以运行的模型-03-多模态
多模态
没问题,那我们就继续。图像理解和语音对话是本地AI应用里很实用也很有趣的部分,它们能将你电脑的“大脑”拓展出“眼睛”和“耳朵”。
对于图像理解任务,我们直接利用你电脑上的Gemma 3 12B模型就能实现,无需额外下载。你只需要在代码中将它的功能稍作切换,并传入图片路径即可,它就能“看懂”图片并回答你的问题。
📸 图像理解能力
Gemma 3 12B 本身是一个多模态模型,理...
2026-04-10 13:01:55 |
AI
本地可以运行的模型-gamma
一些能力
Google 的 Gemma 系列,特别是最新的 Gemma 3,可能是你正在寻找的本地 AI 服务构建的核心模型。它延续了 Google 开源、高性能的传统,最大的亮点是将强大的多模态能力(理解图像和文本)引入了轻量级模型,让本地部署的门槛大大降低。
我把 Gemma 3 与其他相关的 Gemma 模型一起,整理进之前的分档清单里,方便你全面比较:
🧩 Gemma 系列模型...
2026-04-10 13:01:55 |
AI
本地可以运行的模型
一些能力
希望在自己的个人电脑,用 python 启动一些小的 ai 服务,测试验证。
期望有下面的 ai 能力列表,每一个推荐对应的开源模型+理由:
## AI 能力
- [] ocr
- [] tts stt 文本、语音
- [] 图片理解
- [] 图片生成
- [] 对文章、视频的总结能力
- [] 评论区 AT ai 的能力
- [] ai 对话
- [] 向量化分词
- ...
2026-04-10 13:01:55 |
AI
VoxCPM2:基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆
VoxCPM2
基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆
VoxCPM 是一个无离散音频分词器(Tokenizer-Free)的语音合成系统,通过端到端的扩散自回归架构直接生成连续语音表征,绕过对音频的离散编码步骤,实现高度自然且富有表现力的语音合成。
VoxCPM2 是最新的版本 — 基于 MiniCPM-4 基座构建,总计 20亿 参数,在超过 200万小时 的多...
2026-04-09 13:01:55 |
AI