个人简介

Echo Blog


江湖无名 安心练剑
  • Voicebox 开源语音合成工作室
    Voicebox 什么是 Voicebox? Voicebox 是一个 本地优先的声音克隆工作室 —— 免费开源的 ElevenLabs 替代品。只需几秒钟的音频即可克隆声音,在 5 种 TTS 引擎上生成 23 种语言的语音,应用后期处理效果,并通过时间轴编辑器创作多声部项目。 完全隐私 —— 模型和声音数据保留在您的机器上 5 种 TTS 引擎 —— Qwen3-TTS、...
    2026-04-15 13:01:55 | AI
  • MarkItDown 用于将各种文件转换为 Markdown 格式,以便供 LLM 及相关文本分析流水线使用
    MarkItDown MarkItDown 是一个轻量级 Python 工具,用于将各种文件转换为 Markdown 格式,以便供 LLM 及相关文本分析流水线使用。从这个角度来说,它与 textract 最为相似,但侧重于保留重要的文档结构和内容为 Markdown(包括:标题、列表、表格、链接等)。 虽然输出结果通常具有良好的可读性和人工友好性,但其本意是供文本分析工具使用 —— 对...
    2026-04-15 13:01:55 | AI
  • Claude Cookbooks 提供了旨在帮助开发者使用 Claude 进行构建的代码和指南
    Claude Cookbooks Claude Cookbooks 提供了旨在帮助开发者使用 Claude 进行构建的代码和指南,提供了可直接复制并轻松集成到您自己项目中的代码片段。 前置条件 为了充分利用本 cookbook 中的示例,您需要一个 Claude API 密钥(可在此处免费注册)。 虽然代码示例主要使用 Python 编写,但这些概念可以适配到任何支持与 Claude...
    2026-04-15 13:01:55 | AI
  • 阿波罗 11 号制导计算机(AGC)中指令模块(Comanche055)和登月模块(Luminary099)原始代码。
    阿波罗 11 号 阿波罗 11 号制导计算机(AGC)中指令模块(Comanche055)和登月模块(Luminary099)原始代码。 由 [虚拟 AGC][3] 和 [MIT 科学博物馆][4] 的伙计们完成电子化。 本仓库存在的目的是存储阿波罗 11 号原始代码。 当然,倘若在本仓库或原始代码扫描件 [Luminary 099][5] 及 [Comanche 055][6] 发...
    2026-04-15 13:01:55 | AI
  • 本地可以运行的模型-03-多模态
    多模态 没问题,那我们就继续。图像理解和语音对话是本地AI应用里很实用也很有趣的部分,它们能将你电脑的“大脑”拓展出“眼睛”和“耳朵”。 对于图像理解任务,我们直接利用你电脑上的Gemma 3 12B模型就能实现,无需额外下载。你只需要在代码中将它的功能稍作切换,并传入图片路径即可,它就能“看懂”图片并回答你的问题。 📸 图像理解能力 Gemma 3 12B 本身是一个多模态模型,理...
    2026-04-10 13:01:55 | AI
  • 本地可以运行的模型-gamma
    一些能力 Google 的 Gemma 系列,特别是最新的 Gemma 3,可能是你正在寻找的本地 AI 服务构建的核心模型。它延续了 Google 开源、高性能的传统,最大的亮点是将强大的多模态能力(理解图像和文本)引入了轻量级模型,让本地部署的门槛大大降低。 我把 Gemma 3 与其他相关的 Gemma 模型一起,整理进之前的分档清单里,方便你全面比较: 🧩 Gemma 系列模型...
    2026-04-10 13:01:55 | AI
  • 本地可以运行的模型
    一些能力 希望在自己的个人电脑,用 python 启动一些小的 ai 服务,测试验证。 期望有下面的 ai 能力列表,每一个推荐对应的开源模型+理由: ## AI 能力 - [] ocr - [] tts stt 文本、语音 - [] 图片理解 - [] 图片生成 - [] 对文章、视频的总结能力 - [] 评论区 AT ai 的能力 - [] ai 对话 - [] 向量化分词 - ...
    2026-04-10 13:01:55 | AI
  • VoxCPM2:基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆
    VoxCPM2 基于连续表征的多语言语音合成、创意音色设计与高保真声音克隆 VoxCPM 是一个无离散音频分词器(Tokenizer-Free)的语音合成系统,通过端到端的扩散自回归架构直接生成连续语音表征,绕过对音频的离散编码步骤,实现高度自然且富有表现力的语音合成。 VoxCPM2 是最新的版本 — 基于 MiniCPM-4 基座构建,总计 20亿 参数,在超过 200万小时 的多...
    2026-04-09 13:01:55 | AI