📦 项目:TaxHacker
🧠 一句话(翻译)
一个自托管的 AI 会计应用,用 LLM 自动分析发票、收据和交易数据 ([GitHub][1])
📌 项目定位(核心翻译)
TaxHacker 是一个面向:
- 自由职业者(freelancer)
- 独立开发者(indie hacker)
- 小型企业
的工具,用来:
自动化记账 + 报税准备 + 发票管理
🎯 解决的核心问题
👉 传统痛点:
- 手动录入收据(极其耗时)
- 多币种换算复杂
- 分类混乱
- 报税准备繁琐
👉 TaxHacker 的目标:
拍照 → AI解析 → 自动结构化 → 可导出报税
⚙️ 核心能力(翻译)
1️⃣ AI 发票/收据解析(最核心)
上传:
- 收据照片
- 发票 PDF
- 银行账单
系统会自动提取:
- 商家(merchant)
- 金额(amount)
- 日期(date)
- 商品明细(items)
- 税(tax)
并存入结构化数据库 ([GitHub][1])
✨ 关键能力
- 自动分类(Auto-categorization)
- 拆分明细(item splitting)
- 多语言识别(甚至手写)
👉 本质:
OCR + LLM 语义解析
2️⃣ 多币种 & 加密货币支持
支持:
- 170+ 法币
- BTC / ETH 等加密货币
能力:
- 自动识别币种
- 按交易日期汇率转换(历史汇率) ([GitHub][1])
👉 这个点非常关键:
不用当前汇率,而是交易当天汇率(符合税务要求)
3️⃣ 完全自定义数据模型(非常重要)
你可以:
- 自定义字段(类似 Excel 列)
- 自定义分类(categories)
- 自定义项目(projects)
🔥 更强的是:
每个字段都可以绑定一个 AI Prompt
例如:
字段:风险评估
Prompt:这个发票是否可能被税务局拒绝?
👉 本质:
数据库字段 = AI 可计算字段
4️⃣ 可自定义 AI Prompt(核心亮点)
你可以修改:
- 系统 Prompt
- 字段 Prompt
- 分类规则
👉 甚至可以:
完全控制 AI 的行为
这点非常关键:
TaxHacker ≠ 固定产品 TaxHacker = 可编程 AI 会计系统
5️⃣ 数据过滤 & 导出
支持:
- 按时间 / 分类 / 项目过滤
- 全文搜索
- CSV 导出
- 报税报告
👉 可直接交给会计师
6️⃣ 自托管(核心卖点)
- 本地部署(Docker)
- 数据完全私有
- 无厂商锁定
docker compose up
👉 本质:
你的财务数据 = 完全归你
🏗️ 技术架构(翻译)
技术栈
- 前端:Next.js 15+
- 数据库:PostgreSQL
- ORM:Prisma
- AI:OpenAI / Gemini / Mistral
- PDF处理:Ghostscript / GraphicsMagick ([GitHub][1])
部署结构(Docker)
包含:
- App 容器
- PostgreSQL
- 持久化存储
核心数据流
上传文件
↓
AI解析(LLM)
↓
结构化数据(DB)
↓
过滤 / 导出 / 报表
🧠 核心设计思想(非常关键)
🔥 1️⃣ “AI + 结构化数据”的结合
不是简单 OCR:
传统:图片 → 文本
TaxHacker:图片 → 语义结构
🔥 2️⃣ 用户完全控制 AI
传统 SaaS:
AI 是黑盒
TaxHacker:
AI 是可配置系统
🔥 3️⃣ Excel 化数据模型
交易表 = 可扩展表结构
👉 非常像:
- Airtable
- Notion DB
但加了 AI
🔥 4️⃣ 自托管优先
目标用户:
技术人 / 独立开发者
👉 核心价值:
- 隐私
- 可控
- 可扩展
🚀 和传统工具的区别
| 维度 | 传统记账软件 | TaxHacker |
|---|---|---|
| 数据输入 | 手动 | AI 自动 |
| 数据结构 | 固定 | 可自定义 |
| AI能力 | 无/弱 | 强 |
| 可扩展性 | 低 | 极高 |
| 数据控制 | SaaS | 自托管 |
🧩 本质抽象(非常重要)
你可以这样理解:
TaxHacker = AI + 可配置数据表 + 工作流
或者更本质:
TaxHacker = 面向财务的 AI ETL 系统
🔥 Reddit 用户真实反馈(有价值)
“it saves me a lot of time and nerves” ([Reddit][2])
“I gave up paid bookkeeping” ([Reddit][2])
👉 说明:
- 对 freelancer 非常实用
- 可以替代部分会计服务
🚀 对你当前方向的价值(重点)
你在做:
IM + 推荐 + AI 根因分析平台
这个项目对你启发很大👇
🧠 1️⃣ “数据 + AI Prompt”模型
你可以直接套:
日志 / 报警
↓
AI解析(Prompt可配)
↓
结构化数据
👉 类似:
字段:root_cause
Prompt:分析根因
🧠 2️⃣ “用户可编程 AI”
TaxHacker:
用户定义 AI 行为
你可以做:
运维工程师定义分析规则(Prompt)
👉 这比写规则引擎更强:
- 更灵活
- 更快上线
- 更易迭代
🧠 3️⃣ “AI ETL”能力
TaxHacker 本质是:
非结构化数据 → AI → 结构化数据
你可以做:
日志 / Trace → AI → 根因数据
🧠 4️⃣ Skill + TaxHacker 思想融合
你之前看的:
- Skills → SOP
- Agent Lightning → 学习系统
这个项目补上:
👉 数据层
🧩 可以组合成完整体系:
Skill(规则)
+ TaxHacker(数据结构化)
+ Lightning(学习)
👉 = 可进化 AI 平台
🧩 一句话总结
TaxHacker 本质是:
一个“让 AI 参与数据结构化和业务建模”的通用平台(只是应用在财务场景)
