Unsloth

通过统一的本地界面运行和训练 AI 模型。

Unsloth Studio（BETA）允许你在 Windows、Linux 和 macOS 上运行和训练文本、音频、向量嵌入、视觉模型。

⭐ 功能特性

Unsloth 为推理和训练提供了多个核心能力：

推理（Inference）

搜索 + 下载 + 运行模型，支持 GGUF、LoRA 适配器、safetensors
导出模型：保存或导出为 GGUF、16-bit safetensors 等格式
工具调用：支持自愈式工具调用以及网页搜索
代码执行：允许 LLM 执行代码、处理数据并验证结果，从而提高回答准确性
自动调优推理参数，并支持自定义聊天模板
支持上传图片、音频、PDF、代码、DOCX 等多种文件进行对话

训练（Training）

支持训练 500+ 模型，最高可达 2 倍速度提升，并减少 最高 70% 显存占用，且不损失精度
支持完整微调（full fine-tuning）、预训练、4-bit、16-bit、FP8 训练
可观测性（Observability）：实时监控训练过程，跟踪 loss、GPU 使用情况，并支持自定义图表
数据配方（Data Recipes）：自动构建数据集，支持 PDF、CSV、DOCX 等，并可通过可视化节点流程编辑数据
强化学习（RL）：高效的强化学习库，在 GRPO、FP8 等场景下可减少 80% 显存
支持多 GPU训练，并将在未来持续优化

⚡ 快速开始

Unsloth 有两种使用方式：

Unsloth Studio（Web UI）
Unsloth Core（代码方式）

两者依赖环境不同。

Unsloth Studio（Web UI）

Unsloth Studio（BETA）支持 Windows、Linux、WSL 和 macOS

CPU：仅支持聊天推理
NVIDIA：支持 RTX 30/40/50、Blackwell、DGX Spark、Station 等训练
macOS：目前仅支持聊天；MLX 训练即将推出
AMD：支持聊天；训练需使用 Unsloth Core（Studio 即将支持）
即将支持：Apple MLX、AMD、Intel 训练
多 GPU：已支持，未来将有重大升级

MacOS、Linux 或 WSL 安装（一次性）：

curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_studio --python 3.13
source unsloth_studio/bin/activate
uv pip install unsloth --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

之后每次启动：

source unsloth_studio/bin/activate
unsloth studio -H 0.0.0.0 -p 8888

Windows PowerShell（一次性）：

winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv  -e
uv venv unsloth_studio --python 3.13
.\unsloth_studio\Scripts\activate
uv pip install unsloth --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

之后每次启动：

.\unsloth_studio\Scripts\activate
unsloth studio -H 0.0.0.0 -p 8888

使用官方 Docker 镜像 unsloth/unsloth。参考 Docker 指南。

Nightly 安装 - MacOS、Linux 或 WSL（一次性）：

curl -LsSf https://astral.sh/uv/install.sh | sh
git clone --filter=blob:none https://github.com/unslothai/unsloth.git unsloth_studio
cd unsloth_studio
uv venv --python 3.13
source .venv/bin/activate
uv pip install -e . --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

之后每次启动：

cd unsloth_studio
source .venv/bin/activate
unsloth studio -H 0.0.0.0 -p 8888

Nightly 安装 - Windows PowerShell（一次性）：

winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv  -e
git clone --filter=blob:none https://github.com/unslothai/unsloth.git unsloth_studio
cd unsloth_studio
uv venv --python 3.13
.\.venv\Scripts\activate
uv pip install -e . --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

之后每次启动：

cd unsloth_studio
.\.venv\Scripts\activate
unsloth studio -H 0.0.0.0 -p 8888

Unsloth Core（代码方式）

Linux、WSL

curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_env --python 3.13
source unsloth_env/bin/activate
uv pip install unsloth --torch-backend=auto

Windows PowerShell

winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv  -e
uv venv unsloth_env --python 3.13
.\unsloth_env\Scripts\activate
uv pip install unsloth --torch-backend=auto

对于 Windows，pip install unsloth 仅在已安装 PyTorch 时可用。参考 Windows 安装指南。

可以与 Unsloth Studio 使用相同的 Docker 镜像。

AMD、Intel

对于 RTX 50x、B200、6000 系列 GPU：

uv pip install unsloth --torch-backend=auto

参考：

在 AMD 和 Intel GPU 上安装，请参考：

✨ 免费 Notebook

使用我们的 Notebook 免费训练模型。参考指南。添加数据集、运行，然后部署模型。

模型	免费 Notebook	性能	内存使用
Qwen3.5 (4B)	▶️ 免费开始	1.5 倍更快	减少 60%
gpt-oss (20B)	▶️ 免费开始	2 倍更快	减少 70%
gpt-oss (20B): GRPO	▶️ 免费开始	2 倍更快	减少 80%
Qwen3: Advanced GRPO	▶️ 免费开始	2 倍更快	减少 50%
Gemma 3 (4B) Vision	▶️ 免费开始	1.7 倍更快	减少 60%
embeddinggemma (300M)	▶️ 免费开始	2 倍更快	减少 20%
Mistral Ministral 3 (3B)	▶️ 免费开始	1.5 倍更快	减少 60%
Llama 3.1 (8B) Alpaca	▶️ 免费开始	2 倍更快	减少 70%
Llama 3.2 Conversational	▶️ 免费开始	2 倍更快	减少 70%
Orpheus-TTS (3B)	▶️ 免费开始	1.5 倍更快	减少 50%

查看全部 Notebook：
- Kaggle
- GRPO
- TTS
- embedding
- Vision
查看全部模型与 Notebook
查看完整文档

🦥 Unsloth 最新动态

Unsloth Studio 发布：用于运行和训练 LLM 的 Web UI
Qwen3.5 支持
MoE 模型训练提速 12 倍
Embedding 微调提速 1.8–3.3 倍
长上下文 RL（7 倍）
Triton Kernel 优化
500K 上下文训练
FP8 与视觉 RL
gpt-oss 支持

🔗 链接与资源

类型	链接
Reddit 社区	加入社区
文档	官方文档
Twitter (X)	关注我们
安装	Pip & Docker
模型	模型目录
博客	官方博客

📌 引用

你可以这样引用 Unsloth：

@software{unsloth,
  author = {Daniel Han, Michael Han and Unsloth team},
  title = {Unsloth},
  url = {https://github.com/unslothai/unsloth},
  year = {2023}
}

如果你使用 🦥Unsloth 训练了模型，可以使用这个贴纸！

📄 许可证

Unsloth 使用双许可证模式：Apache 2.0 + AGPL-3.0。

核心包：Apache 2.0
可选组件（如 Studio UI）：AGPL-3.0

该结构既支持持续开发，也保持开源生态发展。

🙏 致谢

llama.cpp 库（用于运行和保存模型）
Hugging Face 及其 transformers、TRL
PyTorch 和 Torch AO 团队
所有贡献者和用户

参考资料

Unsloth
参考资料

Unsloth Studio（BETA）通过统一的本地界面运行和训练 AI 模型

Unsloth

⭐ 功能特性

推理（Inference）

训练（Training）

⚡ 快速开始

Unsloth Studio（Web UI）

MacOS、Linux 或 WSL 安装（一次性）：

Windows PowerShell（一次性）：

Nightly 安装 - MacOS、Linux 或 WSL（一次性）：

Nightly 安装 - Windows PowerShell（一次性）：

Unsloth Core（代码方式）

Linux、WSL

Windows PowerShell

AMD、Intel

✨ 免费 Notebook

🦥 Unsloth 最新动态

🔗 链接与资源

📌 引用

📄 许可证

🙏 致谢

参考资料

更多学习