个人简介

Echo Blog


江湖无名 安心练剑
  • dive-into-llms-07-Transformers pipeline 入门例子
    pipeline 例子 python 我直接命令行测试,很不幸,开门失败。 PS C:\Users\Administrator> python Python 3.13.0a5 (tags/v3.13.0a5:076d169, Mar 12 2024, 21:29:03) [MSC v.1938 64 bit (AMD64)] on win32 Type "help", "copy...
    2025-11-03 12:40:12 | AI
  • dive-into-llms-06-Transformers 基本环境安装快速入门
    快速上手 快来使用 🤗 Transformers 吧! 无论你是开发人员还是日常用户,这篇快速上手教程都将帮助你入门并且向你展示如何使用 pipeline() 进行推理,使用 AutoClass 加载一个预训练模型和预处理器,以及使用 PyTorch 或 TensorFlow 快速训练一个模型。 如果你是一个初学者,我们建议你接下来查看我们的教程或者课程,来更深入地了解在这里介绍到的概...
    2025-11-03 12:40:12 | AI
  • dive-into-llms-05-PyTorch 入门介绍
    背景 https://pytorch.org/ chat 是什么? 我来系统、易懂地帮你介绍一下 PyTorch —— 它是几乎所有大模型(LLM)开发者都要掌握的核心框架。 💡 一、PyTorch 是什么? PyTorch 是一个 基于 Python 的深度学习框架,由 Facebook(现在的 Meta)AI 研究院在 2016 年发布。 它主要用于: ...
    2025-11-03 12:40:12 | AI
  • dive-into-llms-04-Transformers 简介
    背景 https://huggingface.co/docs/transformers/main/zh/index Transformers 简介 为 PyTorch 打造的先进的机器学习工具. 🤗 Transformers 提供了可以轻松地下载并且训练先进的预训练模型的 API 和工具。 使用预训练模型可以减少计算消耗和碳排放,并且节省从头训练所需要的时间和资源。 这些模型支持...
    2025-11-03 12:40:12 | AI
  • dive-into-llms-03-自然语言处理/大模型的一些背景概念
    背景 学习 dive-into-llms chat 对自然语言处理/大模型的一些背景概念有初步认识:什么是预训练、微调、Transformer 架构、模型推理、量化、部署等等。 非常棒 👍,你现在已经到了学习大模型最关键的一步 —— 理解 自然语言处理(NLP)与大模型的核心概念体系。 我来用尽可能通俗、系统、工程化的方式,帮你快速建立一个「从 0 到能看懂大模型原理」的完整认知地...
    2025-11-03 12:40:12 | AI
  • dive-into-llms-02-deeplearning 深度学习基础知识入门
    背景 学习 dive-into-llms chat 深度学习基础知识入门 这一步正是「从会用大模型 → 理解大模型」的关键转折。 你想要快速建立「深度学习基础认知」——不是搞学术,而是能听懂大模型背后的逻辑。 那我们就用最通俗易懂的方式讲清楚。 🧠 一、深度学习到底是什么? 一句话讲清楚: 深度学习就是「让计算机通过大量数据自动学出规律」的过程。 比如: ...
    2025-11-03 12:40:12 | AI
  • dive-into-llms-01-python 基础知识入门
    背景 学习 dive-into-llms chat python 基础 要想真正“入门大模型”,Python 编程基础是必不可少的地基。 因为几乎所有的大模型框架(Transformers、PyTorch、TensorFlow、LangChain、OpenAI API 等)都基于 Python 实现。 我给你讲得系统一点👇 (不废话、实用导向,专门为“想入门大模型”的人定制) ...
    2025-11-03 12:40:12 | AI
  • dive-into-llms-00-学习概览
    背景 学习 dive-into-llms 项目简介 这个项目是 Dive into LLMs(中文名:《动手学大模型》) — 一个由 上海交通大学 NLP / AI 课程团队发起、在 GitHub 上开源的 “大语言模型 (LLM) 编程实践教程” 系列。 (GitHub) 它的主要目标如下: 帮助读者 从实践角度快速上手大语言模型(LLM)相关技术,而不仅仅是理论。 (Gi...
    2025-11-03 12:40:12 | AI