-
dive-into-llms-03-自然语言处理/大模型的一些背景概念
背景
学习 dive-into-llms
chat
对自然语言处理/大模型的一些背景概念有初步认识:什么是预训练、微调、Transformer 架构、模型推理、量化、部署等等。
非常棒 👍,你现在已经到了学习大模型最关键的一步 —— 理解 自然语言处理(NLP)与大模型的核心概念体系。
我来用尽可能通俗、系统、工程化的方式,帮你快速建立一个「从 0 到能看懂大模型原理」的完整认知地...
2025-11-03 12:40:12 |
AI
-
dive-into-llms-02-deeplearning 深度学习基础知识入门
背景
学习 dive-into-llms
chat
深度学习基础知识入门
这一步正是「从会用大模型 → 理解大模型」的关键转折。
你想要快速建立「深度学习基础认知」——不是搞学术,而是能听懂大模型背后的逻辑。
那我们就用最通俗易懂的方式讲清楚。
🧠 一、深度学习到底是什么?
一句话讲清楚:
深度学习就是「让计算机通过大量数据自动学出规律」的过程。
比如:
...
2025-11-03 12:40:12 |
AI
-
dive-into-llms-01-python 基础知识入门
背景
学习 dive-into-llms
chat
python 基础
要想真正“入门大模型”,Python 编程基础是必不可少的地基。
因为几乎所有的大模型框架(Transformers、PyTorch、TensorFlow、LangChain、OpenAI API 等)都基于 Python 实现。
我给你讲得系统一点👇
(不废话、实用导向,专门为“想入门大模型”的人定制)
...
2025-11-03 12:40:12 |
AI
-
dive-into-llms-00-学习概览
背景
学习 dive-into-llms
项目简介
这个项目是 Dive into LLMs(中文名:《动手学大模型》) — 一个由 上海交通大学 NLP / AI 课程团队发起、在 GitHub 上开源的 “大语言模型 (LLM) 编程实践教程” 系列。 (GitHub)
它的主要目标如下:
帮助读者 从实践角度快速上手大语言模型(LLM)相关技术,而不仅仅是理论。 (Gi...
2025-11-03 12:40:12 |
AI
-
第21章 机器学习的未来
非常好 👍,这一章《机器学习的未来》是全书的终章,
它不再聚焦于算法与工程实现,而是从 技术演化、智能本质、人与AI共生的视角 出发,展望机器学习未来的发展方向。
可以看作是对前20章的“哲学升华篇”——从学习的技术走向学习的智能。
第21章 机器学习的未来
21.1 自监督学习与自适应智能
🔹 一、监督学习的极限
传统机器学习依赖“标注数据”进行训练。
但标注往往昂贵、主观...
2025-11-03 12:40:12 |
AI
-
第20章 机器学习的思维方式
第20章《机器学习的思维方式》可以视为全书的“升华章”——从技术到思维的回归。
这章不再讲具体算法,而是讨论 如何像一个机器学习工程师那样思考问题,以及这种思维方式如何迁移到其他领域。
下面是完整详细讲解:
第20章 机器学习的思维方式
20.1 从算法思维到系统思维
🔹 一、算法思维:局部最优的思考方式
初学机器学习的人,往往从“算法”出发:
给我一个算法,我喂...
2025-11-03 12:40:12 |
AI
-
第19章 可解释性与可信AI
这一章进入了当代机器学习/AI 的伦理与可信性核心议题。
“可解释性”“公平性”“鲁棒性”“隐私保护”不仅是技术问题,更是机器学习走向现实世界的底线工程。
下面是第19章《可解释性与可信AI》的完整详细讲解。
第19章 可解释性与可信AI
19.1 模型解释 vs 黑箱问题
🔹 一、什么是“黑箱模型”?
随着模型复杂度不断提升(尤其是深度神经网络、大语言模型),我们越来越...
2025-11-03 12:40:12 |
AI
-
第18章 大模型与预训练范式
第18章是整本书的“现代 AI 篇”的核心部分——它讲述了从「词向量」到「BERT」,再到「GPT 与智能体(Agent)」的整条技术演化主线。
这一章不仅是机器学习与深度学习的融合点,更是当代人工智能(尤其是大语言模型)的技术根基。
第18章 大模型与预训练范式
18.1 从词向量到 BERT
🔹 一、传统NLP的局限
在早期的自然语言处理中,机器学习模型(如SVM、朴素...
2025-11-03 12:40:12 |
AI