写作目的

由于自己偏向于实战派,所以理论比较差。

这个系列主要用于 AI 基本知识的入门,或者说简单的整理汇总,方便大家学习查询使用。

背景

📘《深入理解机器学习:从原理到实践》


第一部分:机器学习的全景图

第1章 机器学习的诞生与演化

  • 1.1 从符号主义到统计学习
  • 1.2 数据驱动范式的崛起
  • 1.3 传统机器学习、深度学习与大模型的演进关系
  • 1.4 人工智能、机器学习、深度学习的关系与分工

第2章 机器学习的核心思想

  • 2.1 从“规则编程”到“经验学习”
  • 2.2 学习系统的五要素:数据、表示、目标、优化、评估
  • 2.3 偏差-方差权衡
  • 2.4 泛化能力与过拟合
  • 2.5 机器学习与人类学习的异同

第二部分:机器学习的数学基石

第3章 概率与统计

  • 3.1 随机变量与分布
  • 3.2 极大似然估计(MLE)与贝叶斯推断
  • 3.3 条件概率与朴素贝叶斯模型
  • 3.4 信息论基础:熵、KL散度、交叉熵

第4章 线性代数与矩阵运算

  • 4.1 向量空间与特征表示
  • 4.2 矩阵运算在学习算法中的作用
  • 4.3 特征值与奇异值分解
  • 4.4 PCA 的数学推导与降维本质

第5章 优化与数值计算

  • 5.1 损失函数与目标函数
  • 5.2 梯度下降、随机梯度下降
  • 5.3 正则化与模型复杂度控制
  • 5.4 优化陷阱:局部最优、鞍点、梯度消失

第三部分:传统机器学习核心算法

第6章 线性模型家族

  • 6.1 线性回归
  • 6.2 逻辑回归与分类边界
  • 6.3 多项式与岭回归
  • 6.4 判别式与生成式模型比较

第7章 基于距离与相似度的方法

  • 7.1 k-近邻算法(KNN)
  • 7.2 相似度度量与特征归一化
  • 7.3 实例学习与惰性学习思想

第8章 决策树与集成学习

  • 8.1 决策树构建原理(ID3、C4.5、CART)
  • 8.2 随机森林与特征重要性
  • 8.3 Boosting、Bagging、XGBoost、LightGBM
  • 8.4 集成方法的偏差-方差机制分析

第9章 概率模型与统计学习

  • 9.1 朴素贝叶斯
  • 9.2 隐马尔可夫模型(HMM)
  • 9.3 条件随机场(CRF)
  • 9.4 EM算法与期望最大化思想

第10章 无监督学习与聚类

  • 10.1 k-means 与高维空间的挑战
  • 10.2 层次聚类与密度聚类(DBSCAN)
  • 10.3 PCA、LDA、ICA、t-SNE
  • 10.4 异常检测与流形学习

第四部分:机器学习的工程与应用

第11章 特征工程与数据处理

  • 11.1 特征提取、选择与编码
  • 11.2 标准化、归一化、缺失值处理
  • 11.3 特征交互与高维稀疏化
  • 11.4 自动特征工程与 Feature Store

第12章 模型评估与调优

  • 12.1 交叉验证与数据划分策略
  • 12.2 分类指标(准确率、召回率、F1、AUC)
  • 12.3 超参数调优(Grid Search、Bayesian Optimization)
  • 12.4 模型稳定性与可解释性

第13章 NLP 领域的机器学习实践

  • 13.1 文本预处理与向量化(TF-IDF、Word2Vec)
  • 13.2 文本分类与情感分析
  • 13.3 主题模型(LDA、LSA)
  • 13.4 信息抽取与关键词提取

第14章 计算机视觉与传统机器学习

  • 14.1 图像特征(SIFT、HOG、LBP)
  • 14.2 图像分类与目标检测
  • 14.3 人脸识别中的机器学习
  • 14.4 视觉特征与深度学习的衔接

第15章 时序数据与预测

  • 15.1 时间序列分解与趋势建模
  • 15.2 ARIMA 与传统预测模型
  • 15.3 特征化时间序列(滑动窗口)
  • 15.4 异常检测与序列聚类

第五部分:迈向深度学习与现代AI

第16章 深度学习的兴起

  • 16.1 神经网络的数学基础
  • 16.2 BP算法与梯度传播
  • 16.3 深度结构带来的表达能力
  • 16.4 从传统特征工程到自动特征学习

第17章 卷积与序列模型

  • 17.1 CNN 的思想:局部感受野与权重共享
  • 17.2 RNN、LSTM、GRU 与序列依赖
  • 17.3 注意力机制与 Transformer

第18章 大模型与预训练范式

  • 18.1 从词向量到 BERT
  • 18.2 预训练-微调范式
  • 18.3 大语言模型(LLM)的架构与原理
  • 18.4 从 GPT 到 Agent:智能体的出现

第六部分:机器学习的未来与思维

第19章 可解释性与可信AI

  • 19.1 模型解释 vs 黑箱问题
  • 19.2 SHAP、LIME 等解释技术
  • 19.3 公平性、鲁棒性与隐私保护

第20章 机器学习的思维方式

  • 20.1 从算法思维到系统思维
  • 20.2 建模思路的抽象框架
  • 20.3 学习曲线与成长路径

第21章 机器学习的未来

  • 21.1 自监督学习与自适应智能
  • 21.2 AI 模型与知识融合
  • 21.3 从学习到推理的统一
  • 21.4 人机共生的智能演化

附录