机器学习系列

第0张 深入理解机器学习

第1章 机器学习的诞生与演化

第2章 机器学习的核心思想

第3章 概率与统计

第4章 线性代数与矩阵运算

第5章 优化与数值计算

第6章 线性模型家族

第7章 基于距离与相似度的方法

第8章 决策树与集成学习

第9章 概率模型与统计学习

第10章 无监督学习与聚类(Unsupervised Learning & Clustering)

第11章 特征工程与数据处理

第12章 模型评估与调优

第13章 NLP 领域的机器学习实践

第14章 计算机视觉与传统机器学习 Computer Vision, CV

第15章 时序数据与预测

第16章 深度学习的兴起

第17章 卷积与序列模型 卷积神经网络(Convolutional Neural Network, CNN)

第18章 大模型与预训练范式

第19章 可解释性与可信AI

第20章 机器学习的思维方式

第21章 机器学习的未来

写作目的

由于自己偏向于实战派,所以理论比较差。

这个系列主要用于 AI 基本知识的入门,或者说简单的整理汇总,方便大家学习查询使用。

背景

📘《深入理解机器学习:从原理到实践》


第一部分:机器学习的全景图

第1章 机器学习的诞生与演化

  • 1.1 从符号主义到统计学习
  • 1.2 数据驱动范式的崛起
  • 1.3 传统机器学习、深度学习与大模型的演进关系
  • 1.4 人工智能、机器学习、深度学习的关系与分工

第2章 机器学习的核心思想

  • 2.1 从“规则编程”到“经验学习”
  • 2.2 学习系统的五要素:数据、表示、目标、优化、评估
  • 2.3 偏差-方差权衡
  • 2.4 泛化能力与过拟合
  • 2.5 机器学习与人类学习的异同

第二部分:机器学习的数学基石

第3章 概率与统计

  • 3.1 随机变量与分布
  • 3.2 极大似然估计(MLE)与贝叶斯推断
  • 3.3 条件概率与朴素贝叶斯模型
  • 3.4 信息论基础:熵、KL散度、交叉熵

第4章 线性代数与矩阵运算

  • 4.1 向量空间与特征表示
  • 4.2 矩阵运算在学习算法中的作用
  • 4.3 特征值与奇异值分解
  • 4.4 PCA 的数学推导与降维本质

第5章 优化与数值计算

  • 5.1 损失函数与目标函数
  • 5.2 梯度下降、随机梯度下降
  • 5.3 正则化与模型复杂度控制
  • 5.4 优化陷阱:局部最优、鞍点、梯度消失

第三部分:传统机器学习核心算法

第6章 线性模型家族

  • 6.1 线性回归
  • 6.2 逻辑回归与分类边界
  • 6.3 多项式与岭回归
  • 6.4 判别式与生成式模型比较

第7章 基于距离与相似度的方法

  • 7.1 k-近邻算法(KNN)
  • 7.2 相似度度量与特征归一化
  • 7.3 实例学习与惰性学习思想

第8章 决策树与集成学习

  • 8.1 决策树构建原理(ID3、C4.5、CART)
  • 8.2 随机森林与特征重要性
  • 8.3 Boosting、Bagging、XGBoost、LightGBM
  • 8.4 集成方法的偏差-方差机制分析

第9章 概率模型与统计学习

  • 9.1 朴素贝叶斯
  • 9.2 隐马尔可夫模型(HMM)
  • 9.3 条件随机场(CRF)
  • 9.4 EM算法与期望最大化思想

第10章 无监督学习与聚类

  • 10.1 k-means 与高维空间的挑战
  • 10.2 层次聚类与密度聚类(DBSCAN)
  • 10.3 PCA、LDA、ICA、t-SNE
  • 10.4 异常检测与流形学习

第四部分:机器学习的工程与应用

第11章 特征工程与数据处理

  • 11.1 特征提取、选择与编码
  • 11.2 标准化、归一化、缺失值处理
  • 11.3 特征交互与高维稀疏化
  • 11.4 自动特征工程与 Feature Store

第12章 模型评估与调优

  • 12.1 交叉验证与数据划分策略
  • 12.2 分类指标(准确率、召回率、F1、AUC)
  • 12.3 超参数调优(Grid Search、Bayesian Optimization)
  • 12.4 模型稳定性与可解释性

第13章 NLP 领域的机器学习实践

  • 13.1 文本预处理与向量化(TF-IDF、Word2Vec)
  • 13.2 文本分类与情感分析
  • 13.3 主题模型(LDA、LSA)
  • 13.4 信息抽取与关键词提取

第14章 计算机视觉与传统机器学习

  • 14.1 图像特征(SIFT、HOG、LBP)
  • 14.2 图像分类与目标检测
  • 14.3 人脸识别中的机器学习
  • 14.4 视觉特征与深度学习的衔接

第15章 时序数据与预测

  • 15.1 时间序列分解与趋势建模
  • 15.2 ARIMA 与传统预测模型
  • 15.3 特征化时间序列(滑动窗口)
  • 15.4 异常检测与序列聚类

第五部分:迈向深度学习与现代AI

第16章 深度学习的兴起

  • 16.1 神经网络的数学基础
  • 16.2 BP算法与梯度传播
  • 16.3 深度结构带来的表达能力
  • 16.4 从传统特征工程到自动特征学习

第17章 卷积与序列模型

  • 17.1 CNN 的思想:局部感受野与权重共享
  • 17.2 RNN、LSTM、GRU 与序列依赖
  • 17.3 注意力机制与 Transformer

第18章 大模型与预训练范式

  • 18.1 从词向量到 BERT
  • 18.2 预训练-微调范式
  • 18.3 大语言模型(LLM)的架构与原理
  • 18.4 从 GPT 到 Agent:智能体的出现

第六部分:机器学习的未来与思维

第19章 可解释性与可信AI

  • 19.1 模型解释 vs 黑箱问题
  • 19.2 SHAP、LIME 等解释技术
  • 19.3 公平性、鲁棒性与隐私保护

第20章 机器学习的思维方式

  • 20.1 从算法思维到系统思维
  • 20.2 建模思路的抽象框架
  • 20.3 学习曲线与成长路径

第21章 机器学习的未来