序言

老马作为一名 java 开发者,对于机器学习仰慕已久。

对于机器学习甚至使用过 java 的深度学习框架 DL4j 学习过一遍,不过感觉依然没有入门。仔细想来,是没有理解机器学习背后的原理导致的。

而如何入门机器学习,也一直是一个困扰老马的问题。

本系列将和大家一起从零学习机器学习,揭开机器学习的神秘面纱。

机器学习

是什么?

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

这一段是百科定义,我们可以发现几个点:

(1)机器学习多领域的交叉科学,数学更是其中的重中之重。

(2)主要模拟或者研究如何实现人类的学习行为

人工智能、机器学习和深度学习的关系?

我们经常听到人工智能、机器学习和深度学习这样的词,他们之间的关系是怎么样的?

输入图片说明

机器学习是人工智能的一个分支,机器学习的算法有很多,深度学习只是其中一个。

应用

数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。

步骤

机器学习在实际操作层面一共分为7步:

  • 收集数据

  • 数据准备

  • 选择一个模型

  • 训练

  • 评估

  • 参数调整

  • 预测(开始使用)

学习路线图

模范 python

numpy => pandas => scikit-learn => tensorflow => kera

在机器学习前 - (零基础)

基础知识

Python 基础语法 ✔️

计算基础-Numpy

计算进阶-Pandas

可视化-Matplotlib

可视化-poltly

神经网络

了解机器学习方法 (*可跳)

框架

Tensorflow (Google开发, 社区大)

PyTorch (Facebook开发, 方便debug)

Keras (类似Tensorflow, 推荐直接学Tensorflow)

Theano (类似Tensorflow, 推荐直接学Tensorflow)

有监督/无监督/半监督/降维多功能包 (Sklearn)

机器人无师自通 (强化学习)

使用进化论的机器学习 (进化算法)

实战

诗词

学写诗词

未来方向

网络爬虫

用于收集数据,是后面的基础。

量化计算

用于风险投资。

国内市场具有很大的不确定,建议多读一些投资方面的书。

量化计算可以用来忽悠人。

数据发掘

底层还是大数据。

深度学习

个人最看好(✔️)

最有实际价值,和未来前景的方向。

建议学习方式

  1. 以这个为学习大纲,每一个内容一节节的学习。

  2. 不要看视频。自己去学习。

参考资料

莫烦 python 学习

deeplearningbook-chinese

吴恩达系列教程

源于产业实践的开源深度学习平台

[机器学习 – machine learning ML](https://easyai.tech/ai-definition/machine-learning/)