序言
老马作为一名 java 开发者,对于机器学习仰慕已久。
对于机器学习甚至使用过 java 的深度学习框架 DL4j 学习过一遍,不过感觉依然没有入门。仔细想来,是没有理解机器学习背后的原理导致的。
而如何入门机器学习,也一直是一个困扰老马的问题。
本系列将和大家一起从零学习机器学习,揭开机器学习的神秘面纱。
机器学习
是什么?
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
这一段是百科定义,我们可以发现几个点:
(1)机器学习多领域的交叉科学,数学更是其中的重中之重。
(2)主要模拟或者研究如何实现人类的学习行为
人工智能、机器学习和深度学习的关系?
我们经常听到人工智能、机器学习和深度学习这样的词,他们之间的关系是怎么样的?
机器学习是人工智能的一个分支,机器学习的算法有很多,深度学习只是其中一个。
应用
数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。
步骤
机器学习在实际操作层面一共分为7步:
-
收集数据
-
数据准备
-
选择一个模型
-
训练
-
评估
-
参数调整
-
预测(开始使用)
学习路线图
numpy => pandas => scikit-learn => tensorflow => kera
在机器学习前 - (零基础)
基础知识
Python 基础语法 ✔️
神经网络
了解机器学习方法 (*可跳)
框架
Tensorflow (Google开发, 社区大)
PyTorch (Facebook开发, 方便debug)
Keras (类似Tensorflow, 推荐直接学Tensorflow)
Theano (类似Tensorflow, 推荐直接学Tensorflow)
有监督/无监督/半监督/降维多功能包 (Sklearn)
机器人无师自通 (强化学习)
使用进化论的机器学习 (进化算法)
实战
未来方向
网络爬虫
用于收集数据,是后面的基础。
量化计算
用于风险投资。
国内市场具有很大的不确定,建议多读一些投资方面的书。
量化计算可以用来忽悠人。
数据发掘
底层还是大数据。
深度学习
个人最看好(✔️)
最有实际价值,和未来前景的方向。
建议学习方式
-
以这个为学习大纲,每一个内容一节节的学习。
-
不要看视频。自己去学习。
参考资料
吴恩达系列教程
[机器学习 – machine learning | ML](https://easyai.tech/ai-definition/machine-learning/) |