老马学机器学习-04-java 类似于 pandas 的开源库 Joinery
Joinery
Joinery 是遵循Pandas或R数据帧精神的数据帧实现。
快速开始
maven 引入
<dependency>
<groupId>joinery</groupId>
<artifactId>joinery-dataframe</artifactId>
<version>1.9&l...
2019-04-16 02:55:13 |
ML
老马学机器学习-04-java 类似于 numpy 的开源库 ND4j 简介
序言
API 有一个非常强大之处在于,是完全可以跨语言的。
numpy 工具强大到令人赞叹,那么 java 有没有类似的开源库呢?
答案是有的。
numpy 对应就是 ND4j。
ND4j
ND4J 是Java编写的开源、分布式深度学习项目,由总部位于旧金山的商业智能和企业软件公司Skymind牵头开发。
团队成员包括数据专家、深度学习专家、Java程序员和具有一定感知力的机器...
2019-04-16 02:55:13 |
ML
老马学机器学习-03-python 必备工具包简介
必备工具包
君子生非异也,善假于物也。——《劝学》
机器学习更是如此,前人为我们整理了大量的工具,我们要学会利用这些工具,帮助我们更快更好的学习。
当然就像孙悟空去东海一样,武器五花八门,我们最好的还是找到几个趁手的工具。
这里我们介绍一个最核心的 python 工具包。
Numpy
NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量...
2019-04-16 02:55:13 |
ML
老马学机器学习-02-Anaconda 安装笔记
Anaconda
Anaconda 指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。
可以简单理解为 python 全家桶,包含了常见的工具包,这样就省去了我们后期安装各种依赖包。
核心组件
Anaconda 包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等
conda是一个开源的包、环境管理...
2019-04-16 02:55:13 |
ML
机器学习-01-如何从零开始入门机器学习?
序言
老马作为一名 java 开发者,对于机器学习仰慕已久。
对于机器学习甚至使用过 java 的深度学习框架 DL4j 学习过一遍,不过感觉依然没有入门。仔细想来,是没有理解机器学习背后的原理导致的。
而如何入门机器学习,也一直是一个困扰老马的问题。
本系列将和大家一起从零学习机器学习,揭开机器学习的神秘面纱。
机器学习
是什么?
机器学习是一门多领域交叉学科,涉及概率...
2019-04-16 02:55:13 |
ML
HBase-02-基本概念
基本概念
在 HBase 的数据被存储在表中,具有行和列。
这和关系数据库(RDBMS中)的术语是重叠,但在概念上它们不是一类。
相反,应该将 HBase 的表当作是一个多维的 map 结构而更容易让人理解。
术语
Table(表):HBase table 由多个 row 组成。
Row(行):每一 row 代表着一个数据对象,每一 row 都是以一个 row key(行键)和一...
2019-04-16 02:55:13 |
Database
HBase-01-Overview
HBase
Apache HBase™ 是Hadoop数据库,是一个分布式,可扩展的大数据存储。
当您需要对大数据进行随机,实时读/写访问时,请使用Apache HBase™。
该项目的目标是托管非常大的表 - 数十亿行X百万列 - 在商品硬件集群上。
Apache HBase是一个开源的,分布式的,版本化的非关系数据库,模仿Google的Bigtable:Chang等人的结构化数据...
2019-04-16 02:55:13 |
Database
shell 工具类
shell 工具类
如果你是使用 windows 的用户,而你恰巧更习惯 linux 的命令行。
你可以使用下面的工具来增强 windows 中的 cmd 命令行。
带给 windows linux 一样的操作感觉
PowerShell
Cmder
windows 下远程 linux
XShell-版权
SecureCRT
Putty
SecureCRT 中文乱码问题
...
2019-04-05 03:56:39 |
Tool