H2O
H2O 是一个用于分布式、可扩展机器学习的内存平台。
H2O 使用熟悉的界面,如 R、Python、Scala、Java、JSON 和 Flow notebook/web 界面,并与 Hadoop 和 Spark 等大数据技术无缝协作。
H2O 提供了许多流行算法的实现,例如广义线性模型 (GLM)、梯度提升机(包括 XGBoost)、随机森林、深度神经网络、堆叠集成、朴素贝叶斯、广义加性模型 (GAM)、Cox 比例风险、K- Means、PCA、Word2Vec,以及全自动机器学习算法(H2O AutoML)。
H2O 是可扩展的,因此开发人员可以添加他们选择的数据转换和自定义算法,并通过所有这些客户端访问它们。
H2O 模型可以下载并加载到 H2O 内存中进行评分,或者导出为 POJO 或 MOJO 格式,以便在生产中非常快速地评分。更多信息可以在 H2O 用户指南中找到。
H2O-3(此存储库)是 H2O 的第三个化身,也是 H2O-2 的继承者。
下载 H2O-3
虽然本自述文件的大部分内容是为自己构建的开发人员编写的,但大多数 H2O 用户只是下载并使用预构建的版本。
如果您是 Python 或 R 用户,安装 H2O 的最简单方法是通过 PyPI 或 Anaconda(适用于 Python)或 CRAN(适用于 R):
- Python
pip install h2o
- R
install.packages("h2o")
如需最新的稳定版、夜间版、Hadoop(或 Spark/Sparkling Water)版本或独立的 H2O jar,请访问:https://h2o.ai/download
有关下载和安装 H2O 的更多信息,请参阅 H2O 用户指南。
Java用户
Java 8 及更高版本支持 H2O-3。
对于 Java 开发人员,以下资源将帮助您创建自己的使用 H2O 的自定义应用程序。
H2O 核心 Java 开发人员文档:H2O 核心组件的权威 Java API 指南。
H2O Algos Java 开发人员文档:H2O 使用的算法的权威 Java API 指南。
h2o-genmodel (POJO/MOJO) Javadoc:提供在 Java 应用程序中创建和实现 POJO 或 MOJO 的分步指南。
参考资料
https://github.com/h2oai/h2o-3
https://docs.h2o.ai/h2o/latest-stable/h2o-docs/welcome.html#java-users