H2O

H2O 是一个用于分布式、可扩展机器学习的内存平台。

H2O 使用熟悉的界面,如 R、Python、Scala、Java、JSON 和 Flow notebook/web 界面,并与 Hadoop 和 Spark 等大数据技术无缝协作。

H2O 提供了许多流行算法的实现,例如广义线性模型 (GLM)、梯度提升机(包括 XGBoost)、随机森林、深度神经网络、堆叠集成、朴素贝叶斯、广义加性模型 (GAM)、Cox 比例风险、K- Means、PCA、Word2Vec,以及全自动机器学习算法(H2O AutoML)。

H2O 是可扩展的,因此开发人员可以添加他们选择的数据转换和自定义算法,并通过所有这些客户端访问它们。

H2O 模型可以下载并加载到 H2O 内存中进行评分,或者导出为 POJO 或 MOJO 格式,以便在生产中非常快速地评分。更多信息可以在 H2O 用户指南中找到。

H2O-3(此存储库)是 H2O 的第三个化身,也是 H2O-2 的继承者。

下载 H2O-3

虽然本自述文件的大部分内容是为自己构建的开发人员编写的,但大多数 H2O 用户只是下载并使用预构建的版本。

如果您是 Python 或 R 用户,安装 H2O 的最简单方法是通过 PyPI 或 Anaconda(适用于 Python)或 CRAN(适用于 R):

  • Python
pip install h2o
  • R
install.packages("h2o")

如需最新的稳定版、夜间版、Hadoop(或 Spark/Sparkling Water)版本或独立的 H2O jar,请访问:https://h2o.ai/download

有关下载和安装 H2O 的更多信息,请参阅 H2O 用户指南。

Java用户

Java 8 及更高版本支持 H2O-3。

对于 Java 开发人员,以下资源将帮助您创建自己的使用 H2O 的自定义应用程序。

H2O 核心 Java 开发人员文档:H2O 核心组件的权威 Java API 指南。

H2O Algos Java 开发人员文档:H2O 使用的算法的权威 Java API 指南。

h2o-genmodel (POJO/MOJO) Javadoc:提供在 Java 应用程序中创建和实现 POJO 或 MOJO 的分步指南。

参考资料

https://github.com/h2oai/h2o-3

https://docs.h2o.ai/h2o/latest-stable/h2o-docs/welcome.html#java-users