Apache Hive™ 数据仓库软件使得在分布式存储中读取、写入和管理大型数据集,并使用 SQL 语法进行查询变得更加容易。
构建在 Apache Hadoop™ 之上,Hive 提供了以下功能:
- 通过 SQL 启用对数据的轻松访问,从而支持数据仓库任务,如提取/转换/加载(ETL)、报告和数据分析。
- 对各种数据格式施加结构的机制。
- 访问存储在 Apache HDFS™ 或其他数据存储系统(如 Apache HBase™)中的文件。
通过 Apache Tez™、Apache Spark™ 或 MapReduce 进行查询执行。
具备 HPL-SQL 的过程语言。
通过 Hive LLAP、Apache YARN 和 Apache Slider 实现亚秒级查询检索。
Hive 提供标准的 SQL 功能,包括用于分析的许多 SQL:2003、SQL:2011 和 SQL:2016 功能。
Hive 的 SQL 还可以通过用户定义函数(UDFs)、用户定义聚合函数(UDAFs)和用户定义表函数(UDTFs)进行扩展。
2024年1月24日大约 9 分钟