Apache Iceberg 开源的数据表格格式,用于在大规模数据湖中存储和管理结构化数据
Iceberg 介绍
Apache Iceberg是一个用于大型分析数据集的开放表格格式。
Iceberg通过为计算引擎(包括Spark、Trino、PrestoDB、Flink、Hive和Impala)添加表格,采用高性能的表格格式,其操作方式与SQL表格相同。
用户体验
Iceberg避免了令人不快的惊喜。模式演变可靠运行,不会无意中取消删除数据。用户无需了解分区即可获得快速查询...
2024-01-24 13:01:55 |
Database
apache hudi 构建在Apache Hadoop和Apache Spark之上的库,用于管理和处理大规模数据湖中的增量数据
apache hudi
欢迎来到Apache Hudi!本概述将提供Apache Hudi是什么的高层次摘要,并引导您如何学习更多内容以入门。
什么是Apache Hudi
Apache Hudi(发音为“hoodie”)是下一代流数据湖平台。Apache Hudi直接将核心仓库和数据库功能引入数据湖。Hudi提供了表格、事务、高效的更新/删除、高级索引、流入服务、数据聚类/压缩优化以...
2024-01-24 13:01:55 |
Database
apache hive 在 Hadoop 上的数据仓库工具
Apache Hive™
Apache Hive™ 数据仓库软件使得在分布式存储中读取、写入和管理大型数据集,并使用 SQL 语法进行查询变得更加容易。
构建在 Apache Hadoop™ 之上,Hive 提供了以下功能:
通过 SQL 启用对数据的轻松访问,从而支持数据仓库任务,如提取/转换/加载(ETL)、报告和数据分析。
对各种数据格式施加结构的机制。
访问存储在...
2024-01-24 13:01:55 |
Database
DB2 关系数据库管理系统(RDBMS)
chat
详细介绍一下 DB2
DB2(Database 2)是IBM(International Business Machines Corporation)开发和推广的一种关系数据库管理系统(RDBMS)。
DB2最初于1983年发布,是IBM的主力数据库产品之一。它支持多种操作系统平台,包括Linux、UNIX、Windows和IBM i(原AS/400)等。
以下是DB2的一...
2024-01-24 13:01:55 |
Database
Clickhouse 开源的列式数据库管理系统(DBMS)
什么是 ClickHouse?
ClickHouse 是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
在传统的行式数据库系统中,数据按如下顺序存储:
Row
WatchID
JavaEnable
Title
GoodEvent
EventTime
...
2024-01-24 13:01:55 |
Database
Apache Cassandra intro 高度可伸缩、分布式、开源的NoSQL数据库系统
What is Apache Cassandra?
Cassandra是一种分布式的NoSQL数据库。按设计,NoSQL数据库具有轻量级、开源、非关系型和广泛分布的特点。
它们的优势之一包括横向可扩展性、分布式架构以及对模式定义的灵活性。
NoSQL数据库使得对极高容量、不同数据类型的数据进行快速的即兴组织和分析成为可能。这在最近几年变得更加重要,随着大数据的出现以及在云中迅速扩展数据...
2024-01-24 13:01:55 |
Database
AmazonDynamoDB intro Amazon DynamoDB 是一种完全托管的NoSQL数据库服务
AmazonDynamoDB 介绍
https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/Introduction.html
Amazon DynamoDB是一种完全托管的NoSQL数据库服务,提供快速且可预测的性能,并具备无缝扩展的能力。DynamoDB使您能够摆脱操作和扩展分布式数据库的管理负担,因此您无需担...
2024-01-24 13:01:55 |
Database
Database Source 00 Overview
国产数据库探索多领域技术突破海外竞争力亟需增强
2023年下半年,数据库行业有了一些新的发展特点,特别是国产厂商成为了发展主力。经过多年发展,国产数据库推广进入“深水区”,并取得不俗成绩。
从技术角度上看,国内数据库产品在多模向量、智能运维、云与云原生、数据库兼容等技术上取得了不少突破,并开始在用户落地上取得一定成果。
在分布式数据库领域,一方面产品规模化落地并开始输出行业经验,加速实...
2024-01-24 13:01:55 |
Database