个人简介

Echo Blog


江湖无名 安心练剑
  • 数据库统一查询方案介绍-01-intro
    拓展阅读 calcite简介和使用 quick-sql 查询 背景介绍 背景说明 项目相关组件现状: 多个引擎需要投入多倍的人力,在人员有限的情况下,对引擎的掌控力会减弱 语法兼容问题(Hive/Impala/Spark) 语义支持问题(Hive/Impala/Oracle) 扩展时重复工作量多 ...
    2024-01-10 13:01:55 | Database
  • SQL 适配-01-apache drill 01 入门介绍
    Drill 简介 Drill 是一个用于 Big Data 探索的 Apache 开源 SQL 查询引擎。 Drill 从头开始设计,旨在支持在现代 Big Data 应用中产生的半结构化且快速演化的数据上进行高性能分析,同时提供 ANSI SQL、行业标准的查询语言的熟悉性和生态系统。 Drill 提供与现有的 Apache Hive 和 Apache HBase 部署的即插即用集成...
    2024-01-10 13:01:55 | Database
  • 如何通过标准的 SQL 适配访问各种数据源?
    一些 SQL 引擎? 本文涵盖了6个开源领导者:Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto,还加上Calcite、Kylin、Phoenix、Tajo 和Trafodion。 Hive-不支持 Impala-不支持 Spark SQL-支持,基于 calcite HAWQ-hadoop生态,不适合迁移 Apache Calcite Apache ...
    2024-01-10 13:01:55 | Database
  • Apache splunk-01-Splunk 是一种用于搜索、监控和分析大规模机器生成的实时数据的软件平台。它能够处理来自各种来源的大量数据,并提供实时的搜索、分析和可视化功能
    splunk TODO… chat Q: 详细介绍一下 splunk Splunk是一种用于搜索、监控和分析大规模机器生成的实时数据的软件平台。它能够处理来自各种来源的大量数据,并提供实时的搜索、分析和可视化功能。 下面是对Splunk的详细介绍: 1. 数据收集和索引 Splunk能够从各种来源收集数据,包括服务器日志、应用程序日志、传感器数据、网络流量等。一旦数据被收集,Sp...
    2024-01-10 13:01:55 | Database
  • Apache pig/Apache piglet-01-简单而强大的方式来处理大规模数据集
    chat 详细介绍一下 pig “Pig” 在计算机科学领域中通常指的是一种数据流语言,它是用于处理大规模数据集的高级编程语言。 Pig 被设计用于简化并行处理大规模数据集的过程,特别是在 Apache Hadoop 这样的分布式计算框架上。 下面是关于 Pig 的详细介绍: 1. Pig 的特点: 简单易学: Pig 提供了一种类似于 SQL 的语法,使得开发者能够更轻松地...
    2024-01-10 13:01:55 | Database
  • Apache Geode/Pivotal GemFire-01-分布式内存数据管理平台,用于在大规模的数据处理中提供高性能、高可扩展性和可靠性
    关于Apache Geode Apache Geode是一个数据管理平台,它通过广泛分布的云架构为数据密集型应用提供实时、一致的数据访问。 Geode通过跨多个进程池化内存、CPU、网络资源和可选的本地磁盘来管理应用程序对象和行为。它使用动态复制和数据分区技术来实现高可用性、改进的性能、可扩展性和容错性。 除了作为分布式数据容器外,Geode还是一个内存数据管理系统,提供可靠的异步事件...
    2024-01-10 13:01:55 | Database
  • Apache Druid-01-a high performance real-time analytics database 高性能实时分析数据库 Apache Imply
    Apache Druid简介 Apache Druid是一个实时分析数据库,专为快速切片分析(”OLAP”查询)大型数据集而设计。 在大多数情况下,Druid被用于需要实时摄取、快速查询性能和高可用性的应用场景。 Druid通常用作分析应用程序的数据库后端,或者用于需要快速聚合的高并发API。Druid最适合事件导向的数据。 Druid常见的应用领域包括: 点击流分析,包括网...
    2024-01-10 13:01:55 | Database
  • Apache Doris-01-overview Doris 介绍
    Doris 介绍 Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB 实...
    2024-01-10 13:01:55 | Database