# druid **Repository Path**: src-openeuler/druid ## Basic Information - **Project Name**: druid - **Description**: Apache Durid is a real-time database to power modern analytics application. - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 4 - **Created**: 2022-04-20 - **Last Updated**: 2025-06-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: BigData ## README # druid #### 介绍 Apache Druid是一个开源的分布式数据存储。Druid的核心设计结合了OLAP /分析数据库,时间序列数据库和搜索系统的思想,为广泛的用例创建了一个统一的系统。Druid将这三个系统中的每个系统的关键特征合并到其接收层,存储格式,查询层和核心体系结构中。 主要功能包括: - 列式存储:Druid分别存储和压缩每一列,并且只需要读取特定查询所需的内容即可,这支持快速扫描,排名和groupBys。 - 本机搜索索引:Druid为字符串值创建倒排索引,以便快速搜索和过滤。 - 流式处理和批量摄取:适用于Apache Kafka,HDFS,AWS S3,流处理器等的现成连接器。 - 灵活的架构:优雅地处理不断发展的模式和嵌套数据。 - 时间优化的分区:Druid基于时间对数据进行智能分区,并且基于时间的查询比传统数据库要快得多。 - SQL支持:除了基于本机JSON的本地语言外,Druid还通过HTTP或JDBC 讲SQL。 - 横向可扩展性:Druid已用于生产中,每秒接收数百万个事件,保留多年的数据并提供亚秒级的查询。 - 操作简便:只需添加或删除服务器即可扩大或缩小规模,而Druid会自动重新平衡。容错架构围绕服务器故障进行路由。 #### 软件架构 软件架构说明 具有基于微服务的架构,可以认为是一个反汇编的数据库。Druid中的每个核心服务(摄取,查询和协调)都可以单独或联合部署在商用硬件上。 Druid明确命名了每个主要服务,以使操作员可以根据用例和工作量对每个服务进行微调。例如,如果工作负载需要,操作员可以将更多资源分配给Druid的提取服务,而将更少的资源分配给Druid的查询服务。 Druid服务可以独立发生故障,而不会影响其他服务的运行。 #### ARM支持: 1. 移植指南:https://support.huaweicloud.com/prtg-apache-kunpengbds/kunpengdruid_02_0001.html 2. 部署指南:xxxx 3. 调优指南:xxxx #### 安装教程 1. xxxx 2. xxxx 3. xxxx #### 使用说明 1. xxxx 2. xxxx 3. xxxx #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)