12 mirrors 1578989292
14
Brooklin 是一种近实时的大规模数据流分布式服务,LinkedIn 自 2016 年以来一直在使用这项服务,支撑每天数千个数据流和超过 2 万亿条消息
Java
5天前
12 mirrors 1578989292
14
Hibench 是一个大数据基准测试套件,用来测试框架的速度、吞吐率与资源利用率等
Java
5天前
1723143 tomfat 1578958543
14
这是一个基于机器学习和大数据的决策对抗系统,包含GIS系统,后端基于springMVC,spring,Mybatis,日志基于logback,算法部分包括机器学习,深度学习对打击做仿真
Java
接近7年前
12 mirrors 1578989292
13
AthenaX 是 Uber 的内部流分析平台,旨在满足以下需求并为每一个人提供可访问的流分析能力: (1)轻松为各类用户提供导航服务,而无需对其技术背景提出任何要求 ; (2)以
Java
5天前
319685 bboss 1578989326
13
kafka-elasticsearch数据同步工具
Java
3个月前
6892317 apache 1605059459
11
Apache Fluo 是  Google Percolator(搜索索引)的开源实现,允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新,而无需重新处理
Java
1个月前
1116819 hanmov5 1578940692
9
hbase template封装
8
数据清洗工具
Java
5年多前
10005514 tugraph 1703817023
6
Mirror of https://github.com/TuGraph-family/DataX
Java
2年前
6892317 apache 1605059459
6
Apache HAWQ is a Hadoop native SQL query engine that combines the key technological advantages of MPP database with the scalability and convenience of Hadoop.
Java
1年多前
6892317 apache 1605059459
6
AsterixDB is a BDMS (Big Data Management System) with a rich feature set that sets it apart from other Big Data platforms. Its feature set makes it well-suited to modern needs such as web data warehousing and social data storage and analysis.
Java
1天前
6892317 apache 1605059459
6
Apache Apex is a unified platform for big data stream and batch processing. Use cases include ingestion, ETL, real-time analytics, alerts and real-time actions.
Java
3年多前
6892317 apache 1605059459
6
Apache Avro™ is a data serialization system.
Java
16小时前
6892317 apache 1605059459
6
Apache Mnemonic  是一个面向非易失性混合内存存储的库,它提出了一个非易失性/持久的 Java 对象模型和持久的计算服务,能显着提高了海量实时数据处理/分析的性能
Java
4个月前
6350403 huaweiclouddeveloper 1653037187
6
针对datax的obs插件,提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动能力,以及繁杂业务背景下的数据同步解决方案。
Java
2年多前

搜索帮助