# dg-datagrid-datax
**Repository Path**: sumht/dg-datagrid-datax
## Basic Information
- **Project Name**: dg-datagrid-datax
- **Description**: DataGrid是基于DataX的可视化的分布式数据集成开发工具,提供简单易用的流程编排页面,任务配置页面,数据同步页面,降低Datax的使用成本。
DataGrid作为抚顺新钢铁下辖研究院的开源项目,已经在本企业的数字化进程中深度使用。
欢迎企业或个人联合开发。
- **Primary Language**: Java
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 23
- **Created**: 2024-12-25
- **Last Updated**: 2024-12-25
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# DataGrid数据集成开发平台
DataGrid是基于DataX的可视化的分布式数据集成开发工具,提供简单易用的流程编排页面,任务配置页面,数据同步页面,降低Datax的使用成本。
DataGrid作为抚顺新钢铁下辖研究院的开源项目,已经在本企业的数字化进程中深度使用。
欢迎企业或个人联合开发。
# Architecture diagram

# System Requirements
- Language: Java 8(jdk版本建议1.8.201以上)
- Environment: MacOS, Windows,Linux
- Database: Mysql
# Features
- 1.图形化拖拽式流程编排,使用更简单
- 2.流程编排时可以自由启用或停用任意节点,并实时显示运行状态,让开发过程更简单
- 3.支持mybatis语义解析,可以直接使用mybatis编写sql,再结合变量配置机制,让sqL开发更加灵活
- 4.简单点击即可完成数据抽取作业,同时支持原生datax调用方式,让历史datax作业迁移更容易
- 5.支持动态修改任务状态、启动/停止任务,以及终止运行中任务,即时生效。
- 6.任务支持多层级依赖关系,当父任务执行结束后自动触发子任务。
- 7.支持多主题,多用户及权限控制
- 8.支持Mysql,Oracle,Postgresql,Sqlserver、Hive、HBase、ClickHouse、MongoDB等数据源页面化配置
- 9.数据库用户名密码自动加密,保证使用安全
- 10.支持任务超时,任务运行超时将会主动中断任务。
- 11.支持任务重试,当任务失败时将会按照预设的失败重试次数重试出错节点。
- 12.调度采用console-executor设计,支持集群部署
- 13.自研流程引擎,内存中运行,支持高并发调度,保证执行效率。
- 14.仅依赖mysql数据库,不需要额外搭建任何其他服务,安装过程十分容易。
# Quick Start
[部署手册 ](https://gitee.com/fsxgt/dg-datagrid-datax/blob/master/dg-datagrid-doc/deploy.md)
[用户手册](https://gitee.com/fsxgt/dg-datagrid-datax/blob/master/dg-datagrid-doc/use.md)
# Introduction
### 1.数据源管理
支持Mysql,Oracle,Postgresql,Sqlserver、Hive、HBase、ClickHouse、MongoDB等数据源

### 2.数据集成
用户通过简单几次点击,即可完成数据同步配置。支持直接选择表或编写SQL进行同步。
同步工具支持三种模式
datax-skin:系统会用户页面上配置自动生成datax配置,然后使用原生datax执行,需要搭建datax环境,配置datax_home系统参数。


datax-fast:前端页面与datax-skin相同,基于datax源码,扩展开发的数据同步模块。excuter直接使用方法调用,省去datax初始化JVM的过程,所以启动速度提高10倍以上,适用于分钟级乃至秒级的数据同步。
datax-shell:原生datax,shell调用,用户需要自主编辑同步配置文件

### 3.数据开发
可视化数据处理流程开发。支持串行、并行、事务控制,条件分支、多流合并。
支持局部运行,代码级运行日志输出,支持多主题切换。

### 4.任务调度
支持任务定时,多层级调度,任务运行资源控制。
基于微服务的console-executor分布式架构,支撑高并发调度,理论上并发数没有上限。
阻塞处理策略:当单个任务没有运行完成时,又再次启动,会丢弃新启动的调度

### 5.用户管理
角色简单分为超级用户可普通用户,超级用户可以编辑用户信息并具有管理所有用户数据的权限

# UI
[前端源码](https://gitee.com/fsxgt/dg-datagrid-ui)
node v16.20.0
# 项目成员
- 六
负责整体架构和后端开发
- Ripper
参与了前期技术验证和技术选型
- 阿哲
前端架构
- 坚持 努力 听话
负责前端开发
- 吐个泡泡
测试人员,也是本系统的主要使用者
- 阿轩
测试人员,也是本系统的主要使用者
感谢贡献!
# Contributing
Contributions are welcome! Open a pull request to fix a bug, or open an Issue to discuss a new feature or change.
欢迎参与项目贡献!比如提交PR修复一个bug,或者新建 Issue 讨论新特性或者变更。
# Copyright and License
Apache-2.0 license
产品开源免费,并且将持续提供免费的社区技术支持。个人或企业内部可自由的接入和使用。
# Contact us
### 个人微信
### QQ交流群
