# DataSphereStudio **Repository Path**: hzfcode/DataSphereStudio ## Basic Information - **Project Name**: DataSphereStudio - **Description**: 将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出等数据应用开发全流程场景需求。欢迎申请体验demo环境:https://sandbox.webank.com/wds/dss/#/register - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: https://github.com/WeBankFinTech/DataSphereStudio - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 862 - **Created**: 2020-06-23 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ![DSS](images/en_US/readme/DSS_logo.png) ==== [![License](https://img.shields.io/badge/license-Apache%202-4EB1BA.svg)](https://www.apache.org/licenses/LICENSE-2.0.html) [English](README.md) | 中文 ## 引言 DataSphere Studio(简称DSS)是微众银行自研的一站式数据应用开发管理门户。 基于插拔式的集成框架设计,及计算中间件 [**Linkis**](https://github.com/WeBankFinTech/Linkis) ,可轻松接入上层各种数据应用系统,让数据开发变得简洁又易用。 在统一的UI下,DataSphere Studio以工作流式的图形化拖拽开发体验,将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出应用等,数据应用开发全流程场景需求。 **DSS通过插拔式的集成框架设计,让用户可以根据需要,简单快速替换DSS已集成的各种功能组件,或新增功能组件。** 借助于 [**Linkis**](https://github.com/WeBankFinTech/Linkis) 计算中间件的连接、复用与简化能力,DSS天生便具备了金融级高并发、高可用、多租户隔离和资源管控等执行与调度能力。 ## 界面预览 请您耐心等待,加载gif需要一些时间。 ![DSS-V1.0 GIF](images/en_US/readme/DSS_gif.gif) ## 核心特点 DSS主要特点: ### 一、一站式、全流程的应用开发管理界面        DSS集成度极高,目前已集成的系统有:        1、数据开发IDE工具——[Scriptis](https://github.com/WeBankFinTech/Scriptis)        2、数据可视化工具——[Visualis](https://github.com/WeBankFinTech/Visualis)(基于宜信[Davinci](https://github.com/edp963/davinci)二次开发)        3、数据质量管理工具——[Qualitis](https://github.com/WeBankFinTech/Qualitis)        4、工作流调度工具——[Azkaban](https://azkaban.github.io/)        **DSS插拔式的框架设计模式,允许用户快速替换DSS已集成的各个Web系统**。如:将Scriptis替换成Zeppelin,将Azkaban替换成DolphinScheduler。 ![DSS一站式](images/zh_CN/readme/onestop.gif) ### 二、基于Linkis计算中间件,打造独有的AppJoint设计理念        AppJoint,是DSS可以简单快速集成各种上层Web系统的核心概念。        AppJoint——应用关节,定义了一套统一的前后台接入规范,可让外部数据应用系统快速简单地接入,成为DSS数据应用开发中的一环。        DSS通过串联多个AppJoint,编排成一条支持实时执行和定时调度的工作流,用户只需简单拖拽即可完成数据应用的全流程开发。        由于AppJoint对接了Linkis,外部数据应用系统因此具备了资源管控、并发限流、用户资源管理等能力,且允许上下文信息跨系统级共享,彻底告别应用孤岛。 ### 三、Project级管理单元        以Project为管理单元,组织和管理各数据应用系统的业务应用,定义了一套跨数据应用系统的项目协同开发通用标准。 ### 四、已集成的数据应用组件        DSS通过实现多个AppJoint,已集成了丰富多样的各种上层数据应用系统,基本可满足用户的数据开发需求。        **用户如果有需要,也可以轻松集成新的数据应用系统,以替换或丰富DSS的数据应用开发流程。**        1、DSS的调度能力——Azkaban AppJoint            用户的很多数据应用,通常希望具备周期性的调度能力。            目前市面上已有的开源调度系统,与上层的其他数据应用系统整合度低,且难以融通。            DSS通过实现Azkaban AppJoint,允许用户将一个编排好的工作流,一键发布到Azkaban中进行定时调度。            DSS还为调度系统定义了一套标准且通用的DSS工作流解析发布规范,让其他调度系统可以轻松与DSS实现低成本对接。 ![Azkaban](images/zh_CN/readme/Azkaban_AppJoint.gif)        2、数据开发——Scriptis AppJoint            什么是[Scriptis](https://github.com/WeBankFinTech/Scriptis)?            Scriptis是一款支持在线写SQL、Pyspark、HiveQL等脚本,提交给[Linkis](https://github.com/WeBankFinTech/Linkis)执行的数据分析Web工具,且支持UDF、函数、资源管控和智能诊断等企业级特性。            Scriptis AppJoint为DSS集成了Scriptis的数据开发能力,并允许Scriptis的各种脚本类型,作为DSS工作流的节点,参与到应用开发的流程中。            目前已支持HiveSQL、SparkSQL、Pyspark、Scala等脚本节点类型。 ![Scriptis](images/zh_CN/readme/Scriptis_AppJoint.gif)        3、数据可视化——Visualis AppJoint            什么是Visualis?            Visualis是一个基于宜信开源项目Davinci二次开发的数据可视化BI工具,为用户在数据安全和权限方面,提供金融级数据可视化能力。            Visualis AppJoint为DSS集成了Visualis的数据可视化能力,并允许数据大屏和仪表盘,作为DSS工作流的节点,与上游的数据集市关联起来。 ![Visualis](images/zh_CN/readme/Visualis_AppJoint.gif)        4、数据质量——Qualitis AppJoint            Qualitis AppJoint 为DSS集成数据质量校验能力,将数据质量系统集成到DSS工作流开发中,对数据完整性、正确性等进行校验。 ![Qualitis](images/zh_CN/readme/Qualitis_AppJoint.gif)        5、数据发送——Sender AppJoint            Sender AppJoint为DSS集成数据发送能力,目前支持SendEmail节点类型,所有其他节点的结果集,都可以通过邮件发送。            例如:SendEmail节点可直接将Display数据大屏作为邮件发送出来。        6、信号节点——Signal AppJoint            EventChecker AppJoint用于强化业务与流程之间的解耦和相互关联。            DataChecker节点:检查库表分区是否存在。            EventSender: 跨工作流和工程的消息发送节点。            EventReceiver: 跨工作流和工程的消息接收节点。        7、功能节点            空节点、子工作流节点。        8、**节点扩展**            **根据需要,用户可以简单快速替换DSS已集成的各种功能组件,或新增功能组件。** ## Demo试用环境        由于DataSphereStudio支持执行脚本风险较高,WeDataSphere Demo环境的隔离没有做完,考虑到大家都在咨询Demo环境,决定向社区先定向发放邀请码,接受企业和组织的试用申请。        如果您想试用Demo环境,请加入DataSphere Studio社区用户群(**加群方式请翻到本文档末尾处**),联系团队成员获取邀请码。        WeDataSphere Demo环境用户注册页面:https://sandbox.webank.com/wds/dss/#/register        WeDataSphere Demo环境登录页面:https://sandbox.webank.com/wds/dss/        我们会尽快解决环境隔离问题,争取早日向社区完全开放WeDataSphere Demo环境。 ## 与类似系统对比        DSS是一个引领数据应用开发管理方向的开源项目,开源社区目前尚没有同类产品。 ## 使用场景        DataSphere Studio适用于以下场景:        1. 正在筹建或初步具备大数据平台能力,但无任何数据应用工具的场景。        2. 已具备大数据基础平台能力,且仅有少数数据应用工具的场景。        3. 已具备大数据基础平台能力,且拥有全部数据应用工具,但工具间尚未打通,用户使用隔离感强、学习成本高的场景。        4. 已具备大数据基础平台能力,且拥有全部数据应用工具,部分工具已实现对接,但尚未定义统一规范的场景。 ## 快速安装使用 点我进入[快速安装使用](docs/zh_CN/ch2/DSS_LINKIS_Quick_Install.md) ## 架构 ![DSS架构](images/zh_CN/readme/architecture.png) ## 文档列表 #### 1. 安装编译文档 [快速安装使用文档](docs/zh_CN/ch2/DSS_LINKIS_Quick_Install.md) [**DSS安装常见问题列表**](docs/zh_CN/ch1/DSS安装常见问题列表.md) [DSS编译文档](docs/zh_CN/ch1/DSS编译文档.md) #### 2. 使用文档 [快速使用文档](docs/zh_CN/ch3/DataSphere_Studio_QuickStart.md) [用户手册](docs/zh_CN/ch3/DSS_User_Manual.md) #### 3. AppJoint插件安装文档 **以下为手动安装相关插件的指南,DSS一键安装【标准版】已自动安装了以下插件,可忽略。** [DSS的Azkaban AppJoint插件安装指南](docs/zh_CN/ch4/如何接入调度系统Azkaban.md) [DSS的Qualitis AppJoint插件安装指南](https://github.com/WeBankFinTech/Qualitis/blob/master/docs/zh_CN/ch1/%E6%8E%A5%E5%85%A5%E5%B7%A5%E4%BD%9C%E6%B5%81%E6%8C%87%E5%8D%97.md) #### 4. 第三方系统如何接入文档 [DSS如何快速集成第三方系统](docs/zh_CN/ch4/第三方系统接入DSS指南.md) #### 5. 架构文档 [DSS工程发布到调度系统的架构设计](docs/zh_CN/ch4/DSS工程发布调度系统架构设计.md) 更多文档,敬请期待! ## 交流贡献 ![交流](images/zh_CN/readme/communication.png) ## License DSS is under the Apache 2.0 license. See the [License](LICENSE) file for details.