# spark-analyse **Repository Path**: YaphetSWorkSpace/spark-analyse ## Basic Information - **Project Name**: spark-analyse - **Description**: spark离线和实时分析项目 - **Primary Language**: Scala - **License**: MulanPSL-1.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2021-03-27 - **Last Updated**: 2022-05-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # spark-analyse #### 介绍 spark离线和实时项目 #### 软件架构 软件架构说明 ```$xslt 基于: hadoop 语言: sacla java 离线源数据存储: hive 实时源数据传输: kafka + canal 离线计算: spark rdd + spark sql + spark on hive 实时计算: flink 离线结果集存储: mysql 实时结果集存储: redis + hbase ``` #### 安装教程 1. 需要Hadoop集群环境 2. 安装hive + mysql + kafka + zookeeper + spark + flink 等大数据组件 3. maven管理项目,多个模块 #### 模块描述 1. commons 工具类 + 样例类 2. mock 模拟数据源模块 3. analyse 数据分析模块 #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request