# Spark_SourceCode_Reading **Repository Path**: eshijia/Spark_SourceCode_Reading ## Basic Information - **Project Name**: Spark_SourceCode_Reading - **Description**: 系统性地还原 Spark 最新版本的源代码设计 - **Primary Language**: Scala - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2015-01-19 - **Last Updated**: 2020-12-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Spark SourceCode Reading ## 简介 本项目致力于跟进 [Spark](http://spark.apache.org) 最新的源代码,对 Spark 的代码结构以及核心模块展开分析,从而全面理解分布式内存计算框架的设计思想。祝愿大家早日成为 Spark Contributor! ## 总体计划 *Step1:* 搭建 Spark 源代码分析环境,计划采用 Intellij IDEA 连接Github 上的 [Spark 代码库](https://github.com/apache/spark) ,并可对其在本地进行编译,单机调试运行。 *Step2:* Spark 源代码目录结构分析,较为详细的对 Spark 的源代码目录进行模块化的描述。 *Step3:* 对 Spark 核心代码制定代码阅读计划,按照相同的目录结构,对 Spark core 中的代码撰写注释文档,画出必要的代码执行流程图。