使用Java写的一个日记本程序
本项目选择以下数据源完成数据分析相关工作: https://www.kaggle.com/competitions/sp 其中ghj负责完成分类和聚类部分的工作,wwr负责完成数据预处理、统计分析、回归分析部分的工作,zhx负责完成频繁项集、关联规则挖掘部分的工作
爬取京东网站的电脑配件商品数据,并使用Spark的RDD算子、SparkSQL、SparkStreaming、StructuredStreaming、SparkML对其进行分析
最近一年贡献:41 次
最长连续贡献:3 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。