# 新闻推荐系统 **Repository Path**: java-sauce/news-recommendation-system ## Basic Information - **Project Name**: 新闻推荐系统 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 4 - **Created**: 2022-01-20 - **Last Updated**: 2022-01-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # News_recommend 本次项目是基于大数据计算引擎的新闻推荐系统--"今日小站",包含了爬虫,新闻网站(前端和后端),推荐系统(Spark)。
## 前端效果:
![输入图片说明](https://images.gitee.com/uploads/images/2021/1025/161233_142899d6_5342409.png "pic1.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/1025/161247_35cf19da_5342409.png "pic2.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/1025/161256_ad35ca47_5342409.png "pic3.png")

## 一.爬虫
### 开发环境:
pycharm+python3
### 软件架构:
mysql+scrapy+splash
### 项目描述:
爬虫项目负责重复爬取今日头条首页新闻,去除重复新闻,存入mysql。

## 二.新闻网站:
### 开发环境:
IntelliJ IDEA + maven + git + linux
### 软件架构:
mysql + springboot
### 项目描述:
今日小站是基于springboot框架搭建的web项目,用户在网站完成注册登录后,网站会记录用户的浏览行为。同时网站也会把推荐结果呈现给用户。

## 三.推荐系统:
### 开发环境:
IntelliJ IDEA + maven + git + linux
### 软件架构:
zookeeper + flume + kafka + spark + mysql
### 项目描述:
推荐系统计算两两文章间的相似度,并将与之最相似的10条数据id存入mysql。实时处理用户行为日志,将结果存入mysql。根据用户行为数据对用户进行推荐,并将结果存入mysql。

![输入图片说明](https://images.gitee.com/uploads/images/2021/1025/161410_2ae23a53_5342409.png "pic4.png")
### 服务器规划:
spark1:192.168.56.101
spark2:192.168.56.102
spark3:192.168.56.103

项目持续更新中....