# JavaSpiderDemo **Repository Path**: HDMBS/JavaSpiderDemo ## Basic Information - **Project Name**: JavaSpiderDemo - **Description**: (此项目将迁移至 GitHub,并计划迎来一次基于 AI 技术的重大升级。届时,它将从一个 Demo 演进为一个功能完备的网站应用,底层技术架构也可能不再依赖传统的爬虫方案。) Java爬虫实现,SpringBoot + HttpClient+Jsoup 爬虫Demo,满屏注释,适合入门 - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: Spider_V1.0 - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 21 - **Forks**: 13 - **Created**: 2017-11-18 - **Last Updated**: 2025-08-18 ## Categories & Tags **Categories**: spider **Tags**: None ## README ## 重要通知与项目迁移公告 感谢各位的关注,本 Gitee 账户即将注销。 此项目将迁移至 GitHub,并计划迎来一次基于 AI 技术的重大升级。届时,它将从一个 Demo 演进为一个功能完备的网站应用,底层技术架构也可能不再依赖传统的爬虫方案。 历史上的今天Demo的所有后续开发、更新与开源工作都将在 GitHub 进行。欢迎您前往关注(Star)或监控(Watch)项目,共同见证它的成长。 GitHub 地址: https://github.com/jasperyou #### 这是一个 HDMBS 基于SpringBoot 实践的一个 Java爬虫 Demo 爬取中华新闻网的 历史上的今天页面,开发过程中给我的技术带来了少许精进,也希望能给大家带来帮助!!!
## 主要技术栈 : -

Spring-boot-2.0(Scheduled定时爬取) -

Spring-boot-tomcat -

commons-email(发送邮件) -

httpclient(http请求) -

jsoup(解析html页面) -

commons-io(写文件) #### 运行须知 : 修改有 TODO 标注的代码, 修改为自己的配置方可运行