# htmlto
**Repository Path**: YunJieDeveloper/htmlto
## Basic Information
- **Project Name**: htmlto
- **Description**: 爬取网站html/js/css/img资源到本地,并转化成chm/pdf文档.使用hhc将html转为chm,使用wkhtmltopdf将html转为pdf(高清带标签)
- **Primary Language**: Java
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 83
- **Created**: 2023-01-10
- **Last Updated**: 2023-01-10
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# htmlto
#### 介绍
爬取网站html相关资源并转成其他格式,如chm/pdf等
- 使用jsoup爬取doc网页资源
- 使用enjoy模板生成chm的工程配置文件
- 代码简单,欢迎大家使用
##### 放两张生成的chm和pdf的效果图


---
##### 20190903 新增罗辑思维的文章
1. 爬了[罗辑集](http://www.luojiji.com/)的[罗辑思维](http://www.luojiji.com/forum-LJSWW-1.html)系列文章
---
##### 20190715 适应新版[jfinal官网](https://www.jfinal.com/)
1. 样式适应新版jfinal官网
2. jfinal-doc更新到4.3
---
##### 20190221 新增jfinal doc 的pdf版本
1. 拼接所有chm用的html到单个的all.html
2. 使用wkhtmltopdf把all.html转成pdf
- *尝试使用itext,但是对h5和css支持不好,放弃了*
---
##### 20190220 新增jfinal-weixin的wiki doc
- 因为没有图片什么的,所以很简单
- 其中1.1和1.4wiki上没找到,先404了
- 样式已从wiki上下载,并因为chm兼容问题做了部分修改
- 尝试代码高亮,但因为ie8,又没想用htmlunit爬取异步内容,所以暂搁浅了
- 运行JifinalWeixinDoc.main()即可
---
##### 20190219
目前仅有根据jfinal官网的doc生成chm文档的部分,运行JfinalDoc.main()即可