# htmlto **Repository Path**: git654321/htmlto ## Basic Information - **Project Name**: htmlto - **Description**: 爬取网站html/js/css/img资源到本地,并转化成chm/pdf文档.使用hhc将html转为chm,使用wkhtmltopdf将html转为pdf(高清带标签) - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 83 - **Created**: 2019-02-22 - **Last Updated**: 2020-12-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # htmlto #### 介绍 爬取网站html相关资源并转成其他格式,如chm/pdf等 - 使用jsoup爬取doc网页资源 - 使用enjoy模板生成chm的工程配置文件 - 代码简单,欢迎大家使用 --- ##### 20190219 目前仅有根据jfinal官网的doc生成chm文档的部分,运行JfinalDoc.main()即可 --- ##### 20190220 新增jfinal-weixin的wiki doc - 因为没有图片什么的,所以很简单 - 其中1.1和1.4wiki上没找到,先404了 - 样式已从wiki上下载,并因为chm兼容问题做了部分修改 - 尝试代码高亮,但因为ie8,又没想用htmlunit爬取异步内容,所以暂搁浅了 - 运行JifinalWeixinDoc.main()即可 --- ##### 20190221 新增jfinal doc 的pdf版本 1. 拼接所有chm用的html到单个的all.html 2. 使用wkhtmltopdf把all.html转成pdf - *尝试使用itext,但是对h5和css支持不好,放弃了* ---