# templatespider
**Repository Path**: apebug/templatespider
## Basic Information
- **Project Name**: templatespider
- **Description**: 扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
- **Primary Language**: Java
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: http://www.templatespider.zvo.cn
- **GVP Project**: No
## Statistics
- **Stars**: 1
- **Forks**: 954
- **Created**: 2024-03-28
- **Last Updated**: 2024-09-06
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
## 所见网站,皆可为我所用-templatespider
看好哪个网站,指定好URL,自动扒下来做成 html模版。并且所下载的css、js、图片、html文件会自动分好类保存到特定文件夹!
然后使用 模版计算工具,自动将 html模版计算合成为 [网市场云建站系统](https://gitee.com/mail_osc/wangmarket) 可用的模版。
项目最初目的为 [网市场云建站系统(CMS建站系统)](https://gitee.com/mail_osc/wangmarket) 因模版量少而做。用了之前写的 [xnx3](https://gitee.com/mail_osc/xnx3) ,以及 Jsoup 。
## 软件下载
支持Windows、Mac、Linux等系统。下载后解压,即可一键运行!
[下载网址 www.templatespider.zvo.cn](http://www.templatespider.zvo.cn/#rjxz)
## 项目分支简介
#### 扒网站工具

看着网上哪个网站好,可用此软件将其下载,变为标准的 html 模版,自动分好图片、css、js、以及html页面。可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用. [查看更多说明及步骤示例](http://www.wang.market/2712.html)
#### 模版计算工具

将使用扒网站工具扒下来的html模版,或者网上自行下载的html模版、又或者你自己定制做的模版,导入进去。软件会自动帮您计算合成 网市场云建站系统 中可一键导入使用的模版(当然,您还是要微调的). [查看更多说明及步骤示例](http://www.wang.market/4234.html)
## 扒网站工具使用步骤
1. 将要扒取的网站页面的网址粘贴进去
2. 点击左下方“开始抓取”按钮
3. 等待抓取完毕,自动打开下载好的文件夹
## 扒网站工具使用示例
例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:
````
http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html
````
设置如下图所示

设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。
扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:

可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。
## 二次开发
1. 下载Ecipse。不知道如何下载,可参考 https://gitee.com/leimingyun/dashboard/wikis/leimingyun/wm/preview?sort_id=3600899&doc_id=1101390
2. eclipse中导入本git项目。 不会导入,可参考 https://gitee.com/leimingyun/dashboard/wikis/leimingyun/wm/preview?sort_id=3600882&doc_id=1101390
3. 运行。直接在 ````com.xnx3.spider.entry.java上右键-运行,即可运行。
## 配套-网市场云建站CMS建站系统-已贡献入华为云开发团队
[https://gitee.com/HuaweiCloudDeveloper/huaweicloud-obs-website-wangmarket-cms](https://gitee.com/HuaweiCloudDeveloper/huaweicloud-obs-website-wangmarket-cms)
华为云OBS与网市场云建站CMS内容管理系统的深度整合,提供一个无技术门槛、可快速搭建100%自由度的网站。可做博客、文档、企业官网、电子简历…… 结合云计算的海量、安全、高可靠、低成本等优势,使各企业都能享受华为云所带来的技术变革。[优先建议采用此方式]
## 优秀开源项目及社区推荐
[https://github.com/featbit/featbit](https://github.com/featbit/featbit) 100% 开源的 Feature Management 平台。将软件交付风险在面向最终用户前降至最低,随便瞎写也不会有bug,加速软件创新的历史进度。FeatBit 赋能全团队交付、管理软件的超能力。
## 关于及交流
作者:管雷鸣
微信:xnx3com
使用有问题可加作者微信并备注:扒网站工具进群, 我看到后便通过同时将你拉入微信交流群
## 使用许可
本软件及源码仅用于技术学习、研究使用,禁止用于非法用途!
## 开源项目
致力于开源基础化信息建设,如有需要,可直接拿去使用。这里列出了我部分开源项目:
| 项目| star数量 | 简介 |
| --- | --- | --- |
|[wangmarket CMS](https://gitee.com/mail_osc/wangmarket) |  | [私有部署自己的SAAS建站系统](https://gitee.com/mail_osc/wangmarket) |
|[obs-datax-plugins](https://gitee.com/HuaweiCloudDeveloper/obs-datax-plugins) |  | [Datax 的 华为云OBS 插件](https://gitee.com/HuaweiCloudDeveloper/obs-datax-plugins) |
| [templatespider](https://gitee.com/mail_osc/templatespider) |  | [扒网站工具,所见网站皆可为我所用](https://gitee.com/mail_osc/templatespider) |
|[FileUpload](https://gitee.com/mail_osc/FileUpload)|  | [文件上传,各种存储任意切换](https://gitee.com/mail_osc/FileUpload) |
| [cms client](https://gitee.com/HuaweiCloudDeveloper/huaweicloud-obs-website-wangmarket-cms) |  | [云服务深度结合无服务器建站](https://gitee.com/HuaweiCloudDeveloper/huaweicloud-obs-website-wangmarket-cms) |
| [kefu.js](https://gitee.com/mail_osc/kefu.js) |  | https://gitee.com/mail_osc/kefu.js | [在线聊天的前端框架](https://gitee.com/mail_osc/kefu.js) |
| [msg.js](https://gitee.com/mail_osc) |  | [轻量级js消息提醒组件](https://gitee.com/mail_osc) |
| [translate.js](https://gitee.com/mail_osc/translate) |  | [三行js实现 html 全自动翻译](https://gitee.com/mail_osc/translate) |
| [WriteCode](https://gitee.com/mail_osc/writecode) |  | [代码生成器,自动写代码](https://gitee.com/mail_osc/writecode) |
| [log](https://gitee.com/mail_osc/log) |  | [Java日志存储及读取](https://gitee.com/mail_osc/log) |
| [layui translate](https://gitee.com/mail_osc/translate_layui) |  | [Layui的国际化支持组件](https://gitee.com/mail_osc/translate_layui) |
| [http.java](https://gitee.com/mail_osc/http.java) |  | [Java8轻量级http请求类](https://gitee.com/mail_osc/http.java) |
| [xnx3](https://gitee.com/mail_osc/xnx3) |  | [Java版按键精灵,游戏辅助开发](https://gitee.com/mail_osc/xnx3) |
| [websocket.js](https://gitee.com/mail_osc/websocket.js) |  | [js的WebSocket框架封装](https://gitee.com/mail_osc/websocket.js) |
| [email.java](https://gitee.com/mail_osc/email.java) |  | [邮件发送](https://gitee.com/mail_osc/email.java) |
| [notification.js](https://gitee.com/mail_osc/notification.js) |  | [浏览器通知提醒工具类](https://gitee.com/mail_osc/notification.js) |
| [pinyin.js](https://gitee.com/mail_osc/pinyin.js) |  | [JS中文转拼音工具类](https://gitee.com/mail_osc/pinyin.js) |
| [xnx3_weixin](https://gitee.com/mail_osc/xnx3_weixin) |  | [Java 微信常用工具类](https://gitee.com/mail_osc/xnx3_weixin) |
| [xunxian](https://gitee.com/mail_osc/xunxian) |  | [QQ寻仙的游戏辅助软件](https://gitee.com/mail_osc/xunxian) |
| [wangmarket_shop](https://gitee.com/leimingyun/wangmarket_shop) |  | [私有化部署自己的 SAAS 商城](https://gitee.com/leimingyun/wangmarket_shop) |
| [wm](https://gitee.com/leimingyun/wm) |  | [Java开发框架及规章约束](https://gitee.com/leimingyun/wm) |
| [yunkefu](https://gitee.com/leimingyun/yunkefu) |  | [私有化部署自己的SAAS客服系统](https://gitee.com/leimingyun/yunkefu) |
| [javadoc](https://gitee.com/leimingyun/javadoc) |  | [根据标准的 JavaDoc 生成接口文档 ](https://gitee.com/leimingyun/javadoc) |
| [elasticsearch util](https://gitee.com/leimingyun/elasticsearch) |  | [用sql方式使用Elasticsearch](https://gitee.com/leimingyun/elasticsearch) |
| [AutoPublish](https://gitee.com/leimingyun/sftp-ssh-autopublish) |  | [Java应用全自动部署及更新](https://gitee.com/leimingyun/sftp-ssh-autopublish) |
| [aichat](https://gitee.com/leimingyun/aichat) |  | [智能聊天机器人](https://gitee.com/leimingyun/aichat) |
| [yunbackups](https://gitee.com/leimingyun/yunbackups) |  | [自动备份文件到云存储及FTP等](https://gitee.com/leimingyun/yunbackups) |
| [chatbot](https://gitee.com/leimingyun/chatbot) |  | [智能客服机器人](https://gitee.com/leimingyun/chatbot) |
| [java print](https://gitee.com/leimingyun/printJframe) |  | [Java打印及预览的工具类](https://gitee.com/leimingyun/printJframe) |
…………