# templatespider
**Repository Path**: xiaolang1/templatespider
## Basic Information
- **Project Name**: templatespider
- **Description**: 扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
- **Primary Language**: Java
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: http://www.wang.market
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 954
- **Created**: 2018-02-24
- **Last Updated**: 2020-12-19
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 所见网站,皆可为我所用-templatespider
看好哪个网站,指定好URL,自动扒下来做成模版。并且所下载的css、js、图片、html文件会自动分好类保存到特定文件夹!
项目最初目的为 [网市场云建站系统(CMS建站系统)](https://gitee.com/mail_osc/wangmarket) 因模版量少而做。用了之前写的 [xnx3](https://gitee.com/mail_osc/xnx3) ,以及 Jsoup 。
## 软件下载
不说没用的,不吹多牛,能直接用,产生价值才是真的!
##### Windows 系统
[点击此处下载 Windows平台 运行软件](https://github.com/xnx3/templatespider/raw/master/application/spider.zip) 软件下载后,解压即可直接使用!
##### Mac、Linux 系统
[点击此处下载可运行jar包](https://github.com/xnx3/templatespider/raw/master/application/spider.jar)
前提是需自行安装JDK8。jar下载后可直接打开运行。
## 项目分支简介
1. 看着网上哪个网站好,可用此软件将其下载,变为模版,可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用 [application/spider.zip](https://github.com/xnx3/templatespider/raw/master/application/spider.zip)
2. 下载的模版,采用人工智能,自动进行计算识别,将其转化,导出网市场云建站可使用的模版,做到一键导入使用!(尚未完成)
````
templatespider GitHub目录
├─SourceCode 项目源代码
│ ├─lib 依赖的 jar 包
│ ├─src java 源码
└─application 可直接运行的应用(下载后可直接部署起来运行)
└─spider.zip 扒网站工具的 Windows 应用程序
````
## 软件界面

## 使用步骤
1. 将要扒取的网站页面的网址粘贴进去
2. 点击左下方“开始抓取”按钮
3. 等待抓取完毕,自动打开下载好的文件夹
## 使用示例
例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:
````
http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html
````
设置如下图所示

设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。
扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:

可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。