# templatespider

**Repository Path**: xiaolang1/templatespider

## Basic Information

- **Project Name**: templatespider
- **Description**: 扒网站工具，看好哪个网站，指定好URL，自动扒下来做成模版。所见网站，皆可为我所用！
- **Primary Language**: Java
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: http://www.wang.market
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 980
- **Created**: 2018-02-24
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 所见网站，皆可为我所用－templatespider
看好哪个网站，指定好URL，自动扒下来做成模版。并且所下载的css、js、图片、html文件会自动分好类保存到特定文件夹！
<br/>
项目最初目的为 [网市场云建站系统（CMS建站系统）](https://gitee.com/mail_osc/wangmarket) 因模版量少而做。用了之前写的 [xnx3](https://gitee.com/mail_osc/xnx3) ，以及 Jsoup 。
<br/>
<br/>
## 软件下载
不说没用的，不吹多牛，能直接用，产生价值才是真的！
##### Windows 系统
[点击此处下载 Windows平台 运行软件](https://github.com/xnx3/templatespider/raw/master/application/spider.zip) 软件下载后，解压即可直接使用！
<br/>
##### Mac、Linux 系统
[点击此处下载可运行jar包](https://github.com/xnx3/templatespider/raw/master/application/spider.jar)
前提是需自行安装JDK8。jar下载后可直接打开运行。
<br/>
<br/>
## 项目分支简介
1. 看着网上哪个网站好，可用此软件将其下载，变为模版，可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用 [application/spider.zip](https://github.com/xnx3/templatespider/raw/master/application/spider.zip)<br/>
2. 下载的模版，采用人工智能，自动进行计算识别，将其转化，导出网市场云建站可使用的模版，做到一键导入使用！（尚未完成）<br/>

````
templatespider                      GitHub目录
├─SourceCode                        项目源代码
│  ├─lib                            依赖的 jar 包
│  ├─src                            java 源码
└─application                       可直接运行的应用(下载后可直接部署起来运行)
  └─spider.zip                      扒网站工具的 Windows 应用程序
````


## 软件界面
![image](http://cdn.weiunity.com/site/254/news/20180126/1516934385872060782.png)


## 使用步骤
1. 将要扒取的网站页面的网址粘贴进去
2. 点击左下方“开始抓取”按钮
3. 等待抓取完毕，自动打开下载好的文件夹


## 使用示例
例如，我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面，拔取下来做成模板，扒网站工具中可以这么设置URL：

````
http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html
````

设置如下图所示
![image](http://cdn.weiunity.com/site/254/news/20180126/1516934727962011819.png)

设置好后，点击左下角的“开始提取”按钮，便开始了自动扒这几个设置好的页面。

扒完后，会自动打开下载好的文件夹。例如，上面拔取的结果：

![image](http://cdn.weiunity.com/site/254/news/20180126/1516935019354059686.png)

可以看到，扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。