# templatespider **Repository Path**: xiaolang1/templatespider ## Basic Information - **Project Name**: templatespider - **Description**: 扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用! - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: http://www.wang.market - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 954 - **Created**: 2018-02-24 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 所见网站,皆可为我所用-templatespider 看好哪个网站,指定好URL,自动扒下来做成模版。并且所下载的css、js、图片、html文件会自动分好类保存到特定文件夹!
项目最初目的为 [网市场云建站系统(CMS建站系统)](https://gitee.com/mail_osc/wangmarket) 因模版量少而做。用了之前写的 [xnx3](https://gitee.com/mail_osc/xnx3) ,以及 Jsoup 。

## 软件下载 不说没用的,不吹多牛,能直接用,产生价值才是真的! ##### Windows 系统 [点击此处下载 Windows平台 运行软件](https://github.com/xnx3/templatespider/raw/master/application/spider.zip) 软件下载后,解压即可直接使用!
##### Mac、Linux 系统 [点击此处下载可运行jar包](https://github.com/xnx3/templatespider/raw/master/application/spider.jar) 前提是需自行安装JDK8。jar下载后可直接打开运行。

## 项目分支简介 1. 看着网上哪个网站好,可用此软件将其下载,变为模版,可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用 [application/spider.zip](https://github.com/xnx3/templatespider/raw/master/application/spider.zip)
2. 下载的模版,采用人工智能,自动进行计算识别,将其转化,导出网市场云建站可使用的模版,做到一键导入使用!(尚未完成)
```` templatespider GitHub目录 ├─SourceCode 项目源代码 │ ├─lib                            依赖的 jar 包 │ ├─src                           java 源码 └─application                       可直接运行的应用(下载后可直接部署起来运行) └─spider.zip                     扒网站工具的 Windows 应用程序 ```` ## 软件界面 ![image](http://cdn.weiunity.com/site/254/news/20180126/1516934385872060782.png) ## 使用步骤 1. 将要扒取的网站页面的网址粘贴进去 2. 点击左下方“开始抓取”按钮 3. 等待抓取完毕,自动打开下载好的文件夹 ## 使用示例 例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL: ```` http://qiye1.wscso.com http://qiye1.wscso.com/gongsijieshao.html http://qiye1.wscso.com/xinwenzixun.html ```` 设置如下图所示 ![image](http://cdn.weiunity.com/site/254/news/20180126/1516934727962011819.png) 设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。 扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果: ![image](http://cdn.weiunity.com/site/254/news/20180126/1516935019354059686.png) 可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。