# site-mirror-go **Repository Path**: generals-space/site-mirror-go ## Basic Information - **Project Name**: site-mirror-go - **Description**: 网站镜像工具, 可以将整个站点上的全部资源抓取到本地访问. - **Primary Language**: Go - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 9 - **Forks**: 6 - **Created**: 2019-03-31 - **Last Updated**: 2024-09-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # site-mirror-go 这是一个通用的爬虫, 整站下载工具, 可以下载包括页面, 图片, css样式及js文件的所有资源, 并存储到本地指定目录下. 功能特性: 1. 指定抓取深度(0为不限深度, 1为只抓取单页面) 2. 可以通过配置指定不下载图片, css, js或字体等资源 3. 设置黑名单以屏蔽指定链接的资源 完成后可以通过仓库中的`docker-compose.yml`启动一个nginx容器从本地访问. 注意: 本工具只能下载静态页面, 对于通过js动态加载的内容无能为力(比如bilibili), 一般只限于文章, 图片, 新闻资讯等网站. ------ 同类的python版本见 - [site-mirror-py github](https://github.com/generals-space/site-mirror-py) - [site-mirror-py 码云](https://gitee.com/generals-space/site-mirror-py) 实现逻辑相同. golang版本: 1.11.1+ ------ 效果截图 ![](./doc/src/screenshot.jpg)