# wechatDownload **Repository Path**: adam01/wechatDownload ## Basic Information - **Project Name**: wechatDownload - **Description**: No description available - **Primary Language**: Unknown - **License**: GPL-3.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 1 - **Created**: 2024-04-29 - **Last Updated**: 2024-12-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # wechatDownload 微信公众号文章下载工具 此仓库已停止维护,感谢使用。 ## 前言 能来 github 的,我默认都是友好的技术人员。大家提 issues 前,请确保你已经按照下面的说明正确安装证书。在 issues 中详细描述清楚你的环境(系统版本、软件版本、数据库版本等)和遇到的问题,并附上日志(设置中心->打开日志位置) 参考:[提问的智慧](https://github.com/tvvocold/How-To-Ask-Questions-The-Smart-Way) ## 项目介绍 ### 技术栈 Electron + Typescript + VUE3 ### 原理 获取微信公号文章列表,需要 3 个特殊参数: - \_biz:公众号的 id - uin:微信用户的 ID - key:不知道是啥 这 3 个参数通过 http 代理获取,剩下的就是普通爬虫的做法了 ### 使用 ![image-20230112181356841](doc/imgages/main.jpg) ![image-20230821104149231](doc/imgages/setting.jpg) - 单篇文章下载 直接输入链接,点击下载按钮即可 此方式无需登录微信,也因此无法获取评论和文章中QQ音乐音频,如需要这两样数据,请使用批量下载或监控下载 - 批量下载 1. 初次使用请安装证书, - 自动安装(仅限window系统) 需要管理员权限(右击软件图标 -> 以管理员身份运行) 设置中心 → 安装证书 - 手动安装 设置中心 → 打开证书路径 → 打开rootCA.crt文件 ![Untitled](doc/imgages/ca.png) 2. 需要安装电脑版微信 3. 点击**批量下载**按钮,开始监听微信公号数据 4. 在电脑版微信打开一篇需要下载的公号的文章 5. 回到WechatDownload,会弹框提示 ![wechatDownload.gif](doc/imgages/batch.gif) - 监控下载 1. 需要安装电脑版微信 2. 在WechatDownload点击**监控下载**按钮(按钮会变颜色) 3. 在电脑版微信打开需要下载的文章(可以打开多篇文章) 4. 回到WechatDownload,再次点击**监控下载**按钮即可开始下载 ![wechatDownload](doc/imgages/monitoring.gif) - 保存至 MySql 需要执行 /doc/mysql.sql 文件中的 SQL 语句创建表 - 线程配置 时间间隔:单位是毫秒,假设时间间隔500,单线程是下载完一篇文章,等待500毫秒再继续下载。多线程就是每500毫秒异步下载文章,无需等待上一篇文章下载完成。 单批数量:假设单批数量10,每次会同时异步下载10篇文章,等待这10篇下载完成,再继续下载10篇。 - 过滤规则 目前支持对标题和作者进行关键词过滤 ```json { "title": { "include": ["包含关键词1", "包含关键词2"], "exclude": ["排除关键词1","排除关键词2"] }, "auth": { "include": ["包含关键词1", "包含关键词2"], "exclude": ["排除关键词1", "排除关键词2"] } } ``` 举例子,如果需要作者是 张三 并且标题包含 好人,那就是 ```json { "title": { "include": ["好人"] }, "auth": { "include": ["张三"] } } ``` - 生成Epub 支持通过 HTML 文件生成 Epub 电子书,所以使用需要先使用**批量下载**将公众号文章保存到本地,再生成 Epub 使用参数如下 - 文件名:必要参数。例如填写 **test**,最后就会生成 **test.epub** 文件 - 文件夹:必要参数。保存了 HTML 文件的文件夹,也就是 Epub 的数据来源 - 封面图片:Epub 文件的封面图片,支持 jpg、png 格式 ### 功能 设置中心有啥就支持啥 - 支持选择下载范围 - 将网页抓换成HTML、Markdown、PDF - 将网页源码保存至Mysql(下载来源是网络才有效) - 下载图片、音频到本地 - 添加原文链接、元数据(作者、时间、公号名) - 跳过现有文章 - 下载评论 - 下载来源(此选项只影响批量下载): - 网络:就是从微信接口获取文章 - 数据库:如果选择了**保存至Mysql**选项,数据库中会保存文章的网页源码,此时如果需要将源码转换成HTML、Markdown ,选择下载来源是数据库即可。(微信接口用得多会被限制) ## 源码运行&编译 ### 安装 ```bash $ npm install ``` ### 调试 ```bash $ npm run dev ``` ### 编译 ```bash # For windows $ npm run build:win # For macOS $ npm run build:mac # For Linux $ npm run build:linux ``` ## 特别感谢 [![](https://resources.jetbrains.com/storage/products/company/brand/logos/jb_beam.svg)](https://www.jetbrains.com/?from=wechatDownload) 感谢 [JetBrains](https://www.jetbrains.com/?from=wechatDownload) 提供的开源开发许可证