# python多线程爬虫 **Repository Path**: peng-yuwei132/python-big-job-multithreading ## Basic Information - **Project Name**: python多线程爬虫 - **Description**: 这是一个简单的python多线程程序 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2023-05-31 - **Last Updated**: 2025-07-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # python多线程爬虫 #### 介绍 这是一个简单的python多线程程序,使用到requests、bs4、re。requests 是网络请求、bs4 用于对于前端页面代码中的数据进行筛选、re 用于利用正则匹配筛选数据。 #### 软件架构 Python #### 安装教程 1. 安装所有文件中缺少的模块,即可使用 #### 使用说明 1. 运行 “主程序.py” #### 参与贡献 程序全部由我编写 #### 特技 1. 爬取了一个小说网站和一个图片网站。 2. 有个加快下载速度的多线程设计,但多线程也存在几个问题。首先,容易被网站发现在快速多次访问,进而被屏蔽;其次,访问失败时,没有设置判断失败,然后重新发送的机制。