# Proxy_Pool **Repository Path**: bianyuan456/Proxy_Pool ## Basic Information - **Project Name**: Proxy_Pool - **Description**: Proxy_Pool(代理资源池),一个小巧的代理ip抓取+评估+存储+展示的一体化的工具,包括了web展示和接口。 - **Primary Language**: JavaScript - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-08-11 - **Last Updated**: 2022-01-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Proxy_Pool Proxy_Pool,一个小巧的代理ip抓取+评估+存储+展示的一体化的工具,可自动化的搜集检测可用代理并进行评分,并添加了web展示和接口。 # 安装 1、从GitHub上脱下来,把代码放在web目录下。 ``` git clone https://github.com/TideSec/Proxy_Pool ``` web服务器在unix/linux下可以用`https://github.com/teddysun/lamp`进行快速安装。 在windows下可以用[phpstudy](http://phpstudy.php.cn/)进行快速部署。 2、在mysql中新建数据库proxy,将proxy.sql文件导入,在include/config.inc.php中修改数据库密码。 3、此时本机访问http://ip:port,应该可以看到代理web展示界面 4、安装python2依赖库 ``` pip install lxml pip install requests pip install pymysql ``` 5、在py_proxy_task/config.py文件中配置数据库连接信息及其他参数。 # 使用 在py_proxy_task目录下有`proxy_get.py`和`proxy_check.py`两个程序,前者负责每天抓ip存进数据库,后者负责数据库中ip的清理和评估。 ```bash python proxy_get.py # 等待上述程序抓取完结果后再运行评测程序 python proxy_check.py ``` 之后按默认配置,这两个程序每天分别执行抓取和评估工作,放服务器上长期运行即可。 # 简介 原作者代码在这里:`https://github.com/chungminglu/Proxy` 我对部分代码进行了修改,完善了部分提取代理的解析代码,并加入了web展示和web接口,方便其他程序调用。 web页面我是从我的另外一个扫描器上改过来的`https://github.com/TideSec/WDScanner/`,里面可能有部分无用代码没有删除。 程序的几个功能: 1、每天从多个代理ip网站上抓下最新高匿ip数据。 2、经过筛选后的ip将存入数据库。 3、存入数据库的ip每天也要经过测试,存在剔除、评分机制,多次不合格的ip将被删除,每个ip都被评分,我们最终可以按得分排名获得稳定、低响应时间的优质ip。 web展示如下图所示: