# Python **Repository Path**: hanzihouse/python ## Basic Information - **Project Name**: Python - **Description**: 一个简单的爬虫项目,运用Python flask框架显示出来 - **Primary Language**: Python - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2022-01-25 - **Last Updated**: 2022-03-30 ## Categories & Tags **Categories**: Uncategorized **Tags**: python爬虫, mysql数据库, Flask框架 ## README # Python #### 介绍 一个简单的爬虫项目,运用Python flask框架显示出来 使用简易的爬虫技术爬取了豆瓣网排名Top250的电影信息,有存取到excel表格的方式,主要使用还是连接到mysql数据库进行存放。 同时通过flask框架将数据展示出来,应用了一些echarts,词云,Re,Bs4正则表达式等小玩意 #### 安装教程 1. 直接将项目下载到本地,装上项目必须的几个库 bs4 import BeautifulSoup # 网页解析,获取数据、 re # 正则表达式,进行文字匹配、 urllib.request, urllib.error # 制定URL,获取网页数据、 openpyxl # 进行Excel操作、 pymysql # 数据库操作 2. 根据main方法中的步骤进行分布调试 1.爬取网页 2.保存数据 3. 本项目中的数据库版本是8.0+使用者最好是用相同版本 4. 项目先直接运行app.py 然后进入控制台中的网址 5. 啊哈哈差点忘记 团队页面还没有完善 后续再上传鸭