实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目:
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目:
使用scrapy框架爬取大众点评网站店铺信息 包括: 店铺名称 所在城市 地址 评论数 评价消费 标签 口味评分 环境评分 服务评分
http://college.gaokao.com/schlist/ 这个网站上面所有高校院校数据的抓取。 使用requests请求获取网页数据, 使用lxml解析网页, 使用xpath提取数据。 并保存成excel表格文件。
使用scrapy框架爬取简书的用户数据+文章内容等并写入数据库 class JianshuItem(scrapy.Item): #用户名 #主页链接地址 #关注量 #粉丝数 #文章数 #字数 #收获喜欢 #收获喜欢 class JianshuArticleItem(scrapy.Item): #文章标题 #作者 #最后编辑时间 #字数 #阅读数 #评论数 #喜欢数 #赞赏数 #作者签名信息 #正文——文本——信息 #文章页面链接 #微博长图链接
使用scrapy爬取上海地区二手房信息 包括数据: #名称 #所在区域 #楼栋总数 #建筑年代 #总户数 #物业类型 #容积率 #绿化率 #物业费 #开发商 #物业公司 #小区地址 #周边学校 #小区均价 #环比上月(上涨or下跌) #小区成交
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。