# interesting-python **Repository Path**: coder_jk/interesting-python ## Basic Information - **Project Name**: interesting-python - **Description**: 有趣的Python爬虫和Python数据分析小项目(Some interesting Python crawlers and data analysis projects) - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2021-03-29 - **Last Updated**: 2021-03-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #

interesting-python: 有趣的Python爬虫和数据分析小项目

## 简介 可以用Python实现的有趣的小项目,内容包括Python爬虫、Python数据分析、机器学习、深度学习等,持续更新中。 本Repository主要用于存放项目代码,对应的项目文章可以关注公众号。
作者:Alfred 微信公众号:[Alfred数据室](https://wx1.sinaimg.cn/mw690/007yVcwsgy1g03lo67ikoj30u00f0ta0.jpg)(原名为Alfred在纽西兰) 合作请加微信号:July-december
### 项目介绍 1. **LiveStreaming**: - 内容: 爬取了西瓜直播(今日头条旗下APP)各类型游戏的主播直播数据107.5万条,并分析直播平台和游戏主播行业是否真如我们想象般的暴利 - 对应微信公众号文章:《[游戏直播行业真的如你想象般暴利?](https://mp.weixin.qq.com/s/-B8cWjB6db6t0gNmqJ34GQ)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★★☆
2. **LaborDay**: - 内容: 按全国各个城市抓取飞猪“景点门票”栏的景点门票销售数据,并且分析五一哪些景点会人挤人,哪些景点值得一去 - 对应微信公众号文章:《[五一不看人人人人人人,哪儿耍合适?](https://mp.weixin.qq.com/s/iuCNreCuKzrggdXtvurpkQ)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★☆☆☆
3. **KrisWu**: - 内容: 随机抓取吴亦凡发表《大碗宽面》微博的微博转发数据10万条,并分析该条微博的真假转发比例,以及大家对于这首歌的情感倾向如何 - 对应微信公众号文章:《[大碗宽面 VS 律师函警告,情感分析吴亦凡自黑式圈粉!](https://mp.weixin.qq.com/s/Neh3asFZAtcIzywwXstBYQ)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★☆☆
4. **ESL**: - 内容: 爬取外籍人员招聘网站JobLEADChina上的外籍英语老师招聘数据945条,万行教师人才网上的英语老师招聘数据5780条,以及微信群成员信息498条,分析外教教师的招聘状况 - 对应微信公众号文章:《[没经验没学历的外教为啥能拿1.4W+的高薪?](https://mp.weixin.qq.com/s/BMfiB08gWy66zzvCe2lJmQ)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★☆☆☆☆
5. **ICU996**: - 内容: 爬取程序员集体抵制996的Github热门项目[996.ICU](996.ICU)中,Issues页面讨论数据和点了star的程序员Github个人信息数据,并且分析这群抵制996的程序员都是何方神圣 - 对应微信公众号文章:《[大胆,都是哪些程序员在反对996?!](https://mp.weixin.qq.com/s/BZhHcEwdUJNJRVFix8NRSQ)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★☆☆☆
6. **Paediatrician**: - 内容: 爬取[丁香人才网](https://www.jobmd.cn/)10950条涵盖儿科、内科、外科、妇产科、眼科的招聘数据,并且分析儿科医生的生存处境 - 对应微信公众号文章:《[儿科医生的眼泪,全被数据看见了](https://mp.weixin.qq.com/s/3SCI4kL-YX-9q1WDY23J-A)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★☆☆
7. **CaiXuKun**: - 内容: 随机抓取蔡徐坤100万+转发的微博《再见,“任性的”千千…》的10万条转发数据,并且分析蔡徐坤真假转发流量的比例以及真假粉丝的用户画像 - 对应微信公众号文章:《[用大数据扒一扒蔡徐坤的真假流量粉](https://mp.weixin.qq.com/s/j1kgf2RR7jssbWa7uWC-uA)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★☆☆
8. **BSGS_Rent**: - 内容: 爬取北上广深四个城市的链家租房房源信息,并且分析四个城市的租房现状和考虑因素 - 对应微信公众号文章:《[北上广深租房图鉴](https://mp.weixin.qq.com/s/sb-g7sGmPJPIsfF23INlmQ)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★☆☆
9. **Fireworks_and_Pm2.5**: - 内容: 爬取全国367个城市的空气质量指数数据,并分析烟花爆竹对空气质量的影响,以及城市禁放烟花爆竹是否有效 - 对应微信公众号文章:《[六万条数据全面解析,城市春节禁放烟花爆竹真的有用吗?](https://mp.weixin.qq.com/s/TO9ouZXOThiM5iOHqt0i0A)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★☆☆
10. **TheWanderingEarth**: - 内容: 爬取电影《流浪地球》的猫眼评论和评分,并分析该电影出现低分的原因 - 对应微信公众号文章:《[十万条评论告诉你,给《流浪地球》评1星的都是什么心态?](https://mp.weixin.qq.com/s/3d_ycK0D1KfbjQJ3m7FhEQ)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★☆☆
11. **Weibo_Comment_Pics**: - 内容: 模拟登陆微博手机端爬取海量表情包 - 对应微信公众号文章:《[开年表情包局部富有指南,盘它!](https://mp.weixin.qq.com/s/iTtVXMVdoTBxWHzEzbQH1Q)》 - 适合人群:Python爬虫学习者 - 难度:★★★☆☆
12. **English_names**: - 内容: 分析美国婴儿取名数据,为取英文名提供一些建议 - 对应微信公众号文章:《[看完这篇分析,楼下的Tony和Kevin都改名了!](https://mp.weixin.qq.com/s/7dGJbueO-_cLuw9d8mPUyg)》 - 适合人群:Python数据分析学习者、Pandas使用者、数据可视化学习者 - 难度:★★★☆☆
13. **shixiseng_packet_capture** - 内容:主要通过手机抓包分析和获取“实习僧”网站iso端的数据接口,有了接口便可以直接编写代码爬取数据 - 对应微信公众号文章:《[回复“实习僧”CTO之换种姿势爬取实习僧网站](https://mp.weixin.qq.com/s/UF3SF_cpbx8PFkva7rWW3Q)》 - 适合人群:Python爬虫学习者、手机抓包学习者 - 难度:★☆☆☆☆
14. **PUBG-juediqiusheng-data_analysis** - 内容:主要分析绝地求生72万场比赛的数据,并结合数据给出吃鸡攻略,用数据吃鸡! - 对应微信公众号文章:《[【20G】Kaggle数据集强势分析“绝地求生”,攻略吃鸡!](https://mp.weixin.qq.com/s/FednLB6IIQFBmMYv3udm0A)》 - 适合人群:Python数据分析学习者、Pandas使用者、各位吃鸡观众 - 难度:★★★☆☆
15. **Wechat_article_collector**: - 内容:微信公众号文章采集器,用于采集微信公众号文章并保存至word文档 - 对应微信公众号文章:《[50行代码教你打造一个公众号文章采集器](https://mp.weixin.qq.com/s/Yt4Gde2TuCWvK8pPCiZZRQ)》 - 适合人群:Python学习者、新媒体运营人群? - 难度:★★☆☆☆ - 注:该项目由于依赖包[WechatSogou](https://github.com/Chyroc/WechatSogou)疏于维护,目前暂时不能使用了。(2019-04-02 updated)
16. **mongoTV**: - 内容:爬取芒果TV的《我是大侦探》节目评论数据,并进行情感分析 - 对应微信公众号文章:《[《我是大侦探》到底怎么了?(上:数据爬取篇)》](https://mp.weixin.qq.com/s/XmPXUIWfIJGH6AARKltEtQ)》、《[《我是大侦探》到底怎么了?(下:情感分析篇)](https://mp.weixin.qq.com/s/bm9GKl2ovB91U9_uI48Now)》 - 适合人群:Python scrapy爬虫学习者、Python数据分析学习者、Pandas使用者 - 难度:★★★☆☆
17. **shixiseng**: - 内容:爬取实习僧网站中“数据挖掘”等相关岗位的数据,并对数据进行分析 - 对应微信公众号文章:《[帮了个小忙|破解“实习僧”网站字体加密](https://mp.weixin.qq.com/s/e56flQKah104IVwd0VfoIQ)》、《[“小忙”连载篇|实习僧网站数据分析](https://mp.weixin.qq.com/s/FS70XOhmF2w4J3EghCzZfw)》 - 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者 - 难度:★★★☆☆
### 支持作者 熬夜敲代码写稿件,咖啡才是第一生产力。 喜欢作者的分享,如何支持作者? Maybe you could buy me a cup of coffee. Salute!