# WEEK09_Webminning **Repository Path**: NFUNM062/WEEK09_Webminning ## Basic Information - **Project Name**: WEEK09_Webminning - **Description**: No description available - **Primary Language**: HTML - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-05-17 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 项目名称:抓取公众号关键词 - [ipynb代码文本链接](https://gitee.com/NFUNM062/WEEK09_Webminning/blob/master/week9_%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98.ipynb) - [数据表下载链接](https://gitee.com/NFUNM062/WEEK09_Webminning/blob/master/%E5%85%AC%E4%BC%97%E5%8F%B7_url_%E8%85%BE%E8%AE%AF%E7%A0%94%E7%A9%B6%E9%99%A2.xlsx) ## 数据加值宣言 - 本项目以用户搜索关键词寻找到相应的文章为目标。 ## 数据的最小可用产品 ### 数据维度 - 文章信息:51页内的所有文章题目 - 时间信息:文章创作的时间 - url信息:文章的超链接 - 关键词信息:'马化腾','QQ','央行'等关键词 ### 核心价值(解决的问题) - 解决用户对于腾讯研究院公众号内所有关键词与"央行"有关的所有文章,并通过简单的关键词筛选方式来找到相应的文章url。 ## 挖掘微信公众号的基本信息 - rel_accounts中包含和腾讯研究院相关的公众号及其url。 - url_cat中包含腾讯研究院公众号内容信息的标题(title)、创作时间(create_time)、文章的url信息(link)、与及关键词变量(variable)。 - stats中包含关键词信息。