# public_data **Repository Path**: beihai_xiaoshi/public_data ## Basic Information - **Project Name**: public_data - **Description**: 一些公共网站、公共资源的采集 包括畅想之星、资源学科创新平台、中国互联网信息中心、中国行政区划网、国家法律法规数据库、古诗文网、汉典古籍、买购网、bilibili商城、国家图书馆、国家统计局、 中华地名网_中华行政区划网、易车网等网站的数据采集 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 0 - **Created**: 2024-11-19 - **Last Updated**: 2024-12-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # public_data #### 介绍 一些公共网站、公共资源的采集 包括畅想之星、资源学科创新平台、中国互联网信息中心、中国行政区划网、国家法律法规数据库、古诗文网、汉典古籍、买购网、bilibili商城、国家图书馆、国家统计局、 中华地名网_中华行政区划网、易车网等网站的数据采集 ### 涉及的网站 中国行政区划网 http://www.tcmap.com.cn/ 国家法律法规数据库 https://flk.npc.gov.cn/fl.html 资源学科创新平台http://www.data.ac.cn/tabinfo/ 中国互联网信息中心 https://www.cnnic.net.cn/6/86/88/index1.html ### 一些书籍网站的采集 拉看网 独步小说网 畅想之星 ### 湖北政务信息公开 https://tzxm.hubei.gov.cn/xxgk 解决的难题,一个headers参数extoken 的逆向 ### 一些汉语相关的网站 汉典古籍 古诗词网 组词网 简繁体对照