# eudic词典制作_微信小程序爬虫_数据处理_词典制作 **Repository Path**: zixing/eudic-dictionary-making ## Basic Information - **Project Name**: eudic词典制作_微信小程序爬虫_数据处理_词典制作 - **Description**: eudic词典制作:微信小程序爬虫+数据处理+词典制作 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2023-03-08 - **Last Updated**: 2023-03-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # eudic词典制作 - 下载地址:[下载地址](https://gitee.com/wp19991/eudic-dictionary-making/raw/master/%E8%AF%8D%E5%85%B8%E7%BC%96%E5%86%99/%E8%AF%8D%E6%B1%87%E7%9A%84%E9%80%BB%E8%BE%91.eudic) # 1 词典介绍: - 词汇的逻辑书本的内容,在此感谢微信小程序《考上背词》邀请体验。 - 作者:参考答案开心否 - 邮箱:983214439@qq.com - GitHub:[wp19991](https://github.com/wp19991) - Gitee:[wp19991](https://gitee.com/wp19991) - CSDN:[参考答案开心否](https://blog.csdn.net/qq_16881981) # 2 项目介绍 - eudic词典制作,其中包括了 - 微信小程序爬虫 - 数据处理 - 词典制作 ## 3 微信小程序爬虫 1. 线索是 `https://ksedusit-1302986692.file.myqcloud.com/bookmanage/wordplus/010010101/50.txt?sign=63fd20d7af74a63c3b1e2ba74de1ee72&t=1612620604` 2. 首先需要从 `./爬虫/从stream-response.txt里面获取下载的逻辑/1/stream-response.txt` 和 `./爬虫/从stream-response.txt里面获取下载的逻辑/2/stream-response.txt` 文件中获取接口的路径后面sign和t参数的生成方法,需要看懂js文件。 3. 用jupyter notebook编写爬虫文件,需要用到 `pyexecjs`、`requests` 库。 4. 编写爬取逻辑。 5. 爬取的文件已经压缩到压缩包里面了 `./爬虫/data_解压就是爬取的数据.zip` ## 4 数据处理 1. 用jupyter notebook编写数据处理文件,需要用到 `json` 库。 2. 需要先修改把文件的名称用wordid命名 3. 按照单词为 key 变成字典dict 4. 编写逻辑把分散的json文件保存成一个文件 `zong_data_json.json` 和 `zong_data_json_utf8.json` ## 5 词典制作 1. 根据自己喜欢的样式(这里是根据书上面的样式)编写展示的逻辑,需要写到一行里面。 ```html transport
[ˈtrænspɔːt] [trænsˈpɔːt]
n. 运输,运送;交通工具
v. 运输,运送
``` 2. 按eudic词典格式编写导出拼接逻辑 3. 导出成txt文件 `./词典编写/词汇的逻辑.txt` ![image-20210308195524139](README.assets/image-20210308195524139.png) ![image-20210308195456718](README.assets/image-20210308195456718.png)