# eudic词典制作_微信小程序爬虫_数据处理_词典制作
**Repository Path**: zixing/eudic-dictionary-making
## Basic Information
- **Project Name**: eudic词典制作_微信小程序爬虫_数据处理_词典制作
- **Description**: eudic词典制作:微信小程序爬虫+数据处理+词典制作
- **Primary Language**: Python
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 1
- **Created**: 2023-03-08
- **Last Updated**: 2023-03-08
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# eudic词典制作
- 下载地址:[下载地址](https://gitee.com/wp19991/eudic-dictionary-making/raw/master/%E8%AF%8D%E5%85%B8%E7%BC%96%E5%86%99/%E8%AF%8D%E6%B1%87%E7%9A%84%E9%80%BB%E8%BE%91.eudic)
# 1 词典介绍:
- 词汇的逻辑书本的内容,在此感谢微信小程序《考上背词》邀请体验。
- 作者:参考答案开心否
- 邮箱:983214439@qq.com
- GitHub:[wp19991](https://github.com/wp19991)
- Gitee:[wp19991](https://gitee.com/wp19991)
- CSDN:[参考答案开心否](https://blog.csdn.net/qq_16881981)
# 2 项目介绍
- eudic词典制作,其中包括了
- 微信小程序爬虫
- 数据处理
- 词典制作
## 3 微信小程序爬虫
1. 线索是 `https://ksedusit-1302986692.file.myqcloud.com/bookmanage/wordplus/010010101/50.txt?sign=63fd20d7af74a63c3b1e2ba74de1ee72&t=1612620604`
2. 首先需要从 `./爬虫/从stream-response.txt里面获取下载的逻辑/1/stream-response.txt` 和 `./爬虫/从stream-response.txt里面获取下载的逻辑/2/stream-response.txt` 文件中获取接口的路径后面sign和t参数的生成方法,需要看懂js文件。
3. 用jupyter notebook编写爬虫文件,需要用到 `pyexecjs`、`requests` 库。
4. 编写爬取逻辑。
5. 爬取的文件已经压缩到压缩包里面了 `./爬虫/data_解压就是爬取的数据.zip`
## 4 数据处理
1. 用jupyter notebook编写数据处理文件,需要用到 `json` 库。
2. 需要先修改把文件的名称用wordid命名
3. 按照单词为 key 变成字典dict
4. 编写逻辑把分散的json文件保存成一个文件 `zong_data_json.json` 和 `zong_data_json_utf8.json`
## 5 词典制作
1. 根据自己喜欢的样式(这里是根据书上面的样式)编写展示的逻辑,需要写到一行里面。
```html
transport
[ˈtrænspɔːt] [trænsˈpɔːt]
❶ n. 运输,运送;交通工具
❷ v. 运输,运送