# pyim-tsinghua-dict **Repository Path**: emacs-hub/pyim-tsinghua-dict ## Basic Information - **Project Name**: pyim-tsinghua-dict - **Description**: 此仓库是为了提升国内下载速度的镜像仓库,每日同步一次。 原始仓库: - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: https://github.com/redguardtoo/pyim-tsinghua-dict.git - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-05-15 - **Last Updated**: 2022-06-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README * pyim-tsinghua-dict 用[[http://thuocl.thunlp.org/][THUOCL:清华大学开放中文词库]] 数据建立的 [[https://github.com/tumashu/pyim][pyim 输入法]] 的词库. 已基于词频统计信息DF值(Document Frequency)优化. DF值小于等于10的词都被排除,相对原始数据词汇量少了一半.可以提高输入法的速度,减少内存消耗. * 安装和使用 将 pyim-tsinghua-dict 添加到 load-path, 然后: #+begin_src emacs-lisp (require 'pyim-tsinghua-dict) (pyim-tsinghua-dict-enable) #+end_src 除了上述方法,用户也可以运行 `pyim-dict-manager' 命令,然后按提示添加 pyim-tsinghua-dict.pyim 词库文件。 * Utils 相关文件 1. "mkdict.py" 是生成 pyim-tsinghua-dict.pyim 的工具。 2. "hanzi.csv" 记录着汉字对应的拼音。 3. "words-with-freq-sorted-by-pinyin.csv" 是把词库的数据另存为csv格式. 以供研究。 * 版权 使用了清华大学开放中文词库, 韩世依, 张钰晖, 马云山, 涂存超, 郭志芃, 刘知远, 孙茂松. THUOCL:清华大学开放中文词库. 2016. 由我编辑整理,仅供个人研究、交流学习使用,不涉及商业盈利目的。如涉及版权问题,请联系我予以更改或删除.