# Demo_TFIDF_Simhash_Python
**Repository Path**: zlczero/Demo_TFIDF_Simhash_Python
## Basic Information
- **Project Name**: Demo_TFIDF_Simhash_Python
- **Description**: python3 利用用TF特征向量和Simhash指纹计算中文文本的相似度的示例
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 2
- **Created**: 2021-04-02
- **Last Updated**: 2021-04-02
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 1、Python语言的应用 之 Demo_TFIDF_Simhash_Python
python3 利用TF特征向量和sim hash指纹计算中文文本的相似度的示例
# 2、更新信息
开发者:沙振宇(沙师弟专栏)
创建时间:2018-12-25
最后一次更新时间:2019-12-13
CSDN博客地址——Python开发 之 利用TF特征向量和Simhash指纹计算中文文本的相似度的示例:
https://shazhenyu.blog.csdn.net/article/details/103522732
# 3、过程
- 准备测试数据
- 预处理读到的数据
- 加载数据到Map中
- 输入用户问题
- 利用TF特征向量和Simhash指纹计算出 预处理的配置文件中的分值
# 4、预先安装包
此项目需要先安装 jieba
# 5、效果图
