# Demo_TFIDF_Simhash_Python **Repository Path**: zlczero/Demo_TFIDF_Simhash_Python ## Basic Information - **Project Name**: Demo_TFIDF_Simhash_Python - **Description**: python3 利用用TF特征向量和Simhash指纹计算中文文本的相似度的示例 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2021-04-02 - **Last Updated**: 2021-04-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 1、Python语言的应用 之 Demo_TFIDF_Simhash_Python python3 利用TF特征向量和sim hash指纹计算中文文本的相似度的示例
# 2、更新信息 开发者:沙振宇(沙师弟专栏)
创建时间:2018-12-25
最后一次更新时间:2019-12-13

CSDN博客地址——Python开发 之 利用TF特征向量和Simhash指纹计算中文文本的相似度的示例:
https://shazhenyu.blog.csdn.net/article/details/103522732
# 3、过程 - 准备测试数据
- 预处理读到的数据
- 加载数据到Map中
- 输入用户问题
- 利用TF特征向量和Simhash指纹计算出 预处理的配置文件中的分值
# 4、预先安装包 此项目需要先安装 jieba # 5、效果图 ![image](https://github.com/ShaShiDiZhuanLan/Demo_TFIDF_Simhash_Python/blob/master/%E6%95%88%E6%9E%9C%E5%9B%BE.png)