# similarity **Repository Path**: coddest/similarity ## Basic Information - **Project Name**: similarity - **Description**: 短文本相似度匹配 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2020-05-04 - **Last Updated**: 2020-12-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### similarity 短文本相似度匹配 ### 依赖包 pip install gensim pip install jieba pip install paramiko ### 问题 1. 需要正则匹配数字,空格并过滤,停用词表无法穷举 ### 测试数据 原句: 请问,截至六月30日,公司的股东人数是多少?谢谢 匹配目标: 请问,截至六月30日,公司的股东人数是多少?谢谢 请问,截至7月十五日,公司的股东人数是多少?谢谢 请问8月中期股东户数?谢谢 4月30日股东户6442户,6月15日6364户,请问减少的这部分是何原因为主?股份数量增加的账号是否全是机构投资者?谢谢解答。