# nlp-lang **Repository Path**: nanbowang/nlp-lang ## Basic Information - **Project Name**: nlp-lang - **Description**: 这个项目是一个基本包.封装了大多数nlp项目中常用工具 - **Primary Language**: Java - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2020-02-22 - **Last Updated**: 2022-10-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README nlp-lang ======== [![1.X Build Status](https://travis-ci.org/NLPchina/nlp-lang.svg?branch=master)](https://travis-ci.org/NLPchina/nlp-lang) 文档地址:http://www.nlpcn.org/docs/7 部分演示:http://www.nlpcn.org/demo ##MAVEN org.nlpcn nlp-lang 1.7.3 #### 这个项目是一个基本包.封装了大多数nlp项目中常用工具 > 工具 * √ 词语标准化 * √ tire树结构 * √ 双数组tire树 * √ 文本断句 * √ html标签清理 * √ Viterbi算法增加 > 组件 * √ 汉字转拼音 * √ 简繁体转换 * √ bloomfilter * √ 指纹去重 * √ SimHash文章相似度计算 * √ 词共现统计 * √ 基于内存的搜索提示 * √ WordWeight词频统计,词idf统计,词类别相关度统计