# nlp4han **Repository Path**: chen-dong-git/nlp4han ## Basic Information - **Project Name**: nlp4han - **Description**: 中文自然语言处理工具集【断句/分词/词性标注/组块/句法分析/语义分析/NER/N元语法/HMM/代词消解/情感分析/拼写检查】 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2023-12-05 - **Last Updated**: 2023-12-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # nlp4han 中文自然语言处理工具集。更多信息参见[Wiki](https://github.com/kidden/nlp4han/wiki) ## 功能特性 * 断句 * 基于规则的中文断句器 * 分词 * 基于字的最大熵中文分词器 * 组合中文分词和词性标注器 * 词性标注 * 基准中文词性标注器 * 单步基于词的最大熵中文词性标注器 * 单步基于字的最大熵中文词性标注器 * 组合中文分词和词性标注器 * 基于HMM的中文词性标注器 * N元语言模型 * HMM模型 * 命名实体识别 * 基于字的命名实体识别 * 基于分词的命名实体识别 * 基于分词和词性标注的命名实体识别 * 组块/浅层句法分析 * 基于词的最大熵中文基本组块标注 * 基于词和词性的最大熵中文基本组块标注 * 组合中文词性标注和基本组块标注 * 基于SVM的中文组块标注 * 依存句法分析 * 基于最大生成树MST和最大熵的依存句法分析 * 基于转换的依存句法分析 * 短语结构(成分)句法分析 * 基于最大熵的短语结构(成分)句法分析 * 基于CKY的PCFG短语结构(成分)句法分析 * 中心词驱动的短语结构句法分析 * 基于隐藏标记的非词汇化短语结构句法分析 * 语义角色标注 * 基于最大熵的语义角色标注 * 指代消解 * 基于Hobbs算法的指代消解 * 情感分析 * 基于朴素贝叶斯的文档情感分析 * 基于规则和短语结构树的句子情感分析 * GUI工具 * 基于nlp4han功能实现的短语结构树编辑工具 ## 更新日志 * 2018.12.16, 基于Hobbs算法的指代消解 * 2018.12, 基于隐藏标记的非词汇化短语结构句法分析 * 2018.11, 集成短语结构树编辑工具到nlp4han-tools,并使用nlp4han的中文分词、词性标注和句法分析功能。 * 2018.10, 基于SVM的中文组块标注 * 2018.9, 中心词驱动的短语结构句法分析 * 2018.7, 基于CKY的PCFG短语结构(成分)句法分析 * 2018.6, 基于转换的依存句法分析 * 2018.5, 基于朴素贝叶斯的文档情感分析, 基于规则和短语结构树的句子情感分析 * 2018.3, 基于最大熵的语义角色标注 * 2018.2, 基于最大熵的短语结构(成分)句法分析, HMM模型 * 2018.1, 基于最大生成树MST和最大熵的依存句法分析 * 2017.12, 组合中文词性标注和基本组块标注, N元语言模型 * 2017.11, 基于词和词性的最大熵中文基本组块标注, 基于词的最大熵中文基本组块标注 * 2017.10, 基于分词和词性标注的命名实体识别 * 2017.9, 基于分词的命名实体识别, 基于字的命名实体识别 * 2017.8, 基于HMM的中文词性标注器 * 2017.7, 组合中文分词和词性标注器 * 2017.6, 单步基于字的最大熵中文词性标注器 * 2017.5, 单步基于词的最大熵中文词性标注器 * 2017.4, 基准中文词性标注器 * 2017.3, 组合中文分词和词性标注器 * 2017.2, 基于字的最大熵中文分词器 * 2016.12, 基于规则的中文断句器