# pyltp **Repository Path**: lightjake/pyltp ## Basic Information - **Project Name**: pyltp - **Description**: 除了分词之外,pyltp 还提供词性标注、命名实体识别、依存句法分析、语义角色标注等功能。原地址:https://github.com/HIT-SCIR/pyltp.git - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2021-03-08 - **Last Updated**: 2024-05-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # pyltp [![PyPI Status](https://badge.fury.io/py/pyltp.svg)](https://badge.fury.io/py/pyltp) [![Readthedocs](https://readthedocs.org/projects/pyltp/badge/?version=latest)](http://pyltp.readthedocs.io/) [![Build Status](https://travis-ci.org/HIT-SCIR/pyltp.svg?branch=master)](https://travis-ci.org/HIT-SCIR/pyltp) [![Build status](https://ci.appveyor.com/api/projects/status/kp2kjujo4amunyvr/branch/master?svg=true)](https://ci.appveyor.com/project/Oneplus/pyltp/branch/master) [![PyPI Downloads](https://img.shields.io/pypi/dm/pyltp.svg)](https://pypi.python.org/pypi/pyltp) pyltp 是 [语言技术平台(Language Technology Platform, LTP)](https://github.com/HIT-SCIR/ltp)的 Python 封装。 在使用 pyltp 之前,您需要简要了解 [语言技术平台(LTP)](http://ltp.readthedocs.org/zh_CN/latest/) 能否帮助您解决问题。 **目前基于Pytorch的LTP4 已经发布,而PyLTP将会只有非常有限的维护,请大家移步使用**[LTP 4]([LTP 4](https://github.com/HIT-SCIR/ltp)) ## 依赖支持情况 Python 2.7, 3.x, and PyPy (PyPy2.7 >= 5.7) ## 一个简单的例子 下面是一个使用 pyltp 进行分词的例子 ```python # -*- coding: utf-8 -*- from pyltp import Segmentor segmentor = Segmentor("/path/to/your/cws/model") words = segmentor.segment("元芳你怎么看") print("|".join(words)) segmentor.release() ``` 除了分词之外,pyltp 还提供词性标注、命名实体识别、依存句法分析、语义角色标注等功能。 详细使用方法可以参考 [example](example/example.py) ## 安装 * 第一步,安装 pyltp 使用 pip 安装 ``` $ pip install pyltp ``` 或从源代码安装 ``` $ git clone https://github.com/HIT-SCIR/pyltp $ cd pyltp $ git submodule init $ git submodule update $ python setup.py install ``` + Mac系统出现版本问题使用 MACOSX_DEPLOYMENT_TARGET=10.7 python setup.py install + 编译时间较长(约5分钟左右),请耐心等待 * 第二步,下载模型文件 [七牛云](http://ltp.ai/download.html),当前模型版本 3.4.0 ## 制作安装包 ``` git submodule init git submodule update python setup.py bdist_wheel ``` ## 版本对应 * pyltp 版本:0.4.0 * LTP 版本:3.4.0 * 模型版本:3.4.0 ## 作者 * 冯云龙 << ylfeng@ir.hit.edu.cn >> 2020-7-30 重写代码,换用 Pybind11 * 徐梓翔 << zxxu@ir.hit.edu.cn >> 2015-01-20 解决跨平台运行问题 * 刘一佳 << yjliu@ir.hit.edu.cn >> 2014-06-12 重组项目 * HuangFJ << biohfj@gmail.com >> 本项目最初作者