@Samuelcoding
Pasca 暂无简介
使用预训练语言模型BERT做中文NER尝试,fine - tune BERT模型
pylucene使用
中文文本相似性算法
任务一:基于机器学习的文本分类 任务二:基于深度学习的文本分类 任务三:基于注意力机制的文本匹配 任务四:基于LSTM+CRF的序列标注 任务五:基于神经网络的语言模型
nltk下载解决
NLTK包下载失败解决办法
西湖大学在EMNLP2019上提出了一个中文text-to-sql的数据集CSpider,主要是选择Spider作为源数据集进行了问题的翻译,并利用SyntaxSQLNet作为基线系统进行了测试,同时探索了在中文上产生的一些额外的挑战,包括中文问题对英文数据库的对应问题(question-to-DBmapping)、中文的分词问题以及一些其他的语言现象。 挑战赛链接:https://taolusi.github.io/CSpider-explorer/
本资源提供gitchat上《中文自然语言处理入门实战》实战的语料数据集合代码资源
《 Python 自然语言处理 中文第二版 》jupyter版笔记