任务一:基于机器学习的文本分类 任务二:基于深度学习的文本分类 任务三:基于注意力机制的文本匹配 任务四:基于LSTM+CRF的序列标注 任务五:基于神经网络的语言模型
最近更新: 5年多前西湖大学在EMNLP2019上提出了一个中文text-to-sql的数据集CSpider,主要是选择Spider作为源数据集进行了问题的翻译,并利用SyntaxSQLNet作为基线系统进行了测试,同时探索了在中文上产生的一些额外的挑战,包括中文问题对英文数据库的对应问题(question-to-DBmapping)、中文的分词问题以及一些其他的语言现象。 挑战赛链接:https://taolusi.github.io/CSpider-explorer/
最近更新: 5年多前HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
最近更新: 5年多前