# NLP_From_Zero_to_One

**Repository Path**: lduml/NLP_From_Zero_to_One

## Basic Information

- **Project Name**: NLP_From_Zero_to_One
- **Description**: https://github.com/jiangzhongkai/NLP_From_Zero_to_One
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2020-07-23
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

## 主要是使用当下比较流行的深度学习框架进行NLP简单代码的编写

| 模型              | 论文地址         |  代码复现地址       |   时间       |
| :----------------:   | :---------------:  | :--------------: | :------------:|
| 词袋模型        |      [论文地址](http://www.baidu.com)      |       [代码](http://www.baidu.com)    |2003    |
| Word2Vec           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| GloVe           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| NNLM           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| TextCNN           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| TextRCNN           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| Seq2Seq           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| Seq2Seq+Attention           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| Transformer           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| Bert           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| FastText           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| BiLSTM+Attention           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| Attention+LSTM_FCN           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |
| HAN           | [论文地址](http://www.baidu.com)         |   [代码](http://www.baidu.com)       |2006     |


## 主流框架：

      1.tensorflow1.8.0  ---谷歌开源深度学习框架
      2.keras
      3.pytorch      ---Facebook开源的深度学习框架

## 使用的第三方库：

     1.tensorflow
     2.numpy,sklearn,pandas,matplotlib
     3.keras
## 数据集：
   *[数据集：搜狗实验室的数据集](https://www.sogou.com/labs/resource/cs.php)
   
## 主要通过以下模型学习nlp:

### 1.NNLM  --2003

  *[参考论文:A neural probabilistic language model](http://www.pengjingtian.com/2016/09/17/nnlm/)\
  *[实现代码](https://github.com/jiangzhongkai/NLP_From_Zero_to_One/tree/master/NNLM)\
  ![image](images/nnlm.png)

### 2.Word2Vec 
------
    1.CBOW
    2.skip-grams

### 3.FastText  --2016
-----
  *[参考论文:]\
  *[实现代码](https://github.com/jiangzhongkai/NLP_From_Zero_to_One/tree/master/FastText)\
  *分级softmax![image](images/H-softmax.jpg)\
  *FatText内部结构![image](images/fasttext.jpg)\
  *FastText网络结构![image](images/fasttext_model.jpg)
    

### 4.TextCNN   --2014 

  *[参考论文：Convolutional Neural Networks for Sentence Classification](https://arxiv.org/abs/1408.5882)\
  *[实现代码](https://github.com/jiangzhongkai/NLP_From_Zero_to_One/tree/master/TextCNN)\
  ![image](images/textCNN.jpg)
  
### 5.TextRNN


### 6.TextRCNN

  - [参考论文:recurrent convolutional neural networks for text classification](https://www.aaai.org/ocs/index.php/AAAI/AAAI15/paper/view/9745/9552)
  - [实现代码]
  - ![image](images/TextRCNN.jpg)
  

### 7.TextLSTM


### 8.BiLSTM


### 9.BiLSTM+Attention


### 10.Seq2Seq


### 11.Seq2Seq+Attention


### 12.Transformer

 - The Transformer - model architecture![image](images/transformer.jpg)
 - (left) Scaled Dot-Product Attention. (right) Multi-Head Attention consists of several attention layers running in parallel![image](images/tr_dot.jpg)
### 13.BERT 

### 14.HAN(分层注意力网络)
     

## 每个py文件主要是包含：
   - 数据预处理
   - 模型搭建
   - 模型训练
   - 模型保存

## 持续更新中，欢迎fork和关注

## 参考资料
   - [Attention原理和源码解析](https://zhuanlan.zhihu.com/p/43493999)
   - [Attention is All You Need](https://arxiv.org/pdf/1706.03762.pdf)
   - [Seq2Seq+Attention](https://zhuanlan.zhihu.com/p/40920384)
   - [Transformer详解](https://zhuanlan.zhihu.com/p/44121378)
   - [BERT详解](https://zhuanlan.zhihu.com/p/46652512)
   - [BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding](https://arxiv.org/abs/1810.04805)
   - [Attention机制原理解析、模型分类以及应用](https://zhuanlan.zhihu.com/p/31547842)
   - [tensorflow实现RNN+Attention](https://github.com/jiangzhongkai/tf-rnn-attention)
   - [Hierarchical Attention Networks for Document Classification(HAN)](http://www.aclweb.org/anthology/N16-1174)
   - [GloVe论文](https://nlp.stanford.edu/pubs/glove.pdf)
   - [Glove代码实现](https://github.com/maciejkula/glove-python/blob/master/glove/glove.py)