# pangu_alpha
**Repository Path**: mindspore-lab/pangu_alpha
## Basic Information
- **Project Name**: pangu_alpha
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 1
- **Forks**: 0
- **Created**: 2023-01-17
- **Last Updated**: 2023-06-21
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 盘古alpha下游任务
## 一、Pangu-Alpha介绍
Pangu-Alpha由以鹏城实验室为首的技术团队联合攻关,首次基于“鹏城云脑Ⅱ”和国产MindSpore框架的自动混合并行模式实现在2048卡算力集群上的大规模分布式训练,训练出业界首个2000亿参数以中文为核心的预训练生成语言模型。鹏程·盘古α预训练模型支持丰富的场景应用,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出,具备很强的小样本学习能力。
## 二、运行环境
- mindspore >= 1.8.1
- python >= 3.7
- jieba >= 0.42.1
- sentencepiece >= 0.1.97
## 三、微调套件安装
套件采用云端本地统一架构, **提供一键微调、评估、推理、在线部署** 等能力,提供 **命令行** 和 **API接口** 两种调用形式,可支持大模型平台的建设与使用。
### 1.本地场景安装
```shell
pip install TuningKit/Ascend_mindxsdk_mxTuningKit-3.0.0-py3-none-any.whl
```
[软件下载](https://github.com/mindspore-lab/pangu_alpha/tree/master/mxTuningKit) 安装详细教程请参考[此文档](https://www.hiascend.com/document/detail/zh/mind-sdk/30rc3/mxtuningkit/tuningkitug/mxtuningug_0001.html)解决。
### 2.ModelArts(AICC场景)安装
```shell
pip install TuningKit/Ascend_mindxsdk_mxFoundationModel-1.0.1.RC2.b001-py3-none-any.whl
```
[软件下载](https://github.com/mindspore-lab/pangu_alpha/tree/master/mxTuningKit),安装过程遇到问题请参考[此文档](https://github.com/mindspore-lab/pangu_alpha/blob/master/mxTuningKit/%E5%BE%AE%E8%B0%83%E7%BB%84%E4%BB%B6(%E4%BA%91%E4%B8%8A%E5%9C%BA%E6%99%AF).md)解决。
## 四、支持下游任务
| 下游任务 | 任务类型 | 论文精度(pangu-2B6) | 复现精度(pangu-2B6) | 样本类型 |
|-----------------------------------------------------------------------------------| --------------------------- |------------------|-------------------|------------|
| [AFQMC](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/afqmc) | 文本相似度 | acc=64.62% | acc=68.9% | one-shot |
| [CMRC2017](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/cmrc2017) | 中文阅读理解(填空型阅读理解) | acc=38.00% | acc=37.5% | one-shot |
| [TNEWS](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/tnews) | 新闻短文本分类 | acc=57.95% | acc=60.18% | one-shot |
| [CMRC2018](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/cmrc2018) | 中文阅读理解(句子级填空型阅读理解) | Em/F1=1.21/16.65 | Em/F1=1.06/16.53 | zero-shot |
| [WebQA](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/webqa) | 中文问答 | Em/F1=24/33.94 | Em/F1=23.77/33.86 | few_shot |
| [IFLYTEK](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/iflytek) | 应用长文本分类 | acc=74.26% | acc=73.72% | zero-shot |
| [PD&CFT](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/pd_cft) | 中文阅读理解(填空型阅读理解) | PD: acc=58.05%
CFT: acc=42.39% | PD: acc=58.56%
CFT: acc=42.31% | zero-shot |
| [DUREADER](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/dureader) | 中文阅读理解(知识问答) | Rouge-l=21.07% | Rouge-l=28.98% | zero_shot |
| [CMRC2019](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/cmrc2019) | 中文阅读理解(片段抽取任务) | acc=67.89% | acc=67.93% | zero-shot |
| [CSL](https://github.com/mindspore-lab/pangu_alpha/tree/master/src/csl) | 论文关键词识别 | acc=50.9% | acc=52.1% | one-shot |
## 其他注意事项
目前下游任务微调支持8卡执行
评估和推理支持单卡、4卡和8卡执行