# mRNA_II
**Repository Path**: wang567/mRNA_II
## Basic Information
- **Project Name**: mRNA_II
- **Description**: Kaggle竞赛:新冠mRNA疫苗降解预测
- **Primary Language**: Python
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 2
- **Forks**: 0
- **Created**: 2022-04-09
- **Last Updated**: 2025-04-07
## Categories & Tags
**Categories**: Uncategorized
**Tags**: mRNA疫苗, 图神经网络, GNN
## README
# mRNA_II (mRNA 2.0)
#### 介绍
Kaggle competition: COVID-19 mRNA Vaccine Degradation Prediction
Kaggle竞赛:新冠mRNA疫苗降解预测
#### 模型架构
- checkpoints: 保存模型训练权重的文件夹;已保存训练好的权重,使用者可自行训练保存
- data: 包含数据预处理的类和函数
- dataset: 保存的是数据集;训练集和验证集有真实标签,但测试集没有
- layers: 包含三种模型的layer定义:GCN、GAT、GatedGCN
- log: 保存log信息的文件夹;已保存训练过的信息,保存时文件名称会命名为当前时间
- nets: 包含三种模型的net定义:GCN、GAT、GatedGCN
- plat: 包含各种画图函数和类,可以对原数据画图展示
- test: 包含测试文件,通过读取checkpoints中保存的训练权重,对测试集中数据进行测试
- train: 包含训练函数和评价指标函数
- Config.py: 模型的参数设置文件
- main.py: 主函数
#### 使用准备
- dgl>=0.4.2
1. Anaconda (版本最好不要太旧)
2. torch==1.6.0; torch_vision==0.7.0 及相关的包 (或者更高版本,可自行调试)
4. logging; pandas; spicy; networkx (版本自行调试)
5. 其他相关的包,可自行调试判断
#### 使用说明
- 本代码仅供学习和学术研究下载
1. 安装指定的包
2. 克隆后将文件夹变为Sources Root类型
3. 使用Config.py对模型进行设置
4. 运行main.py,调试并训练
5. 使用plat文件中的函数对训练过程进行查看
6. 使用test文件中的read_checkpoint.py对训练效果查看
#### 最优参数
- 模型名称: `GatedGCN`
- 使用碱基对: `True`
- 使用密码子: `True`
- 使用循环类型: `True`
- 使用位置编码: `False` 位置编码维度: `8`
- init_lr: `0.001` weight_decay: `0.0001`
- num_epoch: `100` batch_size: `16`
- 使用损失函数类型: `MCRMSE`

#### 参与贡献
Wang567