# mRNA_II **Repository Path**: wang567/mRNA_II ## Basic Information - **Project Name**: mRNA_II - **Description**: Kaggle竞赛:新冠mRNA疫苗降解预测 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2022-04-09 - **Last Updated**: 2025-04-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: mRNA疫苗, 图神经网络, GNN ## README # mRNA_II (mRNA 2.0) #### 介绍 Kaggle competition: COVID-19 mRNA Vaccine Degradation Prediction Kaggle竞赛:新冠mRNA疫苗降解预测 #### 模型架构 - checkpoints: 保存模型训练权重的文件夹;已保存训练好的权重,使用者可自行训练保存 - data: 包含数据预处理的类和函数 - dataset: 保存的是数据集;训练集和验证集有真实标签,但测试集没有 - layers: 包含三种模型的layer定义:GCN、GAT、GatedGCN - log: 保存log信息的文件夹;已保存训练过的信息,保存时文件名称会命名为当前时间 - nets: 包含三种模型的net定义:GCN、GAT、GatedGCN - plat: 包含各种画图函数和类,可以对原数据画图展示 - test: 包含测试文件,通过读取checkpoints中保存的训练权重,对测试集中数据进行测试 - train: 包含训练函数和评价指标函数 - Config.py: 模型的参数设置文件 - main.py: 主函数 #### 使用准备 - dgl>=0.4.2 1. Anaconda (版本最好不要太旧) 2. torch==1.6.0; torch_vision==0.7.0 及相关的包 (或者更高版本,可自行调试) 4. logging; pandas; spicy; networkx (版本自行调试) 5. 其他相关的包,可自行调试判断 #### 使用说明 - 本代码仅供学习和学术研究下载 1. 安装指定的包 2. 克隆后将文件夹变为Sources Root类型 3. 使用Config.py对模型进行设置 4. 运行main.py,调试并训练 5. 使用plat文件中的函数对训练过程进行查看 6. 使用test文件中的read_checkpoint.py对训练效果查看 #### 最优参数 - 模型名称: `GatedGCN` - 使用碱基对: `True` - 使用密码子: `True` - 使用循环类型: `True` - 使用位置编码: `False` 位置编码维度: `8` - init_lr: `0.001` weight_decay: `0.0001` - num_epoch: `100` batch_size: `16` - 使用损失函数类型: `MCRMSE` 最优参数训练和验证损失变化
#### 参与贡献 Wang567