# 基于端到端的声纹识别 **Repository Path**: TheInit/ge2-e ## Basic Information - **Project Name**: 基于端到端的声纹识别 - **Description**: 基于谷歌GE2E,数据集为VCTK的实现。 声纹识别也叫说话人识别。 本实验实现了TDSV,TISV - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 5 - **Forks**: 2 - **Created**: 2021-03-23 - **Last Updated**: 2025-02-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # GE2E #### 介绍 基于谷歌的广义端到端网络 因无法获取元数据集,故这里采用数据集VCTK来实现。 #### 软件架构 软件架构说明 #### 安装教程 环境包在requirements.txt中 #### 使用说明 1. configuration.py 常用参数的配置,是否训练,训练批次,说话人个数,每个说话人的话语数,LSTM网络结构参数 2. data_preprocess.py 输入数据集路径,提取FBank特征,并存储到指定文件夹中 3. main.py 主函数,运行该函数进行训练或者测试。参数在configuration.py中进行改变 4. model.py LSTM网络结构的定义 5. utils.py 工具类,包括损失函数计算,EER计算等功能 实验前先准备好数据集,然后在data_preprocess.py中配置好数据集路径进行特征提取;之后配置好configuration.py的参数,运行main.py即可 #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request