# 基于端到端的声纹识别

**Repository Path**: TheInit/ge2-e

## Basic Information

- **Project Name**: 基于端到端的声纹识别
- **Description**: 基于谷歌GE2E，数据集为VCTK的实现。
声纹识别也叫说话人识别。
本实验实现了TDSV，TISV
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 5
- **Forks**: 2
- **Created**: 2021-03-23
- **Last Updated**: 2025-02-23

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# GE2E

#### 介绍
基于谷歌的广义端到端网络
因无法获取元数据集，故这里采用数据集VCTK来实现。

#### 软件架构
软件架构说明


#### 安装教程

环境包在requirements.txt中

#### 使用说明

1.  configuration.py
    常用参数的配置，是否训练，训练批次，说话人个数，每个说话人的话语数，LSTM网络结构参数
2.  data_preprocess.py
    输入数据集路径，提取FBank特征，并存储到指定文件夹中
3.  main.py
    主函数，运行该函数进行训练或者测试。参数在configuration.py中进行改变
4.  model.py
    LSTM网络结构的定义
5.  utils.py
    工具类，包括损失函数计算，EER计算等功能

实验前先准备好数据集，然后在data_preprocess.py中配置好数据集路径进行特征提取；之后配置好configuration.py的参数，运行main.py即可


#### 参与贡献

1.  Fork 本仓库
2.  新建 Feat_xxx 分支
3.  提交代码
4.  新建 Pull Request