Skip to content

Latest commit

 

History

History
9 lines (9 loc) · 495 Bytes

README.md

File metadata and controls

9 lines (9 loc) · 495 Bytes

Speaker-Recognition

项目目的

根据43位同学的训练语音,识别测试语音的说话者,即“Speaker Recognition”。

数据准备

本项目数据在./data文件夹下,共43位同学的96条语音,文件名形如“201811580345-1-16K.wav”,“201811580345”是学号,“1”是第一条语音,“16K”是采样率

技术点

使用python+pytorch构建了三种模型,TDNN、LSTM、复合模型,识别效果越来越好。

项目环境

requirements.txt