Speaker-Recognition 项目目的 根据43位同学的训练语音,识别测试语音的说话者,即“Speaker Recognition”。 数据准备 本项目数据在./data文件夹下,共43位同学的96条语音,文件名形如“201811580345-1-16K.wav”,“201811580345”是学号,“1”是第一条语音,“16K”是采样率 技术点 使用python+pytorch构建了三种模型,TDNN、LSTM、复合模型,识别效果越来越好。 项目环境 requirements.txt