DL_project:TAU DL课程的项目 源码
一口气说话人识别 这是以下代码的源代码:“一口气说话人识别:您需要一个好的指标吗?” 我们在TAU深度学习2021课程的最终项目中撰写的论文。 数据 为了训练或测试我们的模型,您必须从LibriSpeech项目中下载用于训练目的的,以及和。 Wav2vec重量 我们使用了来自fairseq存储库的预训练的wav2vec网络。 在开始使用我们的源代码之前,请确保下载 。 数据预处理 首先,创建一个名为-'cut_train_data_360_full_repr'的新文件夹。为了在几秒钟内将音频文件剪切为“长度”,请运行以下命令: python data_preprocessing / create_dataset.py {LibriSpeech_data_folder} {cut_train_data_360_full_repr}长度 CLI命令中的“长度”应替换为您要剪切数据的时间量(窗
下载地址
用户评论