-
Notifications
You must be signed in to change notification settings - Fork 182
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
模型训练loss变化是什么样的? #50
Comments
hi @shihuai , could you please share the training scripts.. it would be very helpful for us to reproduce the model for indian languages? |
一样,loss快速从8.x降到3.x |
找到bug了,是我的target_units设置有问题,默认用0来pad了,应该用-100 |
|
又找到bug了 |
还是不行,推理出来基本都是blank,好怪 |
你说的这些情况我们也遇到过,后面是通过手动将attention mask扩展到4维。不过我们还没有做过推理,情况应该也会很差。 |
ctc_upsample_factort,针对你的数据集调小点试一下 |
这部分也是调整过的,现在我们音频离散化的模型1s是50个token,ctc_upsample_factor现在减少到了12,loss会比之前低,但降了一点后基本就是在震荡了。 |
现在不知道是不是受模型初始化部分影响,后面再试着改一下这部分。 |
我目前也在复现这篇论文的模型架构和训练但是目前遇到一定的问题,能否大家建立一个微信群讨论一下? |
下面的issue已经有人拉群了。 |
感谢分享经验,请教一下:
|
我在100条数据上训练,收敛到2,生成的语音速度很快,中间有不清楚的地方。想问下你们能在训练集上拟合吗 |
可以进这个群讨论,不少人复现成功:#46 |
请问第一阶段你的loss到多少了?我一直无法复现第一阶段的效果 |
感谢你们把这么好的工作开源。最近我们的尝试在复现模型的效果,模型一阶段训练loss收敛还可以,但模型二阶段训练过程中loss从12下降到3.0左右,就无法在降低了。所以想问一下,你们当时训练的时候,两个训练阶段的loss是如何变化的,训练过程中有什么需要注意的地方吗?
The text was updated successfully, but these errors were encountered: