训练说话模型而非唱歌的问题

Question

<p dir="auto">近期尝试用sovits训练说话人模型，训练数据是中文，目标声音是英文，发现在句子结束的时候声音会上扬，不知道是怎么回事。推断是底模的作用，底模主要是唱歌，所以模仿的时候会按

ShadowLoveElysia · Answer

best.pt是没有的，一般看mel图，如果real和fake几乎一致就代表差不多了

ShadowLoveElysia · Answer

<p dir="auto">voice是给朗读音频用的，如果你不在意rmvpe的音质比crepe差一点点的事实，你确实可以使用rmvpe进行推理，即使是crepe出来的模型也可以使用rmvpe进行推理

ShadowLoveElysia · Answer

记得改pitch 如果是歌曲就不用，句子要改

ShadowLoveElysia · Answer

或者你可以折腾一下我适配的largev3和rmvpe
不过largev3练出来的模型可能底噪多点

ILG2021 · Answer

记得改pitch 如果是歌曲就不用，句子要改

谢谢回复。改pitch？我训练的干声

ShadowLoveElysia · Answer

不影响但pitch需要改，rmvpe倒是不需要，你或许看可以看看我的fork

Taiwan1912 · Answer

或者你可以折腾一下我适配的largev3和rmvpe 不过largev3练出来的模型可能底噪多点

ShadowLoveElysia · Answer

或者你可以折腾一下我适配的largev3和rmvpe 不过largev3练出来的模型可能底噪多点

ILG2021 · Answer

看起来有希望，能搞个模式开关吗？唱歌的和说话的。你这边对pitch的处理和原作有什么区别？

ShadowLoveElysia · Answer

你可以修改pitch内容，crepe需要修改pitch/inferencecrepe.py的132行代码，
sing改成voice或者slow，slow在原库中有，

ShadowLoveElysia · Answer

rmvpe不需要这个步骤

ILG2021 · Answer

你可以修改pitch内容，crepe需要修改pitch/inferencecrepe.py的132行代码， sing改成voice或者slow，s

ILG2021 · Answer

<p dir="auto">大佬，可以指导下 <a href="https://github.com/PlayVoice/so-vits-svc-5.0/issues/180" data-hoverc

ShadowLoveElysia · Answer

失真问题至少我没遇到过，可能是特定歌曲影响

ILG2021 · Answer

尝试了一下compute_f0_voice，尾音上扬依然存在，使用compute_f0_mouth解决。失真的问题在音频比较长的时候比较容易出现。我用的是5.0原版

ILG2021 · Answer

voice是给朗读音频用的，如果你不在意rmvpe的音质比crepe差一点点的事实，你确实可以使用rmvpe进行推理，即使是crepe出来的模型也

训练说话模型而非唱歌的问题 about so-vits-svc-5.0 HOT 16 CLOSED