Comments (16)
best.pt是没有的,一般看mel图,如果real和fake几乎一致就代表差不多了
from so-vits-svc-5.0.
voice是给朗读音频用的,如果你不在意rmvpe的音质比crepe差一点点的事实,你确实可以使用rmvpe进行推理,即使是crepe出来的模型也可以使用rmvpe进行推理,如果还是有问题建议重新训练
from so-vits-svc-5.0.
记得改pitch 如果是歌曲就不用,句子要改
from so-vits-svc-5.0.
或者你可以折腾一下我适配的largev3和rmvpe
不过largev3练出来的模型可能底噪多点
from so-vits-svc-5.0.
记得改pitch 如果是歌曲就不用,句子要改
谢谢回复。改pitch?我训练的干声没有唱歌的。
from so-vits-svc-5.0.
不影响 但pitch需要改,rmvpe倒是不需要,你或许看可以看看我的fork
from so-vits-svc-5.0.
或者你可以折腾一下我适配的largev3和rmvpe 不过largev3练出来的模型可能底噪多点
試用了一下對於多版本拼接的使用者很方便,整合了Rmver、Crepe推理
另外如果把whisper-vits-svc-bigvgan-mix-v2的svc_train_retrieval、svc_inference
丟進去so-vits-svc-5.0-LargeV3-MiX3
然後先跑一次python svc_inferencermvpev3.py 推理
就能使用svc_inference指令去跑特徵檢索
變成一個版本能跑三種版本的語音做拼接
Crepe、Rmvpe、特徵檢索
from so-vits-svc-5.0.
或者你可以折腾一下我适配的largev3和rmvpe 不过largev3练出来的模型可能底噪多点
試用了一下對於多版本拼接的使用者很方便,整合了Rmver、Crepe推理
另外如果把whisper-vits-svc-bigvgan-mix-v2的svc_train_retrieval、svc_inference
丟進去so-vits-svc-5.0-LargeV3-MiX3
然後先跑一次python svc_inferencermvpev3.py 推理
就能使用svc_inference指令去跑特徵檢索
變成一個版本能跑三種版本的語音做拼接
Crepe、Rmvpe、特徵檢索
我有时间搞一下
from so-vits-svc-5.0.
看起来有希望,能搞个模式开关吗?唱歌的和说话的。你这边对pitch的处理和原作有什么区别?
from so-vits-svc-5.0.
你可以修改pitch内容,crepe需要修改pitch/inferencecrepe.py的132行代码,
sing改成voice或者slow,slow在原库中有,我去除了,如果你想用slow跑我的fork,你可以复制相关代码粘贴到我的fork项目包里
from so-vits-svc-5.0.
rmvpe不需要这个步骤
from so-vits-svc-5.0.
你可以修改pitch内容,crepe需要修改pitch/inferencecrepe.py的132行代码, sing改成voice或者slow,slow在原库中有,我去除了,如果你想用slow跑我的fork,你可以复制相关代码粘贴到我的fork项目包里
非常感谢。
from so-vits-svc-5.0.
大佬,可以指导下 issue 180 issue 179吗?
from so-vits-svc-5.0.
失真问题至少我没遇到过,可能是特定歌曲影响
from so-vits-svc-5.0.
尝试了一下compute_f0_voice,尾音上扬依然存在,使用compute_f0_mouth解决。失真的问题在音频比较长的时候比较容易出现。我用的是5.0原版
from so-vits-svc-5.0.
voice是给朗读音频用的,如果你不在意rmvpe的音质比crepe差一点点的事实,你确实可以使用rmvpe进行推理,即使是crepe出来的模型也可以使用rmvpe进行推理,如果还是有问题建议重新训练
通过看其他issues,我替换rmvpe之后解决了失真问题。感谢回复
from so-vits-svc-5.0.
Related Issues (20)
- About Numpy Version
- Error but show nothing(error). HOT 2
- 推理是是否需要用分离后的人声部分进行推理 HOT 1
- 推理速度如何加快,CPU
- 5分多钟的歌,生成出来只有2分钟左右,这个是什么原因,我使用的是space中的代码 HOT 2
- Pre-training model dataset questions in SO-VITS-SVC 5.0 HOT 1
- 现在需要男歌手翻唱女声的歌曲,使用的是singer0008,因为软件没有变调功能,出来的效果不太行 HOT 2
- 模型训练之后没有best.pt,能否改进?
- 奇怪的问题,GPU推理声音有部分失真,cpu推理正常 HOT 1
- UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weig ht_norm. HOT 3
- 训练的时候GPU利用率较低
- where the Timbre Encode come from? HOT 2
- 怎么把whisper替换掉啊???可以把whisper替换为fast-whisper嘛,为什么替换掉whisper就可以实时语音转换了
- 关于版权方面 HOT 2
- Missing data perturbation code in Data preprocessing. HOT 1
- 如何推理能产出48k的音频?
- 混合说话人参数时仅输出.spk.npy,没有输出模型,混合后的说话人参数怎么用?
- sovits好像会抑制高频数据,导致输出的结果平平的,有没有参数可以调节,达到还原度最高?
- 想修改模型架构为输出48k,不知道训练底模需要成本是多少?作者是用A100 80G训练的吗?7天 80 batch_size HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from so-vits-svc-5.0.