Giter Site home page Giter Site logo

Comments (40)

0we avatar 0we commented on September 7, 2024 7

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

from mockingbird.

babysor avatar babysor commented on September 7, 2024 4

假如你下载的 aidatatang_200zh文件放在D盘,train文件路径为 D:\data\aidatatang_200zh\corpus\train , 你的datasets_root就是 D:\data\

from mockingbird.

XiuChen-Liu avatar XiuChen-Liu commented on September 7, 2024 3

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持

推薦標貝數據集

from mockingbird.

woct0rdho avatar woct0rdho commented on September 7, 2024 3

给个思路,那些galgame都是几十万字的文本与语音对应的数据集

from mockingbird.

hertz-pj avatar hertz-pj commented on September 7, 2024 2

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

from mockingbird.

XiuChen-Liu avatar XiuChen-Liu commented on September 7, 2024 2

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

from mockingbird.

XiuChen-Liu avatar XiuChen-Liu commented on September 7, 2024 2

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

好的,謝謝大佬的回覆,另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice

from mockingbird.

hertz-pj avatar hertz-pj commented on September 7, 2024 1

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

from mockingbird.

ShouNichi avatar ShouNichi commented on September 7, 2024 1

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

from mockingbird.

yfq512 avatar yfq512 commented on September 7, 2024

朋友,你是怎么跑起来的,我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了,这个datasets_root是指什么呢?

from mockingbird.

babysor avatar babysor commented on September 7, 2024

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

from mockingbird.

babysor avatar babysor commented on September 7, 2024

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

程序逻辑还没实现 囧 目前我是手动分开跑

from mockingbird.

loilih avatar loilih commented on September 7, 2024

aidatatang_200zh在哪里下载呢

from mockingbird.

loilih avatar loilih commented on September 7, 2024

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

谢谢

from mockingbird.

babysor avatar babysor commented on September 7, 2024

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

#59 已支持aishell3,不过训练效果没增强

from mockingbird.

XiuChen-Liu avatar XiuChen-Liu commented on September 7, 2024

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

from mockingbird.

babysor avatar babysor commented on September 7, 2024

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

from mockingbird.

FawenYo avatar FawenYo commented on September 7, 2024

請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 CorentinJ/Real-Time-Voice-Cloning#819
檔案結構大致如圖
image
其中 clips 資料夾內容包含各項 xxx.mp3
希望日後能支持,謝謝

from mockingbird.

Zhiqing-Xu avatar Zhiqing-Xu commented on September 7, 2024

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

from mockingbird.

babysor avatar babysor commented on September 7, 2024

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

  1. 录制的话,建议是5-10秒长度的大于等于16khz的音频,每个语音单一说话人,尽可能多的覆盖男女生、不同声色(不要单独分开训练,混一起效果好)。预处理的话也就是把音频去噪,切割满足上面这个需求。
  2. 你指下载下来的数据集吗?
  3. 私信的话,可以走邮件,或者扫这里的二维码: > > WechatIMG54

from mockingbird.

Zhiqing-Xu avatar Zhiqing-Xu commented on September 7, 2024

from mockingbird.

babysor avatar babysor commented on September 7, 2024

#20 这里有新的二维码

from mockingbird.

babysor avatar babysor commented on September 7, 2024

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息,不过我访问不了

from mockingbird.

ShouNichi avatar ShouNichi commented on September 7, 2024

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息,不过我访问不了

是指数据集不能访问吗?如果是百度云不能访问的话我这边可以转mega或者GD
链接: https://pan.baidu.com/s/16er-ubcLljayQM7ucd238Q 提取码: dwet

-----------------更新---------------------

访问不了是链接不知怎的最后多了个z,删掉就行了
https://github.com/fighting41love/zhvoice
写了貌似可以直接用于zhrtvc,同一个分支出来的
https://github.com/xingmegshuo/zhrtvc
突然发现上面已经有人推荐过了...

from mockingbird.

Charlottecuc avatar Charlottecuc commented on September 7, 2024

@babysor 二维码过期了,求重发一个~

from mockingbird.

babysor avatar babysor commented on September 7, 2024

cb0f71d680c3b7d6c2aca6fce1a220d

@Charlottecuc

from mockingbird.

LxKxC avatar LxKxC commented on September 7, 2024

群满了,加不进去,求作者微信号

from mockingbird.

kslz avatar kslz commented on September 7, 2024

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

from mockingbird.

babysor avatar babysor commented on September 7, 2024

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

理论可行,可以联系我讨论

from mockingbird.

kslz avatar kslz commented on September 7, 2024

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

理论可行,可以联系我讨论

你好 已发到你的gmail里 [email protected] 上面的二维码过期了

from mockingbird.

lcp580 avatar lcp580 commented on September 7, 2024

新增标贝数据支持BZNSYP
MozillaCommonVoice
以上两个数据集支持在最新的主版本中没有看到?难道还没能合并进来吗?

from mockingbird.

babysor avatar babysor commented on September 7, 2024

BZNSYP

都在分支上, #75

from mockingbird.

ycMia avatar ycMia commented on September 7, 2024

给个思路,那些galgame都是几十万字的文本与语音对应的数据集

牵涉版权问题哦 🌱

from mockingbird.

joshua54321 avatar joshua54321 commented on September 7, 2024

3. 话,可以走邮件,或者扫这里的二维码: > >

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

程序逻辑还没实现 囧 目前我是手动分开跑

作者您好,请问现在支持自动跑多个数据集了吗?如果手动分开跑,是如何操作的呢?

from mockingbird.

babysor avatar babysor commented on September 7, 2024
  1. 话,可以走邮件,或者扫这里的二维码: > >

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

程序逻辑还没实现 囧 目前我是手动分开跑

作者您好,请问现在支持自动跑多个数据集了吗?如果手动分开跑,是如何操作的呢?

可以, https://zhuanlan.zhihu.com/p/417134499 分开跑比较麻烦,因为混合起来就不太能区分了

from mockingbird.

l-i-p-f avatar l-i-p-f commented on September 7, 2024

请问有粤语数据集吗?

from mockingbird.

ZeroAurora avatar ZeroAurora commented on September 7, 2024

https://www.openslr.org/18/
THCHS-30 数据集,体量较小,想拿来练手用

from mockingbird.

babysor avatar babysor commented on September 7, 2024

https://www.openslr.org/18/ THCHS-30 数据集,体量较小,想拿来练手用

最好确保有100hrs级别的语音

from mockingbird.

123qq679 avatar 123qq679 commented on September 7, 2024

C:\Users\Administrator\Desktop\mockingbird\MockingBird-main>python pre.py D:\ -d data_aishell3
Traceback (most recent call last):
File "C:\Users\Administrator\Desktop\mockingbird\MockingBird-main\pre.py", line 55, in
assert args.dataset in recognized_datasets, 'is not supported, please vote for it in #10'
AssertionError: is not supported, please vote for it in #10
大佬,这是怎么回事?

from mockingbird.

1044690543 avatar 1044690543 commented on September 7, 2024

cb0f71d680c3b7d6c2aca6fce1a220d

@Charlottecuc

求进群

from mockingbird.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.