想要支持更多数据集？在这里提建议,about babysor/mockingbird

Comments (40)

0we commented on September 7, 2024 7

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68)
需要更多请在这里提建议，并+1投票，将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

from mockingbird.

babysor commented on September 7, 2024 4

假如你下载的 aidatatang_200zh文件放在D盘，train文件路径为 D:\data\aidatatang_200zh\corpus\train , 你的datasets_root就是 D:\data\

from mockingbird.

XiuChen-Liu commented on September 7, 2024 3

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68)
需要更多请在这里提建议，并+1投票，将为大家补充支持

推薦標貝數據集

from mockingbird.

woct0rdho commented on September 7, 2024 3

给个思路，那些galgame都是几十万字的文本与语音对应的数据集

from mockingbird.

hertz-pj commented on September 7, 2024 2

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

from mockingbird.

XiuChen-Liu commented on September 7, 2024 2

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

from mockingbird.

XiuChen-Liu commented on September 7, 2024 2

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

好的，謝謝大佬的回覆，另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice

from mockingbird.

hertz-pj commented on September 7, 2024 1

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

from mockingbird.

ShouNichi commented on September 7, 2024 1

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

from mockingbird.

yfq512 commented on September 7, 2024

朋友，你是怎么跑起来的，我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了，这个datasets_root是指什么呢？

from mockingbird.

babysor commented on September 7, 2024

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

from mockingbird.

babysor commented on September 7, 2024

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

程序逻辑还没实现囧目前我是手动分开跑

from mockingbird.

loilih commented on September 7, 2024

aidatatang_200zh在哪里下载呢

from mockingbird.

loilih commented on September 7, 2024

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

谢谢

from mockingbird.

babysor commented on September 7, 2024

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68)
需要更多请在这里提建议，并+1投票，将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

#59 已支持aishell3，不过训练效果没增强

from mockingbird.

XiuChen-Liu commented on September 7, 2024

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

from mockingbird.

babysor commented on September 7, 2024

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

from mockingbird.

FawenYo commented on September 7, 2024

請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 CorentinJ/Real-Time-Voice-Cloning#819
檔案結構大致如圖

其中 clips 資料夾內容包含各項 xxx.mp3
希望日後能支持，謝謝

from mockingbird.

Zhiqing-Xu commented on September 7, 2024

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

from mockingbird.

babysor commented on September 7, 2024

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

录制的话，建议是5-10秒长度的大于等于16khz的音频，每个语音单一说话人，尽可能多的覆盖男女生、不同声色（不要单独分开训练，混一起效果好）。预处理的话也就是把音频去噪，切割满足上面这个需求。
你指下载下来的数据集吗？
私信的话，可以走邮件，或者扫这里的二维码： > >

from mockingbird.

Zhiqing-Xu commented on September 7, 2024

你的群二维码过期了，可以给个微信么，有一些细节还是想请教

…

On Mon, 6 Sept 2021 at 01:54, Vega ***@***.***> wrote: 老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么 1. 录制的话，建议是5-10秒长度的大于等于16khz的音频，每个语音单一说话人，尽可能多的覆盖男女生、不同声色（不要单独分开训练，混一起效果好）。预处理的话也就是把音频去噪，切割满足上面这个需求。 2. 你指下载下来的数据集吗？ 3. 私信的话，可以走邮件，或者扫这里的二维码： > > [image: WechatIMG54] <https://user-images.githubusercontent.com/7423248/130546423-5588bc46-af02-4eda-a122-f64d8f4b7627.jpeg> — You are receiving this because you commented. Reply to this email directly, view it on GitHub <#10 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/ALODQYY2IKTK5WWYPXGOSL3UARJPVANCNFSM5CG2ISUQ> . Triage notifications on the go with GitHub Mobile for iOS <https://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675> or Android <https://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub>.

from mockingbird.

babysor commented on September 7, 2024

#20 这里有新的二维码

from mockingbird.

babysor commented on September 7, 2024

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息，不过我访问不了

from mockingbird.

ShouNichi commented on September 7, 2024

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息，不过我访问不了

是指数据集不能访问吗？如果是百度云不能访问的话我这边可以转mega或者GD
链接: https://pan.baidu.com/s/16er-ubcLljayQM7ucd238Q 提取码: dwet

-----------------更新---------------------

访问不了是链接不知怎的最后多了个z，删掉就行了
https://github.com/fighting41love/zhvoice
写了貌似可以直接用于zhrtvc，同一个分支出来的
https://github.com/xingmegshuo/zhrtvc
突然发现上面已经有人推荐过了...

from mockingbird.

Charlottecuc commented on September 7, 2024

@babysor 二维码过期了，求重发一个～

from mockingbird.

babysor commented on September 7, 2024

@Charlottecuc

from mockingbird.

LxKxC commented on September 7, 2024

群满了，加不进去，求作者微信号

from mockingbird.

kslz commented on September 7, 2024

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

from mockingbird.

babysor commented on September 7, 2024

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

理论可行，可以联系我讨论

from mockingbird.

kslz commented on September 7, 2024

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

理论可行，可以联系我讨论

你好已发到你的gmail里 [email protected] 上面的二维码过期了

from mockingbird.

lcp580 commented on September 7, 2024

新增标贝数据支持BZNSYP
MozillaCommonVoice
以上两个数据集支持在最新的主版本中没有看到？难道还没能合并进来吗？

from mockingbird.

babysor commented on September 7, 2024

BZNSYP

都在分支上， #75

from mockingbird.

ycMia commented on September 7, 2024

给个思路，那些galgame都是几十万字的文本与语音对应的数据集

牵涉版权问题哦 🌱

from mockingbird.

joshua54321 commented on September 7, 2024

3. 话，可以走邮件，或者扫这里的二维码： > >

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

程序逻辑还没实现囧目前我是手动分开跑

作者您好，请问现在支持自动跑多个数据集了吗？如果手动分开跑，是如何操作的呢？

from mockingbird.

babysor commented on September 7, 2024

话，可以走邮件，或者扫这里的二维码： > >

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

程序逻辑还没实现囧目前我是手动分开跑

作者您好，请问现在支持自动跑多个数据集了吗？如果手动分开跑，是如何操作的呢？

可以， https://zhuanlan.zhihu.com/p/417134499 分开跑比较麻烦，因为混合起来就不太能区分了

from mockingbird.

l-i-p-f commented on September 7, 2024

请问有粤语数据集吗？

from mockingbird.

ZeroAurora commented on September 7, 2024

https://www.openslr.org/18/
THCHS-30 数据集，体量较小，想拿来练手用

from mockingbird.

babysor commented on September 7, 2024

https://www.openslr.org/18/ THCHS-30 数据集，体量较小，想拿来练手用

最好确保有100hrs级别的语音

from mockingbird.

123qq679 commented on September 7, 2024

C:\Users\Administrator\Desktop\mockingbird\MockingBird-main>python pre.py D:\ -d data_aishell3
Traceback (most recent call last):
File "C:\Users\Administrator\Desktop\mockingbird\MockingBird-main\pre.py", line 55, in
assert args.dataset in recognized_datasets, 'is not supported, please vote for it in #10'
AssertionError: is not supported, please vote for it in #10
大佬，这是怎么回事？

from mockingbird.

1044690543 commented on September 7, 2024

@Charlottecuc

求进群

from mockingbird.

想要支持更多数据集？在这里提建议 about mockingbird HOT 40 OPEN

Comments (40)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent