这是一个用于 ChatTTS 的Web UI界面项目,提供网页中使用 ChatTTS 合成语音的功能,并支持api接口调用. Releases中可下载Windows整合包。
界面预览
试听合成语音效果
buzaihu.mp4
- 从 Releases中下载压缩包,解压后双击 app.exe 即可使用
-
配置好 python3.9+环境
-
创建空目录
/data/chattts
执行命令cd /data/chattts && git clone https://github.com/jianchang512/chatTTS-ui .
-
创建虚拟环境
python3 -m venv venv
-
激活虚拟环境
source ./venv/bin/activate
-
安装依赖
pip3 install -r requirements.txt
-
如果不需要CUDA加速,执行
pip3 install torch torchaudio
如果需要CUDA加速,执行
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118 pip install nvidia-cublas-cu11 nvidia-cudnn-cu11
另需安装 CUDA11.8+ ToolKit,请自行搜索安装方法 或参考 https://juejin.cn/post/7318704408727519270
-
执行
python3 app.py
启动,将自动打开浏览器窗口,默认地址http://127.0.0.1:9966
-
配置好 python3.9+环境,安装git ,执行命令
brew install git [email protected]
继续执行export PATH="/usr/local/opt/[email protected]/bin:$PATH" source ~/.bash_profile source ~/.zshrc
-
创建空目录
/data/chattts
执行命令cd /data/chattts && git clone https://github.com/jianchang512/chatTTS-ui .
-
创建虚拟环境
python3 -m venv venv
-
激活虚拟环境
source ./venv/bin/activate
-
安装依赖
pip3 install -r requirements.txt
-
安装torch
pip3 install torch torchaudio
-
执行
python3 app.py
启动,将自动打开浏览器窗口,默认地址http://127.0.0.1:9966
-
Macos下可能会到一些问题,请查看 常见问题与报错解决方法
-
下载python3.9+,安装时注意选中
Add Python to environment variables
-
下载并安装git,https://github.com/git-for-windows/git/releases/download/v2.45.1.windows.1/Git-2.45.1-64-bit.exe
-
创建空文件夹
D:/chattts
并进入,地址栏输入cmd
回车,在弹出的cmd窗口中执行命令git clone https://github.com/jianchang512/chatTTS-ui .
-
创建虚拟环境,执行命令
python -m venv venv
-
激活虚拟环境,执行
.\venv\scripts\activate
-
安装依赖,执行
pip install -r requirements.txt
-
如果不需要CUDA加速,执行
pip install torch torchaudio
如果需要CUDA加速,执行
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118
另需安装 CUDA11.8+ ToolKit,请自行搜索安装方法或参考 https://juejin.cn/post/7318704408727519270
-
执行
python app.py
启动,将自动打开浏览器窗口,默认地址http://127.0.0.1:9966
-
源码部署启动后,会先从 modelscope下载模型,但modelscope缺少spk_stat.pt,会报错,请点击链接 https://huggingface.co/2Noise/ChatTTS/blob/main/asset/spk_stat.pt 下载 spk_stat.pt,将该文件复制到
项目目录/models/pzc163/chatTTS/asset/ 文件夹内
-
注意 modelscope 仅允许**大陆ip下载模型,如果遇到 proxy 类错误,请关闭代理。如果你希望从 huggingface.co 下载模型,请打开
app.py
查看大约第50行-60行的注释。
# 默认从 modelscope 下载模型,如果想从huggingface下载模型,请将以下3行注释掉
CHATTTS_DIR = snapshot_download('pzc163/chatTTS',cache_dir=MODEL_DIR)
chat = ChatTTS.Chat()
chat.load_models(source="local",local_path=CHATTTS_DIR)
# 如果希望从 huggingface.co下载模型,将以下注释删掉。将上方3行内容注释掉
#os.environ['HF_HUB_CACHE']=MODEL_DIR
#os.environ['HF_ASSETS_CACHE']=MODEL_DIR
#chat = ChatTTS.Chat()
#chat.load_models()
默认地址是 http://127.0.0.1:9966
,如果想修改,可打开目录下的 .env
文件,将 WEB_ADDRESS=127.0.0.1:9966
改为合适的ip和端口,比如修改为WEB_ADDRESS=192.168.0.10:9966
以便局域网可访问
请求方法: POST
请求地址: http://127.0.0.1:9966/tts
请求参数:
text: str 必须, 要合成语音的文字
voice: int 可选,默认 2222, 决定音色的数字, 2222 | 7869 | 6653 | 4099 | 5099,可选其一,或者任意传入将随机使用音色
prompt: str 可选,默认 空, 设定 笑声、停顿,例如 [oral_2][laugh_0][break_6]
temperature: float 可选, 默认 0.3
top_p: float 可选, 默认 0.7
top_k: int 可选, 默认 20
skip_refine: int 可选, 默认0, 1=跳过 refine text,0=不跳过
custom_voice: int 可选, 默认0,自定义获取音色值时的种子值,需要大于0的整数,如果设置了则以此为准,将忽略 voice
返回:json数据
code=0 成功,filename=wav文件名,url=可下载的wav网址
code=1 失败,msg=错误原因
import requests
res=requests.post('http://127.0.0.1:9966/tts',data={"text":"你好啊亲爱的朋友。[laugh]","voice":2222,"prompt":'[oral_2][laugh_0][break_6]'})
print(res.json())
#成功
{code:0,msg:'ok',filename:1.wav,url:http://${location.host}/static/wavs/1.wav}
#error
{code:1,msg:"error"}
升级 pyVideoTrans 到 1.82+ https://github.com/jianchang512/pyvideotrans
- 点击菜单-设置-ChatTTS,填写请求地址,默认应该填写 http://127.0.0.1:9966
- 测试无问题后,在主界面中选择
ChatTTS