Comments (17)
非常感谢你的反馈。其中这三点我也有考虑过,并计划在之后的更新中增加:
- 自动识别用户语音输入的语言,当用户停顿一定时长后,将识别结果自动发送给 GPT;
- 在每个对话旁边添加一个 “朗读” 按钮;
- 支持 PWA。
关于你提到的多语言环境问题,是指对话里的多语言还是整个聊天中的多语言?
- 对于对话中的多语言,这取决于语音合成 API 是否支持多种语言;
- 对于整个聊天环境中的多语言,需要先检测对话中的语言,然后进行语音合成。之后的更新中我会考虑添加一个选项,让用户可以为每种语言选择默认的语音,再增加自动识别语言的选项。
由于我预期的 SpeechGPT 主要用法是用户直接访问官网,因此目前所有配置信息都存储在浏览器中,并可通过设置进行修改。当然,之后更新也会提供通过环境变量来初始化默认配置的方法。
from speechgpt.
对了,还有一个更为重要的建议: 支持在部署时,通过环境变量(Environment Variable)来设置页面中需要手动设置的密钥和其他参数变量。 尽管可以直接将这些变量放入代码中,但在前端存储这些信息可能并不是一个好主意。
+1, 很需要通过env来设置这些key @hahahumble
from speechgpt.
对了,还有一个更为重要的建议:
支持在部署时,通过环境变量(Environment Variable)来设置页面中需要手动设置的密钥和其他参数变量。
尽管可以直接将这些变量放入代码中,但在前端存储这些信息可能并不是一个好主意。
from speechgpt.
我在跟 ai 对话的时候,会担心自己的英语有语法错误,能否自动预设 promt 让 ai 纠错?
可以通过写类似这样的 Prompt 实现:Please correct my grammar first, and then answer my question while practicing English speaking with me
from speechgpt.
Azure 语音识别语言设为中文,是可以同时识别中文和英文的,之后也会支持可以同时识别中英文的语音识别 API
from speechgpt.
目前大多数语音合成 API 都只支持单一语言的朗读,而手动将其拆分为多种语言又容易出错。因此,可能要等基础功能完善后才考虑这个功能。
from speechgpt.
多语言环境问题主要是针对单次回复朗读,因为发现朗读GPT回复时,TTS(Azure TTS)会自动跳过非在设置里指定语言,想要的效果时足够自然地处理这一场景,而非忽略。
谢谢你的回复。
from speechgpt.
对了,还有一个更为重要的建议: 支持在部署时,通过环境变量(Environment Variable)来设置页面中需要手动设置的密钥和其他参数变量。 尽管可以直接将这些变量放入代码中,但在前端存储这些信息可能并不是一个好主意。
+1, 很需要通过 env 来设置这些 key @hahahumble
用 env 来设置这些 key 之后,在发送的请求里也可以看见这些 key,还需要加一层 Api 中间件吗?
from speechgpt.
可以自动语音识别吗?就是说中文识别成中文,说英语识别成英语
from speechgpt.
我在跟ai对话的时候,会担心自己的英语有语法错误,能否自动预设promt让ai纠错?
from speechgpt.
我在跟 ai 对话的时候,会担心自己的英语有语法错误,能否自动预设 promt 让 ai 纠错?
可以通过写类似这样的 Prompt 实现:Please correct my grammar first, and then answer my question while practicing English speaking with me
谢谢,很有用的prompt
from speechgpt.
能否增加一个代理 url 设置,使得调用走代理
from speechgpt.
能否增加一个代理 url 设置,使得调用走代理
今晚可以更新
from speechgpt.
用 env 来设置这些 key 之后,在发送的请求里也可以看见这些 key,还需要加一层 Api 中间件吗?
或许可以参考一下这个项目:https://github.com/ddiu8081/chatgpt-demo
from speechgpt.
env 设置好以后,就和前端无关了。
可参考 https://github.com/Yidadaa/ChatGPT-Next-Web 里面的 openai key 和 code 机制很好地解决了既可以依赖后端 env 内置,也可以前端自行设置覆盖 key,并用 code 控制访问。
from speechgpt.
经常读了50个词后,就开始停止读了,请问可以在哪里修改这个读词限制呢
from speechgpt.
非常感谢你的反馈。其中这三点我也有考虑过,并计划在之后的更新中增加:
- 自动识别用户语音输入的语言,当用户停顿一定时长后,将识别结果自动发送给 GPT;
- 在每个对话旁边添加一个 “朗读” 按钮;
- 支持 PWA。
关于你提到的多语言环境问题,是指对话里的多语言还是整个聊天中的多语言?
- 对于对话中的多语言,这取决于语音合成 API 是否支持多种语言;
- 对于整个聊天环境中的多语言,需要先检测对话中的语言,然后进行语音合成。之后的更新中我会考虑添加一个选项,让用户可以为每种语言选择默认的语音,再增加自动识别语言的选项。
由于我预期的 SpeechGPT 主要用法是用户直接访问官网,因此目前所有配置信息都存储在浏览器中,并可通过设置进行修改。当然,之后更新也会提供通过环境变量来初始化默认配置的方法。
建议新增下载语音的功能!非常有用
from speechgpt.
Related Issues (20)
- 语音合成服务必须连接外网吗? HOT 4
- 是否支持流式阅读ChatGPT的回复 HOT 2
- 有没有人有Azure key可以借用一下 HOT 1
- How to fill in the parameter when using vercel deployment? HOT 6
- 录制识别完成是否该在光标处插入?
- Dokcer build 没报错,但是没有 HOT 10
- Can you add an access password feature? HOT 3
- 使用语音功能过程中一定要连接梯子吗,是否可以不连 HOT 3
- 功能和改进 语音识别可以用官网的 whisper和加入浏览器内置语音成合
- 长对话记录会导致输入卡顿。
- 一个非常简单的请求,录音/停止键增加一个键盘快捷键,这样对话和发送都不需要鼠标了 HOT 1
- 可以加一个配置对话场景的页面么, HOT 1
- 如果能在国内正常访问呢?关了梯子都不能用T_T HOT 7
- 国内访问不行问题 HOT 9
- There was an error with your request HOT 3
- Docker for ARM64 arch HOT 3
- add caption
- docker里面的配置APIKEY的文件的具体位置在哪里?想在后台直接配好APIKEY,谢谢! HOT 1
- 关于发送信息后一直在”等待中“的问题
- API key not loaded in starting HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from speechgpt.