В этом проекте я покажу как на компьютере при помощи Python3 дать возможность ChatGPT слушать вас и отвечать на вопросы без использования клавиатуры и дисплея.
Для начала нужно получить token для работы с API и organiztion id. Это можно сделать на следующих страницах:
https://platform.openai.com/account/api-keys
https://platform.openai.com/account/org-settings
Ссылка на страницу с документацией
https://platform.openai.com/docs/api-reference/introduction
Эти значения надо записать в переменные openai.api_key и openai.organization (13 и 14 строчки в файле ChatGPT.py)
openai.organization = "organiztion id"
openai.api_key = "token"
Менять тип используемой модели можно здесь(38 строчка)
engine='text-davinci-003'
Максимальное количество токенов (слов) в ответе(41 строка). Количество ограниченно в бесплатной версии.
Теперь необходимо установить следующие библиотеки pip install openai pip install pyaudio pip install googletrans pip unstall vosk pip install pyttsx3
Эти библиотеки необходимы для распознавания речи, перевода текста в английский и обратно и для синтеза речи. В репозитарии на гитхабе уже лежит языковая модель для распознавания русской речи. Хорошо работает только в тишине.
После запуска программы необходимо произнести слов "слушай". Компьютер ответит "Говори. Слушаю внимательно" и далее все произнесенные слова будут отправлены сначало в гугл переводчик, а затем уже отправлены в бота. Это сделано в целях получения более конкретного ответа от бота. Затем после получения ответа от бота данные отправляются в синтезатор речи.
Ну и результат на видео