Giter Site home page Giter Site logo

siliconlife / unity-ai-chat-toolkit Goto Github PK

View Code? Open in Web Editor NEW

This project forked from zhangliwei7758/unity-ai-chat-toolkit

0.0 0.0 0.0 420.8 MB

使用unity实现AI聊天相关功能。目前这个库包含了对chatgpt、chatglm等大语言模型的api调用的代码实现以及实现了微软Azure以及百度AI的语音服务功能,语音服务均采用web api实现,支持Windows/WebGL/Android等平台

License: MIT License

unity-ai-chat-toolkit's Introduction

Unity-AI-Chat-Toolkit

这是一个提供给unity开发者的工具库,用于快速实现AI聊天相关功能。目前这个库包含了对chatgpt、rwkv以及chatglm等大语言模型的api调用的代码实现以及实现了微软Azure以及百度AI的语音合成、语音识别的web api接入。在这个库我们可以通过这代码库,在unity上,快速实现跨平台的应用。

image

1. unity版本要求

要求unity2020.3.44及以上版本

2. 工具内置功能说明

这个工具是根据我之前的AI二次元小姐姐项目整合后的工具包,目前是整合了通用模块,把相关模型包括Vroid以及live2d模型全部删除了,如果需要使用老版本资源的话,文档后面我会放上传送门,自行下载就可以了。

2.1 项目的主要结构

目前这个工具,主要模块包括LLM以及TTS&&STT两个模块:

image

LLM模块:

=====================

实现的就是针对不同的大语言模型的api调用的代码实现。目前已经实现的大语言模型包括:

chatgpt:

集成了chatgpt 3.5/4 的api接口,使用这个脚本,需要在脚本参数里填写openai的api key, 默认设置的模型是chatgpt-3.5,如果要替换chatgpt4,需要自行修改模型名称;

chatglm:

集成了对chatglm官方示例的api接口,如果使用chatglm官方的仓库部署的api服务,就可以直接使用,需要配置的内容是,配置部署好的api地址即可;

rwkv:

集成了针对rwkv runner开源项目的api接口,因为rwkv runner这个项目的api格式和chatgpt是一样的,如果下载rwkv runner这个项目使用的话,可以使用工具提供的脚本,只需要在api地址参数配置实际的地址就可以了。

星火大模型:

集成了科大讯飞的星火大模型的api对接功能,可根据需求自行配置V1.5/V2.0版本

百度智能云千帆大模型平台:

集成了百度智能云千帆大模型平台模型api服务,包括文心一言等十种模型

智谱AI开放平台:

集成了智谱AI开放平台下,chatGLM Turbo模型的api支持

TTS&&STT模块:

=====================

这个模块实现了对语言模型反馈信息的语音合成功能的代码实现,以及发送信息时,可能用到的语音识别服务相关的代码实现。目前已实现的语音产品包括:

微软Azure语音合成以及语音识别服务:

如果使用这个服务,需要准备微软Azure的语音服务令牌,自行注册账号,开通服务获得;

百度AI的语音合成以及语音识别服务:

使用这个服务时,注册百度AI开放平台的账号,开通语音合成、语音识别服务,创建应用获取到相关的密钥,填入相应脚本即可。

OpenAI平台提供的在线Whisper语音识别服务:

集成了openAI平台的Whisper在线语音识别api,需要使用openai的api key 集成了openAI平台的TTS语音合成api,可实现语音合成功能

提供针对开源的Whisper模型的api集成:

集成的项目是github上开源项目:https://github.com/ahmetoner/whisper-asr-webservice 部署这个项目,可使用本模块来调用语音识别的api

提供针对科大讯飞语音服务的api集成:

实现了对科大讯飞语音服务的api集成,采用了websocket方式,可使用科大讯飞的语音识别以及语音合成服务

WOV模块:

=====================

这个模块实现了关键词语音唤醒相关的功能,能够通过实时监听关键词,进行对话功能的唤醒

Unity内置关键词识别:

使用了windows.speech库,实现的关键词识别功能,支持在windows平台下的语音唤醒功能

角色口型:

=====================

使用了Oculus的Lipsync方案,并集成到了项目包里,可以使用本方案实现windows平台的音频转口型的效果。 完整的插件地址,可以自行下载:https://developer.oculus.com/downloads/package/oculus-lipsync-unity/

2.2 模型如何使用

示例场景里编写了一个调用示例,查看一下ChatAgent对象。

image

在配置面板上,根据自己的需求,配置chatmodel以及tts\stt脚本就可以了。

3. 关于发布到WebGL方法

因为这个项目用到了unity内置的microphone类,webgl是不支持这个类的,所以工具也整合了别的大佬的解决方案,具体可在工具包路径下找到Tool,查看具体的配置说明。unity端的代码已经在示例场景做过配置,不需要再处理,只需要在导出的webgl项目中做相应的代码调整即可

image

4. 旧版本项目传送门

旧版本项目会包含chatgpt\chatglm\微软azure\baiduAI\VITS等几个项目示例,可以以下传送门获取

chatGPTAIGirlFriendSample:https://gitee.com/DammonSpace/chat-gptaigirl-friend-sample

vits-chatgpt-live2d-unity-wife:https://gitee.com/DammonSpace/vits-chatgpt-live2d-unity-wife

unity-ai-chat-toolkit's People

Contributors

zhangliwei7758 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.