hqwu-hitcs / awesome-chinese-llm Goto Github PK
View Code? Open in Web Editor NEW整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。
简介:MeChat:中文心理健康支持对话大模型。该项目开源的中文心理健康支持通用模型由 ChatGLM-6B LoRA 16-bit 指令微调得到。数据集通过调用gpt-3.5-turbo API扩展真实的心理互助 QA为多轮的心理健康支持多轮对话,提高了通用语言大模型在心理健康支持领域的表现,更加符合在长程多轮对话的应用场景。
本来想自己弄一个,看到有人弄了,就不弄了。发个言鼓励下。我看更新也蛮及时的。周末上的模型都在上面。
单位:山西大学与山西农业大学
农业大模型后稷(AgriMa):https://github.com/zhiweihu1103/AgriMa
希望能够添加进去
https://github.com/Tongjilibo/bert4torch
起源于苏神的bert4keras改torch版,目前在大模型上,已经包含了目前主要的开源大模型,llama系列,chatglm,bloom系列等等,代码简洁阅读性高,希望收纳
可以把各个成果按照不同维度做一个评级吗?
这个仓库做了非常有价值的工作,十分受用。请问是否可以添加各模型推理和微调的硬件需求,以便于评估当前的硬件条件下能使用哪些模型。
比如causallm之类的,谢谢
项目地址: https://github.com/DUTIR-BioNLP/Taiyi-LLM
项目由大连理工大学信息检索研究室开发
非常不错的工作,有没有考虑提供中文 LLM 性能评测排行
零一万物 Yi-34B和Yi-6B 在图中分支没看到,属于哪个分支?还是自成?
LMDeploy 支持 LLM 和 VL 模型的量化、推理和服务。它具备以下特点:
高效的推理:LMDeploy 开发了 Persistent Batch(即 Continuous Batch),Blocked K/V Cache,动态拆分和融合,张量并行,高效的计算 kernel等重要特性。推理性能是 vLLM 的 1.8 倍
可靠的量化:LMDeploy 支持权重量化和 k/v 量化。4bit 模型推理效率是 FP16 下的 2.4 倍。量化模型的可靠性已通过 OpenCompass 评测得到充分验证。
便捷的服务:通过请求分发服务,LMDeploy 支持多模型在多机、多卡上的推理服务。
有状态推理:通过缓存多轮对话过程中 attention 的 k/v,记住对话历史,从而避免重复处理历史会话。显著提升长文本多轮对话场景中的效率。
浦语实战营 包括了InternLM 从模型,到训练,到部署的全套教程
如题
您好,提供一个数据集哈
SmileConv
地址:https://github.com/qiuhuachuan/smile
数据集说明:数据集通过ChatGPT改写真实的心理互助 QA为多轮的心理健康支持多轮对话(single-turn to multi-turn inclusive language expansion via ChatGPT),该数据集含有56k个多轮对话,其对话主题、词汇和篇章语义更加丰富多样,更加符合在长程多轮对话的应用场景。
项目地址 https://github.com/davidpig/lychee_law
由德国萨尔大学团队和**南京大学团队合作开发。
检索到信息:
大语言模型可能会编造数据,产生"幻觉",可以用小唐搜索引擎来给生成的数据加上引用,让用户可以追溯数据的来源和可信度;
小唐搜索引擎是字符级搜索引擎,具有毫秒级的文本片段检索能力,效果类似:perplexity.ai
还有其它解决方案吗?
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.