Giter Site home page Giter Site logo

xunziallm's Introduction

中文  |  English

荀子系列大语言模型

本次荀子系列模型开源包括两个部分:基座模型XunziALLM,作为本次模型开源的重点,本项目推出了完全开放使用的古籍领域大模型,与此同时,为方便非人工智能领域人员更好地了解本次开源模型,我们使用一部分数据构建了对话模型XunziChat,用户可使用与调用千问、Baichuan2、ChatGLM3等对应开源模型一致方法调用我们的古籍处理模型。

当前已发布的古籍大模型:

模型名称 下载链接 对应开源模型
Xunzi-Qwen-7B(基座模型) 链接 Qwen-7B基座模型(版本v1.0.5)
Xunzi-Qwen-7B-CHAT(对话模型) 链接 Qwen-7B对话模型
Xunzi-GLM-6B(基座模型) 链接 ChatGLM3-6B基座模型
Xunzi-Baichuan-7B(基座模型) 链接 Baichuan2-7B基座模型

Xunzi-Qwen-7B与Xunzi-Qwen-7B-CHAT调用方式与Qwen模型相同。

Xunzi-GLM-6B调用方式与ChatGLM3-6B模型相同。

Xunzi-Baichuan-7B调用方式与Baichuan2-7B模型相同。

新闻

  • 2024/1/16 更新github项目开源模型列表。

荀子系列模型亮点:

  • 古籍智能标引,荀子模型具备强大的古籍文献标引能力,能够对古籍中的内容进行高质量主题标引,帮助研究人员快速了解文章主题。

index

  • 古籍信息抽取,荀子模型能够自动从古籍中抽取关键信息,如人物、事件、地点等,大大节省了研究人员的信息整理时间。

ner

  • 诗歌生成:荀子模型还具备诗歌生成的能力,能够根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供创作灵感。

poetry

  • 古籍高质量翻译:对于那些难以理解的古籍文献,荀子模型能够提供高质量的翻译服务,帮助研究人员更好地理解原文含义。

translation

  • 阅读理解:荀子模型能够对给出的古文文本进行分析解释,实现对古籍文本的自动阅读。

reading_comprehension

  • 词法分析:荀子模型可以完成古籍文本的自动分词和词性标注,能够有效提升语言学工作者的研究效率。

pos

  • 自动标点:荀子大模型可以快速完成古籍文本的断句和标点,提升研究者以及业余爱好者对古籍文本的阅读体验。

punctuation

由于我们同时发布了基座模型,用户也可以根据自己的需求,使用本地的训练语料微调荀子基座模型,使得其能够在古籍下游处理任务上取得更佳的处理性能。

声明:

荀子系列大语言模型在处理中华古籍文本信息方面表现出了不错的性能,不仅能够准确剖析古籍文本的复杂性,还可以进一步挖掘**传统文化的丰富内涵。然而,我们也清楚地认识到,本模型仍有许多需要改进和优化的地方。因此,我们非常欢迎和鼓励用户对我们的模型提出宝贵的意见和建议,并且在后续工作中,我们会推出具有更好性能的新版本大语言模型。

大语言模型庞大的参数量也带来了更多的随机性,虽然我们在训练数据选取时已经尽可能保证了数据的合规性,但由于数据和模型的复杂性,仍有可能存在一些无法避免的问题。因此,如果由于使用本开源模型而导致的各种问题,包括但不限于数据安全问题、公共舆论风险,或模型被误导、滥用、传播或不当利用所带来的任何风险和问题,我们将不承担任何责任。

此外,根据国家网信办等七部门联合发布的《生成式人工智能服务管理暂行办法》,在训练、使用本模型以及其他生成式模型,请依据相关法律法规,为构建和谐、健康、可持续的生成式人工智能社区共同努力。

如果您在模型使用过程中有任何疑问,欢迎联系我们([email protected])

xunziallm's People

Contributors

shenxin0925 avatar lclcjj avatar njauzzx avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.