Giter Site home page Giter Site logo

有点困惑请教一下 about starwhisper HOT 3 OPEN

yu-yang-li avatar yu-yang-li commented on September 21, 2024
有点困惑请教一下

from starwhisper.

Comments (3)

Yu-Yang-Li avatar Yu-Yang-Li commented on September 21, 2024

readme的功能展示说明是20w条天文对话数据分布微调 我想请教一下,一个大模型纯微调是应该没有办法增加新的领域知识的吧,所以这里我们仅仅只做了微调(sft),还是也做了预训练(pt)。 如果能够通过微调就增加新的领域知识的话,我们微调的硬件大概是一个什么配置,谢谢。

您好!
在开始前,我们确实倾向于LIMA的论文观点,即微调主要学习的是知识的引导方式,以引导模型激活预训练时所见过的知识。但是在具体训练后,我们发现经过大量的微调数据微调后,是可以回答一些未微调或者微调数据不太够的问题,这与LinkSoul以及很多微调项目的结果是一致的,所以我们认为“大量”是可以注入知识的。
但是我们更倾向于通过知识库注入知识,将微调当做一种学习任务形式的过程,以提升模型使用外挂知识库的能力。个人认为,随着未来基模型参数量的增加,考虑到领域知识配比、与原数据分布差异问题,预训练的成本将会更高,而微调在提升链接知识库能力的同时,伴随激活的预训练知识会更加可观。
目前训练的配置是2*A6000。

from starwhisper.

r00mz avatar r00mz commented on September 21, 2024

谢谢回答,那我继续请教一下,就我的认知目前以外挂知识库为主的方式除了chatgpt其他的llm好像能落地的很少见到,哪怕像chatlaw那种也是pt、sft、知识库一起上。
答主方便回答一下怎么理解通过pt、sft加强llm的提取关键词的能力么,谢谢。

from starwhisper.

Yu-Yang-Li avatar Yu-Yang-Li commented on September 21, 2024

谢谢回答,那我继续请教一下,就我的认知目前以外挂知识库为主的方式除了chatgpt其他的llm好像能落地的很少见到,哪怕像chatlaw那种也是pt、sft、知识库一起上。 答主方便回答一下怎么理解通过pt、sft加强llm的提取关键词的能力么,谢谢。

通过特定文本的sft和RLHF加强模型链接知识库能力,是我们v2版本正在尝试的内容。关于特定文本SFT部分,我们考虑通过具有长文本history、总结类任务等的数据进行训练,以学习根据材料回复这种任务形式。关于后者,已经有相关项目进行了可观的实践(https://huggingface.co/fb700/chatglm-fitness-RLHF)
,我们预期的实现效果也是通过人工反馈让模型正确的依赖资料进行回复。
预计这个月会更新相应权重。相关问题可以加微信:Astro_YuYang,一起学习交流。

from starwhisper.

Related Issues (11)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.