Giter Site home page Giter Site logo

Comments (6)

EricHou89 avatar EricHou89 commented on August 23, 2024 2

就是很常规的办法,看看config文件就明白了
比如ChatLaw-13B说了是在姜子牙模型基础上训练的,而从文件列表的config里面能看出来是lora微调的,用peft加载一下就行了。
第一步 搞到一个llama-13B模型
第二步 下载IDEA-CCNL/Ziya-LLaMA-13B-v1,并根据其README里面指导合成最终的Ziya-LLaMA-13B-v1模型。
第三部 下载JessyTsu1/ChatLaw-13B,用peft加载lora模型的方式加载Ziya-LLaMA-13B-v1和ChatLaw-13B就行了。

from chatlaw.

baiyutang avatar baiyutang commented on August 23, 2024

+1

from chatlaw.

ScottishFold007 avatar ScottishFold007 commented on August 23, 2024

就是很常规的办法,看看config文件就明白了 比如ChatLaw-13B说了是在姜子牙模型基础上训练的,而从文件列表的config里面能看出来是lora微调的,用peft加载一下就行了。 第一步 搞到一个llama-13B模型 第二步 下载IDEA-CCNL/Ziya-LLaMA-13B-v1,并根据其README里面指导合成最终的Ziya-LLaMA-13B-v1模型。 第三部 下载JessyTsu1/ChatLaw-13B,用peft加载lora模型的方式加载Ziya-LLaMA-13B-v1和ChatLaw-13B就行了。

但是合并完跑不出成型的结果,要么是unk,要么是很短的回答,还不如原生的ziya v1

from chatlaw.

EricHou89 avatar EricHou89 commented on August 23, 2024

就是很常规的办法,看看config文件就明白了 比如ChatLaw-13B说了是在姜子牙模型基础上训练的,而从文件列表的config里面能看出来是lora微调的,用peft加载一下就行了。 第一步 搞到一个llama-13B模型 第二步 下载IDEA-CCNL/Ziya-LLaMA-13B-v1,并根据其README里面指导合成最终的Ziya-LLaMA-13B-v1模型。 第三部 下载JessyTsu1/ChatLaw-13B,用peft加载lora模型的方式加载Ziya-LLaMA-13B-v1和ChatLaw-13B就行了。

但是合并完跑不出成型的结果,要么是unk,要么是很短的回答,还不如原生的ziya v1

我这边结合之后似乎是正常的,包括我对ziya模型做了4bit量化之后再结合chatlaw的lora之后输出结果也是正常的。

from chatlaw.

cdround avatar cdround commented on August 23, 2024

就是很常规的办法,看看config文件就明白了 比如ChatLaw-13B说了是在姜子牙模型基础上训练的,而从文件列表的config里面能看出来是lora微调的,用peft加载一下就行了。 第一步 搞到一个llama-13B模型 第二步 下载IDEA-CCNL/Ziya-LLaMA-13B-v1,并根据其README里面指导合成最终的Ziya-LLaMA-13B-v1模型。 第三部 下载JessyTsu1/ChatLaw-13B,用peft加载lora模型的方式加载Ziya-LLaMA-13B-v1和ChatLaw-13B就行了。

请问有 config 文件以及 llama-13B 模型权重嘛?跪求,非常感谢!!

from chatlaw.

haoyunlyy avatar haoyunlyy commented on August 23, 2024

就是很常规的办法,看看config文件就明白了 比如ChatLaw-13B说了是在姜子牙模型基础上训练的,而从文件列表的config里面能看出来是lora微调的,用peft加载一下就行了。 第一步 搞到一个llama-13B模型 第二步 下载IDEA-CCNL/Ziya-LLaMA-13B-v1,并根据其README里面指导合成最终的Ziya-LLaMA-13B-v1模型。 第三部 下载JessyTsu1/ChatLaw-13B,用peft加载lora模型的方式加载Ziya-LLaMA-13B-v1和ChatLaw-13B就行了。

May I ask which model is the full name of the llama model?

from chatlaw.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.