Topic: deepspeed Goto Github

Some thing interesting about deepspeed

👇 Here are 52 public repositories matching this topic...

5663015 / llms_train

deepspeed,一套代码指令微调大模型

User: 5663015

baichuan bloom chatglm-6b deepspeed language-model llama llm-training llms lora pythia

abhilash1910 / framework-optimization

deepspeed,Framework, Model & Kernel Optimizations for Distributed Deep Learning - Data Hack Summit

User: abhilash1910

codegen ddp deepspeed fsdp inductor pytorch triton pipelineparallel tensorparallel

affjljoo3581 / bms-molecular-translation

deepspeed,🥈50th place in Bristol-Myers Squibb – Molecular Translation competition🥈

User: affjljoo3581

competition kaggle pytorch pytorch-lightning deepspeed wandb transformer vision-transformer deep-learning

afogarty85 / applied_nlp_demos

deepspeed,

User: afogarty85

Home Page: http://seekinginference.com/

pytorch bert natural-language-processing accelerate chatbot deepspeed nlp transformers lora t5-model

andresoble / performerdualencoder

deepspeed,Train a Performer Dual Encoder to get Language Agnostic Sentence Embeddings like LABSE

User: andresoble

performer pytorch dualencoder dual encoder deepspeed

beomi / transformers-language-modeling

deepspeed,Train 🤗transformers with DeepSpeed: ZeRO-2, ZeRO-3

User: beomi

Home Page: https://wiki.beomi.net/transformers-deepspeed-new-bert-model.html

transformers bert language-model deepspeed

billvsme / train_law_llm

deepspeed,✏️0成本LLM微调上手项目，⚡️一步一步使用colab训练法律LLM，基于microsoft/phi-1_5、chatglm3，包含lora微调，全参微调

User: billvsme

ai deepspeed law llama2 llm lora python

bobo0810 / learndeepspeed

deepspeed,DeepSpeed教程 & 示例注释 & 学习笔记（大模型高效训练）

User: bobo0810

deepspeed examples large-language-models

bobo0810 / minigpt-4-deepspeed

deepspeed,MiniGPT-4基于DeepSpeed加速➕ 扩充模型规模 ➕ 实验分析

User: bobo0810

deepspeed llm minigpt4

cdw / deepspeed_in_aml

deepspeed,Create an environment within AzureML that supports Deepspeed training, execute some example training processes thereon.

User: cdw

deepspeed azureml

coincheung / gdgpt

deepspeed,Train llm (bloom, llama, baichuan2-7b, chatglm3-6b) with deepspeed pipeline mode. Faster than zero/zero++/fsdp.

User: coincheung

deepspeed llm pipeline nlp pytorch full-finetune model-parallization bloom flash-attention baichuan2-7b

damomineraleo / bittensorgui

deepspeed,[T] ~ Nova Wallet ~ GUI wallet for windows on the bittensor network polkadot you can use this to store your TAO under a polkadot address [T]

User: damomineraleo

Home Page: https://bittensor.com/

ai aicreative bittensor computerlearning deepspeed machine machinelearning neural-machine-translation neural-network pytorch tensorflow

dyedd / deepspeed-diffusers

deepspeed,使用deepspeed训练diffusers（training diffusers with deepspeed）

User: dyedd

deepspeed diffusers diffusion model

git-cloner / llama2-lora-fine-tuning

deepspeed,llama2 finetuning with deepspeed and lora

Organization: git-cloner

Home Page: https://gitclone.com/aiit/chat/

deepspeed finetuning llama2 lora

glb400 / toy-reclm

deepspeed,①A toy large model for recommender system based on LLaMA2, SASRec, and Meta's generative recommenders. ②Note and experiments of official implementation for Meta's generative recommenders.

User: glb400

large-language-models llama2 recommender-system sasrec actions-speak-louder-than-words deepspeed

homebrewnlp / revlib

deepspeed,Simple and efficient RevNet-Library for PyTorch with XLA and DeepSpeed support and parameter offload

Organization: homebrewnlp

Home Page: https://github.com/HomebrewNLP/revlib

deep-learning deepspeed momentumnet pytorch revnet tpu xla

intelligent-machine-learning / glake

deepspeed,GLake: optimizing GPU memory management and IO transmission.

Organization: intelligent-machine-learning

deepspeed gpu llm memory onnx pytorch

internlm / lmdeploy

deepspeed,LMDeploy is a toolkit for compressing, deploying, and serving LLMs.

Organization: internlm

Home Page: https://lmdeploy.readthedocs.io/en/latest/

cuda-kernels deepspeed fastertransformer llm-inference turbomind internlm llama llm codellama llama2

jackaduma / alpaca-lora-rlhf-pytorch

deepspeed,A full pipeline to finetune Alpaca LLM with LoRA and RLHF on consumer hardware. Implementation of RLHF (Reinforcement Learning with Human Feedback) on top of the Alpaca architecture. Basically ChatGPT but with Alpaca

User: jackaduma

alpaca chatgpt deepspeed finetune gpt llama llm lora peft ppo pytorch reward-models rlhf

jackaduma / chatglm-lora-rlhf-pytorch

deepspeed,A full pipeline to finetune ChatGLM LLM with LoRA and RLHF on consumer hardware. Implementation of RLHF (Reinforcement Learning with Human Feedback) on top of the ChatGLM architecture. Basically ChatGPT but with ChatGLM

User: jackaduma

lora chatglm chatglm-6b chatgpt finetune gpt llm pytorch rlhf llama

jistiak / finetune-gpt-deepspeed

deepspeed,Sample codes and guidelines on how to finetune any opensource GPT models using #deepspeed and #huggingface

User: jistiak

deepspeed finetuning gpt hf llm

l294265421 / my-llm

deepspeed,All about large language models

User: l294265421

chatgpt large-language-models deepspeed distributed-training

limccn / deepspeed-trick

deepspeed,Just record my journey to advance and democratize artificial intelligence through ZeRO and MSOS DeepSpeed

User: limccn

artificial-intelligence deepspeed

linydub / azureml-greenai-txtsum

deepspeed,Samples for fine-tuning HuggingFace models with AzureML

User: linydub

huggingface azureml deep-learning nlp machine-learning azure transfer-learning fine-tuning text-summarization carbon-footprint

mddunlap924 / llm-inference-serving

deepspeed,This repository demonstrates LLM execution on CPUs using packages like llamafile, emphasizing low-latency, high-throughput, and cost-effective benefits for inference and serving.

User: mddunlap924

deepspeed large-language-models llamacpp llamafile llm-inference llm-serving llms vllm

nawnoes / pytorch-gpt-x

deepspeed,Implementation of autoregressive language model using improved Transformer and DeepSpeed pipeline parallelism.

User: nawnoes

gpt pytorch transformer pipeline-parallelism deepspeed

opencsgs / llm-inference

deepspeed,llm-inference is a platform for publishing and managing llm inference, providing a wide range of out-of-the-box features for model deployment, such as UI, RESTful API, auto-scaling, computing resource management, monitoring, and more.

Organization: opencsgs

deepspeed llama-cpp llm-inference ray transformer vllm

openllmai / openrlhf

deepspeed,An Easy-to-use, Scalable and High-performance RLHF Framework (Support 70B+ full tuning & LoRA & Mixtral & KTO)

Organization: openllmai

Home Page: https://huggingface.co/OpenLLMAI

deepspeed large-language-models raylib reinforcement-learning reinforcement-learning-from-human-feedback transformers vllm

openmoss / collie

deepspeed,Collaborative Training of Large Language Models in an Efficient Way

Organization: openmoss

Home Page: https://openlmlab-collie.readthedocs.io

deep-learning deepspeed nlp pytorch

pku-alignment / safe-rlhf

deepspeed,Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

Organization: pku-alignment

Home Page: https://pku-beaver.github.io

ai-safety alpaca datasets deepspeed large-language-models llama llm llms reinforcement-learning reinforcement-learning-from-human-feedback

pszemraj / ai-msgbot

deepspeed,Training & Implementation of chatbots leveraging GPT-like architecture with the aitextgen package to enable dynamic conversations.

User: pszemraj

ai gpt-2 aitextgen gradio chatbot chat-application nlp-parsing nlp transformers text-generation

reason-wang / instructllm

deepspeed,The official implementation of paper "Demystifying Instruction Mixing for Fine-tuning Large Language Models"

User: reason-wang

deepspeed fine-tuning instruction-tuning llama2 llm nlp transformers

saforem2 / l2hmc-qcd

deepspeed,Application of the L2HMC algorithm to simulations in lattice QCD.

User: saforem2

Home Page: https://saforem2.github.io/l2hmc-qcd/

mcmc hmc monte-carlo hamiltonian-monte-carlo horovod lattice gauge-theory machine-learning lattice-qcd deep-learning

shm007g / llama-cult-and-more

deepspeed,Large Language Models for All, 🦙 Cult and More, Stay in touch !

User: shm007g

Home Page: https://shm007g.github.io/LLaMA-Cult-and-More/

alpaca chatgpt gpt llama ggml gpt4 gptq vicuna pytorch tensorflow

siahuat0727 / bert-benchmark

deepspeed,A framework for benchmarking various DNN inference engine.

User: siahuat0727

pytorch tensorrt deepspeed onnxruntime nnfusion

srsawant34 / efficient_instruction_learning

deepspeed,Code base for the paper "Instruction Tuned Models are Quick Learners".

User: srsawant34

data-efficiency data-efficient-learning deepspeed finetuning huggingface instruction-learning instruction-tuning instructions machine-learning seq2seq super-natural-instructions t5 tk-instruct transformer transformers