请问有公布模型训练和测评的硬件需求吗？需要调研硬件资源需求，但是md文件好像没有明确说明，大家有看到嘛？

我是A40 48G 显存，采用官方默认的加载精度(fp32)，显存占用31G左右。 <p dir="auto"

你好，目前有推断的硬件资源需求，<a href="https://github.com/QwenLM/Qwen-7B#q

qwen7b的硬件需求是什么呀？ about qwen HOT 6 CLOSED

qwenlm commented on May 22, 2024

qwen7b的硬件需求是什么呀？

from qwen.

Comments (6)

zhangyichang commented on May 22, 2024

你好，目前有推断的硬件资源需求，https://github.com/QwenLM/Qwen-7B#quantization

Precision	MMLU	Memory
BF16	56.7	16.2G
Int8	52.8	10.1G
NF4	48.9	7.4G

训练的硬件需求我们会后续更新。

from qwen.

BeastyZ commented on May 22, 2024

我是A40 48G 显存，采用官方默认的加载精度(fp32)，显存占用31G左右。

from qwen.

txy6666yr commented on May 22, 2024

你好，目前有推断的硬件资源需求，https://github.com/QwenLM/Qwen-7B#quantization

Precision MMLU Memory
BF16 56.7 16.2G
Int8 52.8 10.1G
NF4 48.9 7.4G
训练的硬件需求我们会后续更新。
好的谢谢

from qwen.

txy6666yr commented on May 22, 2024

我是A40 48G 显存，采用官方默认的加载精度(fp32)，显存占用31G左右。

好的，我算力不够，第一天量化int8加载报错，我今天改成fp16再试试

from qwen.

CN-COTER commented on May 22, 2024

你好，目前有推断的硬件资源需求，https://github.com/QwenLM/Qwen-7B#quantization

Precision MMLU Memory
BF16 56.7 16.2G
Int8 52.8 10.1G
NF4 48.9 7.4G
训练的硬件需求我们会后续更新。

您好，请问能提供一个int8的Qwen-chat-7B下载链接吗？

from qwen.

CN-COTER commented on May 22, 2024

你好，目前有推断的硬件资源需求，https://github.com/QwenLM/Qwen-7B#quantization
Precision MMLU Memory
BF16 56.7 16.2G
Int8 52.8 10.1G
NF4 48.9 7.4G
训练的硬件需求我们会后续更新。

您好，请问能提供一个int8的Qwen-chat-7B下载链接吗？

我看了一下Quant用的是AutoGPTQ，如果不方便提供int8的模型的话，可以提供一下GPTQ量化时使用到的datasets吗？

from qwen.

qwen7b的硬件需求是什么呀？ about qwen HOT 6 CLOSED

Comments (6)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent