Comments (5)
一、对的,会一直运行,当然也可以关闭容器,你需要的时候开启。退出重启不会重新分配IP
二、恩恩,多人使用多GPU,第一种是可以把全部GPU分配给每个人,每个人能看到所有的显卡,当然这时候就需要协商好,我用前面几块,你用后面几块。第二种的话是每人分配固定的一块,自己只能看到这一块,别人如果分配的是另一块的话也看不到你的。不过这种方法,我还不清楚怎么每个人分配多块。只有一块的话可能不够用,现在我实验室使用的是第一种。靠协商使用。
三、在第二个问题里面,只有当GPU空闲时才能跑,这是实验室的小型服务器,没有考虑到排队。当然也可以自己写shell脚本,当显卡空闲时,自动跑你设置好的代码
from lxd_gpu_server.
from lxd_gpu_server.
from lxd_gpu_server.
谢谢~ 我现在在做实验室集群的GPU分布式训练来着,也是打算采用容器的样式,不过就想只做成应用容器,docker singularity那种,不用k8s而是用slurm,看看能不能做.不过总体还没有搭起来… 😂 发送自 Windows 10 版邮件<https://go.microsoft.com/fwlink/?LinkId=550986>应用 发件人: shenuiuinmailto:[email protected] 发送时间: 2019年12月26日 19:32 收件人: shenuiuin/LXD_GPU_SERVERmailto:[email protected] 抄送: 晓东mailto:[email protected]; Authormailto:[email protected] 主题: Re: [shenuiuin/LXD_GPU_SERVER] 你好,有一些问题- (#2) 1. 使用这种方式来搭建GPU服务器的话,是否意味着服务器端始终运行所有的容器?如果容器退出重启的话,其IP会重新分配么? 2. 1个容器使用一个GPU核心,另外一个容器能看到该GPU的工作情况么?照理说是不可以的吧,也就是说一个容器分配一个GPU是实现固定好的么? 3. 如何解决GPU的利用率问题,也就是作业排队 谢谢 一、对的,会一直运行,当然也可以关闭容器,你需要的时候开启。退出重启不会重新分配IP 二、恩恩,多人使用多GPU,第一种是可以把全部GPU分配给每个人,每个人能看到所有的显卡,当然这时候就需要协商好,我用前面几块,你用后面几块。第二种的话是每人分配固定的一块,自己只能看到这一块,别人如果分配的是另一块的话也看不到你的。不过这种方法,我还不清楚怎么每个人分配多块。只有一块的话可能不够用,现在我实验室使用的是第一种。靠协商使用。 三、在第二个问题里面,只有当GPU空闲时才能跑,这是实验室的小型服务器,没有考虑到排队。当然也可以自己写shell脚本,当显卡空闲时,自动跑你设置好的代码 — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#2?email_source=notifications&email_token=AHLGALCPTFPFAC36RXQ2ALLQ2SI5VA5CNFSM4J7ECE32YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEHVOOLI#issuecomment-569042733>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AHLGALGOLJIHXMVEI34WXILQ2SI5VANCNFSM4J7ECE3Q.
你好,有一些问题想和你交流下,可以留个联系方式吗?
from lxd_gpu_server.
谢谢~ 我现在在做实验室集群的GPU分布式训练来着,也是打算采用容器的样式,不过就想只做成应用容器,docker singularity那种,不用k8s而是用slurm,看看能不能做.不过总体还没有搭起来… joy 发送自 Windows 10 版邮件<https://go.microsoft.com/fwlink/?LinkId=550986>应用 发件人: shenuiuinmailto:[email protected] 发送时间: 2019年12月26日 19:32 收件人: shenuiuin/LXD_GPU_SERVERmailto:[email protected] 抄送: 晓东mailto:[email protected]; Authormailto:[email protected] 主题: Re: [shenuiuin/LXD_GPU_SERVER] 你好,有一些问题- (#2) 1. 使用这种方式来搭建GPU服务器的话,是否意味着服务器端始终运行所有的容器?如果容器退出重启的话,其IP会重新分配么? 2. 1个容器使用一个GPU核心,另外一个容器能看到该GPU的工作情况么?照理说是不可以的吧,也就是说一个容器分配一个GPU是实现固定好的么? 3. 如何解决GPU的利用率问题,也就是作业排队 谢谢 一、对的,会一直运行,当然也可以关闭容器,你需要的时候开启。退出重启不会重新分配IP 二、恩恩,多人使用多GPU,第一种是可以把全部GPU分配给每个人,每个人能看到所有的显卡,当然这时候就需要协商好,我用前面几块,你用后面几块。第二种的话是每人分配固定的一块,自己只能看到这一块,别人如果分配的是另一块的话也看不到你的。不过这种方法,我还不清楚怎么每个人分配多块。只有一块的话可能不够用,现在我实验室使用的是第一种。靠协商使用。 三、在第二个问题里面,只有当GPU空闲时才能跑,这是实验室的小型服务器,没有考虑到排队。当然也可以自己写shell脚本,当显卡空闲时,自动跑你设置好的代码 — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#2?email_source=notifications&email_token=AHLGALCPTFPFAC36RXQ2ALLQ2SI5VA5CNFSM4J7ECE32YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEHVOOLI#issuecomment-569042733>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AHLGALGOLJIHXMVEI34WXILQ2SI5VANCNFSM4J7ECE3Q.
你好,有一些问题想和你交流下,可以留个联系方式吗?
可以加我QQ:841463650
from lxd_gpu_server.
Related Issues (20)
- 【建议】所说的 可以安装桌面,docker全部可以,docker还共享内核,几乎没有性能损耗 HOT 1
- LXD容器中安装显卡驱动后nvidia-smi报错 HOT 2
- 请问虚拟机可以是Windows系统吗? HOT 4
- 一块GPU卡是否可以分给多台机器? HOT 3
- 使用共享镜像无法禁止Nouveau 内核驱动程序,安装不了显卡驱动 HOT 1
- 实验室的服务器是linux和windows双系统,使用这种方法构建时在linux下构建时,会不会把windows的数据给冲掉? HOT 1
- 在容器内安装完驱动后显示“NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.” HOT 1
- 想请问一下,容器内pytorch调用cuda总是提示初始化失败,而且torch.cuda.is_available总是false HOT 2
- 使用端口监听的方式实现容器远程连接,但是却无效 HOT 1
- 容器内安装matlab,提示挂载失败
- 遇到了LXD无法访问互联网的问题,以及解决方案 HOT 1
- Xorg cann't run. X11服务器无法启动. HOT 1
- 为容器分显卡时错误
- 为什么创建容器后没有IP。
- 博主,您好?请问,多张GPU卡虚拟化后,部署推理深度学习模型还是和普通的调用方式一样吗?
- 您可以使用Google翻譯將英語翻譯添加到README.md文件嗎? Nín kěyǐ shǐyòng Google fānyì jiāng yīngyǔ fānyì tiānjiā dào README.Md wénjiàn ma?
- lxc里nvidia-smi是看不到运行的任务的吧?请问有替代方案吗?
- win10远程桌面闪退 HOT 4
- 您好,想问一下,一台工作站只有一张显卡,可以同时多个人使用吗 HOT 1
- ubuntu18.04.5 容器,远程连黑屏 HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from lxd_gpu_server.